与CUDA的本质区别技术TinkerCUDA抽象目标多卡集群虚拟化单芯片计算资源抽象核心功能分布式训练流程编排并行计算指令优化典型应用千亿参数模型RL训练图像处理/科学计算生态依赖兼容PyTorch/TensorFlow深度绑定NVIDIA硬件