betvictor韦德体育- 韦德体育官方网站- APP支持原生FP8和PyTorch 250摩尔线程发布Tch-MUSA v200
栏目:韦德体育app 发布时间:2025-05-20

  韦德体育,韦德官方网站,韦德网站,bevictor伟德官网,bevictor,韦德体育app,韦德官网入口,韦德网址,韦德体育网址,韦德体育下载,韦德体育app下载,韦德体育客户端,betvictor韦德,韦德体育平台,韦德体育世界杯,韦德体育bevictor,韦德体育注册网址,韦德体育网址最新,韦德体育靠谱吗作为本次升级的核心亮点,Torch-MUSA v2.0.0率先在国产GPU上实现了对FP8数据类型的完整支持。FP8是当前AI计算的一种前沿低精度格式,在支持原生FP8的GPU上,大语言模型(LLM)训练采用FP8混合精度可大幅提高GPU算力,显著降低显存占用。摩尔线程基于新一代 MUSA Compute Capability 3.1 计算架构的全功能 GPU 原生支持 FP8 计算,这为 Torch-MUSA v2.0.0 实现 FP8 矩阵乘法和分布式通信优化提供了坚实的基础。依托这一底层架构优势,Torch-MUSA v2.0.0 能够充分发挥 FP8 的计算效能,显著提升大语言模型训练和推理的效率。

  在Torch-MUSA中,用户只需指定torch.device(musa),即可轻松将现有的PyTorch模型迁移到MUSA架构的GPU上运行,无需大幅修改代码。Torch-MUSA完全兼容PyTorch的自动微分和动态图机制,支持多种常用的神经网络模块及优化算法,并加速了关键深度学习算子的计算。此外,Torch-MUSA还支持多种PyTorch特性,包括DDP、JIT、FSDP、Profiler、Extension等。