返回行业动态

全球首个基于昇腾910B全栈训练的1.58比特开源大模型BitCPM-CANN发布

2026/05/22 15:11
查看原文

OmniTools 5月22日消息,ModelBest、清华大学与OpenBMB社区联合发布BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU完成全栈训练的开源1.58比特三元大模型。该模型采用仅含三种权重状态的极低比特量化技术,内存占用较BF16格式降低约6倍,支持在手机、电脑及车载设备等边缘端高效部署。

其关键突破在于训练全栈(包括量化算子、框架层)均在昇腾平台原生构建与验证,而非对现有方案进行移植适配。BitCPM-CANN模型家族覆盖0.5B至8B参数规模,在多项基准测试中保持全精度模型95%–97%的性能水平。