返回行业动态

商汤发布 SenseNova-U1 技术报告并开源 30 亿参数多模态模型

2026/05/13 06:52
查看原文

OmniTools 5月13日消息,商汤科技正式发布 SenseNova-U1 技术报告,系统阐述原生多模态模型构建方法,涵盖原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练,以及原生混合专家骨干网络等核心技术。

报告详细披露了六阶段训练方案,并包含强化学习后训练与模型蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构,仅激活 30 亿参数,在保障性能的同时显著提升推理效率。

目前,技术报告、模型权重、训练代码及在线演示平台已全面公开。