OmniTools 5月13日消息,商汤科技正式发布 SenseNova-U1 技术报告,系统阐述原生多模态模型构建方法,涵盖原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练,以及原生混合专家骨干网络等核心技术。
报告详细披露了六阶段训练方案,并包含强化学习后训练与模型蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构,仅激活 30 亿参数,在保障性能的同时显著提升推理效率。
目前,技术报告、模型权重、训练代码及在线演示平台已全面公开。
OmniTools 5月13日消息,商汤科技正式发布 SenseNova-U1 技术报告,系统阐述原生多模态模型构建方法,涵盖原生多模态统一建模、无损视觉接口、联合自回归与像素空间流匹配训练,以及原生混合专家骨干网络等核心技术。
报告详细披露了六阶段训练方案,并包含强化学习后训练与模型蒸馏的完整实践指南。其开源版本 SenseNova-U1-A3B-MoT 基于混合专家架构,仅激活 30 亿参数,在保障性能的同时显著提升推理效率。
目前,技术报告、模型权重、训练代码及在线演示平台已全面公开。