OmniTools 5月26日消息,商汤科技正式开源SenseNova U1大模型的完整训练代码库。该代码库支持其8B参数密集模型与A3B MoE架构,采用统一框架,可同时开展文本到图像生成、图像编辑、交错生成及文本 视觉理解等多模态多任务训练。 工程层面专为大规模训练设计,支持混合并行、流式可恢复数据管线、环境变量驱动配置,并兼容从单机8 GPU至多节点集群的弹性扩展部署。相关代码已发布于GitHub,采用Apache 2.0开源协议。