OmniTools 6月15日消息,AI HOT 精选 6月15日消息,MiniMax 近日开源了总参数量 428B、激活参数 23B 的 M3 模型权重,并同步发布 MiniMax Sparse Attention(MSA)技术论文。该架构旨在显著降低长上下文场景下的计算成本。
M3 是首个在预训练阶段即支持文本与图像等多模态数据交错混合训练的开源模型。发布两周后,其在 Artificial Analysis 综合智能指数、GDPval-AA 排行榜均位列开源模型第一;在 Code Arena WebDev 测试中进入帕累托最优序列;在 Vals.AI 榜单中居国产模型首位。
模型输出速度已从约 30 TPS 提升至约 80 TPS,官方表示计划再提速 30%–40%;Token Plan 后台已新增调用量看板功能。