阿里巴巴通义千问团队正式发布 Qwen3.6 系列首款密集开源模型 Qwen3.6-27B。该模型采用 Apache 2.0 许可证,在多项智能体编码基准测试中表现亮眼,部分成绩超越参数量更大的 Qwen3.5-397B-A17B MoE 模型。其中,SWE-bench Verified 得分达 77.2,Terminal-Bench 2.0 得分 59.3,与 Claude 4.5 Opus 持平。
Qwen3.6-27B 针对前端工作流与代码库级推理进行专项优化,并引入“思维保留”(Thinking Preservation)机制,支持在多轮对话中保留历史推理轨迹,有效降低冗余计算并提升 KV 缓存效率。架构上,模型采用 Gated DeltaNet 线性注意力与传统自注意力相结合的混合设计,配合多令牌预测(MTP)实现推测解码。原生上下文窗口为 262K tokens,经 YaRN 扩展最高支持 1M tokens。目前,BF16 与 FP8 双版本权重已同步上线 Hugging Face。