返回行业动态

Z.ai 发布开源大模型 GLM-5.2:744B 参数、1M 上下文窗口

2026/06/23 00:23
查看原文

OmniTools 6月23日消息,Z.ai 正式发布开源大模型 GLM-5.2,总参数量达 744B(活跃参数约 40B),支持 100 万 token 上下文窗口。官方称其综合性能与 Claude 4.8 Opus、GPT-5.5 及 Gemini 3.1 Pro 相当。

该模型通过 Unsloth 实现动态量化,2-bit GGUF 版本内存占用降至 239GB(较原版降低 84%),1-bit 版本进一步降至 217GB(降低 86%),可在配备 256GB 统一内存的 Mac 或单张 24GB GPU 搭配 256GB 内存的设备上本地运行。

GLM-5.2 提供非思考、高、最大三种推理模式。评测数据显示,动态 1-bit 量化版本准确率约为 76.2%,2-bit 版本约为 82%。