OmniTools 6月23日消息,Z.ai 正式发布开源大模型 GLM-5.2,总参数量达 744B(活跃参数约 40B),支持 100 万 token 上下文窗口。官方称其综合性能与 Claude 4.8 Opus、GPT-5.5 及 Gemini 3.1 Pro 相当。
该模型通过 Unsloth 实现动态量化,2-bit GGUF 版本内存占用降至 239GB(较原版降低 84%),1-bit 版本进一步降至 217GB(降低 86%),可在配备 256GB 统一内存的 Mac 或单张 24GB GPU 搭配 256GB 内存的设备上本地运行。
GLM-5.2 提供非思考、高、最大三种推理模式。评测数据显示,动态 1-bit 量化版本准确率约为 76.2%,2-bit 版本约为 82%。