智谱发布GLM-5.1高速版API，输出速度达400 tokens/s

OmniTools 5月22日消息，5月22日，智谱向部分企业客户正式推出旗舰大模型GLM-5.1的高速版API“GLM-5.1-highspeed”。该版本实测输出速度达400 tokens/s，刷新全球大模型API速度纪录。

该版本首次在国产大模型中实现旗舰级能力与低延迟的统一，突破了“高速即轻量”的传统认知。技术由智谱GLM团队与TileRT团队联合完成，通过系统级优化保障生产环境下的稳定性。

新API适用于AI编程、实时语音交互等对响应速度要求较高的场景。