返回行业动态

智谱发布GLM-5.1高速版API,输出速度达400 tokens/s

2026/05/22 02:17
查看原文

OmniTools 5月22日消息,5月22日,智谱向部分企业客户正式推出旗舰大模型GLM-5.1的高速版API“GLM-5.1-highspeed”。该版本实测输出速度达400 tokens/s,刷新全球大模型API速度纪录。

该版本首次在国产大模型中实现旗舰级能力与低延迟的统一,突破了“高速即轻量”的传统认知。技术由智谱GLM团队与TileRT团队联合完成,通过系统级优化保障生产环境下的稳定性。

新API适用于AI编程、实时语音交互等对响应速度要求较高的场景。