返回行业动态

TechCrunch:AI推理成本攀升,企业正加速转向高性价比小模型

2026/06/09 18:59
查看原文

OmniTools 6月10日消息,随着AI推理成本持续上升,科技公司正重新评估模型选型策略,开始测试并部署成本更低的AI模型。Coinbase联合创始人Brian Armstrong预测,未来12至18个月内,约80%的AI工作负载将迁移至价格低99%的模型,仅20%对智能要求极高的关键任务仍需依赖最新一代前沿模型。

法律AI工具Harvey近期与推理平台Fireworks AI的合作测试显示,在混合调度Claude Opus与GLM 5.1模型的前提下,推理成本降低3倍且输出质量未受影响。Harvey联合创始人Gabe Pereyra指出,行业对“质量”的定义正从“盲目使用最强模型”转向“以最高效率获取正确结果”。

该趋势的核心并非开源与闭源之争,而是大模型与小模型的经济性分野。若企业大规模转向小模型,将显著抑制前沿模型的推理需求,并对OpenAI、Anthropic等正筹备IPO的头部实验室的财务模型构成挑战。