返回行业动态

苹果WWDC将推Siri及设备端AI升级,本地运行Gemini蒸馏模型

2026/05/31 12:35
查看原文

OmniTools 5月31日消息,苹果将于下月WWDC重点展示延迟已久的Siri与设备端AI能力升级。核心方案是在iPhone芯片上本地运行经Google Gemini蒸馏优化的轻量级模型,以兼顾响应延迟、用户隐私与token成本控制。

该技术栈存在显著外部依赖:本地模型基于Gemini蒸馏而来;超出设备算力的复杂查询将路由至Google Cloud处理;机密计算环节采用Nvidia相关技术。苹果正寻求小型设备端AI初创公司合作,以加速模型压缩与适配工作。

此外,苹果2024年提出的Private Cloud Compute方案原计划全部基于自研芯片运行完整Gemini模型,因算力限制已调整为部分任务迁移至谷歌云,但方案名称保持不变。