返回工具研究所
选型指南原创9 分钟阅读

Siri独立成App,苹果AI终于不再只做“润色工具”

一次跳票赔了2.5亿美元之后,苹果把Siri做成了一个独立App,能跨应用帮你摘验证码、改密码、盯着网页降价。这次WWDC的AI更新密度前所未有,但问题同样摆在明面上:硬件门槛卡住了大量老用户,第三方App适配还是一片未知。

2026/06/09

十年后,Siri终于从系统浮层里走了出来。

6月8日的WWDC上,苹果预览了iOS 27、macOS 27等新一代操作系统,几乎所有的软件更新都指向同一件事:AI正在从辅助功能变成系统级的交互入口。最显眼的变化是Siri从一个呼之即来的语音浮窗,变成了一个拥有独立图标的App,支持iCloud同步对话历史,形态上第一次向ChatGPT这类独立AI应用看齐。

上一代Apple Intelligence把Siri限制在系统层的被动响应里。它能帮你润色文字、总结通知,但没法跨应用办事,也记不住你上回问过什么。这一次,苹果试图把Siri从一个“听得懂你”的助手,升级为一个“能替你动手”的代理。这场AI更新的辐射面远不止Siri本身。从相册的空间重构修图,到Safari自动帮你盯商品降价,再到密码管理应用替你登录网站并改掉弱密码,系统角落里几乎到处是新的AI能力。

Siri有了独立入口,对话终于能记住上下文

Siri变成独立App,首先要解决的是“用户去哪找AI”这个问题。

过去,Siri的入口分散在语音唤醒、侧边按钮和锁屏长按之间,缺少一个固定的视觉锚点。ChatGPT和Gemini以独立App形态占据用户桌面之后,Siri的无形状态反而成了一种劣势:用户不知道它到底能做什么,也不习惯反复打开一个没有界面的工具。

有了独立App和对话历史iCloud同步,体验完全不同了。用户在iPhone上让Siri分析一份合同的关键条款,中午在Mac上继续追问细节,Siri能记住上下文。这建立了一个长会话资产,也让Siri在功能认知上更接近“一个能持续对话的AI”,而非“一个回答单次问题的语音工具”。

底层驱动引擎也换了。Wired和多家科技媒体在现场确认,苹果已启动第三代Apple Foundation Models,并与Google Gemini达成了多年深度合作,利用Gemini技术定制开发下一代模型。2024年WWDC时,苹果的合作方还是OpenAI,Siri可以在特定场景下调用ChatGPT。两年后,合作伙伴名单上加入了Google。苹果在基座模型上不再单一依赖某家第三方,选择了一条更灵活的多方定制路径。

从“帮你查一下”到“帮你办妥”

上一代Apple Intelligence的核心能力是理解和生成内容。它能总结长消息、重写邮件语气、从照片库里找出特定图片。但它无法跨应用做事。这是两代产品之间最根本的分界线。

新版Siri AI通过App Intents框架和Spotlight个人数据索引,实现了跨应用上下文理解和任务执行。苹果官网给出了几个典型场景:Siri能从邮件里提取酒店预订确认号,从信息App里找到朋友推荐过的餐厅并直接预订,甚至在通话过程中自动从邮件里抓取验证码显示在Phone应用界面上。

这个名为Call Context的功能让用户不需切屏、不需手动搜索,Siri在通话界面直接弹出需要的那串数字。它解决的是一个具体且高频的痛点:接电话时需要同时查看短信或邮件里的信息,手忙脚乱。

密码管理App的升级同样指向这一点。新版Passwords不仅能检测弱密码和重复密码,还能代理用户自动导航至对应网站、完成登录,然后生成一串强密码并保存。改密码这件事的繁琐程度众所周知,大部分用户选择不改。苹果把这件事交给AI代理去做,降低的是用户的安全维护成本。

Safari也塞进了类似的能力。新增的Notify Me功能可以监控指定网页的变更,比如某件商品降价、某个页面补货,然后主动推送通知。用户在后台等就行,不用隔三差五手动刷新。另一个更彻底的功能是用自然语言描述需求,让AI直接生成一个自定义浏览器插件。用户说“帮我把这个网页里所有表格自动高亮显示金额超过500的行”,Safari就会生成对应插件来完成这件事。这等于给普通用户开了一条零代码定制浏览器的通道。

Shortcuts快捷指令应用也获得了同样的自然语言化改造。“Describe a Shortcut”允许用户只写一句“每天早上8点自动播报今天的日历安排和天气”,AI就能自动组装出对应的快捷指令步骤。这些改动指向同一个目标:把原本只有高级用户或开发者才会用的系统功能,压到普通用户说一句话就能搞定的门槛。

相机装上Siri,扩图和透视重构一起进相册

Visual Intelligence在本次更新中大幅扩展了覆盖范围。相机应用里新增了一个“Siri模式”,用户可以对准餐厅账单让Siri算出AA每人多少钱,Siri识别图片内容后直接通过Apple Cash发起分账请求。对准一本书查评价,对准食物显示营养成分,这些场景和Google Lens多年来的功能路径高度重合。

区别在于苹果把这个视觉理解能力铺到了更多设备上。iPad截图后可以直接用Siri分析,Mac上通过快捷键调起,Vision Pro也能调用。相机不再是唯一入口,苹果在构建的是一个覆盖所有设备的通用视觉理解层。

相册应用也拿到了两个基于AI的新功能:Spatial Reframing空间重构透视和Extend扩图。扩图即AI在照片边缘自动生成扩展内容。Spatial Reframing则有实质差异,它利用空间计算模型来改变照片的透视关系,不是简单裁切或拉伸,而是重新计算画面中物体的前后关系。苹果在发布会上用一张侧面拍摄的建筑照片做了演示,经过处理后画面变成了正面正视的角度。目前官方尚未公布该功能对非建筑类场景的处理效果,但从技术路径看,这比普通生成式扩图多了一步空间理解的计算。

Image Playground的升级则是另一个维度。第一代只能生成卡通风格或插画风格的图像,这次直接支持了照片级真实图像生成。由于对算力要求较高,苹果把它放在了Private Cloud Compute云端运行,而非设备端。每生成一张图片都会强制嵌入SynthID隐形水印,用于标识AI生成内容。同时该功能设置了每日使用限制,具体配额在正式版中会随iCloud+订阅方案有差异,目前尚未披露具体数字。

硬件门槛和地区限制是绕不过去的现实

AI功能的支持范围远比系统更新的支持范围窄。

iOS 27的兼容设备从iPhone 11起步,但Apple Intelligence和Siri AI的核心功能仅限iPhone 15 Pro及以上机型、M1及以上芯片的iPad和Mac。部分更高级的功能,比如更具表现力的语音和高阶听写,还需要更新的硬件:iPhone Air、iPhone 17 Pro系列,或者12GB以上统一内存的M4 iPad和M3 Mac。

地区限制同样严格。受欧盟《数字市场法案》影响,Siri AI在欧盟地区的iOS和iPadOS上暂不可用。中国大陆则因监管要求暂不支持Apple Intelligence。照片级图像生成这类基于PCC云端的AI功能,在有地区限制的市场也一并被锁。对于长期习惯苹果全球统一体验的用户来说,这种按地区和设备双重切割功能的做法可能会带来困惑。

苹果AI这一年:跳票交了学费,合作名单换了

2024年WWDC,苹果首次推出Apple Intelligence概念时,Siri被描绘成一个能深度理解个人数据并跨应用执行任务的智能助手。但这些功能随后数次推迟交付,用户发起虚假宣传集体诉讼,苹果最终支付了2.5亿美元和解金。

这段经历直接影响了本次发布的内容密度和承诺谨慎程度。一年前画过的饼,现在必须端上桌。

整个2025年,苹果在消费级AI功能的发布上明显放慢了节奏,外界将其称为苹果AI的“Gap Year”。期间,苹果重新调整了AI部门的组织架构,为2026年的集中大改版做内部准备。据Yahoo Finance报道,苹果2026年的资本支出计划为140亿美元。和亚马逊、微软动辄数千亿美元的AI基础设施开支相比,这个数字显得克制。苹果不参与算力军备竞赛,依赖自有芯片生态和端侧计算来做差异化。

最值得注意的变化是合作伙伴的转向。2024年Siri接入的外部模型是OpenAI的ChatGPT,到了2026年,苹果与Google Gemini建立多年深度合作,利用Gemini技术定制开发下一代Apple Foundation Models。这种从单一合作到多方并行、从直接调用到深度定制的路径变化,反映出苹果在基座模型上不再愿意绑死在单独一家第三方身上。对用户来说,这意味着Siri背后的模型能力来源更加多元,也有可能在特定任务上切换不同模型的长处。