6 月 8 日 WWDC 的主流解读在数小时内便定型:Apple 将 “Siri AI” 绑定到 Google 的 Gemini 模型,等于公开承认自己在人工智能领域落后。无论是法国媒体还是美国媒体,大多都沿用了这一框架。这个说法并非完全错误,但它忽略了协议真正的运行机制——而这套机制值得拆开来看,因为它决定了这里所谓的“依赖”究竟意味着什么。
Apple 具体宣布了什么
“Siri AI” 是对这款助手的全面重构:支持多轮对话、理解屏幕上显示的上下文、并可跨应用执行操作。它建立在新一代 Apple Intelligence 之上,Apple 也在 keynote 中确认,它将结合自家的 Apple Foundation Models(AFM)以及 Google 的 Gemini 模型。随后,Google 还面向 Apple 生态开发者发布了博文《Bringing the latest Gemini models to Apple developers》,正式确认了这项协议的平台层面内容。
老师不等于引擎
这里正是“Apple 运行在 Gemini 上”这一说法需要修正的地方。根据包括 AppleInsider 在内的技术信息,第三代 AFM 在运行时并不嵌入任何 Gemini 代码。Gemini 只在两个不同层面发挥作用:一是在 AFM 训练阶段作为“老师”模型——通过蒸馏方式,由大模型生成小模型的训练数据和学习信号;二是在云端作为单独调用的模型,用于处理超出本地能力范围的请求。
这种区分并不是细枝末节。训练层面的依赖是一次性的,而且是可逆的:下一代更换“老师”只是采购决策。相比之下,推理层面的依赖会在每一次用户请求中持续影响隐私、延迟和成本。Apple 把第一种依赖留在设备端,同时接受了第二种依赖进入云端——这两种选择性质完全不同,而“依赖”这个词把它们压缩成了同一种含义。
基础设施:协议的另一层
据 The Information 报道,部分云端推理可能运行在托管于 Google 的 Nvidia Blackwell B200 芯片上——这一信息尚未得到 Apple 确认。如果属实,这将意味着一个值得注意的转向:Apple 之所以打造 Private Cloud Compute,正是为了使用自研芯片,以便将推理链路牢牢置于自身控制之下。若 Siri 请求在 Google 数据中心里的 Nvidia 硬件上运行,即便是在合同约束下,也会改变这种控制边界。
欧洲还要再等等
最后一层是监管层面:Siri AI 在上线初期不会在欧盟地区登陆 iPhone 和 iPad(iOS 27 与 iPadOS 27),但会先出现在 macOS 27 和 visionOS 27 上。Apple 将原因归咎于 DMA,认为监管机构的解释会要求第三方 AI 系统获得对设备几乎不受限制的访问权限,而缺乏足够的安全防护。“我们对欧洲用户在新软件版本发布时无法在 iPhone 或 iPad 上使用 Siri AI 深感失望,”Craig Federighi 表示,但并未给出欧盟地区的任何时间表。
总体来看,Apple 与 Google 的协议与其说是投降,不如说是一种分层式让步:Apple 仍掌握设备端模型的控制权,将前沿训练外包,同时在云端推理上让出部分阵地。真正决定后续走向的,不是蒸馏,而是云端推理。
