6월 8일 WWDC에 대한 지배적인 해석은 몇 시간 만에 굳어졌다. Apple이 «Siri AI»를 Google의 Gemini 모델에 기대게 되면서, 인공지능 분야에서의 뒤처짐을 사실상 인정했다는 것이다. 프랑스와 미국 주요 언론이 널리 되풀이한 이 프레이밍은 틀린 말은 아니다. 하지만 이 해석은 합의의 실제 작동 방식, 그리고 여기서 «의존»이 무엇을 의미하는지 규정하는 핵심 메커니즘을 놓치고 있다. 그 메커니즘은 분해해 볼 가치가 있다.
Apple이 발표한 것
«Siri AI»는 비서 기능의 전면 개편이다. 다중 턴 대화, 화면에 표시된 컨텍스트 반영, 앱을 가로지르는 작업 실행을 지원한다. 이는 새로운 세대의 Apple Intelligence를 기반으로 하며, Apple은 기조연설에서 자체 Apple Foundation Models(AFMs)에 더해 Google의 Gemini 모델을 활용한다고 확인했다. 이어 Google은 Apple 생태계 개발자를 위한 게시물, «Bringing the latest Gemini models to Apple developers»를 공개하며 이 협약의 플랫폼 측면을 공식화했다.
교수는 엔진이 아니다
바로 여기서 «Apple이 Gemini로 구동된다»는 해석은 수정이 필요하다. 특히 AppleInsider가 정리한 기술적 요소에 따르면, 3세대 AFM에는 실행 시 Gemini 코드가 전혀 탑재되지 않는다. Gemini는 두 단계에서만 개입한다. 하나는 AFM 학습 과정에서의 «교수» 역할이다. 즉 distillation(증류) 방식으로, 대형 모델이 소형 모델을 위한 학습 데이터와 신호를 생성한다. 다른 하나는 cloud 모델로서, 탑재형 기능을 넘어서는 요청에 대해 별도로 호출되는 경우다.
이 구분은 사소한 디테일이 아니다. 학습 단계의 의존성은 일회성이고 되돌릴 수 있다. 다음 세대에서 교수를 바꾸는 것은 구매 결정에 가깝다. 반면 inference 의존성은 각 사용자, 각 요청마다 기밀성, 지연 시간, 비용을 수반한다. Apple은 온디바이스 영역에서는 첫 번째 선택지를 유지했고, cloud에서는 두 번째를 받아들였다. 이 둘은 성격이 전혀 다른데, «의존»이라는 단어는 그 차이를 지워버린다.
인프라, 또 하나의 층위
The Information에 따르면 cloud inference의 일부는 Google이 호스팅하는 Nvidia Blackwell B200 칩에서 실행될 수 있다고 한다. 다만 이 정보는 Apple이 확인한 바 없다. 사실이라면 이는 상당한 변화다. Apple은 inference 체인을 통제하기 위해 Private Cloud Compute를 자사 실리콘 기반으로 구축해 왔다. 그럼에도 계약 하에 Google의 data center에서 Nvidia 기반으로 Siri 요청을 처리한다면, 통제의 경계가 이동하는 셈이다.
유럽은 기다려야 한다
마지막 층위는 규제다. Siri AI는 iPhone과 iPad의 출시 시점(iOS 27 및 iPadOS 27)에는 European Union에서 제공되지 않지만, macOS 27과 visionOS 27에는 도입될 예정이다. Apple은 DMA를 이유로 들며, 규제 당국의 해석상 third-party AI 시스템에 충분한 안전장치 없이 기기에 사실상 무제한에 가까운 접근 권한을 열어줘야 할 수 있다고 주장한다. Craig Federighi는 «새로운 소프트웨어 버전 출시 시점에 유럽 사용자들이 iPhone이나 iPad에서 Siri AI를 이용할 수 없게 된 점에 깊이 실망했다»고 말했지만, EU에 대한 구체적인 일정은 제시하지 않았다.
종합하면, Apple-Google 합의는 항복이라기보다 일종의 포기 계층을 보여준다. Apple은 온디바이스 모델에 대한 주도권을 유지하고, 최첨단 학습은 외부에 맡기며, cloud inference에서는 일부 영역을 내준다. 이후의 향방은 바로 이 마지막 지점, 즉 distillation이 아니라 inference에서 결정될 것이다.
