Nowy model

Siri AI: Gemini jako nauczyciel, nie jako silnik — czego nie powiedziało WWDC

Prasa skupiła się na przyznaniu przez Apple zależności od Google. Rzeczywisty mechanizm porozumienia — distillation podczas trenowania z jednej strony, inferencja w chmurze z drugiej — opowiada jednak bardziej zniuansowaną i ciekawszą historię.

STStephane Nachez · ·3 min
Siri AI: Gemini jako nauczyciel, nie jako silnik — czego nie powiedziało WWDC
Visuel d'illustration généré par l'IA
Sommaire

Dominująca interpretacja WWDC z 8 czerwca ugruntowała się w ciągu kilku godzin: opierając „Siri AI” na modelach Gemini od Google, Apple miałoby przyznać się do opóźnienia w obszarze sztucznej inteligencji. Ten obraz, powielany przez większość francuskiej i amerykańskiej prasy, nie jest fałszywy. Pomija jednak rzeczywistą mechanikę porozumienia — a ta mechanika zasługuje na rozłożenie na czynniki pierwsze, ponieważ to ona przesądza o tym, co w tym kontekście oznacza „zależność”.

Co ogłosiło Apple

„Siri AI” to kompleksowa przebudowa asystenta: rozmowy wieloturowe, uwzględnianie kontekstu widocznego na ekranie, wykonywanie działań między aplikacjami. Rozwiązanie opiera się na nowej generacji Apple Intelligence i — jak potwierdziło Apple podczas keynote — na modelach Gemini od Google, uzupełniających własne Apple Foundation Models (AFM). Google opublikowało następnie wpis skierowany do deweloperów ekosystemu Apple, „Bringing the latest Gemini models to Apple developers”, formalizując platformowy aspekt umowy.

Nauczyciel to nie silnik

To właśnie tutaj interpretacja „Apple działa na Gemini” wymaga korekty. Zgodnie z ustaleniami technicznymi wskazywanymi m.in. przez AppleInsider, modele AFM trzeciej generacji nie zawierają żadnego kodu Gemini w czasie wykonywania. Gemini pojawia się na dwóch odrębnych poziomach: jako model „nauczycielski” podczas trenowania AFM — w procesie distillation, w którym duży model generuje dane i sygnały uczenia dla mniejszego — oraz jako model chmurowy, uruchamiany osobno dla zapytań wykraczających poza możliwości urządzenia.

To rozróżnienie nie jest detalem. Zależność na etapie trenowania jest punktowa i odwracalna: zmiana nauczyciela przy kolejnej generacji modeli to decyzja zakupowa. Zależność w inferencji angażuje natomiast prywatność, opóźnienia i koszty przy każdym zapytaniu każdego użytkownika. Apple zachowało kontrolę nad pierwszym elementem na urządzeniu, a zaakceptowało drugi w chmurze — to dwa różne wybory, które słowo „zależność” spłaszcza do jednego poziomu.

Infrastruktura, czyli drugi poziom umowy

Według The Information, część inferencji cloud miałaby działać na układach Nvidia Blackwell B200 hostowanych w Google — informacji tej Apple nie potwierdziło. Jeśli się potwierdzi, będzie to istotny zwrot: Apple zbudowało Private Cloud Compute na własnym krzemie właśnie po to, by utrzymać łańcuch inferencji pod kontrolą. Uruchamianie zapytań Siri na Nvidia w centrach danych Google, nawet na podstawie umowy, przesuwa granicę tej kontroli.

Europa poczeka

Ostatni poziom jest regulacyjny: Siri AI nie będzie dostępne w Unii Europejskiej w dniu premiery na iPhone i iPad (iOS 27 oraz iPadOS 27), podczas gdy pojawi się na macOS 27 i visionOS 27. Apple wskazuje na DMA, twierdząc, że interpretacja regulatorów wymagałaby otwarcia systemom AI firm trzecich niemal nieograniczonego dostępu do urządzenia, bez wystarczających zabezpieczeń. „Jesteśmy głęboko rozczarowani, że nasi europejscy użytkownicy nie otrzymają Siri AI na iPhone lub iPad wraz z premierą naszych nowych wersji oprogramowania” — powiedział Craig Federighi, nie podając żadnego harmonogramu dla UE.

W sumie porozumienie Apple-Google rysuje się mniej jako kapitulacja, a bardziej jako hierarchia ustępstw: Apple zachowuje kontrolę nad modelem uruchamianym na urządzeniu, zleca zewnętrznie najbardziej zaawansowane trenowanie i oddaje część pola w inferencji cloud. To właśnie na tym ostatnim poziomie — a nie na distillation — rozegra się dalszy ciąg.

ST
Stephane Nachez
subscriber

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.