Beklendiği gibi, Google I/O 2025 duyurularının merkezinde yapay zeka vardı: Gemini 2.5, Veo 3 ve Imagen 4 modellerinin güncellemeleri, arama motoru için AI Mode... Google, yapay zekayı ve Gemini'yi ürünlerinin kalbine yerleştiriyor.
Gemini 2.5 Ailesi
Mart ayında piyasaya sürülen Gemini 2.5 Pro, Deep Think olarak adlandırılan gelişmiş bir muhakeme modu ile donatıldı. Bu mod, modele matematik veya programlama gibi karmaşık görevler için daha fazla hesaplama döngüsü ayırma ve bir yanıt formüle etmeden önce birden fazla hipotezi keşfetme yeteneği kazandırır.
Nisan ayında tanıtılan Gemini 2.5 Flash, geliştiricilere düşünmeyi etkinleştirme veya devre dışı bırakma imkanı tanıyan hibrit bir muhakeme modelidir ve maliyet, performans ve gecikme arasında optimal bir denge sunmak için tasarlanmıştır. Google, muhakeme, kod yönetimi, çok modlu işleme ve geniş bağlamların anlaşılması konularında iyileştirmeler ve iç değerlendirmelerine göre token tüketiminde %20 ila %30 oranında azalma duyurdu.
İki model de yeni özelliklerden faydalanıyor: daha doğal bir konuşma deneyimi için API aracılığıyla yerel ses çıkışı, gelişmiş güvenlik önlemleri ve Project Mariner'ın AI agent bilgisayar kullanma yetenekleri.
AI Mode Dağıtımı
Google, I/O 2024 etkinliğinde tanıtılan ve yakın zamanda yükseltilen AI Overviews'in ardından, daha derinlemesine keşif, karşılaştırmalar ve nüanslı muhakeme gerektiren sorular için Amerika Birleşik Devletleri'nde AI Mode'un dağıtımını duyurdu.
Gerçek zamanlı kaynaklara ve bilgilere erişim sağlayan optimize edilmiş bir Gemini 2.5 modeli tarafından desteklenen AI Mode, "query fan-out" veya istek dağıtım tekniğine dayanır. Yapay zeka, sorulan soruyla ilgili farklı konular üzerinde çeşitli veri kaynaklarını kullanarak aynı anda birden fazla araştırma başlatır ve bu araştırmaların sonuçlarını toplayarak alıntı yapılan web sayfalarına hiper bağlantılar ile yapılandırılmış bir yanıt sunar. Kullanıcılar dilerlerse takip istekleriyle araştırmalarını daha da özelleştirebilirler.
Project Starline Gelişiyor ve Google Beam Oluyor
Google Beam, 3D görüşme sağlamak için ışık alanı ekranı, altı kamera ile hacimsel yakalama, uzaysal ses ve gerçek zamanlı yapay zeka işlemesi gibi ileri teknolojiler kullanır. Bu yaklaşım, baş hareketlerinin daha fazla doğrulukla 60 kare/saniye hızında görüntülenmesini sağlayarak daha gerçekçi konuşmalar sunar ve kask veya gözlük gibi taşınabilir cihazlar gerektirmez. Başlangıçta bu teknoloji hacimli prototiplerle sınırlıydı, ancak HP ile iş birliği içinde geliştirilen daha kompakt sistemlere entegre edilmek üzere küçültüldü.
Google, Meet'e de entegre ettiği gerçek zamanlı sesli çeviri özelliği ile kullanıcıların sesini, tonunu ve ifadelerini koruyarak çok dilli sorunsuz konuşmalar yapılmasını sağlıyor.
