Kurumsal yapay zekâda asıl zorluk artık model değil, onun işletimi

Haziran 2026’da şirketler için en önemli sinyal, bir LLM’in daha piyasaya çıkması ya da benchmark savaşları değil. Google Cloud, AWS, Microsoft ve Databricks’te görülen gerçek kırılma başka bir yerde: MLOps, dört kritik başlığın aynı anda öne çıktığı bir ajan işletim disiplinine dönüşüyor - iş bağlamı, yönetişim, gözlemlenebilirlik ve birim çıkarım maliyeti. Tüm büyük oyuncular duyurularını runtime, kimlik, gateway’ler, bellek, izlenebilirlik ve sürekli değerlendirme etrafında yeniden düzenlediğinde, bunun bir trend etkisi olmadığı açıktır; bu bir katman değişimidir.

Başka bir deyişle: 2024’te asıl soru hangi modelin seçileceğiydi; 2026’da ise üretime geçişi belirleyen soru, bağlamı, izinleri, izleri, maliyetleri ve tedarikçiyi değiştirme kabiliyetini kimin kontrol ettiği. Microsoft bunu neredeyse açıkça söylüyor: darboğaz artık modellerin kapasitesi değil, şirketin paylaşılan bağlamı. Databricks ise görünür ajan döngüsünün işin yalnızca küçük bir kısmı olduğunu, geri kalanının güvenlik, dağıtım, izleme, maliyet ve kalite gibi gizli bir teknik borçtan oluştuğunu açıklıyor. AWS artık üretim izlerinden sürekli iyileştirmeye odaklanıyor. Google ise ajanları inşa etmek, dağıtmak, yönetişimini sağlamak ve optimize etmek için eksiksiz bir platform sunuyor.

Yapay zekâ cloud’a girmiyor; cloud, yeniden yapay zekânın işletim sistemi haline geliyor.

Tüm sağlayıcılarda görülen kırılma

Bu bahar ve Haziran ayındaki duyuruların ortak noktası çarpıcı. Google Cloud, Gemini Enterprise Agent Platform’u ajanları oluşturmak, ölçeklemek, yönetişimini sağlamak ve optimize etmek için tasarlanmış bir platform olarak lanse etti; model seçimi, entegrasyon araçları, DevOps, orkestrasyon ve güvenliği tek bir katmanda topladı. Google Cloud Next ’26’da ayrıca graph tabanlı bir Agent Developer Kit ve büyük ölçekte ajan oluşturmak, test etmek ve yayınlamak için Agent Studio öne çıkarıldı.

Microsoft tarafında Build 2026 mesajı neredeyse daha az açık değil. Şirket, sorunun artık model gücü değil, iş sistemlerinde hareket etmesi gereken ajanlara tutarlı bir veri bağlamı sunabilme yeteneği olduğunu söylüyor. Build 2026’nın resmi sayfası da ana duyurular arasında, “observability to ROI for AI agents” ile taşınabilir ajan yönetişimi ve Foundry’nin büyük ölçekte dağıtım ve çalıştırılmasına kadar uzanan bileşenleri öne çıkarıyor.

AWS cephesinde Bedrock AgentCore, endüstriyel işletim mantığına geçti. 18 Haziran 2026 tarihli yeni optimizasyon yetenekleri duyurusunda odak, ajan üretmekten çok; üretim izlerinin ne olduğunu anlamak, bozulmaları düzeltmek ve düzeltmelerin sistemi gerçekten iyileştirdiğini kanıtlamak üzerine kuruluyor. AWS, en büyük riski de oldukça net tarif ediyor: en tehlikeli arızalar hata döndürenler değil, ancak sonradan müşteri şikâyetlerinde ortaya çıkan sessiz başarısızlıklar.

Databricks de aynı okuma biçimini farklı kelimelerle savunuyor. DAIS 2026 yazısında editör, ajan döngüsünün yalnızca görünür “%1” olduğunu, geri kalan “%99”un dağıtım, token kapasitesi, güvenlik, değerlendirme, gözlemlenebilirlik, bağlam ve paylaşım işlerinden oluştuğunu söylüyor. Buradaki en ilginç nokta ürün duyurusundan ziyade çerçeveleme: Databricks’e göre pazar problemi artık bir ajan demosu yapmak değil, güvenilir bir ajan sistemi işletmek.

Bir karar verici için ders basit: Google, AWS, Microsoft ve Databricks kendi dilleriyle aynı yapı taşlarına - runtime, kimlik, bellek, gateway, tracing, scoring, yönetişim - doğru yaklaşıyorsa, bu artık “POC + hype” döngüsünden çıkıp mimari döngüsüne girildiği anlamına gelir. Dolayısıyla MLOps’un ağırlık merkezi modelden işletim zincirine kayıyor.

Neden MLOps, AgentOps’a dönüşüyor?

Bu kayma teknik yığının doğasını da değiştiriyor. Klasik bir MLOps yaklaşımında esas olan veri ve modeli versiyonlamak, bir endpoint yayınlamak, birkaç metriği izlemek ve ardından yeniden eğitim hattını çalıştırmaktı. 2026 yığınında buna ek olarak ajan runtime’ını, kısa ve uzun süreli belleği, eylem yetkilerini, dış araçları, yürütme izlerini, yanıt kalitesini, davranış uyumunu ve çok adımlı zincirlerin gecikmesini yönetmek gerekiyor. Google bu katmanlaşmayı şimdiden dokümante ediyor: Agent Platform, yönetilen bir runtime, oturumlar, bir Memory Bank, logging, tracing ve monitoring işlevleri ile her ajan için ayrı kimlik sunuyor.

Belki de en ilginç ayrıntı ajan kimliğinin yükselişi. Google dokümantasyonunda Agent Identity, SPIFFE standardına dayalı, kriptografik olarak doğrulanmış bir kimliğe dayanıyor; bu kimlik bir ajanı MCP sunucularına, cloud kaynaklarına, endpoint’lere ve diğer ajanlara karşı doğrulamak için kullanılıyor. Yani sorun artık sadece “API’yi kim çağırıyor?” değil, “hangi ajan, kimin adına, hangi yetki sınırıyla hareket ediyor?” sorusu. Bu büyük bir kayma: güvenlik, otomatik davranış seviyesine yükseliyor.

AWS de aynı yönde ilerliyor. AgentCore Gateway, mevcut API’leri, Lambda fonksiyonlarını ve servisleri Model Context Protocol ile uyumlu araçlara dönüştürüyor; giriş ve çıkış kimlik doğrulaması, hazır entegrasyonlar ve ince erişim kontrolü sağlıyor. Bu katman stratejik çünkü ajan dünyasını gerçek bilgi sistemine bağlıyor: CRM, mesajlaşma, ticket’lar, dokümantasyon, veritabanları, workflow’lar. Böylece MLOps salt bir “model” konusu olmaktan çıkıp platform + entegrasyon + güvenlik konusuna dönüşüyor.

Diğer kırılma ise nitel gözlemlenebilirlik. Databricks’te MLflow 3, GenAI uygulamaları ve ajanlar için gerçek zamanlı trace’ler, skorlayıcılar, insan geri bildirimi ve versiyonlama ile izleme, değerlendirme ve gözlemlenebilirliği bir araya getiriyor. Üretimde ise Databricks, trace örnekleri üzerinde otomatik scorers çalıştıran bir monitoring yaklaşımı sunuyor; böylece kaliteyi sürekli değerlendirmek mümkün oluyor. Bu, artık yalnızca dağıtımdan önce bir sürümü değerlendirmediğimiz, yayına girdikten sonraki gerçek davranışı da ölçtüğümüz anlamına geliyor. AWS de bunu başka bir biçimde söylüyor: AgentCore Observability, oturum sayısı, gecikme, süre, token kullanımı ve hata oranları için gerçek zamanlı metrikler sunuyor; inceleme için metadata filtreleme sağlıyor.

Son olarak, çıkarım altyapısının kendisi de “sadece GPU barındırma” olmaktan çıkıp daha çok bir platform haline geliyor. CNCF, Gateway API tabanlı Inference Gateway’in artık GA olduğunu ve trafik yönlendirmesini model adına, LoRA adaptörlerine ve endpoint durumuna göre yapabildiğini; böylece sunucu havuzlarını daha verimli paylaşmayı ve hızlandırıcı kullanımını artırmayı mümkün kıldığını hatırlatıyor. Google da NVIDIA Dynamo’yu GKE Inference Gateway ile entegre ederek ve bölünebilir G4 VM’ler duyurarak bu yönü güçlendiriyor. Burada da soru artık sadece “GPU’ları nerede buluruz?” değil; çıkarım kapasitesini disiplinli, ortaklaştırılmış ve ince dengelemeyle nasıl kullanırız?

Bu değişimin organizasyon tarafındaki sonucu kritik: MLOps artık güvenlik, cloud platform, data engineering, IAM ekipleri, FinOps ekipleri ve kimi zaman hukuk ile birlikte çalışmak zorunda. “AgentOps” yeni bir moda sözcük değil; yapay zekâ işletiminin data science silosundan çıkarak bilgi sisteminin operasyonel merkezine yerleştiğinin kanıtı.

Sonunda bütçeye geri dönen gizli maliyet

Asıl karar verdiren nokta burada ortaya çıkıyor. Flexera’nın State of the Cloud 2026 raporuna göre organizasyonların %58’i halihazırda public cloud GenAI hizmetlerini kullanıyor, %45’i bunları yoğun biçimde kullandığını söylüyor, %73’ü hibrit çalışıyor, %49’u cloud harcamasını iş sonuçlarına bağlamak için unit economics kullanıyor ve tahmini IaaS/PaaS israfı %29’a geri yükseliyor. Flexera ayrıca organizasyonların %64’ünün cloud’u artık yalnızca maliyet verimliliğiyle değil, iş birimlerine sağlanan değerle ölçtüğünü belirtiyor. Bu önemsiz değil: sohbet “ne kadar tutuyor?” sorusundan “servis başına, kullanım başına, workflow başına, ekip başına, müşteri başına maliyet ne?” sorusuna dönüyor.

Bu evrim, sahada Avrupa şirketlerinin zaten gördüğü tabloyla uyumlu. Reuters, Siemens, Renault, Orange veya ChapsVision gibi grupların bağımlılık riskini azaltmak için birden fazla sağlayıcı kullandığını; ayrıca ajanlar daha fazla görevi otomatikleştirdikçe token başı maliyetin giderek daha hassas bir konu haline geldiğini aktarıyor. Haberde, bir token bütçesinin beklenenden çok daha hızlı tüketilmesine dair örnekler de yer alıyor. Finans piyasaları bile artık hyperscaler’ların AI altyapı harcamalarının seviyesinden endişe ediyor; bu da ekonomik geri dönüş sorusunun teknik çevrenin dışına çıktığını gösteriyor.

Burada sık yanlış anlaşılan bir noktayı da eklemek gerekir: ajan tabanlı bir sistemin faturası sadece model API fiyatından ibaret değildir. AWS’nin AgentCore pricing sayfası, modelin etrafında gateway çağrıları, kısa süreli bellek, uzun süreli bellek depolama, anı geri getirme ve gözlemlenebilirlik gibi ayrı maliyet kalemleri olduğunu gösteriyor. AWS’nin yayımladığı fiyatlandırma örnekleri tam da bu ayrıntıyı ortaya koyuyor: model maliyetinin dışında bile ajan işletim katmanı kendi ekonomisini yaratıyor.

Bu yüzden bir CIO veya CFO için doğru bütçe sorusu artık “bir prompt bana neye mal oluyor?” değil, “yararlı bir ajan başına toplam maliyetim nedir?” olmalı. Bu toplam maliyet en azından modeli, dış araçları, belleği, logging’i, tracing’i, güvenliği, guardrail’leri, depolamayı, bağlam verilerini ve değerlendirme ile düzeltme için gereken insan zamanını kapsar. Şirket bu ekonomik birimi takip etmezse, benimsenme görülebilir ama bunun değer mi yoksa yalnızca cloud yükü mü yarattığı anlaşılamaz.

Bu nedenle FinOps da doğasını değiştiriyor. Flexera artık klasik cloud cost management işlevlerini değil, uygulamaları, ajanları, modelleri, veri platformlarını ve compute’u kapsayan bir AI Cost Management katmanını öne çıkarıyor. Gizli mesaj açık: AI harcaması artık cloud harcamasının bir eki değil; ayrı araçlar gerektirecek kadar karmaşık, başlı başına bir kontrol kalemi.

AI cloud yeniden egemenlik tercihi haline geliyor

Bir başka okuma hatası da AI cloud’u AWS, Azure ve Google Cloud arasında basit bir teknik tercih gibi görmek olur. Avrupa’da Haziran 2026 itibarıyla konu aynı zamanda iş sürekliliği ve operasyonel egemenlik meselesine dönüşmüş durumda. Avrupa Komisyonu 3 Haziran’da Cloud and AI Development Act önerisini kabul etti; bu girişim Avrupa cloud ve AI ekosistemini, yatırımlarını ve altyapılarını güçlendirmek için bir kaldıraç olarak sunuluyor. Aynı dönemde resmi takvim, AI Act’in 2 Ağustos 2026’dan itibaren tam uygulanacağını, şeffaflık kurallarının Ağustos 2026’da yürürlüğe gireceğini ve genel çerçevenin sağlayıcılar ile deployer’ların sorumluluklarını güçlendireceğini hatırlatıyor.

Bu politik boyut, kurumsal mimarilere şimdiden yansıyor. Reuters, bazı Amerikan hizmetlerine erişim kısıtlamalarının ardından Avrupa gruplarının modellerini ve sağlayıcılarını çeşitlendirmeyi hızlandırdığını; çünkü uzaktaki tescilli bir hizmetin sağlayıcı tarafından sınırlandırılabildiğini ve müşterinin kendi sunucularında mutlaka işletilemeyebildiğini anlatıyor. Bu bağlamda egemenlik, otarşi anlamına gelmiyor: Siemens, Orange veya Renault daha çok esneklik, çoklu sağlayıcı karışımı ve bir aktör erişimi keserse ya da koşulları değiştirirse devreye alınabilecek bir yedek kapasite arıyor.

OVHcloud duyurusunu da bu çerçevede okumak gerekir. Reuters, Fransız grubun ikinci büyük Avrupa LLM oyuncusu olmak için frontier modeller eğitmek istediğini ve bu yeni teknoloji döngüsü için 150 ila 200 milyon euro arasında bir maliyet öngördüğünü aktarıyor; bu rakam, daha önce sıkça dile getirilen 1 milyar euro seviyesinden oldukça uzak. Girişim ticari olarak başarıya ulaşsa da ulaşmasa da önemli bir şey söylüyor: AI cloud egemenliği artık soyut bir kurumsal söylem değil; Avrupa’nın büyük oyuncularının ürün ve altyapı stratejisine geri dönmüş durumda.

Bir şirket için bu gerilimin iş dilindeki karşılığı nettir. “Egemen” bir mimari, yalnızca Avrupa’da barındırılan bir mimari değildir. Hangi bileşenlerin kendi başına işletilebilir olması gerektiğini, hangi araçların değiştirilebilir kalması gerektiğini, hangi bağlam verilerinin tescilli bir runtime’a hapsolmaması gerektiğini ve kritik bir ajanın ne kadar sürede model veya sağlayıcı değiştirebileceğini tanımlayabilen bir mimaridir. Ajan iş süreçlerine etki etmeye başladığı anda, sağlayıcı bağımlılığı artık basit bir geliştirici tercihi değil, bir risk değişkeni haline gelir.

Şimdi karar vermek için kullanışlı çerçeve

Bu yüzden soru “üretken yapay zekâ için MLOps yapmalı mıyız?” değil, hangi tür işletimi standartlaştırmak istediğimizdir. Aşağıdaki çerçeve, Haziran 2026 sinyallerinin bir şirket için gerçekte neyi değiştirdiğini özetliyor. Bütçe, mimari yol haritası veya tedarikçi seçimi için karar vermeye yardımcı olur.

Karar alanı	2026’da ne değişiyor?	Komitede sorulacak soru
Mimari	Temel artık bir model endpoint’i değil, runtime + bellek + gateway + kimlik + trace + değerlendirme bileşenlerinden oluşan bir yığın.	Tek bir ajan runtime’ını mı standartlaştırmak istiyoruz, yoksa birden fazla cloud ve framework arasında taşınabilir bir katman mı istiyoruz?
Yönetişim	Gözlemlenebilirlik davranışsal hale geliyor: token’lar, gecikme, oturumlar, çağrılan araçlar, trace’ler, geri bildirim, sürekli scoring.	Prod’a geçişten önce hangi göstergeleri zorunlu tutmalıyız: maliyet, kalite, groundedness, güvenlik, çözüm süresi?
Bütçe	AI harcaması bileşik hale geliyor: model, bellek, araçlar, log’lar, tracing, güvenlik, veri, GPU kapasitesi. Flexera, unit economics ve cloud israfının yeniden yükseldiğini gözlüyor.	Yararlı bir ajan, kullanıcı yolculuğu veya iş alanı başına toplam maliyeti biliyor muyuz?
İş bağlamı	Microsoft, darboğazın model değil paylaşılan bağlam olduğunu vurguluyor; Databricks ise bağlam kalitesini ve bilgi yönetişimini platformunun temel taşı yapıyor.	Hangi veri setleri, ontolojiler, dokümanlar ve izinler ajanlar için “tek doğruluk kaynağı”mızdır?
Egemenlik	Avrupa’da dayanıklılık; sağlayıcı çeşitliliği, ikame edilebilirlik ve bazı bileşenleri yerelde işletebilme kabiliyetiyle sağlanıyor; düzenleyici çerçeve Ağustos 2026’ya kadar sıkılaşıyor.	Bir sağlayıcı erişim kurallarını değiştirirse, kritik bir ajanı kaç gün içinde taşıyabiliriz?

En pratik sonuç şu: AI cloud alımları artık önce “en iyi model hangisi?” sorusuyla değil, daha az gösterişli ama daha belirleyici beş kritere göre değerlendirilmelidir: bağlamın taşınabilirliği, gözlemlenebilirliğin kalitesi, kontrollerin ayrıntı seviyesi, maliyet görünürlüğü ve geri dönüş kabiliyeti. Bir sağlayıcı demo’da çok iyi, sanayileştirmede zayıf olabilir. Pazarın şekillenmeye başladığı yer tam olarak bu farktır.

Önde gidenlerin zaten anladığı şey

Önden okunması gereken sinyal şudur: Kurumsal yapay zekâdaki bir sonraki savaş, esas olarak daha iyi bir modele erişim üzerine değil, ajanları sürdürülebilir ekonomik ve hukuki bir çerçevede yaşatabilme kapasitesi üzerine olacak. Öne geçen organizasyonlar en hızlı dağıtanlar değil; ajanları ölçülebilir, değiştirilebilir ve yönetilebilir hale getirenlerdir. Bağlamı stratejik bir varlık, maliyeti ürün metriği, güvenliği ise erişim listesi değil bir eylem politikası olarak ele alırlar.

Elbette metodolojik bir ihtiyat payı bırakmak gerekir. Sinyalin önemli bir kısmı sağlayıcı duyurularından ve ürün dokümantasyonundan geliyor; Databricks’teki MLflow 3 production monitoring gibi bazı işlevler hâlâ beta ya da preview aşamasında. Bu da gerçek benimsemenin keynote’ların ima ettiğinden daha yavaş ve düzensiz olacağını gösteriyor. Ancak bu sınırlama temel teşhisi değiştirmiyor: dört büyük cloud ve data ekosistemi aynı teknik ilkelere doğru yaklaşıyorsa, bu hareketin kalıcı olma ihtimali yüksektir.

Bu nedenle akılda tutulması gereken tez cümlesi şudur: 2026’da MLOps & Cloud IA’nın asıl konusu artık bir model sunmak değil, ajanları bağlam, kanıt ve güvenlik bariyerleriyle işletmektir. Bunu yalnızca bir araç seçimi olarak okuyan şirketler geride kalacaktır. Bunu cloud yönetişimi, finansal kontrol ve operasyonel yönetimin yeniden tasarımı olarak görenler ise bir sonraki dalgayı daha iyi karşılayacaktır.

Stephane Nachez

ActuIA yayın kurulu — karar vericiler için yapay zeka üzerine haberler, veriler ve analizler.