企業におけるAIの真の課題は、もはやモデルではなく、その運用にある

2026年6月、企業にとって最も重要なシグナルは、次のLLMの登場でも、ベンチマーク競争でもない。Google Cloud、AWS、Microsoft、Databricksで見えている本当の転換点は別のところにある。MLOpsがエージェント運用のディシプリンへと変わりつつあり、その中で同時に重要性を増している4つの論点、すなわち業務コンテキスト、ガバナンス、オブザーバビリティ、そして推論の単価コストが浮上しているのだ。主要プレイヤーが、runtime、identity、gateway、memory、traceability、継続的評価を軸に発表を再編しているなら、それは単なる流行ではない。レイヤーの変化である。

言い換えれば、2024年には「どのモデルを選ぶべきか」が主な問いだったが、2026年に本番移行を左右するのは、「誰がコンテキスト、権限、トレース、コスト、そしてベンダー変更の自由度を管理するのか」という点だ。Microsoftはほぼ明言している。ボトルネックはもはやモデルの性能ではなく、企業の共有コンテキストである。Databricksは、可視化されるagentic loopは仕事全体のごく一部に過ぎず、残りはセキュリティ、デプロイ、監視、コスト、品質からなる隠れた技術的負債だと説明する。AWSは現在、production tracesを起点にした継続改善を強調している。Googleは、エージェントの構築、展開、ガバナンス、最適化を一体で支えるプラットフォームを推進している。

AIがcloudに入っていくのではない。cloudが、AIのoperating systemとして再び機能し始めているのだ。

各ベンダーに共通して見える転換

この春から6月にかけての各社発表に共通している点は、非常に明確だ。Google CloudはGemini Enterprise Agent Platformを立ち上げ、モデル選定、統合ツール、DevOps、オーケストレーション、セキュリティを同一レイヤーで束ねながら、エージェントの構築、スケール、ガバナンス、最適化を行うためのプラットフォームとして打ち出した。Google Cloud Next ’26では、graphベースのAgent Developer Kitや、大規模にエージェントを構築・テスト・公開するためのAgent Studioも前面に出している。

Microsoftでも、Build 2026のメッセージはほとんど同じだ。課題はもはやモデルの力ではなく、業務システムの中で動作するエージェントに一貫したdata contextを提供できるかどうかだと同社は主張している。Build 2026の公式ページでも、主要発表として「observability to ROI for AI agents」から、portabilityのあるエージェントガバナンス、さらにFoundryの大規模デプロイと実行に至るまでの要素が並んでいる。

AWSも、Bedrock AgentCoreを産業運用の論理へと切り替えた。2026年6月18日の新しい最適化機能の発表では、まずエージェントをどう作るかではなく、production tracesを使って何が起きているのかを理解し、壊れている箇所を修正し、その修正が本当にシステムを改善したことを証明するサイクルに重点が置かれている。AWSは、最も危険な障害はエラーを返すものではなく、後になって顧客の苦情としてしか表面化しない静かな失敗だとまで説明している。

Databricksも、別の表現を使いながらまったく同じ見方を示している。DAIS 2026の投稿で同社は、agentic loopは見えている「1%」にすぎず、残りの「99%」はデプロイ、token capacity、セキュリティ、評価、オブザーバビリティ、コンテキスト、共有に関わるものだと説明している。ここで重要なのは製品発表そのものよりも、そのフレーミングだ。Databricksにとって、市場の課題はもはや「エージェントのデモをどう見せるか」ではなく、「信頼できるagentic systemをどう運用するか」なのだ。

意思決定者にとっての教訓は明快である。Google、AWS、Microsoft、Databricksが、それぞれの言葉を使いながらも、runtime、identity、memory、gateway、tracing、scoring、gouvernanceといった同じ構成要素へ収斂しているなら、それは「POC + hype」の段階を抜け、architectureの段階に入ったことを意味する。したがって、MLOpsの重心はモデルから運用チェーンへと移っている。

なぜMLOpsはAgentOpsへと変わるのか

この変化は、技術スタックの性質そのものを変える。従来のMLOpsでは、データとモデルをバージョン管理し、endpointをデプロイし、いくつかの指標を追跡し、再学習パイプラインを回すことが中心だった。2026年のスタックではそれに加えて、エージェントruntime、短期・長期memory、action権限、外部ツール、実行trace、応答品質、行動のコンプライアンス、複数ステップチェーンのlatencyを管理しなければならない。Googleはすでにこの積み上げを文書化している。Agent Platformは、managed runtime、sessions、Memory Bank、logging、tracing、monitoring、そしてエージェントごとのidentityを提供する。

おそらく最も興味深い詳細は、エージェントidentityの台頭だろう。Googleのdocumentationでは、Agent IdentityはSPIFFE標準に基づく暗号学的に検証されたidentityを用い、MCP servers、cloud resources、endpoints、他のエージェントに対してエージェントを認証する。つまり、問題は単に「誰がAPIを呼ぶのか？」ではなく、「どのエージェントが、誰の代理として、どの権限範囲で動作しているのか？」へと移っている。これは大きな転換であり、セキュリティが自動化された行動レベルにまで引き上げられることを意味する。

AWSも同じ方向へ進んでいる。AgentCore Gatewayは、API、Lambda functions、既存サービスをModel Context Protocol対応のツールへ変換し、inbound/outbound authentication、すぐに使える統合、きめ細かなアクセス制御を提供する。このレイヤーが戦略的なのは、エージェントの世界と実際の情報システムをつなぐからだ。CRM、メッセージング、チケット、ドキュメント、データベース、workflowといった領域である。こうしてMLOpsは、純粋な「モデル」の話ではなく、platform + integration + securityの話へと変わる。

もう一つの転換は、qualitative observabilityである。DatabricksのMLflow 3はすでに、GenAIアプリケーションとエージェントの追跡、評価、オブザーバビリティを、リアルタイムtrace、scorer、人間のfeedback、versioningとともに統合している。productionでは、Databricksはtraceのサンプルに対してscorerを自動実行し、品質を継続的に評価するmonitoringを提供する。これは、デプロイ前に1回評価するだけではなく、リリース後の実際の挙動を評価する方向へ移っていることを示す。AWSも別の形で同じことを言っている。AgentCore Observabilityは、session数、latency、duration、token使用量、error rateに関するリアルタイム指標を提供し、metadataで絞り込みながら調査できる。

最後に、inference infrastructure自体も、単なるGPU hostingではなく、よりプラットフォーム的なものになっている。CNCFは、Gateway APIベースのInference GatewayがGAになったことを示し、model name、LoRA adapters、endpointの状態に応じてtrafficをルーティングし、server poolの共有効率を高め、accelerator利用率を引き上げられると説明している。Googleも、GKE Inference GatewayへのNVIDIA Dynamo統合や、より細かい容量設計を可能にするfractionableなG4 VMを発表し、この流れを後押ししている。ここでも問いは、もはや「どこでGPUを見つけるか？」ではなく、「推論能力をどう規律を持って、共有しながら、精緻に配分するか？」である。

この変化が組織に与える影響は決定的だ。MLOpsは今や、セキュリティ、cloud platform、data engineering、IAMチーム、FinOpsチーム、場合によっては法務とも連携しなければならない。AgentOpsは単なる流行語ではない。AI運用がdata scienceのサイロを離れ、情報システムの中核オペレーションへ入っていくことの証拠である。

最終的に予算へ跳ね返る隠れコスト

ここで、このテーマは本当に意思決定の領域に入る。FlexeraのState of the Cloud 2026によると、58%の組織がすでにpublic cloudのGenAIサービスを利用しており、45%が広範囲に利用していると回答し、73%がhybridで運用し、49%がcloud支出をbusiness成果につなげるためにunit economicsを使っている。また、IaaS/PaaSの推定無駄は29%に戻っている。Flexeraは、64%の組織がcloudをコスト効率だけでなく、ビジネス部門への提供価値で測るようになったとも指摘している。これは些細なことではない。会話の焦点が「いくらかかるのか？」から、「サービスごと、利用ごと、workflowごと、チームごと、顧客ごとにいくらかかるのか？」へ移っているのだ。

この変化は、すでに現場で見えている欧州企業の動きとも整合的だ。Reutersは、Siemens、Renault、Orange、ChapsVisionのような企業が依存リスクを抑えるために複数ベンダーを活用していると報じているが、その背景には、エージェントがより多くのタスクを自動化するにつれて、token単価のコストがますます重要な論点になっていることがある。記事では、この単価コストへの強い意識の高まりと、token予算が想定よりはるかに速く消費された事例も挙げられている。金融市場でさえ、今ではhyperscalerによるAIインフラ投資の規模を懸念しており、経済的リターンの問題が技術コミュニティを超えてしまったことが分かる。

ここで見落とされがちな点を一つ補足したい。agentic systemの請求額は、モデルAPIの価格だけでは終わらない。AWSはAgentCoreのpricingページで、モデルの周辺にgateway呼び出し、短期memory、長期memoryの保存、記憶の検索、observabilityなどのコストが別々に積み上がることを示している。AWSが公開しているpricing例は、この粒度の細かさをよく表している。モデル本体のコストを除いても、agentic operation layer自体が独自の経済圏を作るのだ。

したがって、CIOやCFOにとっての適切な予算の見方は、「1つのpromptにいくらかかるか？」ではなく、「有用な1エージェントあたりの完全コストはいくらか？」である。この完全コストには少なくとも、モデル、外部ツール、memory、logging、tracing、セキュリティ、guardrails、storage、context data、そして評価や是正に必要な人的時間が含まれる。企業がこのunit economicsを追跡しなければ、採用は進んでいるのに、価値を生んでいるのか、単にcloud負荷を増やしているだけなのか判断できなくなる。

そのため、FinOpsの性質も変わる。Flexeraはもはや従来型のcloud cost management機能だけを提供しているのではなく、applications、agents、models、data platforms、computeを対象とするAI Cost Management層を打ち出している。暗黙のメッセージは明確だ。AI支出はもはやcloud支出の付属物ではない。専用ツールを必要とする、独立した管理項目になっている。

AI cloudは再び主権の選択になる

もう一つの誤解は、AI cloudをAWS、Azure、Google Cloudの間での単純な技術比較として扱うことだろう。2026年6月の欧州では、この問題は事業継続性と運用主権の問題にもなっている。欧州委員会は6月3日、Cloud and AI Development Actの提案を採択し、欧州のcloudおよびAIエコシステム、投資、インフラを強化するための手段として位置づけた。同時に、公式日程ではAI Actが2026年8月2日から完全適用となり、透明性ルールは2026年8月に施行され、全体の枠組みは提供者と導入者の責任を強化することが示されている。

この政治的な次元は、すでに企業アーキテクチャに反映されている。Reutersによれば、欧州企業は一部の米国サービスへのアクセス制限を受けた後、モデルとベンダーの多様化を加速している。なぜなら、遠隔地にあるプロプライエタリなサービスは、提供者によって制限される可能性があり、必ずしも顧客自身のサーバー上で運用できるとは限らないからだ。ここでいうsouverainetéは自給自足を意味しない。Siemens、Orange、Renaultが重視しているのは、柔軟性、マルチベンダー構成、そしてある事業者がアクセスを遮断したり条件を変えたりした場合のバックアップ能力である。

この文脈で読むべきなのがOVHcloudの発表だ。Reutersは、同社がフロンティアモデルの学習を行い、欧州で2番目の大規模LLMプレイヤーになろうとしていると報じている。新しい技術サイクルに必要なコストは1億5000万〜2億ユーロと見積もられており、以前よく語られていた10億ユーロ規模からは大きく下がっている。商業的に成功するかどうかは別として、この動きは重要な意味を持つ。AI cloud sovereigntyは、もはや抽象的な制度論ではない。欧州の大手企業のproduct戦略とinfrastructure戦略にまで入り込んでいるのだ。

企業にとって、この緊張関係の実務的な意味は明確だ。「主権的」アーキテクチャとは、単に欧州でホスティングされているアーキテクチャではない。どのコンポーネントを自社で運用可能にする必要があるのか、どのツールを代替可能に保つべきか、どのcontext dataをプロプライエタリなruntimeに縛らせてはならないのか、そして重要なエージェントをどの期間で別のモデルやベンダーへ切り替えられるのか、を見極められるアーキテクチャである。エージェントが業務プロセスに作用するようになれば、ベンダー依存は単なる開発者の選好ではなく、リスク変数になる。

今、判断するための実用的なフレーム

したがって、問いは「生成AIのためにMLOpsをやるべきか？」ではない。どのような運用を標準化したいのか、である。以下の表は、2026年6月のシグナルが企業にとって実際に何を変えるのかを要約したものだ。予算、アーキテクチャの方針、ベンダー選定を判断するためのフレームとして使える。

判断軸	2026年に変わること	会議で問うべきこと
アーキテクチャ	基盤はもはやモデルendpointではなく、runtime + memory + gateway + identity + traces + evaluationの集合になる。	単一のagent runtimeを標準化するのか、それとも複数のcloudやframework間でportableな層を維持するのか？
ガバナンス	オブザーバビリティは行動ベースになる。token、latency、session、呼び出されたtool、trace、feedback、継続的scoringが対象だ。	本番移行の前に、コスト、品質、groundedness、セキュリティ、解決時間のどの指標を必須にするのか？
予算	AI支出は複合化する。モデル、memory、tool、log、tracing、セキュリティ、data、GPU capacity。Flexeraはunit economicsとcloud wasteの再浮上を示している。	有用な1エージェントあたり、ユーザージャーニーあたり、業務あたりの完全コストを把握しているか？
業務コンテキスト	Microsoftはボトルネックがモデルではなく共有コンテキストだと強調し、Databricksはコンテキスト品質と知識ガバナンスをプラットフォームの柱に据えている。	エージェントにとっての「正本」は、どのデータセット、ontology、文書、権限で構成されるのか？
主権	欧州では、回復力はベンダー分散、代替可能性、主要機能をローカルで運用できる能力によって確保される。規制環境は2026年8月に向けて厳格化する。	ベンダーがアクセス条件を変えた場合、何日で重要なエージェントを切り替えられるか？

最も実務的な帰結は、AI cloudの購買判断をもはや「最良のモデルがあるか」だけで評価すべきではない、ということだ。代わりに、5つの、より地味だが決定的な基準で見るべきである。すなわち、contextのportability、observabilityの質、controlの粒度、costの可視性、そしてfallback能力だ。あるベンダーはデモでは優秀でも、industrializationでは弱いかもしれない。まさにそのギャップが、市場を形作り始めている。

先行するプレイヤーがすでに理解していること

先行シグナルとして読むべきなのは、次の点だ。企業AIの次の戦いは、より良いモデルにアクセスできるかどうかではなく、エージェントを持続可能な経済・法務フレームの中で稼働させられるかどうかにある。先行する組織は、単に導入が速いだけではない。エージェントを測定可能にし、変更可能にし、統制可能にしている組織である。彼らはcontextを戦略資産として扱い、costをproduct指標として扱い、securityをアクセス権の一覧ではなく行動ポリシーとして扱っている。

もちろん、方法論上の留保は必要だ。シグナルの大部分はベンダー発表とproduct documentationに由来しており、DatabricksのMLflow 3 production monitoringのように、まだbetaやpreviewの機能もある。つまり、実際の導入はkeynoteが示唆するよりも遅く、ばらつきも大きいだろう。しかし、その制約は本質的な診断を変えない。4つの大きなcloud/dataエコシステムが同じtechnical primitivesへ収斂しているなら、この流れは長続きする可能性が高い。

したがって、押さえておくべき命題は次の一文に集約される。2026年のMLOps & Cloud AIの本質は、モデルを提供することではなく、context、evidence、guardrailsを備えたエージェントを運用することにある。これを単なるツールの話として読む企業は出遅れるだろう。これをcloud governance、financial control、operational governanceの再設計として捉える企業こそ、次の波を吸収しやすくなる。

Stephane Nachez

ActuIA編集部 — 意思決定者のためのAIニュース、データ、分析。