評価対象となった12の主要AIモデルはいずれも、GDPRおよびAI Actのコンプライアンス基準を満たさず、これまでインテグレーターにのしかかっていたリスクは、いまや測定可能で、文書化可能で、異議申立ても可能なものになった。これは、非営利研究財団Aithosが2026年5月27日に公開したベンチマーク「LARA(Legal Assessment for Real-world Agents)」から明らかになった。結論は厳しい。評価されたモデルのいずれも欧州連合の規制要件を完全には満たしておらず、一部は検証されたケースの最大93%で欧州ルールに違反していた。テストされた12モデルの中では、AnthropicのClaude Opus 4.1が約54%のコンプライアンスで最高スコアを記録し、GoogleのGemini 3.1 Proは10%まで落ち込んだ。この結果は、汎用AIモデル提供者に対するAI Actの義務が2025年8月2日から適用されて10か月後に示されたものだ。2024年8月1日に施行され、2026年8月2日に全面適用となる同規則第25条は、すでにインテグレーターの共同責任を法文上に明記していた。LARAが変えるのは、そのリスクを理論上のものからモデル別の数値リスクへと移した点である。
3,000超のシナリオ、12モデル、ほとんど生き残れず
LARAは、GDPRとAI Actが対象とする主要リスクをカバーする3,000以上のシナリオに基づいている。プロトコルは、各モデルを法的・規制上のジレンマに直面するエージェント的状況に置く。たとえば、収集前に同意を取得すること、心理プロファイリングを回避すること、ユーザーを操作しないこと、脆弱な層を保護すること、自動化された意思決定の透明性を確保すること、などだ。文書化された違反で最も多いのは、明確な法的根拠のない個人データの利用、暗黙的な心理プロファイルの生成、ユーザーに影響を与えたり操作したりする可能性のある挙動である。ランキングは厳格だ。上位のClaude Opus 4.1と下位のGemini 3.1 Proの間で、OpenAI、Meta、Mistral AI、xAI、DeepSeekのモデルも、複数のカテゴリで相当な非準拠率を示している。Aithosは、研究責任者Daan Henselmansが率いる非営利財団で、同研究を2026年5月27日に自社Substack上で公開した。なお、この研究は査読を受けておらず、正式な規制認定も受けていない。著者の原文は結論を端的に要約している。「最先端モデルのいずれも、AI Actおよび欧州のプライバシー法の観点から受け入れ可能なコンプライアンス水準に達していない」(意訳)。元記事では、テスト日や、2つのモデル名を除く評価対象モデルの正確なバージョンは明示されていない。これは方法論上の不透明さであり、現時点でツールの公開文書でも解消されていない。
GDPR / AI Act コンプライアンス — AithosのLARAベンチマーク(2026年5月、3,000+シナリオ)
| モデル | 提供元 | コンプライアンス率 |
|---|---|---|
| Claude Opus 4.1 | Anthropic | 約54% |
| Gemini 3.1 Pro | 約10% | |
| OpenAI、Meta、Mistral AI、xAI、DeepSeekの各モデル | 複数 | 個別未公表 |
テストされた12モデルのいずれも、欧州の要件を完全には満たしていない。一部はケースの最大93%でルールに違反している。出典:Aithos LARA benchmark、2026年5月。
AI Act第25条:インテグレーターは共同提供者となる、それはすでに明文化されている
LARAが実務上の形にした中心的な法的メカニズムは、新しいものではない。2024年8月1日に施行され、2026年8月2日から適用されるAI Act第25条第1項は、高リスクAIシステムの想定用途を変更するデプロイヤー、または自社ブランドを付すデプロイヤーは、共同提供者になると定めている。実務上、この資格付与により、第16条が直接適用される。第16条は、提供者に課される義務の基礎を定義しており、リスク管理、技術文書、上市後監視が含まれる。汎用モデルを高リスク用途に組み込むDPOは、この仕組みにより、上流のベンダーと同じ立証責任の枠組みを引き継ぐことになる。
このインテグレーターと提供者の共同責任に加えて、汎用AIモデル提供者向けの独自の制度も並行して適用される。第53条は、2025年8月2日以降、汎用AIモデル提供者に対する固有の義務を定めている。内容は、文書化、著作権遵守方針、学習データの要約である。違反があった場合、第101条は、これらの提供者に対する制裁金の上限を、年間世界売上高の3%または1,500万ユーロのいずれか高い方と規定している。ただし、欧州委員会がこの制裁権限を行使できるのは2026年8月2日以降である。
Aithosは、とりわけインテグレーター側に焦点を当てている。「これらのモデルの上に自社のAIエージェントを構築する企業も、法的責任を負う可能性がある」(意訳)と同財団は指摘する。さらに、方法論上の留保を明示したうえで、「GenAIシステムは、追加の管理策や安全装置なしに、規制の厳しい環境へ展開するにはまだ十分に準備できていない」(意訳)とも付け加えている。共同責任はすでに法文上存在していたが、LARAはそれをモデル別に定量化した。法務部門にとっては、監査準備資料として使える粒度の分析が、これまで存在しなかった形で得られたことになる。法務部門の状況を変えるのは、この理論上のリスクから文書化されたリスクへの転換であり、スコアそのもの以上に重要である。
先例、実効的な制裁、そして資金が流れ始めるコンプライアンス層
LARAの結論は、規制圧力が高まる環境の中で示された。イタリアでは、Garante della Privacyが2024年12月、ChatGPTを通じた個人データ処理を理由にOpenAIへ1,500万ユーロの罰金を科した。これは、2023年に開始された手続きの延長線上にあるもので、ActuIAは当時、イタリアでのサービス初期制限をすでに報じていた。ただし、この制裁は2026年第1四半期にローマ裁判所で控訴審により取り消された。理由は手続上のもので、2024年2月以降、Irish Data Protection CommissionがOpenAIの主たる監督当局となっていたため、GaranteにはGDPRのワンストップショップ制度の下で管轄権がなかったというものだ。とはいえ、実体面の立証問題は依然として完全に खुलいている。提供者側では、Metaが、DMA/GDPR/AI Actの三重の規制に直面するよりも、Llama 3マルチモーダルモデルの欧州展開を見送ることを選んだ。これは、地理的回避が、露出コストが高すぎると判断する事業者にとって依然として有効な選択肢であることを示している。市場側も動いている。LLMとエンドユーザーの間に位置するコンプライアンス用ミドルウェアを開発するスタートアップZeroDriftは、自社発表によれば、LARA公開の数日後である2026年6月上旬に1,000万ドルの資金調達を発表した。2026年6月8日時点で、名指しされた提供者――Anthropic、Google、OpenAI、Meta、Mistral AI、xAI、DeepSeek――はいずれもAithosの方法論に公に異議を唱えず、独自スコアを主張せず、代替プロトコルも提示していない。問題の核心は、テキストの沈黙にある。AI Actは、実害がエンドユーザーに生じた場合に、汎用AIモデル提供者とデプロイヤーの間で立証責任をどう配分するかを明示していない。2026年8月2日以降、各国監督当局に持ち込まれる最初の事案は、この空白を埋めることになるだろう。
