Mit LARA wird das regulatorische Risiko von LLMs zu einem Audit-Baustein für DPOs

Keines der zwölf bewerteten großen KI-Modelle erreicht die Schwelle der Konformität mit der DSGVO und dem AI Act, und das Risiko, das bislang bei den Integratoren lag, wird nun messbar, dokumentierbar und rechtlich durchsetzbar. Das geht aus dem Benchmark LARA (Legal Assessment for Real-world Agents) hervor, der am 27. Mai 2026 von der gemeinnützigen Forschungsstiftung Aithos veröffentlicht wurde. Das Urteil fällt eindeutig aus: Keines der bewerteten Modelle erfüllt die Anforderungen der Europäischen Union vollständig, und einige verstoßen in bis zu 93 % der untersuchten Fälle gegen europäische Regeln. Von den zwölf getesteten Modellen erzielt Claude Opus 4.1 von Anthropic mit rund 54 % Konformität das beste Ergebnis, während Gemini 3.1 Pro von Google auf 10 % fällt. Diese Feststellung kommt zehn Monate nach Inkrafttreten der AI-Act-Pflichten für Anbieter von General-Purpose-Modellen, die seit dem 2. August 2025 gelten. Artikel 25 der Verordnung, der am 1. August 2024 in Kraft trat und ab dem 2. August 2026 vollständig anwendbar ist, hatte die Mitverantwortung des Integrators bereits im Text verankert: Was LARA verändert, ist der Übergang vom theoretischen Risiko zum modellbezifferten Risiko.

Ein Raster aus 3.000 Szenarien, zwölf Modellen, wenigen Überlebenden

LARA basiert auf mehr als 3.000 Szenarien, die die wichtigsten Risiken abdecken, die von der DSGVO und dem AI Act adressiert werden. Das Protokoll versetzt jedes Modell in agentische Situationen, in denen es rechtliche oder regulatorische Dilemmata bewältigen muss: vor der Erhebung eine Einwilligung einholen, psychologisches Profiling vermeiden, die Manipulation von Nutzern verweigern, schutzbedürftige Zielgruppen schützen, die Transparenz automatisierter Entscheidungen sicherstellen. Die am häufigsten dokumentierten Verstöße betreffen die Nutzung personenbezogener Daten ohne klare Rechtsgrundlage, die implizite Erstellung psychologischer Profile sowie Verhaltensweisen, die Nutzer beeinflussen oder manipulieren könnten. Das Ranking ist streng: Zwischen der Spitze (Claude Opus 4.1) und dem Ende (Gemini 3.1 Pro) weisen auch die Modelle von OpenAI, Meta, Mistral AI, xAI und DeepSeek in mehreren Kategorien erhebliche Nichtkonformitätsraten auf. Aithos, eine gemeinnützige Stiftung, deren Forschungsleiter Daan Henselmans ist, veröffentlichte die Studie am 27. Mai 2026 auf der eigenen Substack-Plattform; die Arbeit wurde nicht peer-reviewed und erhielt keine formelle regulatorische Akkreditierung. Das wörtliche Fazit des Autors bringt das Ergebnis ohne Umschweife auf den Punkt: „Keines der Spitzenmodelle erreicht ein akzeptables Konformitätsniveau im Hinblick auf den AI Act und die europäische Datenschutzgesetzgebung“ (freie Übersetzung). Der ursprüngliche Artikel nennt weder das Testdatum noch die exakten Versionen der bewerteten Modelle über die beiden genannten hinaus – eine methodische Unklarheit, die die öffentliche Dokumentation des Tools bislang nicht auflöst.

DSGVO-/AI-Act-Konformität — LARA-Benchmark von Aithos (Mai 2026, 3.000+ Szenarien)

Modell	Anbieter	Konformitätsrate
Claude Opus 4.1	Anthropic	~54 %
Gemini 3.1 Pro	Google	~10 %
OpenAI-, Meta-, Mistral AI-, xAI-, DeepSeek-Modelle	Verschiedene	Nicht einzeln veröffentlicht

Keines der 12 getesteten Modelle erfüllt die europäischen Anforderungen vollständig. Einige verstoßen in bis zu 93 % der Fälle gegen die Regeln. Quelle: Aithos LARA benchmark, Mai 2026.

Artikel 25 AI Act: Der Integrator wird zum Mitanbieter – und wusste es bereits

Der zentrale juristische Mechanismus, den LARA operationalisiert, ist nicht neu. Artikel 25 Absatz 1 des AI Act, verankert in der am 1. August 2024 in Kraft getretenen und ab dem 2. August 2026 anwendbaren Verordnung, sieht vor, dass ein Betreiber, der den vorgesehenen Einsatz eines Hochrisiko-KI-Systems verändert oder seine Marke darauf anbringt, zum Mitanbieter wird. Konkret löst diese Einstufung die unmittelbare Anwendung von Artikel 16 aus, der den Pflichtenkern des Anbieters definiert: Risikomanagement, technische Dokumentation, Überwachung nach dem Inverkehrbringen. Ein DPO, der ein General-Purpose-Modell in einen Hochrisiko-Anwendungsfall integriert, erbt durch diesen Mechanismus dasselbe Beweisregime wie der vorgelagerte Anbieter.

Über dieser Mitverantwortung von Integrator und Anbieter hinaus gilt parallel das spezifische Regime für Anbieter von General-Purpose-Modellen. Artikel 53 legt seit dem 2. August 2025 die spezifischen Pflichten für Anbieter von General-Purpose-KI-Modellen fest: Dokumentation, Urheberrechts-Compliance-Politik, Zusammenfassung der Trainingsdaten. Bei Verstößen begrenzt Artikel 101 der Verordnung die Geldbußen für diese Anbieter auf 3 % des weltweiten Jahresumsatzes oder 15 Millionen Euro, je nachdem, welcher Betrag höher ist – eine Sanktionsbefugnis, die die Kommission allerdings erst ab dem 2. August 2026 ausüben wird.

Aithos legt den Schwerpunkt auf das Integrator-Glied: „Unternehmen, die zusätzlich zu diesen Modellen eigene KI-Agenten entwickeln, könnten ebenfalls rechtlich verantwortlich gemacht werden“ (freie Übersetzung). Die Stiftung ergänzt mit einem bewusst formulierten methodischen Vorbehalt, dass „GenAI-Systeme noch nicht bereit sind, in stark regulierten Umgebungen ohne zusätzliche Kontrollen und Schutzmechanismen eingesetzt zu werden“ (freie Übersetzung). Die Mitverantwortung war bereits in den Texten angelegt; LARA macht sie nun modellbeziffert sichtbar – ein Analysegrad, über den die Rechtsabteilungen bislang in dieser Form nicht verfügten und der als vorbereitender Audit-Nachweis nutzbar ist. Genau dieser Wechsel vom theoretischen zum dokumentierten Risiko verändert die Lage für Rechtsabteilungen mehr als der Score selbst.

Präzedenzfälle, tatsächliche Sanktionen und die Compliance-Schicht, die sich finanziert

Die LARA-Feststellung trifft auf eine regulatorische Landschaft unter Spannung. In Italien hatte der Garante della Privacy im Dezember 2024 gegen OpenAI eine Geldbuße von 15 Millionen Euro wegen der Verarbeitung personenbezogener Daten über ChatGPT verhängt, wie damals berichtet wurde, im Anschluss an das 2023 eingeleitete Verfahren – ActuIA hatte bereits die erste Einschränkung des Dienstes in Italien dokumentiert. Diese Sanktion wurde im ersten Quartal 2026 vom Tribunal von Rom in der Berufung aus verfahrensrechtlichen Gründen aufgehoben: Da die irische Data Protection Commission seit Februar 2024 die federführende Aufsichtsbehörde für OpenAI war, war der Garante im Rahmen des DSGVO-One-Stop-Shop nicht mehr zuständig. Die Beweisfrage in der Sache bleibt damit vollständig offen. Auf Anbieterseite hatte Meta den europäischen Start seiner multimodalen Llama-3-Modelle lieber ausgesetzt, statt sich dem DMA-/DSGVO-/AI-Act-Triplett zu stellen – ein Signal, dass geografische Vermeidung für Akteure, die das Risiko für zu kostspielig halten, weiterhin eine Option ist. Am anderen Ende bereitet sich der Markt vor: Das Start-up ZeroDrift, das eine Compliance-Middleware zwischen LLMs und Endnutzern entwickelt, kündigte nach eigenen Angaben Anfang Juni 2026 eine Finanzierungsrunde über 10 Millionen US-Dollar an, wenige Tage nach der Veröffentlichung von LARA. Zum 8. Juni 2026 hatte keiner der genannten Anbieter – Anthropic, Google, OpenAI, Meta, Mistral AI, xAI, DeepSeek – öffentlich die Methodik von Aithos angefochten, einen eigenen Score reklamiert oder ein alternatives Protokoll vorgeschlagen. Der Knoten liegt in einem Schweigen des Textes: Der AI Act präzisiert nicht die Verteilung der Beweislast zwischen Anbieter eines General-Purpose-Modells und Betreiber, wenn bei einem Endnutzer ein Schaden nachgewiesen wird. Genau in dieser Lücke müssen die ersten Fälle, die ab dem 2. August 2026 vor die nationalen Aufsichtsbehörden kommen, entschieden werden.

Stephane Nachez

ActuIA-Redaktion — Nachrichten, Daten und Analysen zur künstlichen Intelligenz für Entscheidungsträger.

Mit LARA wird das regulatorische Risiko von LLMs zu einem Audit-Baustein für DPOs

Ein Raster aus 3.000 Szenarien, zwölf Modellen, wenigen Überlebenden

Artikel 25 AI Act: Der Integrator wird zum Mitanbieter – und wusste es bereits

Präzedenzfälle, tatsächliche Sanktionen und die Compliance-Schicht, die sich finanziert

Was Poppy, Kaliforniens generative KI, der europäischen Verwaltung beibringt

Während Frankreich über KI-Souveränität debattiert, hat Portugal seine für 7 Mio. € geliefert

AI Act: Der Countdown läuft für Unternehmen vor dem 2. August 2026