专栏 / 观点

Avec LARA,LLM 的监管风险变成了 DPO 的审计材料

Aithos 发布的 LARA 基准显示,受测的 12 个大型 AI 模型没有一个达到 GDPR 与 AI Act 的合规门槛,最高仅约 54%,最低约 10%。这意味着原本模糊的监管风险,正被转化为可量化、可审计、可追责的证据材料。

STStephane Nachez · · ·2 min
Avec LARA,LLM 的监管风险变成了 DPO 的审计材料
目录

在受评估的 12 个大型 AI 模型中,没有一个达到 GDPR 与 AI Act 的合规门槛;此前主要由集成方承担的风险,如今变得可量化、可文档化、且可被追责。这是非营利研究基金会 Aithos 于 2026 年 5 月 27 日发布的基准测试 LARA(Legal Assessment for Real-world Agents)所揭示的结论。结论十分明确:所有受评估模型都未能完全满足欧盟监管要求,其中一些在研究案例中的违规比例高达 93%。在 12 个测试模型中,Anthropic 的 Claude Opus 4.1 表现最佳,合规率约为 54%;而 Google 的 Gemini 3.1 Pro 仅为 10%。这一结果出现在 AI Act 针对通用型模型提供方的义务于 2025 年 8 月 2 日生效十个月后。该法规第 25 条于 2024 年 8 月 1 日生效,并于 2026 年 8 月 2 日起全面适用,此前就已将集成方的共同责任写入文本;LARA 的意义在于,把原本抽象的风险转化为按模型计算的量化风险。

3,000 个场景、12 个模型、少数“幸存者”

LARA 基于 3,000 多个场景,覆盖 GDPR 与 AI Act 所针对的主要风险。该协议将每个模型置于代理式情境中,要求其处理法律或监管两难:在收集前获取同意、避免心理画像、拒绝操纵用户、保护弱势群体、确保自动化决策的透明度。记录到的最常见违规包括:在缺乏明确法律依据的情况下使用个人数据、隐性生成心理画像,以及可能影响或操纵用户的行为。排名结果相当严苛:从最高分的 Claude Opus 4.1 到最低分的 Gemini 3.1 Pro,OpenAI、Meta、Mistral AI、xAI 和 DeepSeek 的模型在多个类别中也都显示出显著的不合规率。Aithos 是一家非营利基金会,研究负责人为 Daan Henselmans;该研究于 2026 年 5 月 27 日发布在其自有 Substack 平台上,未经过同行评审,也未获得正式监管认证。作者原文直言不讳地总结道:“没有任何前沿模型在 AI Act 和欧洲隐私法框架下达到可接受的合规水平”(自由译文)。原文并未说明测试日期,也未披露除前述两款之外其他受评估模型的具体版本——这一方法论上的空白,至今仍未被该工具的公开文档完全补足。

GDPR / AI Act 合规性 — Aithos LARA 基准测试(2026 年 5 月,3,000+ 场景)

模型 厂商 合规率
Claude Opus 4.1 Anthropic ~54 %
Gemini 3.1 Pro Google ~10 %
OpenAI、Meta、Mistral AI、xAI、DeepSeek 的模型 多家 未逐一公布

在测试的 12 个模型中,没有一个完全满足欧洲要求。其中一些在最多 93% 的案例中违反规则。来源:Aithos LARA benchmark,2026 年 5 月。

AI Act 第 25 条:集成方成为共同提供方,这一点早已写入规则

LARA 让其真正可操作的核心法律机制并不新。AI Act 第 25 条第 1 款规定:如果部署方修改高风险 AI 系统的预期用途,或在其上贴附自身品牌,则该部署方将成为共同提供方。该条款写入了 2024 年 8 月 1 日生效、并自 2026 年 8 月 2 日起适用的法规。具体而言,这一资格将直接触发第 16 条的适用,而第 16 条定义了提供方的基本义务:风险管理、技术文档、上市后监测。对于将通用模型集成到高风险用途中的 DPO 而言,这一机制意味着,其承担的举证责任将与上游厂商处于同一监管框架之下。

在集成方与提供方的共同责任之上,通用型模型提供方的专门制度也并行适用。自 2025 年 8 月 2 日起,第 53 条为通用型 AI 模型提供方设定了专属义务:文档记录、版权合规政策、训练数据摘要。若违反规定,第 101 条将对这些提供方的罚款上限设为全球年营业额的 3% 或 1,500 万欧元,以较高者为准——不过,欧盟委员会要到 2026 年 8 月 2 日之后才会真正行使这一处罚权。

Aithos 将重点放在集成环节:“构建自身 AI 代理的企业,若在这些模型之上进行开发,也可能承担法律责任”(自由译文)。该基金会还在方法论上明确保留意见,称“GenAI 系统在没有额外控制和护栏的情况下,尚未准备好部署到高度监管的环境中”(自由译文)。共同责任在法规中早已存在;LARA 则把它按模型量化呈现——这种分析颗粒度,法律部门此前还没有以可直接用于审计准备材料的形式获得。真正改变局面的,不是分数本身,而是从理论风险转向已文档化风险的这一跃迁。

先例、实际处罚,以及正在被投入资金的合规层

LARA 的结论出现在一个监管压力持续上升的背景下。意大利方面,Garante della Privacy 曾在 2024 年 12 月对 OpenAI 处以 1,500 万欧元罚款,原因是通过 ChatGPT 处理个人数据;这一处罚延续了 2023 年启动的程序——ActuIA 当时已报道了该服务在意大利的初始限制措施。不过,这项处罚在 2026 年第一季度被罗马法院以程序理由撤销:自 2024 年 2 月起,爱尔兰数据保护委员会已成为 OpenAI 的主导监管机构,因此在 GDPR 一站式机制下,Garante 已不再具有管辖权。至于实体层面的举证问题,仍然完全开放。另一方面,Meta 选择暂停其 Llama 3 多模态模型在欧洲的发布,而不是去应对 DMA/GDPR/AI Act 的三重约束——这表明,当暴露成本过高时,地理规避仍然是一个可选项。市场的另一端也在积极准备:初创公司 ZeroDrift 正在开发一种位于 LLM 与终端用户之间的合规中间件;据其自身披露,该公司在 2026 年 6 月初、即 LARA 发布后数日完成了 1,000 万美元融资。截至 2026 年 6 月 8 日,所有被点名的提供方——Anthropic、Google、OpenAI、Meta、Mistral AI、xAI、DeepSeek——均未公开质疑 Aithos 的方法论、声明自己的分数,或提出替代协议。真正的堵点来自文本中的一个沉默:AI Act 并未明确,当终端用户发生损害时,通用型模型提供方与部署方之间应如何分配举证责任。正是在这一空白中,自 2026 年 8 月 2 日起,首批提交给各国监管机构的案件将不得不作出裁定。

ST
Stephane Nachez

ActuIA 编辑部 — 面向决策者的人工智能资讯、数据与分析。