Anthropic contraint de suspendre Fable 5 et Mythos 5 après une directive du gouvernement américain

Anthropic a annoncé le 12 juin 2026 devoir suspendre l’accès à ses modèles Fable 5 et Mythos 5, à la suite d’une directive de contrôle à l’export émise le jour même par le gouvernement américain. Officiellement, l’injonction interdit l’accès à ces deux modèles à tout ressortissant étranger - qu’il se trouve ou non sur le sol américain, y compris les salariés étrangers d’Anthropic. Mais, pour garantir sa conformité, l’entreprise indique n’avoir d’autre choix que de couper brutalement Fable 5 et Mythos 5 pour l’ensemble de ses clients. L’accès aux autres modèles d’Anthropic n’est pas affecté.

La directive a été reçue le jour même à 17 h 21 (heure de l’Est). Anthropic précise que le courrier ne détaillait pas la nature exacte de la préoccupation de sécurité nationale invoquée. Selon sa compréhension, le gouvernement estime avoir eu connaissance d’une méthode de contournement - un « jailbreak » - visant Fable 5.

Le contournement en question : faire lire du code à un modèle

Anthropic dit avoir examiné une démonstration de la technique. Celle-ci a servi à identifier « un petit nombre de vulnérabilités mineures déjà connues », qualifiées de relativement simples - et que, souligne l’entreprise, d’autres modèles publics sont capables de découvrir sans recourir au moindre contournement.

À ce stade, Anthropic indique n’avoir reçu du gouvernement qu’une preuve verbale d’un jailbreak potentiel, étroit et non universel, consistant pour l’essentiel à « demander au modèle de lire une base de code précise et d’en corriger les failles logicielles ». L’entreprise affirme avoir consulté le rapport qu’elle pense être à l’origine de la directive, et vérifié que le niveau de capacité décrit est « largement disponible sur d’autres modèles (y compris GPT-5.5 d’OpenAI) » et mobilisé chaque jour par les défenseurs chargés de la sécurité des systèmes. Elle promet de communiquer davantage de détails dans les 24 heures.

La défense d’Anthropic : des garde-fous « parmi les plus robustes »

L’entreprise renvoie à la position exposée lors du lancement de Fable. Elle revendique des garde-fous « si solides » que de nombreux utilisateurs se sont plaints de leur caractère excessivement large, notamment sur les usages liés à la cybersécurité. Dans les semaines précédant le lancement, Fable aurait été soumis à des milliers d’heures de red-teaming, menées avec le gouvernement américain, l’AISI britannique, plusieurs organisations tierces et des équipes internes. Ces tests auraient montré des protections « nettement plus efficaces que celles de tout modèle déployé jusqu’ici ».

Surtout, Anthropic affirme qu’« aucun testeur n’a, à ce jour, trouvé de jailbreak universel » - un contournement capable de désactiver largement les garde-fous. L’entreprise reconnaît toutefois qu’une résistance parfaite n’est probablement atteignable par aucun fournisseur à l’heure actuelle, et que des jailbreaks universels finiront vraisemblablement par apparaître - un point qu’elle dit avoir énoncé clairement dès la sortie de Fable 5.

Une stratégie de « defense in depth »

Faute de résistance parfaite, Anthropic revendique une approche en profondeur : rendre les contournements soit étroits (jailbreaks non universels), soit très coûteux à produire (jailbreaks universels), et coupler cela à une surveillance approfondie pour détecter et stopper rapidement toute attaque réussie. C’est aussi, explique l’entreprise, la raison pour laquelle elle impose une rétention des données client de 30 jours avec Fable - une mesure qui a un coût réel vis-à-vis des clients, mais qui lui permet d’étudier et de corriger les jailbreaks. Anthropic estime que cette stratégie ramène les risques posés par Fable à un niveau comparable à celui des modèles déjà déployés dans l’industrie.

Anthropic se conforme, mais conteste

Tout en appliquant la directive et en retirant l’accès aux deux modèles, Anthropic exprime son désaccord : la découverte d’« un jailbreak potentiel et étroit » ne saurait, selon elle, justifier le rappel d’un modèle commercial « déployé auprès de centaines de millions de personnes ». Appliqué à tout le secteur, un tel standard « reviendrait, en pratique, à figer tout nouveau déploiement de modèle » pour l’ensemble des laboratoires de pointe.

L’entreprise rappelle soutenir publiquement la capacité d’un gouvernement à bloquer des déploiements jugés dangereux - mais dans le cadre d’un processus légal « transparent, équitable, clair et fondé sur des faits techniques », principes auxquels, juge-t-elle, cette action ne se conforme pas. Anthropic présente ses excuses pour la perturbation causée à ses clients, dit croire à un « malentendu » et travailler à rétablir l’accès au plus vite.

Un précédent géopolitique, pas seulement réglementaire

Au-delà du seul cas de Fable 5 et Mythos 5, l’épisode marque une inflexion plus profonde : les États-Unis ne contrôlent plus seulement les puces, les capacités de calcul ou les poids de modèles. Ils revendiquent désormais la possibilité d’interrompre l’accès opérationnel à un modèle déjà commercialisé, au nom de la sécurité nationale.

C’est un déplacement important. Jusqu’ici, le débat sur la souveraineté de l’IA portait surtout sur l’amont : les GPU, les data centers, les jeux de données, les modèles ouverts ou fermés. Ici, le contrôle s’exerce sur l’usage lui-même. La question n’est plus seulement de savoir qui peut entraîner un modèle de frontière, mais qui a le droit de l’interroger, dans quelles conditions, et avec quelle nationalité.

L’injonction visant les ressortissants étrangers, y compris lorsqu’ils se trouvent sur le sol américain ou travaillent pour Anthropic, introduit une fracture nouvelle dans l’économie mondiale de l’IA. Elle transforme la nationalité de l’utilisateur, du chercheur, du salarié ou du client en paramètre d’accès à une infrastructure cognitive. Pour les entreprises, cela ouvre un risque difficile à contractualiser : un service légalement souscrit, techniquement disponible et commercialement déployé peut devenir inaccessible du jour au lendemain pour des motifs administratifs extérieurs à la relation client-fournisseur.

Pour les alliés des États-Unis, le signal est particulièrement sensible. L’Europe, le Canada, le Japon, la Corée du Sud ou l’Australie ne sont pas nécessairement les cibles politiques d’une telle mesure. Mais ils en subissent la logique : dans un régime de sécurité nationale, l’accès aux modèles américains les plus avancés peut être suspendu sans distinction fine entre partenaires, concurrents et adversaires. La souveraineté IA cesse alors d’être un slogan défensif ; elle devient une question de continuité d’activité.

Ce précédent offre aussi un argument aux puissances qui contestent l’hégémonie technologique américaine. Pékin pourra y voir la confirmation que les modèles de frontière américains ne sont pas de simples produits cloud, mais des capacités stratégiques révocables. Plus Washington utilise le contrôle d’accès comme instrument de puissance, plus il encourage ses rivaux à accélérer leurs propres piles souveraines, fermées ou régionales.

La difficulté tient à la nature même du risque invoqué. Une capacité cyber avancée est intrinsèquement duale : le même modèle peut aider un défenseur à identifier une vulnérabilité ou un attaquant à l’exploiter. Si le simple fait de pouvoir lire une base de code et suggérer des corrections devient un motif suffisant pour retirer un modèle du marché, alors le seuil de blocage risque de concerner rapidement l’ensemble des modèles de pointe. À l’inverse, si les États attendent une preuve trop élevée, ils agiront trop tard. C’est cet entre-deux qui reste aujourd’hui sans doctrine publique claire.

L’affaire Fable 5 n’est donc pas seulement un test pour Anthropic. Elle préfigure le régime politique des modèles de frontière : des produits commercialisés à l’échelle mondiale, mais soumis à un droit de rappel souverain ; des infrastructures privées, mais traitées comme des actifs stratégiques ; des outils logiciels, mais gouvernés par des logiques proches de l’export control et de la sécurité nationale.

Le critère retenu dans les prochaines semaines sera décisif. Si un jailbreak étroit, non universel et comparable à des capacités déjà disponibles ailleurs suffit à justifier une coupure globale, les lancements de modèles frontier entreront dans une nouvelle ère : celle de déploiements conditionnels, révocables et géopolitiquement filtrés. Si, au contraire, l’épisode se résout comme un excès de prudence ou un malentendu administratif, il n’en aura pas moins révélé une chose : l’accès aux modèles les plus avancés n’est plus seulement une question de marché. C’est désormais un attribut de puissance.

Stephane Nachez

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.