106 millions de requêtes ClaudeBot : ce que les crawlers IA coûtent réellement à un média spécialisé

ActuIA fait partie des médias qui ont choisi d'ouvrir leurs contenus aux robots des entreprises d'intelligence artificielle. Notre fichier robots.txt autorise explicitement ClaudeBot, GPTBot, PerplexityBot et les principaux crawlers IA. Nous avons voulu mesurer ce que cette ouverture représente concrètement. Les journaux serveur d'ActuIA, agrégés sur seize mois, révèlent un chiffre spectaculaire : entre février 2025 et mai 2026, ClaudeBot a adressé 106 154 885 requêtes à nos serveurs.

Ce chiffre raconte quelque chose qui dépasse largement le cas d'ActuIA.

Depuis vingt ans, le Web repose sur un contrat implicite relativement simple : les robots indexent les contenus, les moteurs de recherche renvoient des lecteurs. Les éditeurs acceptent donc le coût du crawl parce qu'il participe à leur visibilité.

L'arrivée des grands modèles de langage change progressivement cette équation.

Les robots ne se contentent plus d'indexer. Ils lisent, aspirent, classent, résument, alimentent des assistants conversationnels et participent à l'entraînement de systèmes qui répondront directement aux utilisateurs.

La question devient alors simple : que reçoivent les éditeurs en échange ?

Une explosion soudaine à partir de décembre 2025

Jusqu'à l'automne 2025, ClaudeBot est un visiteur discret sur ActuIA : quelques dizaines à quelques milliers de requêtes mensuelles.

Puis, en décembre 2025, la situation change brutalement.

Mois	Requêtes ClaudeBot	Requêtes GPTBot
2025-10	356	139 628
2025-11	35	185 947
2025-12	12 549 707	3 383 705
2026-01	24 033 317	4 212 946
2026-02	15 832 651	2 951 645
2026-03	20 603 560	3 579 407
2026-04	25 954 236	4 489 434
2026-05	7 149 585	2 600 262

Source : agrégat mensuel des journaux serveur ActuIA, calculé avant purge des logs bruts.

Sur l'ensemble de la période analysée, ClaudeBot totalise plus de 106 millions de requêtes. Il devient ainsi, de très loin, le crawler IA le plus actif observé sur notre infrastructure.

Comment atteint-on 106 millions de requêtes sur un média spécialisé ?

C'est sans doute la question la plus intéressante.

ActuIA compte environ 10 000 articles, plusieurs milliers de fiches acteurs et plus de 4 000 pages thématiques, le tout décliné dans quinze langues.

Les journaux récents montrent que ClaudeBot ne se limite pas à consulter les contenus les plus populaires. Il explore systématiquement les espaces de navigation, les pages de tags, les différentes versions linguistiques et les mécanismes de pagination.

Sur la première quinzaine de juin 2026, près de 90 % des requêtes observées visaient des pages thématiques. Le robot ne lit pas seulement le site : il parcourt méthodiquement l'ensemble des combinaisons d'URL qui lui sont accessibles.

Cette activité se produit également par rafales. Les 9 et 10 juin 2026, à la suite de la refonte d'ActuIA, ClaudeBot a adressé respectivement 66 466 puis 102 316 requêtes en deux jours avant de revenir à un rythme beaucoup plus modéré.

Dans notre cas, plus de 99 % de ces requêtes ont reçu une réponse HTTP 200. Nous n'avons jamais bloqué ni limité ces accès. C'était un choix assumé.

Le vrai sujet : combien de visiteurs reviennent en échange ?

Le débat ne porte pas réellement sur le nombre de requêtes.

Les moteurs de recherche traditionnels ont toujours crawlé massivement le Web. Le sujet est plutôt celui de la réciprocité.

Pendant quatorze jours, nous avons comparé le nombre de requêtes adressées à ActuIA par plusieurs familles de robots avec le nombre de visiteurs effectivement renvoyés vers notre site.

Le résultat est révélateur.

Acteur	Crawl observé	Visiteurs renvoyés	Ratio
Anthropic	186 289	57	1 visite pour 3 268 requêtes
OpenAI	1 584 592	7 018	1 visite pour 226 requêtes

Source : journaux nginx ActuIA, période du 29 mai au 12 juin 2026.

Autrement dit, sur la période observée, il a fallu plus de 3 000 requêtes d'Anthropic pour générer une visite identifiable vers ActuIA, contre environ 226 pour OpenAI.

Les deux acteurs consomment massivement des contenus.

Mais ils ne renvoient pas la même valeur aux éditeurs.

Cette différence est suffisamment importante pour constituer à elle seule un sujet de réflexion sur l'avenir des relations entre plateformes IA et producteurs de contenus.

Des coûts invisibles mais bien réels

Pour un média indépendant, le crawl massif n'est pas gratuit.

Il représente de la bande passante, du calcul, des opérations disque, du stockage de logs, du monitoring et du temps d'analyse.

Il complique également la mesure d'audience. Une part importante du trafic observé aujourd'hui sur Internet n'est plus humaine. Les robots brouillent les indicateurs historiques et rendent plus difficile l'évaluation de la consommation réelle des contenus.

Ces coûts restent supportables individuellement.

Mais ils deviennent significatifs lorsque des dizaines de millions de requêtes sont adressées à des sites qui ne reçoivent en retour ni audience significative ni rémunération directe.

Un rapport de force qui commence à évoluer

Le sujet n'est plus marginal.

Cloudflare a annoncé en 2025 un changement majeur de politique en permettant aux éditeurs de bloquer plus facilement les crawlers IA et en expérimentant un modèle de rémunération baptisé « Pay per crawl ».

Parallèlement, le cadre européen de la fouille de textes et de données prévoit déjà des mécanismes permettant aux titulaires de droits de manifester leur opposition à certains usages automatisés.

Autrement dit, les outils techniques et juridiques existent.

La question est désormais économique.

Ouverts, mais pas dupes

ActuIA a fait le choix de l'ouverture.

Nous autorisons les principaux robots IA. Nous avons également mis en place un fichier llms.txt. Nous pensons que les contenus spécialisés ont vocation à alimenter les systèmes d'intelligence artificielle et les outils de recherche de demain.

Mais ces seize mois de logs montrent aussi qu'une ouverture sans contrepartie n'est pas un modèle économique.

Les systèmes d'IA ont besoin de contenus de qualité.

Ces contenus ont un coût de production.

Ils nécessitent des journalistes, des experts, des infrastructures, des outils, du temps et des investissements.

Nous ne plaidons pas pour la fermeture du Web.

Nous posons simplement une question qui devient de plus en plus difficile à éviter : quelle valeur revient aux éditeurs dont les contenus alimentent les systèmes d'IA ?

Licences de contenu, rémunération du crawl, attribution visible, partage de revenus ou trafic qualifié : les mécanismes existent déjà ou émergent progressivement.

Reste à savoir si l'industrie choisira de les généraliser avant que l'équilibre économique de la production d'information ne soit durablement fragilisé.

Méthodologie

Les chiffres présentés dans cet article proviennent des journaux serveur d'ActuIA.

L'analyse repose sur deux sources :

un agrégat mensuel par famille de robots couvrant la période de février 2025 à mai 2026 ;
les journaux nginx bruts du 29 mai au 12 juin 2026 pour l'analyse détaillée des URL, référents et codes HTTP.

L'identification des robots repose sur les user-agents déclarés.

Les visites renvoyées sont mesurées à partir des référents transmis par les plateformes concernées (claude.ai, chatgpt.com, etc.).

Les robots qui masquent leur identité ou les visites ne transmettant aucun référent ne sont pas comptabilisés. Les chiffres publiés doivent donc être considérés comme des minima.

Stephane Nachez

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.