Home Tags évaluation

évaluation

Retour sur GAIA, le benchmark visant à évaluer les assistants d’IA

Différents articles consacrés aux derniers LLMs soulignent la supériorité de leurs performances par rapport à celles des humains dans des domaines spécifiques tels que le droit ou la chimie, mais qu’en est-il pour le raisonnement, la gestion multimodale, la navigation sur l...

Des chercheurs développent un outil pour quantifier la beauté d’un paysage grâce à l’intelligence artificielle

Évaluer et quantifier la beauté d’un paysage, d’un écosystème et ses effets sur le bien-être d’une personne est devenu une question centrale pour les pouvoirs publics. C’est dans cette optique que des scientifiques de l’École polytechnique fédérale de Laus...

Pourquoi et comment certifier l’intelligence artificielle ?

Dans un contexte de développement pléthorique de l’IA et d’un marché jusqu’à présent essentiellement porté par l’offre, les conditions d’un rapprochement de cette dernière avec la demande doivent être réunies au plus tôt. La certification, qui repose sur un référentiel d’exigence...

Facebook met à jour Dynabench, sa plateforme d’évaluation de modèles NLP, avec Dynaboard

Cette semaine, Facebook a proposé une nouvelle fonctionnalité intitulée Dynaboard. Cette plateforme permet de mener des évaluations complètes et standardisées de modèles de traitement naturel du langage (NLP). Cet outil vient mettre à jour Dynabench, un modèle d’analyse com...

Focus sur le projet CORE-MD qui propose une revue des méthodes d’évaluation des dispositifs médicaux

Le projet CORE-MD a été lancé dans le cadre d’une étroite collaboration entre la Fédération européenne des associations nationales d’orthopédie et de traumatologie et la Société européenne de cardiologie. Il s’inscrit dans le programme de recherche et d’innovation Hor...

Tests d’algorithmes d’intelligence artificielle, IA de confiance, effet black box : entretien avec Guillaume Avrin du LNE

Dans le cadre de notre dossier L’intelligence artificielle de confiance : Des systèmes critiques au bien commun paru dans le numéro 3 du magazine ActuIA actuellement en kiosque et disponible dans notre boutique en ligne, nous nous sommes entretenus avec Guillaume Avrin, Res...

Le LNE présente sa plateforme LEIA dédiée à l’évaluation de l’intelligence artificielle

Le Laboratoire national de métrologie et d’essais (LNE) a annoncé la création de LEIA, la première plateforme générique mondiale dédiée à l’évaluation de l’intelligence artificielle suite au financement reçu de l’État à hauteur de 390 000 euros. Ce dernier s’inscrit dans le...