Gemini 2.0 Flash, le modèle qui ouvre la voie aux agents d'IA de Google

Google a annoncé Gemini 2.0 Flash, un modèle conçu pour l'ère agentique, disponible en expérimentation via l'API Gemini dans Google AI Studio et Vertex AI, avec une disponibilité générale prévue en janvier 2025. Optimisé par distillation pour la vitesse et l'efficacité, il améliore la multimodalité (images, vidéo, audio), le texte, le code et le raisonnement, intègre nativement des outils (Search, exécution de code, fonctions tierces) et surpasse selon Google Gemini 1.5 Pro sur des benchmarks tout en étant deux fois plus rapide.

MAMarie-Claude Benoit ·12 déc. 2024 ·Mis à jour le 19 juin 2026 ·3 min

Google a annoncé ce mercredi 11 décembre le lancement de Gemini 2.0 Flash, le premier modèle de la famille Gemini 2, conçue selon lui pour l'ère agentique. Ce modèle est d'ores et déjà disponible en tant que modèle expérimental pour les développeurs et les testeurs de confiance via l’API Gemini dans Google AI Studio et Vertex AI. Sa disponibilité générale est prévue pour janvier 2025. Google a présenté Gemini il y a tout juste un an, Gemini 1.5 Flash a, quant à lui été dévoilé en mai dernier lors de la conférence Google I/O 2024. Optimisé pour la vitesse et l’efficacité, il a été entraîné par 1.5 Pro grâce à un processus appelé "distillation", où les connaissances et les compétences les plus essentielles d’un modèle plus grand sont transférées vers un modèle plus petit et plus efficace. Les performances du modèle ont été améliorées en matière de multimodalité, de texte, de code, de vidéo, de compréhension spatiale et de raisonnement tandis que la latence a été réduite. Flash 2.0 prend en charge les entrées multimodales comme les images, la vidéo et l’audio ainsi que les sorties multimodales, telles que la génération d’images combinées avec du texte et de l’audio multilingue TTS (Text-to-Speech). Il permet également l’intégration native d'outils tels que Google Search, l'exécution de code et des fonctions tierces définies par l'utilisateur. [embed]https://youtu.be/Fs0t6SdODd8[/embed] L'équipe de recherche Gemini a comparé les performances du nouveau modèle avec celles de Gemini 1.5 Flash et Pro. Il surpasse même 1.5 Pro sur les principaux benchmarks, tout en étant deux fois plus rapide.

Projets de recherche

Google a également partagé plusieurs projets illustrant sa vision d'assistants d'IA universels, utiles au quotidien. Ces prototypes cherchent à transformer l’IA en des agents polyvalents, capables de comprendre le contexte d’une situation, de planifier des actions et d’effectuer des tâches à la place des utilisateurs, tout en interagissant de manière transparente avec d'autres systèmes. Project Astra, présenté en mai dernier, a ainsi été mis à jour grâce aux capacités multimodales de Gemini 2.0. Ce prototype montre comment un assistant IA peut interagir dans des conversations multilingues, se souvenir de sessions passées et utiliser des outils comme Google Maps ou Lens. [embed]https://youtu.be/hIIlJt8JERI[/embed] Project Mariner, de son côté, explore la possibilité pour des agents IA d’assister l’utilisateur dans la navigation sur le web en analysant des éléments de page et en effectuant des actions spécifiques dans le navigateur. [embed]https://youtu.be/2XJqLPqHtyo[/embed] Enfin, Jules, un agent de code alimenté par l'IA, assiste les développeurs. Il s'intègre dans leurs flux de travail GitHub pour gérer les corrections de bogues et autres tâches chronophages.

Marie-Claude Benoit

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.

Gemini 2.0 Flash, le modèle qui ouvre la voie aux agents d'IA de Google

Projets de recherche

Google I/O 2025 : L’IA au cœur de l'écosystème technologique

IA agentique : Salesforce et Google Cloud renforcent leur partenariat pour une IA d’entreprise plus performante

Changement majeur dans la recherche en ligne : Google annonce une mise à jour des AI Overviews et introduit AI Mode