Stability AI annonce SDXL, le dernier modèle de la suite Stable Diffusion

Stability AI annonce la sortie de Stabile Diffusion XL (SDXL), son dernier ajout à la suite de modèles Stable Diffusion proposée via ses API destinées aux développeurs d’entreprises. Actuellement en version bêta sur DreamStudio et d'autres applications populaires, comme tous les modèles de base de Stability AI, SDXL sera publié en open source dans un avenir proche. La sortie publique de Stable Diffusion avait été annoncée par Stability AI en août 2022. Ce modèle open source est le fruit d’une collaboration entre la start-up, RunwayML, des groupes de recherche du centre Machine Vision & Learning au LMU de Munich (anciennement laboratoire CompVis à l’Université de Heidelberg), d’EleutherAI et de LAION. La version Stable Diffusion 2.1, publiée le mois de décembre suivant, est disponible en deux résolutions: 768x768 pixels et 512x512 pixels. SDXL compte 2,3 milliards de paramètres, contre 900 millions pour le modèle original et comme lui génère des images de 512x512 pixels. Selon la start-up, SDXL produit des images et des compositions plus détaillées que son prédécesseur Stable Diffusion 2.1, et représente une étape importante dans la lignée des modèles de génération d’images de Stability. Tom Mason, Stability AI Chief Technology Officer, déclare :

« Nous sommes ravis d’annoncer la dernière itération de notre série de solutions d’images Stable Diffusion. SDXL apporte une richesse à la génération d’images qui est transformatrice dans plusieurs industries, y compris la conception graphique et l’architecture, avec des résultats qui se déroulent sous nos yeux ».

Les points forts de SDXL

SDXL offre des résultats photoréalistes et esthétiques supérieurs à ceux des versions précédentes : l'anatomie humaine est nettement mieux gérée par SDXL, même si le problème des doigts subsiste parfois, la génération de portrait de style photo est, quant à elle, très réaliste. Les images sont plus précises, les invites sont mieux compris que par les modèles v1. Le modèle a également une plus grande capacité à générer du texte lisible : bien qu'il ne soit pas toujours très précis, il est bien meilleur que la version 2.1. SDXL dispose de fonctionnalités qui vont au-delà de la simple invite de texte à image, notamment l’invite d’image à image (saisie d’une image pour obtenir des variations de cette image), Inpainting (reconstruction des parties manquantes d’une image) et outpainting (construction d’une extension transparente d’une image existante). SDXL alimente la version la plus récente de DreamStudio, l’application d’imagerie grand public de Stability AI, ainsi que des applications tierces populaires telles que NightCafe Studio. Selon la start-up, la réponse des bêta-testeurs a été très positive, avec des images incroyables publiées en ligne et dans les forums communautaires. Emad Mostaque, PDG de Stability AI, a déclaré sur Discord s'attendre à une « génération d'images au pixel près » qui ne se distingue pas des vraies photos. Pour tester gratuitement Stable Diffusion XL : https://clipdrop.co/stable-diffusion/

Marie-Claude Benoit

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.

Stability AI annonce SDXL, le dernier modèle de la suite Stable Diffusion

Les points forts de SDXL

OpenAI intègre GPT-Image-1 à son API Images

Mistral AI lance Mistral Small 3.1 : une nouvelle référence pour l'IA open source ?

Meta AI présente DINOv3, sa nouvelle génération de modèles de vision par ordinateur avec apprentissage auto-supervisé