Transformer les images 2D en scènes 3D est le sujet de nombreuses recherches, Nvidia Research a récemment présenté Instant NeRf, un modèle d'IA capable de le faire très rapidement, différents logiciels sont proposés gratuitement dans ce but sur Internet. Des chercheurs de l'Université de Stanford et de NVIDIA ont utilisé les GAN (Generative Antagonist Networks ou Réseaux antagonistes Génératifs) pour créer des rendus 3D réalistes. Leur étude intitulée « Efficient Geometry-aware 3D Generative Adversarial Networks » a été publiée sur Arxiv et partagée sur la plateforme Github.
La génération non supervisée d’images 3D de haute qualité utilisant uniquement des collections de photographies 2D à vue unique est un défi de longue date. Les GAN 3D existants sont soit gourmands en calcul, soit font des approximations qui ne sont pas cohérentes en 3D, limitant la qualité et la résolution des images générées.
Dans cette étude, les chercheurs de Stanford et de Nvidia ont amélioré l'efficacité de calcul et la qualité d'image des GAN 3D sans trop se fier à ces approximations. La formation d'un GAN avec un rendu neuronal est coûteuse, ils ont choisi d'introduire une architecture de réseau expressive hybride explicite-implicite qui, associée à d'autres choix de conception, synthétise non seulement des images haute résolution multi-vues cohérentes en temps réel, mais produit également une géométrie 3D de haute qualité.
Cette représentation combine une colonne vertébrale explicite, qui produit des caractéristiques alignées sur trois plans orthogonaux, avec un petit décodeur implicite. Par rapport à une représentation de perceptron multicouche typique, elle est plus de sept fois plus rapide et utilise moins d’un seizième de plus de mémoire.
En découplant la génération de caractéristiques et le rendu neuronal, leur cadre peut tirer parti des générateurs CNN 2D de pointe, tels que StyleGAN2, et hérite de leur efficacité et de leur expressivité.
Des chercheurs de l'Université de Stanford et de NVIDIA publient l'étude « EG3D : GAN 3D efficaces et sensibles à la géométrie »

Acteurs cités
Sur le même sujet
Meta AI présente DINOv3, sa nouvelle génération de modèles de vision par ordinateur avec apprentissage auto-supervisé
03/09/2025
La conférence NVIDIA GTC revient du 17 au 21 mars 2025 à San Jose (Californie) et online
03/03/2025
Vers une nouvelle ère du storytelling : après Gen-4, Runway lance Gen-4 Turbo
15/04/2025
L'Hebdo ActuIA
Inscription confirmée, à très vite !