Une intelligence artificielle qui rend invisible / Deep Flow-Guided Video Inpainting

Pour approfondir le sujet

Sur le même thème :

Prédictions Kaspersky : détournement de l’IA, open source et hacktivisme, à quoi s’attendre des APT en 2025 ?

La Global Research and Analysis Team (GReAT) de Kaspersky, un acteur mondial de la cybersécurité, a récemment publié ses prédictions pour 2025 en matière...

Sora Turbo : l’IA générative de vidéos d’OpenAI est désormais disponible

En février dernier, OpenAI dévoilait son premier modèle text-to-video, Sora, depuis lors en preview. La société a annoncé ce 9 décembre le déploiement de...

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

Une intelligence artificielle qui rend invisible / Deep Flow-Guided Video Inpainting

Depuis l’invention du cinéma et de la pellicule, de nombreux traitements manuels devaient être réalisés. Lorsque l’on souhaitait “couper” une scène, on prenait véritable paire de ciseaux !

Du Pixel au “data”…

Avec l’arrivée du numérique, le cinéma, la vidéo est devenu “pixel”, avec l’arrivée de l’IA la vidéo est devenue “data”. Avec les bons modèles, et la quantité de données adéquate, il est possible de détecter des objets dans une image, segmenter une vidéo (découper l’avant-plan de l’arrière-plan et des sujets présents), et créer des effets spéciaux qui demandaient un temps de travail “humain” important : détourage, corrections image par image… un travail si éprouvant que nombre de studios préfèrent parfois abandonner et tourner de nouveau un scène si un objet inattendu apparaît dans le champ.

Des outils vidéos toujours plus performants et automatisés

En vidéo, remplacer un visage par un autre est une technique assez connue aujourd’hui avec le “DeepFake” (et sa dernière évolution capable d’animer un visage avec une seule photo avec Few-Shot Adversarial Learning of Realistic Neural Talking Head Models de Samsung), NVidia nous a prouvé qu’il était possible de reconstruire des zones endommagées d’une photo. Ce qui est plus complexe encore est de faire disparaître totalement un objet dans une vidéo sans utilisation de fond vert ou autre subterfuge physique, mais bien à base d’une solution 100% logicielle avec une IA.

On sélectionne un objet et il disparaît…

Cette solution permet, par une sélection d’une zone de l’objet : le détourer / segmenter, de la retirer, puis de combler l’espace manquant : en résumé l’objet devient invisible ! Une véritable prouesse pour un outil 100% automatique. Il est également possible de supprimer watermark / signature ou tout autre défaut qui apparaîtrait dans une séquence vidéo que l’on souhaite effacer. D’autres modèles antérieurs permettaient d’effacer en partie l’objet avec quelques parasites très visible, cette solution sera très certainement bientôt intégrée à nombre de studios de cinéma voire TV petit à petit. Il ne sera peut-être plus nécessaire de flouter les objets publicitaires dans les reportages TV quand on sait les faire disparaître… Une solution également aux problèmes de vie privée pour les personnes qui ne souhaitent pas apparaître en vidéo ?

Liens :
https://www.groundai.com/project/deep-flow-guided-video-inpainting/1
https://arxiv.org/abs/1905.02884

Contributeur expert

Cedric Vasseur

Cédric Vasseur est conférencier, formateur, chroniqueur spécialiste des nouvelles technologies

Partager l'article

Prédictions Kaspersky : détournement de l’IA, open source et hacktivisme, à quoi s’attendre des APT en 2025 ?

La Global Research and Analysis Team (GReAT) de Kaspersky, un acteur mondial de la cybersécurité, a récemment publié ses prédictions pour 2025 en matière...

Sora Turbo : l’IA générative de vidéos d’OpenAI est désormais disponible

En février dernier, OpenAI dévoilait son premier modèle text-to-video, Sora, depuis lors en preview. La société a annoncé ce 9 décembre le déploiement de...

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...