Actualité Tutoriel Comprendre les réseaux de neurones convolutifs

Pour approfondir le sujet

Microsoft Build 2020 : Microsoft annonce un superordinateur pour l’entraînement de nouveaux modèles d’intelligence artificielle

À l'occasion de sa conférence Build 2020, Microsoft a dévoilé un superordinateur, conçu en partenariat avec OpenAI. Annoncé comme l'un des cinq plus puissants...

Experience Analytics : Contentsquare lève 190 millions de dollars en Série D

La pépite française Contentsquare, experte en Experience Analytics, a annoncé en ce début de semaine avoir finalisé une levée de fonds de 190 millions...

Projet Cap’FALC : l’outil numérique au service d’une société inclusive d’Inria, Facebook Artificial Intelligence Research et l’Unapei

Face à la crise sanitaire et économique actuelle, il est important que pouvoir transmettre à tous les citoyens les informations leur permettant de comprendre...

Comprendre les réseaux de neurones convolutifs

Thibault Neveu aborde les réseaux à convolution  (CNN), très utilisés dans les applications graphiques (traitement et reconnaissance d’images ou vidéos), mais également dans les systèmes de recommandation.

Les réseaux à convolution sont notamment très utilisés pour l’analyse d’images. Les deux  caractéristiques principales des réseaux convolutifs sont qu’ils utilisent des filtres (kernel) et mettent en oeuvre du pooling.

Les filtres analysent les images zones par zones. Chaque filtre se spécialise de façon à reconnaître des motifs (patterns). Un filtre peut par exemple se spécialiser dans la détection des contours, tandis qu’un autre reconnaîtra certaines formes. La convolution a pour effet d’augmenter la profondeur de la matrice correspondant à l’image, puisque chaque filtre lui ajoutera une couche. Une image qui a une profondeur de 3 couches (le nombre 3 correspondant aux 3 canaux RGB) pourra ainsi résulter en une matrice d’une profondeur de 5, si le réseau convolutif est constitué de 5 filtres.

Le pooling permet quant à lui de réduire la taille d’une image en n’en conservant que les pixels les plus importants. Cela a pour effet de déformer l’image en perdant le positionnement précis des pixels. Cet effet est en fait bénéfique, puisqu’il permet de limiter les risques de surapprentissage. A titre d’exemple, un système de détection des visages aura tout intérêt à apprendre qu’un visage est constitué de deux yeux, d’un nez et d’une bouche, mais il est préférable qu’il n’apprenne pas par coeur l’espacement au pixel près entre ces différents éléments du visage, puisque leur position peut varier d’une personne à l’autre. Il existe d’autres techniques que le pooling, notamment amenées par les capsule Networks, nouvelle technique qui ne sera pas abordée dans le cadre de ce tutoriel sur les réseaux convolutifs.

Accéder à la vidéo suivante tutoriel : implémenter un réseau de neurones convolutif.

Contributeur expert

Partager l'article

Dernières actualités

Microsoft Build 2020 : Microsoft annonce un superordinateur pour l’entraînement de nouveaux modèles d’intelligence artificielle

À l'occasion de sa conférence Build 2020, Microsoft a dévoilé un superordinateur, conçu en partenariat avec OpenAI. Annoncé comme l'un des cinq plus puissants...

Experience Analytics : Contentsquare lève 190 millions de dollars en Série D

La pépite française Contentsquare, experte en Experience Analytics, a annoncé en ce début de semaine avoir finalisé une levée de fonds de 190 millions...

Projet Cap’FALC : l’outil numérique au service d’une société inclusive d’Inria, Facebook Artificial Intelligence Research et l’Unapei

Face à la crise sanitaire et économique actuelle, il est important que pouvoir transmettre à tous les citoyens les informations leur permettant de comprendre...

La Commission européenne annonce 122 millions d’euros supplémentaires pour la recherche et l’innovation

La Commission européenne a annoncé la mobilisation de 122 millions d'euros supplémentaires dans le cadre de son programme de recherche et d'innovation Horizon 2020...