22. Réseaux de neurones convolutifs (CNN)

Les réseaux de neurones convolutifs, mieux connus sous l'acronyme anglais CNN (Convolutional Neural Networks), sont une classe particulière de réseaux de neurones profonds qui se sont révélés extrêmement efficaces dans le domaine du traitement d'images et de la vision par ordinateur. Inspirés par l'organisation du cortex visuel humain, les CNN sont capables de capturer la hiérarchie spatiale des caractéristiques des données visuelles, ce qui les rend adaptés à des tâches telles que la reconnaissance d'images, la détection d'objets et la segmentation sémantique.

Architecture CNN

L'architecture d'un CNN typique est composée de plusieurs couches qui peuvent être regroupées en trois types principaux : les couches convolutives, les couches de pooling et les couches entièrement connectées.

Couches convolutives

Les couches convolutives sont au cœur des CNN. Ils appliquent un ensemble de filtres (également appelés noyaux) à l'entrée pour produire des cartes de fonctionnalités. Chaque filtre est conçu pour détecter un type spécifique de caractéristiques, tel que des bords, des textures ou des motifs plus complexes. Les filtres sont appliqués via une opération mathématique appelée convolution, qui implique une multiplication élémentaire et la somme des valeurs de pixels de l'image avec les valeurs du filtre, en faisant glisser le filtre sur toute la zone de l'image.

Regrouper les calques

Après la convolution, une couche de regroupement (ou de sous-échantillonnage) suit généralement, ce qui réduit la dimensionnalité spatiale des cartes de caractéristiques. Cela contribue à rendre le réseau plus efficace et moins sujet au surajustement, ainsi qu'à rendre les fonctionnalités détectées plus robustes aux variations de position. Le pooling le plus courant est le pooling maximum, qui sélectionne la valeur maximale d'un groupe de pixels dans une fenêtre glissante.

Couches entièrement connectées

Après plusieurs couches convolutionnelles et de pooling, le réseau comprend généralement une ou plusieurs couches entièrement connectées. Ces couches sont similaires aux couches d'un réseau neuronal traditionnel, où chaque neurone est connecté à tous les neurones de la couche précédente. Le but de ces couches est de combiner les fonctionnalités apprises par les couches précédentes pour effectuer la tâche finale, telle que la classification des images.

Apprendre et former un CNN

Entraîner un CNN implique d'ajuster les poids des filtres et des neurones dans les couches entièrement connectées. Cela se fait grâce à un algorithme d'optimisation tel que la descente de gradient stochastique (SGD) ainsi qu'une fonction de perte appropriée telle que l'entropie croisée pour les tâches de classification. Au cours de la formation, le réseau apprend à extraire des fonctionnalités de plus en plus abstraites et pertinentes pour la tâche à accomplir, à mesure que les informations circulent des couches d'entrée vers les couches plus profondes.

Innovations et améliorations dans les CNN

Au fil des années, de nombreuses innovations ont été proposées pour améliorer les performances des CNN. Parmi les plus notables figurent :

  • Fonctions d'activation : des fonctions telles que ReLU (Rectified Linear Unit) ont été préférées aux sigmoïdes et au tanh pour accélérer l'entraînement et atténuer le problème de l'évanouissement du gradient.
  • Initialisation du poids : des techniques telles que l'initialisation He et Glorot aident à démarrer l'entraînement avec des poids sur une échelle appropriée, favorisant une convergence plus rapide.
  • Normalisation par lots : cette technique normalise les entrées de chaque couche afin de stabiliser l'apprentissage et de permettre des taux d'apprentissage plus élevés.
  • Abandon : il consiste à désactiver aléatoirement des neurones pendant l'entraînement pour éviter le surapprentissage et forcer le réseau à apprendre des représentations plus robustes.
  • Archites avancées : des modèles tels que AlexNet, VGG, ResNet, Inception et DenseNet ont apporté des améliorations significatives en termes de profondeur, d'efficacité et de capacité de généralisation.

Applications des CNN

Les CNN ont un large éventail d'applications, notamment :

  • Reconnaissance et classification d'images
  • Détection et suivi d'objets
  • Segmentation sémantique et d'instance
  • Analyse vidéo et reconnaissance d'actions
  • Diagnostic d'imagerie médicale
  • Véhicules autonomes
  • Traitement du langage naturel (lorsqu'il est adapté en tant que CNN 1D)

Défis et considérations futures

Malgré leur succès, les CNN sont toujours confrontés à des défis tels que le besoin de grandes quantités de données étiquetées pour la formation, l'interprétabilité des modèles et l'efficacité des calculs. Des recherches continuent d'être menées pour relever ces défis, notamment les méthodes d'apprentissage semi-supervisé, l'apprentissage par transfert, les réseaux neuronaux explicables et l'optimisation matérielle pour l'inférence temporelle.le vrai.

En résumé, les CNN représentent l’une des plus grandes réussites dans le domaine de l’apprentissage automatique et continuent de faire avancer les progrès dans divers domaines appliqués. Avec l’évolution continue de la technologie et les recherches en cours, nous pouvons nous attendre à ce que les CNN jouent un rôle encore plus important dans la résolution de problèmes complexes de perception et d’analyse des données.

Répondez maintenant à l’exercice sur le contenu :

Laquelle des affirmations suivantes concernant les réseaux de neurones convolutifs (CNN) est vraie ?

Tu as raison! Félicitations, passez maintenant à la page suivante

Vous avez raté! Essayer à nouveau.

Image de l'article Transfert d’apprentissage et mise au point

Page suivante de lebook gratuit :

84Transfert d’apprentissage et mise au point

0 minutes

Obtenez votre certificat pour ce cours gratuitement ! en téléchargeant lapplication Cursa et en lisant lebook qui sy trouve. Disponible sur Google Play ou App Store !

Get it on Google Play Get it on App Store

+ 6,5 millions
d'étudiants

Certificat gratuit et
valide avec QR Code

48 mille exercices
gratuits

Note de 4,8/5 dans les
magasins d'applications

Cours gratuits en
vidéo, audio et texte