L'apprentissage supervisé est une méthode fondamentale de l'intelligence artificielle et de l'apprentissage automatique où un modèle est entraîné à partir de jeux de données étiquetés. Chaque entrée du jeu d'entraînement est associée à la sortie attendue (l'étiquette), permettant ainsi à l'algorithme d'apprendre à prédire ou classer de nouvelles données. Cette approche se distingue de l'apprentissage non supervisé, qui ne dispose pas d'étiquettes, et de l'apprentissage par renforcement, qui repose sur un système de récompense. L'apprentissage supervisé implique l'optimisation de fonctions de perte, la validation croisée, et la gestion du surapprentissage.

Cas d'usages et exemples d'utilisation

L'apprentissage supervisé est omniprésent dans la classification d'images (reconnaissance faciale, détection d'objets), la détection de spams, l'analyse de sentiment, la reconnaissance vocale, la prévision de ventes ou de risques financiers, et la maintenance prédictive. Par exemple, dans la santé, il permet de diagnostiquer des maladies à partir d'imageries médicales ; dans la finance, de prédire des défauts de paiement.

Principaux outils logiciels, librairies, frameworks

Les principaux outils sont scikit-learn, TensorFlow, PyTorch, Keras, XGBoost, et LightGBM. Ils offrent une large gamme d'algorithmes (régression linéaire, forêts aléatoires, réseaux de neurones, SVM) et des fonctionnalités d'évaluation et de visualisation.

Derniers développements, évolutions et tendances

Les dernières avancées portent sur l'automatisation du choix de modèles (AutoML), l'amélioration de la robustesse face aux données bruitées, et l'intégration de l'apprentissage semi-supervisé ou actif pour exploiter des ensembles de données partiellement étiquetés. Les défis actuels incluent la gestion de la biais, l'explicabilité des modèles et l'optimisation de la généralisation.