Supervised learning is een fundamentele methode binnen kunstmatige intelligentie en machine learning waarbij een model wordt getraind op gelabelde datasets. Elke invoer in de trainingsset is gekoppeld aan de verwachte uitvoer (het label), waardoor het algoritme leert om nieuwe data te voorspellen of te classificeren. Dit onderscheidt zich van unsupervised learning (zonder labels) en reinforcement learning (gebaseerd op een beloningssysteem). Supervised learning omvat het optimaliseren van verliesfuncties, cross-validatie en het beheersen van overfitting.
Toepassingsgebieden en voorbeelden
Supervised learning wordt veel toegepast in beeldclassificatie (gezichtsherkenning, objectdetectie), spamdetectie, sentimentanalyse, spraakherkenning, verkoop- of risicovoorspellingen en voorspellend onderhoud. In de gezondheidszorg wordt het ingezet voor diagnose via medische beelden; in de financiële sector voor het voorspellen van wanbetalingen.
Belangrijkste softwaretools, libraries en frameworks
Belangrijke tools zijn scikit-learn, TensorFlow, PyTorch, Keras, XGBoost en LightGBM. Zij bieden uiteenlopende algoritmen (lineaire regressie, random forests, neurale netwerken, SVM) en functionaliteit voor evaluatie en visualisatie.
Laatste ontwikkelingen en trends
Recente ontwikkelingen richten zich op het automatiseren van modelselectie (AutoML), het verbeteren van robuustheid tegen ruis in data en het integreren van semi-supervised of actieve learning voor deels gelabelde datasets. Huidige uitdagingen zijn biasmanagement, modeluitlegbaarheid en het optimaliseren van generalisatie.