Onbegeleid leren is een tak van kunstmatige intelligentie en machine learning waarbij algoritmen leren van niet-gelabelde data, dat wil zeggen zonder vooraf gedefinieerde uitkomsten. In tegenstelling tot begeleid leren is er geen 'ground truth' die het leerproces stuurt. Het doel is patronen, structuren of natuurlijke groeperingen in de data te ontdekken. Dit omvat vaak taken zoals clustering, dimensiereductie of anomaliedetectie. Onbegeleid leren onderscheidt zich door de mogelijkheid om grote datasets zonder menselijke tussenkomst te verkennen, maar vereist doorgaans deskundige interpretatie van de resultaten.

Toepassingen en voorbeelden

Onbegeleid leren wordt gebruikt voor het segmenteren van klanten in marketing, het detecteren van fraude of uitschieters in de financiële sector, het automatisch ordenen van documenten op onderwerp en voor verkennende data-analyse in wetenschap en geneeskunde. Andere voorbeelden zijn aanbevelingssystemen, beeldcompressie en het ontdekken van nieuwe gedragspatronen op sociale netwerken.

Belangrijkste softwaretools, libraries en frameworks

Populaire tools zijn onder andere scikit-learn (Python), TensorFlow en PyTorch voor geavanceerdere implementaties. Voor clustering zijn K-means, DBSCAN en Spectral Clustering veelgebruikte algoritmen. Voor dimensiereductie zijn PCA (Principal Component Analysis), t-SNE en UMAP gangbaar. Platforms zoals RapidMiner en KNIME bieden grafische interfaces voor onbegeleide leerprocessen.

Recente ontwikkelingen, evoluties en trends

Recente ontwikkelingen richten zich op het integreren van onbegeleid leren in deep learning-architecturen, zoals auto-encoders of neurale netwerk gebaseerde clusteringmodellen. Zelf-lerende methoden, waarbij kunstmatige taken uit niet-gelabelde data worden gegenereerd, vervagen de grens tussen begeleid en onbegeleid leren. Onbegeleid leren wordt steeds belangrijker voor datavoorbereiding voor generatieve modellen en de analyse van grote datasets, wat leidt tot meer autonome en robuuste AI-toepassingen.