Beeldclassificatie is een fundamentele taak binnen kunstmatige intelligentie waarbij aan een digitale afbeelding, op basis van de visuele inhoud, één of meerdere vooraf gedefinieerde labels worden toegekend. Dit gebeurt voornamelijk via machine learning en deep learning algoritmes die relevante kenmerken uit afbeeldingen kunnen extraheren om onderscheid te maken tussen categorieën. Beeldclassificatie verschilt van objectdetectie of segmentatie doordat het zich richt op het categoriseren van de volledige afbeelding, zonder objecten te lokaliseren of gebieden te segmenteren. Vaak worden convolutionele neurale netwerken (CNN's) gebruikt, die hiërarchische visuele patronen leren herkennen. Deze technologie maakt het mogelijk automatisch objecten, scenes of afwijkingen in afbeeldingen te herkennen.

Toepassingen en voorbeelden

Beeldclassificatie wordt toegepast bij gezichtsherkenning voor beveiliging, AI-ondersteunde medische diagnostiek (analyseren van radiologische beelden), automatische fotosortering, industriële monitoring (detectie van defecten) en contentbeheer op sociale media (moderatie van afbeeldingen). Ook in de precisielandbouw (herkennen van plantenziekten) en automotive systemen (verkeersbordherkenning) speelt het een rol.

Belangrijkste software, bibliotheken en frameworks

Veelgebruikte tools zijn TensorFlow, PyTorch, Keras, scikit-learn, FastAI en OpenCV. Deze bieden modules voor het bouwen, trainen en evalueren van beeldclassificatiemodellen. Voor geavanceerde toepassingen worden vaak voorgetrainde netwerken zoals ResNet, Inception, VGG of EfficientNet gebruikt.

Recente ontwikkelingen en trends

Recente ontwikkelingen richten zich op efficiënte Transformer-architecturen (Vision Transformers, ViT), zelf-supervised learning, het verkleinen van modellen voor embedded toepassingen en het verbeteren van robuustheid tegen bias en adversariële aanvallen. Automatische annotatie en semi-supervised learning verminderen de afhankelijkheid van grote gelabelde datasets en verbreden de toepassingsmogelijkheden.