Scikit-learn, bibliothèque open source incontournable du ML en Python, continue d'évoluer avec la version 1.7 publiée le 5 juin dernier. Cette mise à jour renforce l’ergonomie, la compatibilité avec d’autres outils et l’efficacité des workflows d’apprentissage automatique.
Améliorations et nouvelles fonctionnalités
Visualisation HTML améliorée des estimateurs
La représentation HTML dans Jupyter affiche désormais la liste complète des paramètres, avec une mise en surbrillance de ceux qui diffèrent des valeurs par défaut. Un bouton facilite la copie des noms pleinement qualifiés, accélérant la configuration des pipelines imbriqués et la recherche d’hyperparamètres.
Validation personnalisée pour Gradient Boosting basé histogramme
Les modèles HistGradientBoosting peuvent désormais recevoir un ensemble de validation explicite (
X_val, y_val, sample_weight_val) via la méthode .fit()pour mieux calibrer l’arrêt anticipé. Cette capacité affine la gestion du surapprentissage, mais repose sur le système de routage de métadonnées (enable_metadata_routing=True ), encore peu utilisé.Visualisation ROC native depuis des résultats croisés
La nouvelle méthode
from_cv_results() pour RocCurveDisplay permet de générer automatiquement plusieurs courbes ROC à partir des résultats de validation croisée (cross_validate). Cette fonctionnalité simplifie l’analyse comparative des modèles et intègre directement le diagnostic visuel dans les workflows de machine learning, sans nécessiter d’outils tiers.Compatibilité étendue avec l’API Array
Plusieurs métriques (e.g.,
fbeta_score, explained_variance_score) acceptent désormais des structures de données compatibles Array API (notamment issues de PyTorch ou CuPy). Le module array-api-compat est intégré en natif.Mises à jour du Perceptron multicouche
Le Perceptron multicouche intègre désormais la perte Poisson, en plus de la perte squared_error par défaut. Il prend également en charge les poids d’échantillon, améliorant sa flexibilité pour diverses applications.
Migration vers les tableaux clairsemés
Tous les estimateurs qui acceptent en entrée les matrices creuses classiques (
scipy.sparse), acceptent désormais les nouveaux tableaux clairsemés (sparray), préparant la transition en cours de SciPy.Installation
La nouvelle version peut être installée via pip : pip install --upgrade scikit-learn
ou avec conda : conda install -c conda-forge scikit-learn