Dataset / ressource ouverte

Sortie de Scikit-learn 1.7 : vers une expérience plus fluide et plus efficace

Scikit-learn 1.7, publié le 5 juin 2025, améliore l'ergonomie et la compatibilité de la bibliothèque. La version apporte une visualisation HTML enrichie, une validation personnalisée pour le Gradient Boosting à histogramme, une compatibilité étendue avec l'API Array, des mises à jour du Perceptron multicouche et le support de tableaux clairsemés, facilitant les workflows d'apprentissage automatique.

STStephane Nachez · · ·2 min
Sortie de Scikit-learn 1.7 : vers une expérience plus fluide et plus efficace
Sommaire
Scikit-learn, bibliothèque open source incontournable du ML en Python, continue d'évoluer avec la version 1.7 publiée le 5 juin dernier. Cette mise à jour renforce l’ergonomie, la compatibilité avec d’autres outils et l’efficacité des workflows d’apprentissage automatique.

Améliorations et nouvelles fonctionnalités

Visualisation HTML améliorée des estimateurs

La représentation HTML dans Jupyter affiche désormais la liste complète des paramètres, avec une mise en surbrillance de ceux qui diffèrent des valeurs par défaut. Un bouton facilite la copie des noms pleinement qualifiés, accélérant la configuration des pipelines imbriqués et la recherche d’hyperparamètres.
 

Validation personnalisée pour Gradient Boosting basé histogramme

Les modèles HistGradientBoosting peuvent désormais recevoir un ensemble de validation explicite (X_val, y_val, sample_weight_val) via la méthode .fit()pour mieux calibrer l’arrêt anticipé. Cette capacité affine la gestion du surapprentissage, mais repose sur le système de routage de métadonnées (enable_metadata_routing=True), encore peu utilisé.
 

Visualisation ROC native depuis des résultats croisés

La nouvelle méthode from_cv_results() pour RocCurveDisplay permet de générer automatiquement plusieurs courbes ROC à partir des résultats de validation croisée (cross_validate). Cette fonctionnalité simplifie l’analyse comparative des modèles et intègre directement le diagnostic visuel dans les workflows de machine learning, sans nécessiter d’outils tiers.

Compatibilité étendue avec l’API Array

Plusieurs métriques (e.g., fbeta_score, explained_variance_score) acceptent désormais des structures de données compatibles Array API (notamment issues de PyTorch ou CuPy). Le module array-api-compat est intégré en natif.

Mises à jour du Perceptron multicouche

Le Perceptron multicouche intègre désormais la perte Poisson, en plus de la perte squared_error par défaut. Il prend également en charge les poids d’échantillon, améliorant sa flexibilité pour diverses applications.

Migration vers les tableaux clairsemés

Tous les estimateurs qui acceptent en entrée les matrices creuses classiques (scipy.sparse), acceptent désormais les nouveaux tableaux clairsemés (sparray), préparant la transition en cours de SciPy.
Installation
 
La nouvelle version peut être installée via pip : pip install --upgrade scikit-learn

ou avec conda : conda install -c conda-forge scikit-learn
ST
Stephane Nachez

Rédaction ActuIA — actualités, données et analyses sur l'intelligence artificielle pour les décideurs.