Scikit-learn, biblioteca open source indispensable de ML en Python, continúa evolucionando con la versión 1.7 publicada el pasado 5 de junio. Esta actualización refuerza la ergonomía, la compatibilidad con otras herramientas y la eficiencia de los workflows de aprendizaje automático.

Mejoras y nuevas funcionalidades

Visualización HTML mejorada de los estimadores

La representación HTML en Jupyter ahora muestra la lista completa de parámetros, con un resaltado de aquellos que difieren de los valores predeterminados. Un botón facilita la copia de los nombres completamente calificados, acelerando la configuración de los pipelines anidados y la búsqueda de hiperparámetros.

Validación personalizada para Gradient Boosting basado en histograma

Los modelos HistGradientBoosting ahora pueden recibir un conjunto de validación explícito (X_val, y_val, sample_weight_val) a través del método .fit() para calibrar mejor la detención anticipada. Esta capacidad afina la gestión del sobreajuste, pero se basa en el sistema de enrutamiento de metadatos (enable_metadata_routing=True), aún poco utilizado.

Visualización ROC nativa desde resultados cruzados

El nuevo método from_cv_results() para RocCurveDisplay permite generar automáticamente múltiples curvas ROC a partir de los resultados de validación cruzada (cross_validate). Esta funcionalidad simplifica el análisis comparativo de los modelos e integra directamente el diagnóstico visual en los workflows de machine learning, sin necesidad de herramientas de terceros.

Compatibilidad extendida con la API Array

Varias métricas (e.g., fbeta_score, explained_variance_score) ahora aceptan estructuras de datos compatibles con Array API (particularmente provenientes de PyTorch o CuPy). El módulo array-api-compat está integrado de manera nativa.

Actualizaciones del Perceptrón multicapa

El Perceptrón multicapa ahora integra la pérdida Poisson, además de la pérdida squared_error por defecto. También admite los pesos de muestra, mejorando su flexibilidad para diversas aplicaciones.

Migración hacia los arrays dispersos

Todos los estimadores que aceptan matrices dispersas clásicas (scipy.sparse) como entrada, ahora aceptan los nuevos arrays dispersos (sparray), preparando la transición en curso de SciPy.
Instalación

La nueva versión se puede instalar via pip: pip install --upgrade scikit-learn
o con conda: conda install -c conda-forge scikit-learn