Scikit-learn, libreria open source indispensabile del ML in Python, continua ad evolversi con la versione 1.7 pubblicata il 5 giugno scorso. Questo aggiornamento rafforza l’ergonomia, la compatibilità con altri strumenti e l’efficienza dei flussi di lavoro di apprendimento automatico.
Miglioramenti e nuove funzionalità
Visualizzazione HTML migliorata degli stimatori
La rappresentazione HTML in Jupyter ora mostra l'elenco completo dei parametri, evidenziando quelli che differiscono dai valori predefiniti. Un pulsante facilita la copia dei nomi completamente qualificati, accelerando la configurazione dei pipeline annidati e la ricerca di iperparametri.
Validazione personalizzata per Gradient Boosting basato su istogramma
I modelli HistGradientBoosting possono ora ricevere un set di validazione esplicito (
X_val, y_val, sample_weight_val) tramite il metodo .fit() per calibrare meglio l’arresto anticipato. Questa capacità affina la gestione dell’overfitting, ma si basa sul sistema di routing dei metadati (enable_metadata_routing=True ), ancora poco utilizzato.Visualizzazione ROC nativa dai risultati incrociati
Il nuovo metodo
from_cv_results() per RocCurveDisplay permette di generare automaticamente più curve ROC dai risultati di validazione incrociata (cross_validate). Questa funzionalità semplifica l’analisi comparativa dei modelli e integra direttamente la diagnosi visiva nei flussi di lavoro di machine learning, senza necessità di strumenti di terze parti.Compatibilità estesa con l’API Array
Diverse metriche (es.,
fbeta_score, explained_variance_score) accettano ora strutture di dati compatibili Array API (provenienti in particolare da PyTorch o CuPy). Il modulo array-api-compat è integrato nativamente.Aggiornamenti del Perceptron multistrato
Il Perceptron multistrato integra ora la perdita Poisson, oltre alla perdita squared_error predefinita. Supporta anche i pesi dei campioni, migliorando la sua flessibilità per varie applicazioni.
Migrazione verso i tabelle sparse
Tutti gli stimatori che accettano in input le matrici sparse classiche (
scipy.sparse), accettano ora i nuovi tabelle sparse (sparray), preparando la transizione in corso di SciPy.Installazione
La nuova versione può essere installata tramite pip : pip install --upgrade scikit-learn
o con conda : conda install -c conda-forge scikit-learn