In kort : Scikit-learn 1.7 biedt verbeterde ergonomie, compatibiliteit en efficiëntie voor machine learning met nieuwe functies zoals verbeterde HTML-visualisatie, aangepaste validatie, native ROC-visualisatie en uitgebreide Array API-compatibiliteit.
Scikit-learn, een onmisbare open source bibliotheek voor ML in Python, blijft evolueren met de versie 1.7, uitgebracht op 5 juni jongstleden. Deze update verbetert de ergonomie, compatibiliteit met andere tools en de efficiëntie van machine learning workflows.
Verbeteringen en nieuwe functies
Verbeterde HTML-visualisatie van schatters
De HTML-weergave in Jupyter toont nu de volledige lijst van parameters, met markering van degenen die verschillen van de standaardwaarden. Een knop vergemakkelijkt het kopiëren van volledig gekwalificeerde namen, waardoor de configuratie van geneste pipelines en de zoektocht naar hyperparameters versneld wordt.
Aangepaste validatie voor histogram-gebaseerde Gradient Boosting
HistGradientBoosting-modellen kunnen nu een expliciete validatieset (
X_val, y_val, sample_weight_val) ontvangen via de .fit() methode om een betere kalibratie van vroegtijdig stoppen te bereiken. Deze mogelijkheid verfijnt de aanpak van overfitting, maar is afhankelijk van het metadataroutingsysteem (enable_metadata_routing=True ), dat nog weinig wordt gebruikt.Native ROC-visualisatie vanuit kruisvalidatieresultaten
De nieuwe methode
from_cv_results() voor RocCurveDisplay maakt het mogelijk om automatisch meerdere ROC-curves te genereren vanuit kruisvalidatieresultaten (cross_validate). Deze functie vereenvoudigt de vergelijkende analyse van modellen en integreert visuele diagnostiek direct in machine learning workflows, zonder dat er externe tools nodig zijn.Uitgebreide compatibiliteit met de Array API
Verschillende metrics (bijv.
fbeta_score, explained_variance_score) accepteren nu gegevensstructuren die compatibel zijn met de Array API (met name afkomstig van PyTorch of CuPy). De module array-api-compat is native geïntegreerd.Updates van de Multilayer Perceptron
De Multilayer Perceptron omvat nu het Poisson-verlies, naast het standaard squared_error-verlies. Het ondersteunt ook steekproefgewichten, wat de flexibiliteit voor diverse toepassingen vergroot.
Migratie naar dunne arrays
Alle schatters die klassieke schaars matrices als invoer accepteren (
scipy.sparse), accepteren nu de nieuwe dunne arrays (sparray), ter voorbereiding op de lopende overgang van SciPy.Installatie
De nieuwe versie kan worden geïnstalleerd via pip: pip install --upgrade scikit-learn
of met conda : conda install -c conda-forge scikit-learn