Uitgave van Scikit-learn 1.7: naar een soepelere en efficiëntere ervaring

Uitgave van Scikit-learn 1.7: naar een soepelere en efficiëntere ervaring

In kort : Scikit-learn 1.7 biedt verbeterde ergonomie, compatibiliteit en efficiëntie voor machine learning met nieuwe functies zoals verbeterde HTML-visualisatie, aangepaste validatie, native ROC-visualisatie en uitgebreide Array API-compatibiliteit.

Scikit-learn, een onmisbare open source bibliotheek voor ML in Python, blijft evolueren met de versie 1.7, uitgebracht op 5 juni jongstleden. Deze update verbetert de ergonomie, compatibiliteit met andere tools en de efficiëntie van machine learning workflows.

Verbeteringen en nieuwe functies

Verbeterde HTML-visualisatie van schatters

De HTML-weergave in Jupyter toont nu de volledige lijst van parameters, met markering van degenen die verschillen van de standaardwaarden. Een knop vergemakkelijkt het kopiëren van volledig gekwalificeerde namen, waardoor de configuratie van geneste pipelines en de zoektocht naar hyperparameters versneld wordt.

Aangepaste validatie voor histogram-gebaseerde Gradient Boosting

HistGradientBoosting-modellen kunnen nu een expliciete validatieset (X_val, y_val, sample_weight_val) ontvangen via de .fit() methode om een betere kalibratie van vroegtijdig stoppen te bereiken. Deze mogelijkheid verfijnt de aanpak van overfitting, maar is afhankelijk van het metadataroutingsysteem (enable_metadata_routing=True), dat nog weinig wordt gebruikt.

Native ROC-visualisatie vanuit kruisvalidatieresultaten

De nieuwe methode from_cv_results() voor RocCurveDisplay maakt het mogelijk om automatisch meerdere ROC-curves te genereren vanuit kruisvalidatieresultaten (cross_validate). Deze functie vereenvoudigt de vergelijkende analyse van modellen en integreert visuele diagnostiek direct in machine learning workflows, zonder dat er externe tools nodig zijn.

Uitgebreide compatibiliteit met de Array API

Verschillende metrics (bijv. fbeta_score, explained_variance_score) accepteren nu gegevensstructuren die compatibel zijn met de Array API (met name afkomstig van PyTorch of CuPy). De module array-api-compat is native geïntegreerd.

Updates van de Multilayer Perceptron

De Multilayer Perceptron omvat nu het Poisson-verlies, naast het standaard squared_error-verlies. Het ondersteunt ook steekproefgewichten, wat de flexibiliteit voor diverse toepassingen vergroot.

Migratie naar dunne arrays

Alle schatters die klassieke schaars matrices als invoer accepteren (scipy.sparse), accepteren nu de nieuwe dunne arrays (sparray), ter voorbereiding op de lopende overgang van SciPy.
Installatie

De nieuwe versie kan worden geïnstalleerd via pip: pip install --upgrade scikit-learn
of met conda : conda install -c conda-forge scikit-learn