Wydanie Scikit-learn 1.7: w kierunku bardziej płynnego i efektywnego doświadczenia

Wydanie Scikit-learn 1.7: w kierunku bardziej płynnego i efektywnego doświadczenia

W skrócie : Scikit-learn 1.7 wprowadza ulepszenia w wizualizacji HTML, walidację dla Gradient Boosting, natywną wizualizację ROC, rozszerzoną kompatybilność z API Array i aktualizacje perceptronu wielowarstwowego.

Scikit-learn, niezbędna biblioteka open source dla ML w Pythonie, nadal się rozwija wraz z wersją 1.7, opublikowaną 5 czerwca. Ta aktualizacja wzmacnia ergonomię, kompatybilność z innymi narzędziami oraz efektywność przepływów pracy w zakresie uczenia maszynowego.

Ulepszenia i nowe funkcjonalności

Ulepszona wizualizacja HTML dla estymatorów

Reprezentacja HTML w Jupyterze teraz wyświetla pełną listę parametrów, z wyróżnieniem tych, które różnią się od wartości domyślnych. Przycisk ułatwia kopiowanie w pełni kwalifikowanych nazw, przyspieszając konfigurację zagnieżdżonych potoków i wyszukiwanie hiperparametrów.

Spersonalizowana walidacja dla Gradient Boosting opartego na histogramie

Modele HistGradientBoosting mogą teraz otrzymywać jawny zestaw walidacyjny (X_val, y_val, sample_weight_val) za pośrednictwem metody .fit() w celu lepszego kalibrowania wczesnego zatrzymania. Ta funkcjonalność poprawia zarządzanie nadmiernym dopasowaniem, ale opiera się na systemie routingu metadanych (enable_metadata_routing=True), który jest jeszcze mało używany.

Natywna wizualizacja ROC z wyników krzyżowych

Nowa metoda from_cv_results() dla RocCurveDisplay umożliwia automatyczne generowanie wielu krzywych ROC na podstawie wyników walidacji krzyżowej (cross_validate). Ta funkcjonalność upraszcza analizę porównawczą modeli i integruje bezpośrednio diagnostykę wizualną w przepływach pracy uczenia maszynowego, bez potrzeby korzystania z narzędzi zewnętrznych.

Rozszerzona kompatybilność z API Array

Wiele metryk (np. fbeta_score, explained_variance_score) akceptuje teraz struktury danych kompatybilne z API Array (pochodzące m.in. z PyTorch lub CuPy). Moduł array-api-compat jest zintegrowany natywnie.

Aktualizacje dla wielowarstwowego perceptronu

Wielowarstwowy perceptron teraz integruje stratę Poissona, oprócz domyślnej straty squared_error. Obsługuje również wagi próbek, poprawiając elastyczność dla różnych zastosowań.

Migracja do rzadkich tablic

Wszyscy estymatorzy, którzy akceptują klasyczne rzadkie macierze wejściowe (scipy.sparse), teraz akceptują nowe rzadkie tablice (sparray), przygotowując trwającą migrację SciPy.
Instalacja
Nową wersję można zainstalować za pomocą pip : pip install --upgrade scikit-learn
lub za pomocą conda : conda install -c conda-forge scikit-learn