W skrócie : Scikit-learn 1.7 wprowadza ulepszenia w wizualizacji HTML, walidację dla Gradient Boosting, natywną wizualizację ROC, rozszerzoną kompatybilność z API Array i aktualizacje perceptronu wielowarstwowego.
Scikit-learn, niezbędna biblioteka open source dla ML w Pythonie, nadal się rozwija wraz z wersją 1.7, opublikowaną 5 czerwca. Ta aktualizacja wzmacnia ergonomię, kompatybilność z innymi narzędziami oraz efektywność przepływów pracy w zakresie uczenia maszynowego.
Ulepszenia i nowe funkcjonalności
Ulepszona wizualizacja HTML dla estymatorów
Reprezentacja HTML w Jupyterze teraz wyświetla pełną listę parametrów, z wyróżnieniem tych, które różnią się od wartości domyślnych. Przycisk ułatwia kopiowanie w pełni kwalifikowanych nazw, przyspieszając konfigurację zagnieżdżonych potoków i wyszukiwanie hiperparametrów.
Spersonalizowana walidacja dla Gradient Boosting opartego na histogramie
Modele HistGradientBoosting mogą teraz otrzymywać jawny zestaw walidacyjny (
X_val, y_val, sample_weight_val) za pośrednictwem metody .fit() w celu lepszego kalibrowania wczesnego zatrzymania. Ta funkcjonalność poprawia zarządzanie nadmiernym dopasowaniem, ale opiera się na systemie routingu metadanych (enable_metadata_routing=True ), który jest jeszcze mało używany.Natywna wizualizacja ROC z wyników krzyżowych
Nowa metoda
from_cv_results() dla RocCurveDisplay umożliwia automatyczne generowanie wielu krzywych ROC na podstawie wyników walidacji krzyżowej (cross_validate). Ta funkcjonalność upraszcza analizę porównawczą modeli i integruje bezpośrednio diagnostykę wizualną w przepływach pracy uczenia maszynowego, bez potrzeby korzystania z narzędzi zewnętrznych.Rozszerzona kompatybilność z API Array
Wiele metryk (np.
fbeta_score, explained_variance_score) akceptuje teraz struktury danych kompatybilne z API Array (pochodzące m.in. z PyTorch lub CuPy). Moduł array-api-compat jest zintegrowany natywnie.Aktualizacje dla wielowarstwowego perceptronu
Wielowarstwowy perceptron teraz integruje stratę Poissona, oprócz domyślnej straty squared_error. Obsługuje również wagi próbek, poprawiając elastyczność dla różnych zastosowań.
Migracja do rzadkich tablic
Wszyscy estymatorzy, którzy akceptują klasyczne rzadkie macierze wejściowe (
scipy.sparse), teraz akceptują nowe rzadkie tablice (sparray), przygotowując trwającą migrację SciPy.Instalacja
Nową wersję można zainstalować za pomocą pip : pip install --upgrade scikit-learn
lub za pomocą conda : conda install -c conda-forge scikit-learn