Scikit-learn 1.7 출시: 더욱 부드럽고 효율적인 경험을 향하여

TLDR : Scikit-learn 1.7 업데이트는 사용 편의성, 호환성, 효율성을 강화하여 머신러닝 워크플로우를 개선합니다.

Scikit-learn, 파이썬의 필수 오픈 소스 머신러닝 라이브러리가 6월 5일에 발표된 1.7 버전으로 계속 발전하고 있습니다. 이번 업데이트는 사용 편의성, 다른 도구와의 호환성, 그리고 머신러닝 워크플로우의 효율성을 강화합니다.

개선 사항 및 새로운 기능

향상된 추정기 HTML 시각화

이제 Jupyter의 HTML 표현은 기본값과 다른 매개변수를 강조하여 전체 매개변수 목록을 표시합니다. 버튼을 통해 완전한 이름을 복사할 수 있어 중첩 파이프라인 구성 및 하이퍼파라미터 검색을 가속화합니다.

히스토그램 기반 Gradient Boosting의 사용자 지정 검증

HistGradientBoosting 모델은 이제 명시적인 검증 세트(X_val, y_val, sample_weight_val)를 .fit() 메서드를 통해 수신하여 조기 중지를 보다 잘 조정할 수 있습니다. 이 기능은 과적합 관리의 세밀함을 더하지만, 아직 널리 사용되지 않은 메타데이터 라우팅 시스템(enable_metadata_routing=True)에 의존합니다.

교차 검증 결과에서의 기본 ROC 시각화

새로운 RocCurveDisplay의 from_cv_results() 메서드는 교차 검증 결과로부터 여러 ROC 곡선을 자동으로 생성할 수 있습니다. 이 기능은 모델의 비교 분석을 단순화하고, 머신러닝 워크플로우에 시각적 진단을 직접 통합하여 타사 도구가 필요 없습니다.

Array API와의 확장된 호환성

여러 메트릭(예: fbeta_score, explained_variance_score)은 이제 Array API와 호환되는 데이터 구조(PyTorch 또는 CuPy에서 유래)를 수용합니다. array-api-compat 모듈이 기본적으로 통합되어 있습니다.

다층 퍼셉트론 업데이트

다층 퍼셉트론은 이제 기본의 squared_error 손실 외에 Poisson 손실을 포함하며, 샘플 가중치를 지원하여 다양한 응용 분야에서 유연성을 향상시킵니다.

희소 배열로의 마이그레이션

클래식 희소 행렬(scipy.sparse)을 입력으로 수용하는 모든 추정기는 이제 새로운 희소 배열(sparray)을 수용하여 진행 중인 SciPy의 전환을 준비합니다.

설치

새 버전은 pip를 통해 설치할 수 있습니다: pip install --upgrade scikit-learn

또는 conda로: conda install -c conda-forge scikit-learn

번역됨 Sortie de Scikit-learn 1.7 : vers une expérience plus fluide et plus efficace