Lançamento do Scikit-learn 1.7: em direção a uma experiência mais fluida e eficiente

Lançamento do Scikit-learn 1.7: em direção a uma experiência mais fluida e eficiente

Em resumo : A versão 1.7 do Scikit-learn introduz melhorias na usabilidade, compatibilidade e eficiência para aprendizado de máquina em Python.

Scikit-learn, biblioteca open source essencial para ML em Python, continua a evoluir com a versão 1.7 lançada no dia 5 de junho. Esta atualização reforça a ergonomia, a compatibilidade com outras ferramentas e a eficiência dos fluxos de trabalho de aprendizado de máquina.

Melhorias e novas funcionalidades

Visualização HTML aprimorada dos estimadores

A representação HTML no Jupyter agora exibe a lista completa de parâmetros, destacando aqueles que diferem dos valores padrão. Um botão facilita a cópia dos nomes totalmente qualificados, acelerando a configuração dos pipelines aninhados e a busca de hiperparâmetros.

Validação personalizada para Gradient Boosting baseado em histograma

Os modelos HistGradientBoosting agora podem receber um conjunto de validação explícito (X_val, y_val, sample_weight_val) através do método .fit() para melhor calibrar a parada antecipada. Essa capacidade refina o gerenciamento de sobreajuste, mas depende do sistema de roteamento de metadados (enable_metadata_routing=True), ainda pouco utilizado.

Visualização ROC nativa a partir de resultados cruzados

O novo método from_cv_results() para RocCurveDisplay permite gerar automaticamente várias curvas ROC a partir dos resultados de validação cruzada (cross_validate). Esta funcionalidade simplifica a análise comparativa dos modelos e integra diretamente o diagnóstico visual nos fluxos de trabalho de machine learning, sem a necessidade de ferramentas de terceiros.

Compatibilidade ampliada com a API Array

Várias métricas (e.g., fbeta_score, explained_variance_score) agora aceitam estruturas de dados compatíveis com a API Array (notadamente provenientes de PyTorch ou CuPy). O módulo array-api-compat é integrado nativamente.

Atualizações do Perceptron multicamada

O Perceptron multicamada agora integra a perda de Poisson, além da perda squared_error padrão. Ele também suporta pesos de amostra, melhorando sua flexibilidade para várias aplicações.

Migração para matrizes esparsas

Todos os estimadores que aceitam em entrada as matrizes esparsas clássicas (scipy.sparse), agora aceitam as novas matrizes esparsas (sparray), preparando a transição em curso do SciPy.
Instalação
A nova versão pode ser instalada via pip: pip install --upgrade scikit-learn
ou com conda: conda install -c conda-forge scikit-learn