Développée initialement par Databricks en 2018, MLflow est une plateforme open source utilisée par de nombreuses organisations, notamment pour les tests de ML. Après qu'une vulnérabilité critique du framework ait été signalée, celle-ci a été corrigée dans la version 2.2.1 publiée il y a 3 semaines, on ne peut que conseiller aux entreprises d'effectuer une mise à jour vers cette dernière version.
MLflow est un outil très populaire (plus de 13 millions de téléchargements mensuels) écrit en Python, utilisé pour gérer le cycle de vie complet de l'apprentissage automatique, conçu pour fonctionner avec n'importe quelle bibliothèque et algorithme d'apprentissage machine et qui peut être utilisé dans l'infrastructure ML existante d'une organisation.
Le framework compte quatre composants principaux:
- MLflow Tracking : permet d'enregistrer et de consulter des expériences, y compris du code, des données, des configurations et des résultats;
- MLflow Projects : fournit un format pour empaqueter le code de science des données de manière réutilisable et reproductible. Il définit des conventions pour spécifier les dépendances et exécuter le code;
- MLflow Models : fournit un format pour empaqueter les modèles d'apprentissage machine qui peuvent être utilisés dans une variété d'outils en aval, tels que la desserte en temps réel via une API REST ou l'inférence par lots sur Apache Spark;
- MLflow Model Registry: Ce composant fournit un magasin de modèles centralisé, un ensemble d'API et une interface utilisateur pour gérer de manière collaborative le cycle de vie complet d'un modèle MLflow.
