La source d'information de référence
sur l'intelligence artificielle

Ai subfield

data science

La data science, ou science des données, est un champ interdisciplinaire qui vise à extraire des connaissances, des insights ou des prédictions à partir de volumes massifs et variés de données, structurées ou non. Elle combine des compétences en statistiques, en analyse de données, en apprentissage automatique (machine learning), en programmation et en compréhension métier. La data science se distingue des disciplines connexes comme la statistique pure ou l'informatique par son approche orientée vers la résolution de problèmes complexes à partir de données réelles, souvent hétérogènes et volumineuses. Elle implique généralement des étapes de collecte, de nettoyage, d'exploration, de modélisation et d'interprétation des données.

Cas d'usages et exemples d'utilisation

La data science s'applique à de nombreux domaines : détection de fraude dans la finance, recommandation de contenus dans le e-commerce, diagnostic médical assisté, prévision de la demande énergétique, analyse de sentiment sur les réseaux sociaux, maintenance prédictive dans l'industrie, ou encore optimisation logistique. Par exemple, les entreprises utilisent la data science pour segmenter leur clientèle, anticiper les ventes ou améliorer leur expérience utilisateur.

Principaux outils logiciels, librairies, frameworks, logiciels

Parmi les outils les plus utilisés en data science, on trouve les langages Python (avec ses librairies pandas, NumPy, scikit-learn, TensorFlow, PyTorch), R (avec tidyverse, caret), ainsi que des plateformes comme Apache Spark pour le traitement distribué. Les notebooks interactifs comme Jupyter facilitent l'analyse exploratoire et la visualisation. Les solutions cloud (AWS SageMaker, Google Cloud AI Platform, Azure ML) permettent l’industrialisation et le passage à l’échelle.

Derniers développements, évolutions et tendances

La data science évolue avec l'intégration de l'intelligence artificielle générative, l'automatisation du machine learning (AutoML), l’explicabilité des modèles (XAI), et l’essor des architectures de données modernes (data lakehouse, data mesh). Les enjeux actuels portent aussi sur la gouvernance des données, la confidentialité, la gestion de la qualité des données et l’intégration de l’éthique dans l’analyse et l’utilisation des résultats.

sur le même thème

75 au total
Création d'entité / lancement de structure · Artefact

Probabl lance le premier programme de certification Scikit-learn

05/11
Appel à projets / AMI / AAP · UCLA

Inclusion et technologie : Break Through Tech AI, une initiative pour former les femmes et les minorités à l'IA

23/05
Nomination · CNRS

Tinashe Mutsvangwa prend la tête du nouveau département data science de l'IMT Atlantique

07/05
Plan / stratégie nationale · GENES

Le GENES annonce un plan de développement pour former plus de data scientists

20/03
Acquisition / rachat · Royaume-Uni

Smart4 Engineering renforce son expertise en IA et data avec l’acquisition de Closer Consulting

26/01
Nomination · Datategy

Arnaud Montebourg rejoint le conseil d'administration de Datategy afin d'en faire le champion de l’IA souveraine

26/12
Rapport de marché / adoption · Dataiku

Etude Dataiku x Databricks : l’IA nécessite une plus grande régulation, selon un expert européen sur deux

10/10
Partenariat commercial / distribution · OVHcloud

Data Scientists : choisissez la performance des outils clés en main d’OVHcloud !

17/08
Pédagogie / explication · Télécom Paris

Télécom Paris Executive Education : ChatGPT, IA et souveraineté numérique

03/07
Déploiement en entreprise / organisation · Nvidia

La licorne Dataiku rejoint le programme NVIDIA DGX-Ready Software

14/04
Création d'entité / lancement de structure · École Hexagone

École Hexagone : une approche humaniste de l'enseignement de l'IA

12/04
Concours / challenge / hackathon · BpiFrance

IA et santé : lancement du Data Challenge en santé VisioMel

09/02