Intelligence artificielle Formation Python – Machine Learning 17/30 : Pandas - Le cas...

Pour approfondir le sujet

Sur le même thème :

Tutoriel d’initiation à l’IA – Python, Pandas et Matplotlib partie 2

Dans ce tutoriel, nous allons nous initier à Python, Pandas et Matplotlib en manipulant des données CSV. Nous partons du principe qu'Anaconda est installé...

JetBrains propose DataSpell, son nouvel environnement de développement dédié à la data science

JetBrains, un éditeur de logiciels pour développeurs, présente en mode preview, son nouvel environnement de développement (IDE) intitulé DataSpell. Dédié à la data science,...

ABBYY enrichit sa bibliothèque de développement open source dédiée au machine learning

ABBYY, une multinationale spécialisée dans la conception de logiciels et dans "l'intelligence digitale", étend les capacités de sa bibliothèque de développement open source NeoML....

Facebook AI et le HZM utilisent l’intelligence artificielle pour prévoir les effets des combinaisons de médicaments

Dans le cadre d'une recherche collaborative entre le centre de recherche allemand Helmholtz Zentrum München (HZM) et Facebook AI, un modèle d'intelligence artificielle a...

Formation Python – Machine Learning 17/30 : Pandas – Le cas des passagers du Titanic

Ce tutoriel python français vous présente Pandas : la libraire python la plus importante pour l’analyse de données et le data science.

Pandas ressemble beaucoup à Excel dans python, mais surpasse de loin les capacités d’Excel en matière d’analyse de données. Ce tutoriel francais vous présente les fonctions d’analyses les plus simples et les plus importantes en faisant l’analyse d’un dataset très célèbre: le Dataset des Passagers du Titanic.

Timecode la vidéo:

PARTIE 1: Analyse des données du TITANIC !

  • 01:12 Importer vos données dans python : pd.read_csv()
  • 02:18 Inspecter un Dataframe : shape, head, columns
  • 03:22 Éliminer les colonnes inutiles: drop()
  • 04:23 Statistiques rapides: describe()
  • 05:13 Les données manquantes dans Pandas : fillna() dropna()
  • 07:08 Value_counts et graphiques matplotlib !
  • 08:26 Groupby : equivalent des pivot table de Excel dans Pandas

PARTIE 2: DATAFRAMES ET SÉRIES dans les DÉTAILS

  • 10:11 DataFrame et Séries
  • 12:08 Indexing et Slicing
  • 13:58 Iloc et loc
  • 15:45 Exercice de Feature Engineering

 

►TÉLÉCHARGER LE DATASET DU TITANIC

► Documentation Pandas 

 

 

Sommaire de la formation:

[su_menu name=”formation_python_machinelearnia”]

Contributeur expert

Guillaume Saint-Cirgue

Guillaume Saint-Cirgue est Lead Data Scientist à GKNAerospace (Royaume-Uni). Ingénieur généra

Partager l'article

Deux ans après l’arrivée de ChatGPT, comment la GenAI transforme la recherche en ligne et le marketing

Alors que ChatGPT vient de fêter son second anniversaire et compte aujourd'hui plus de 300 millions d'utilisateurs hebdomadaires, le rapport "Online Search After ChatGPT:...

Llama 3.3 70B : Meta dévoile son dernier ajout à la famille Llama 3, un modèle particulièrement efficace

Alors que Meta prépare le lancement des premiers modèles Llama 4 pour le début de l'année prochaine, l'entreprise a dévoilé en fin de semaine...

AgentLab, un framework open source pour le développement et l’évaluation des agents Web

Lancé par ServiceNow, AgentLab est un framework open source visant à faciliter le développement et l'évaluation d'agents Web. Son objectif principal est de soutenir...

Pleias : des modèles de langages ouverts pour une IA éthique et transparente

Pleias, une start-up française, annonce le lancement de sa première famille de grands modèles de langage (LLM), définissant de nouvelles références en matière...