Intelligence artificielle Formation Python – Machine Learning 17/30 : Pandas - Le cas...

Pour approfondir le sujet

Sur le même thème :

Tutoriel d’initiation à l’IA – Python, Pandas et Matplotlib partie 2

Dans ce tutoriel, nous allons nous initier à Python, Pandas et Matplotlib en manipulant des données CSV. Nous partons du principe qu'Anaconda est installé...

JetBrains propose DataSpell, son nouvel environnement de développement dédié à la data science

JetBrains, un éditeur de logiciels pour développeurs, présente en mode preview, son nouvel environnement de développement (IDE) intitulé DataSpell. Dédié à la data science,...

ABBYY enrichit sa bibliothèque de développement open source dédiée au machine learning

ABBYY, une multinationale spécialisée dans la conception de logiciels et dans "l'intelligence digitale", étend les capacités de sa bibliothèque de développement open source NeoML....

Facebook AI et le HZM utilisent l’intelligence artificielle pour prévoir les effets des combinaisons de médicaments

Dans le cadre d'une recherche collaborative entre le centre de recherche allemand Helmholtz Zentrum München (HZM) et Facebook AI, un modèle d'intelligence artificielle a...

Formation Python – Machine Learning 17/30 : Pandas – Le cas des passagers du Titanic

Ce tutoriel python français vous présente Pandas : la libraire python la plus importante pour l’analyse de données et le data science.

Pandas ressemble beaucoup à Excel dans python, mais surpasse de loin les capacités d’Excel en matière d’analyse de données. Ce tutoriel francais vous présente les fonctions d’analyses les plus simples et les plus importantes en faisant l’analyse d’un dataset très célèbre: le Dataset des Passagers du Titanic.

Timecode la vidéo:

PARTIE 1: Analyse des données du TITANIC !

  • 01:12 Importer vos données dans python : pd.read_csv()
  • 02:18 Inspecter un Dataframe : shape, head, columns
  • 03:22 Éliminer les colonnes inutiles: drop()
  • 04:23 Statistiques rapides: describe()
  • 05:13 Les données manquantes dans Pandas : fillna() dropna()
  • 07:08 Value_counts et graphiques matplotlib !
  • 08:26 Groupby : equivalent des pivot table de Excel dans Pandas

PARTIE 2: DATAFRAMES ET SÉRIES dans les DÉTAILS

  • 10:11 DataFrame et Séries
  • 12:08 Indexing et Slicing
  • 13:58 Iloc et loc
  • 15:45 Exercice de Feature Engineering

 

►TÉLÉCHARGER LE DATASET DU TITANIC

► Documentation Pandas 

 

 

Sommaire de la formation:

[su_menu name=”formation_python_machinelearnia”]

Contributeur expert

Guillaume Saint-Cirgue

Guillaume Saint-Cirgue est Lead Data Scientist à GKNAerospace (Royaume-Uni). Ingénieur généra

Partager l'article

Performance et santé : le sport à l’ère de l’intelligence artificielle

Courir en utilisant une application qui analyse nos performances et nous fait des recommandations est devenu courant. Les solutions technologiques autour du sport de...

Deloitte et Akila s’associent pour la gestion durable des bâtiments aux Etats-Unis

Akila, une plateforme française de données spécialisée dans les jumeaux numériques, a annoncé ce 24 juillet un partenariat stratégique avec Deloitte, un acteur mondial...

NVIDIA AI Foundry intègre Llama 3.1 pour aider les entreprises à créer des modèles personnalisés

NVIDIA annonce le lancement d'un nouveau service NVIDIA AI Foundry qui permettra aux entreprises d'utiliser la nouvelle famille Llama 3.1 pour créer des modèles...

GenAI : avec une levée de fonds de 500 millions de dollars, Cohere renforce sa position sur le marché de l’IA

Cohere, licorne canadienne spécialisée dans l'IA générative à destination des entreprises, a récemment clôturé une levée de fonds de série D de 500 millions...