Prochain numéro du magazine ActuIA le 15 octobre
Actualité Formation Python – Machine Learning 17/30 : Pandas - Le cas...

Pour approfondir le sujet

Tutoriel d’initiation à l’IA – Python, Pandas et Matplotlib partie 2

Dans ce tutoriel, nous allons nous initier à Python, Pandas et Matplotlib en manipulant des données CSV. Nous partons du principe qu'Anaconda est installé...

Création par intelligence artificielle : découvrez les 6 finalistes de RockTech Paris #CreativeAI

RockTech Paris a révélé les les 6 finalistes de sa troisième édition dédiée aux startups de l’intelligence artificielle appliquée aux industries créatives : Lobster (UK): plate-forme de vidéos...

Tesla mise sur l’intelligence artificielle et les réseaux de neurones et laisse de côté le LiDAR

L'utilisation du LiDAR en matière de solutions hardware pour véhicule autonome semble majoritaire dans l'industrie automobile. Plusieurs voix dissonantes se font pourtant entendre et...

Bill Gates participe à la deuxième levée de fonds d’Echodyne, concepteur d’un système radar miniaturisé pour drone

La deuxième levée de fonds d'Echodyne vient de se terminer et la start-up a annoncé avoir réuni 29 millions de dollars. Bill Gates, Vulcan...

Formation Python – Machine Learning 17/30 : Pandas – Le cas des passagers du Titanic

Ce tutoriel python français vous présente Pandas : la libraire python la plus importante pour l’analyse de données et le data science.

Pandas ressemble beaucoup à Excel dans python, mais surpasse de loin les capacités d’Excel en matière d’analyse de données. Ce tutoriel francais vous présente les fonctions d’analyses les plus simples et les plus importantes en faisant l’analyse d’un dataset très célèbre: le Dataset des Passagers du Titanic.

Timecode la vidéo:

PARTIE 1: Analyse des données du TITANIC !

  • 01:12 Importer vos données dans python : pd.read_csv()
  • 02:18 Inspecter un Dataframe : shape, head, columns
  • 03:22 Éliminer les colonnes inutiles: drop()
  • 04:23 Statistiques rapides: describe()
  • 05:13 Les données manquantes dans Pandas : fillna() dropna()
  • 07:08 Value_counts et graphiques matplotlib !
  • 08:26 Groupby : equivalent des pivot table de Excel dans Pandas

PARTIE 2: DATAFRAMES ET SÉRIES dans les DÉTAILS

  • 10:11 DataFrame et Séries
  • 12:08 Indexing et Slicing
  • 13:58 Iloc et loc
  • 15:45 Exercice de Feature Engineering

 

►TÉLÉCHARGER LE DATASET DU TITANIC

► Documentation Pandas 

 

 

Sommaire de la formation:

[su_menu name=”formation_python_machinelearnia”]

Contributeur expert

Guillaume Saint-Cirgue

Guillaume Saint-Cirgue est Lead Data Scientist à GKNAerospace (Royaume-Uni). Ingénieur généra

Partager l'article

8 startups et PME françaises lauréates de l’appel à projets EUREKA – Challenge international COVID-19

Bpifrance a annoncé ce jour les lauréats du Challenge international Covid-19. Suite à l'appel à projets ouvert du 15 avril au 15 mai 2020,...

Une approche européenne de l’intelligence artificielle : EIT Digital fait part de ses recommandations

EIT Digital a présenté son troisième rapport de sa série Policy Perspective. Il aborde la manière dont l'Europe devrait gérer l'intelligence artificielle et fournit...

Replay – Conférence 1re Pierre : Cité de l’Intelligence Artificielle organisée par le département des Alpes-Maritimes et l’Institut EuropIA

Le lundi 14 septembre 2020 s'est déroulé le troisième #IADATES organisé par le département des Alpes-Maritimes et l’Institut EuropIA. Intitulée "1re Pierre : Cité...

reciTAL, spécialiste du TAL, lève 3,5 M€ auprès de Breega

Paris, le 10 septembre 2020 - reciTAL, start-up IA spécialisée dans les solutions de Document Intelligence, effectue une première levée de fonds de 3,5 M€...