Initiation à l’analyse de texte sur Twitter en Python avec Textblob et Tweepy

Initiation à l’analyse de texte sur Twitter en Python avec Textblob et Tweepy
Actu IA

Ce tutoriel vidéo réalisé par Nils Schaetti vous permet d’apprendre à analyser des Tweets grâce au module Python Tweepy et au module de TAL (Traitement Automatisé du Langage) TextBlob. Vous apprendrez au cours de ce tutoriel comment mettre en oeuvre une solution d’analyse de sentiments, de traduction automatique et de tokenisation de texte.

Le module Tweepy vous permet d’interroger de façon très simple l’API Twitter afin de récupérer les Tweets, tandis que le module TextBlob vous permet d’analyser le texte de ces tweets.

Les étapes préparatoires de ce tutoriel sont donc l’installation et l’import des modules Tweepy et Textblob. Argparse est également utilisé afin d’accepter en paramètre un nom d’utilisateur Twitter lors de l’exécution de votre application. Ce sont en effet les Tweets de cet utilisateur qui seront analysés par le script python que vous allez créer.

Il est également nécessaire de créer une application sur Twitter permettant d’accéder au réseau social depuis votre code source Python. Une fois cette application créée, vous aurez accès aux paramètres consumer_key , consumer_secret, access_token et access_secret permettant au module Tweepy de se connecter à Twitter.

Nous récupérons ensuite les 200 derniers tweets de l’utilisateur grâce à Tweepy.

C’est alors que l’analyse textuelle entre en jeu grâce à TextBlob. Ce module intégrant une fonctionnalité d’analyse de sentiments, il est très facile de l’implémenter dans votre application : le résultat de l’analyse est automatiquement stocké dans la propriété “sentiment” sous forme de deux valeurs distinctes : polarity, de type float pouvant aller de -1 à 1, -1 étant la valeur la plus pessimiste et 1 la valeur la plus optimiste, ainsi que subjectivity, de type float pouvant aller de 0 à 1 ,  0 représentant un texte subjectif et 1 un texte objectif.

TextBlob intègre également une fonctionnalité de traduction automatisée que vous pourrez mettre en oeuvre grâce à la méthode “translate”, acceptant deux paramètres : le langue d’origine et la langue de destination.

Enfin, vous verrez que TextBlob permet également d’accéder aux différents tokens qui constituent le tweet, grâce à la propriété “words”. Si cette fonctionnalité peut sembler peu utile au premier abord, il faut savoir que la tokenisation est la première étape de la plupart des opérations de traitement automatisé du langage. Elle vous sera donc très utile si vous souhaitez intégrer vos propres analyses par la suite.

Vous trouverez ici le Tutoriel rédigé par Nils Schaetti en anglais ainsi que les codes sources de l’application développée.

Nous tenons à remercier Nils Schaetti pour nous avoir autorisé à diffuser sur Actu IA la vidéo de son tutoriel.

Si vous souhaitez aller plus loin avec TextBlob et apprendre à mettre en oeuvre un classifieur de texte en moins de dix minutes, consultez ce tutoriel.