Hors-Série IA 2020

Civis Analytics analyse les tweets de la primaire américaine

Nos confrères américains ont l’habitude et le réflexe d’exposer leurs opinions sur Twitter. Cela est d’autant plus vraie lorsque des élections se préparent. Il est aisé de détecter une tendance sur un réseau social tel que Twitter car celle-ci est généralement accompagnée d’un hashtag (par exemple #Big Data). L’intérêt d’une telle méta-donnée est la capacité qu’elle offre pour analyser des données textuelles. L’exploitation marketing de Twitter est un des thèmes développés dans le dernier numéro de Survey-Magazine. Alors que dans la plupart des cas les données textuelles sont classifiées par des mots-clefs définis au préalable, la société Civis Analytics opte pour une approche différente. Le contenu de ces milliers de tweets, messages composés de 140 caractères, sont saisis par un algorithme de partitionnement qui détermine le niveau d’importance d’un sujet par rapport à son occurrence.
Dans le contexte des primaires américaines Civis Analytics constate que la menace de quitter le sol américain est une des thématiques les plus récurrentes. En état les mots « move », « moving » et « leaving » sont le plus souvent associés aux termes Trump (pour Donald Trump) et Canada.
Ces résultats informent sur l’opinion générale des américains (qui utilisent Twitter, bien entendu) en ces temps de primaires électorales : le candidat républicain est décrié et si une expatriation était envisagée, c’est le Canada qui en profiterait. Une méthode d’apprentissage non supervisée est déployée pour déceler ces tendances depuis une source Big Data telle que Twitter. Bien entendu les mots tels que « move » ou « Canada » peuvent être employés au même moment mais pour des raisons et contextes bien différents. Il s’agit alors de dissocier les conversations. Pour cela, des réseaux de neurones identifient les associations les plus fortes entre les mots et les tweets. L’analyse humaine prend ensuite le relais pour interpréter les résultats obtenus. Au regard des primaires démocrates, les discussions semblent tourner davantage autour de la vie de famille alors que la sécurité aux frontières fait débat côté républicains. Plus loin, il est intéressant d’analyser les relations entre les utilisateurs de Twitter. L’algorithme de partitionnement ou clustering a permis de regrouper les internautes en communauté politique (progressiste/conservateurs/médias) pour une représentation graphique au regard de leur activité sur le réseau social.

    Civis Analytics est une société américaine spécialisée dans l’analyse de données en provenance des Big Data.
  • Abonnement SurveyMag

Suivez-nous