Nos confrères américains ont l’habitude et le réflexe d’exposer
leurs opinions sur Twitter. Cela est d’autant plus vraie lorsque des
élections se préparent. Il est aisé de détecter une tendance sur un réseau
social tel que Twitter car celle-ci est généralement accompagnée d’un
hashtag (par exemple #Big Data). L’intérêt d’une telle
méta-donnée est la capacité qu’elle offre pour analyser des données
textuelles. L’exploitation marketing de Twitter est un des thèmes
développés dans le dernier numéro de Survey-Magazine. Alors que dans la
plupart des cas les données textuelles sont classifiées par des mots-clefs
définis au préalable, la société Civis Analytics opte pour une approche
différente. Le contenu de ces milliers de tweets, messages composés de 140
caractères, sont saisis par un algorithme de partitionnement qui détermine
le niveau d’importance d’un sujet par rapport à son occurrence.
Dans le contexte des primaires américaines Civis Analytics constate que la
menace de quitter le sol américain est une des thématiques les plus
récurrentes. En état les mots « move », « moving » et « leaving » sont le
plus souvent associés aux termes Trump (pour Donald Trump) et Canada.
Ces résultats informent sur l’opinion générale des américains (qui
utilisent Twitter, bien entendu) en ces temps de primaires électorales : le
candidat républicain est décrié et si une expatriation était envisagée,
c’est le Canada qui en profiterait. Une méthode d’apprentissage
non supervisée est déployée pour déceler ces tendances depuis une source Big
Data telle que Twitter. Bien entendu les mots tels que « move » ou
« Canada » peuvent être employés au même moment mais pour des raisons et
contextes bien différents. Il s’agit alors de dissocier les
conversations. Pour cela, des réseaux de neurones identifient les
associations les plus fortes entre les mots et les tweets. L’analyse
humaine prend ensuite le relais pour interpréter les résultats obtenus. Au
regard des primaires démocrates, les discussions semblent tourner davantage
autour de la vie de famille alors que la sécurité aux frontières fait débat
côté républicains. Plus loin, il est intéressant d’analyser les
relations entre les utilisateurs de Twitter. L’algorithme de
partitionnement ou clustering a permis de regrouper les internautes
en communauté politique (progressiste/conservateurs/médias) pour une
représentation graphique au regard de leur activité sur le réseau social.
-
Civis Analytics est une société américaine spécialisée dans l’analyse
de données en provenance des Big Data.