L’analyse des réseaux sociaux et plus globalement l’utilisation du Big data ont fait irruption dans la sphère politique pour alimenter les sondages et tenter de prédire quel sera au final le candidat élu. Au-delà de cette utilisation devenue classique des données, les différents candidats tendent également à avoir de plus en plus recours au Big data pour définir leur stratégie de campagne, mobiliser leurs soutiens ou encore pour identifier et prioriser les électeurs à convaincre. Le traitement, l’analyse des données en masse et plus globalement le Big data serait-il en train de révolutionner la manière de faire de la politique ?
Le Big Data pour les traditionnels sondages.
Il y a quelques mois, dans le cadre de l’élection présidentielle américaine, la victoire de Donald Trump face à Hilary Clinton a surpris la plupart des instituts de sondage alors que l’utilisation du Big data avait permis de prédire cette élection. Depuis, les entreprises spécialisées dans les analyses prédictives jouissent d’une crédibilité accrue par rapport aux instituts de sondage traditionnels. Toutefois, le Big data semble avoir ses propres limites. Il n’a en effet pas été en mesure de prévoir le triomphe d’Emmanuel Macron au premier tour de l’élection présidentielle. Le Canadien Filteris envisageait ainsi un duel entre François Fillon et Marine Le Pen tout comme les étudiants de Telecom Paris Tech, quand la startup Vigiglobe prédisait une victoire de François Fillon et l’agence suisse Enigma un second tour entre Jean-Luc Mélenchon et François Fillon. Aucun algorithme n’a donc réussi à prédire la victoire d’Emmanuel Macron au premier tour. L’une des explications vient du fait que les modèles prédictifs utilisés par ces sociétés prennent en compte de nombreuses données démographiques, électorales, sociologiques mais également les tendances qui se dessinent sur internet. La startup Vigiglobe prend ainsi en compte le buzz des candidats sur les divers réseaux sociaux et Enigma comptabilise les recherches effectuées sur Google. Il n’y a donc ici pas forcément adéquation entre activité sur les réseaux sociaux ou nombre de recherches sur les moteurs de recherche et intentions de votes. Cependant, dans le futur, l’accroissement du pourcentage de citoyens connectés combiné à l’amélioration des technologies de Machine Learning et de Big data devraient contribuer au renforcement de la précision de ces analyses prédictives. En attendant, il est fort probable que les sondages traditionnels et les analyses Big data se complètent pour proposer des prédictions plus précises. Pour autant, les usages du Big data en politique ne cessent de croitre. Au-delà des sondages traditionnels, les politiques l’utilisent aussi très largement dans le cadre de leurs campagnes électorales.
Le Big Data pour campagnes électorales.
La première utilisation du Big data pour une campagne a été celle de Barack Obama en 2008. Les équipes de campagne du candidat démocrate, en analysant données sociales, préférences politiques et activité sur les réseaux sociaux, ont donné au futur président des Etats Unis une connaissance particulièrement fine du terrain. Guillaume Liegey, Arthur Muller et Vincent Pons, trois passionnés de politique et de nouvelles technologies ont assisté de près à cette campagne avant de décider d’importer ces nouvelles techniques en France et de créer la première start-up de stratégie électorale d’Europe: LMP. La société est, depuis, devenue l’un des leaders du secteur pour en avoir couvert plus de 200 en Europe dont celle de la campagne présidentielle 2012 de François Hollande et celle d’Anne Hidalgo pour les municipales 2014 à Paris.
Les services proposés par la start up reposent sur un logiciel baptisé 50+1 qui permet, depuis une interface unique, de préparer sa campagne électorale en définissant par exemple les cibles d’électeurs à prioriser en fonction de leur lieu d’habitation mais également les thèmes de campagnes. Un logiciel qui aurait permis de faire changer d’avis 1 électeur sur 5 qui s’apprêtaient à voter Marine Le Pen pour au final voté François Hollande pour les présidentielles de 2012.
Une prouesse rendue possible grâce aux technologies Big data et à des modèles prédictifs qui utilisent l’ensemble des résultats électoraux et des données issues du recensement pour les analyser. Cela permet notamment d’identifier les variables explicatives du vote, d’aboutir à un ciblage et à un profiling avancé des électeurs et d’en déduire des informations pertinentes pour définir la stratégie de la campagne.
Le Big Data pour campagnes électorales.
Pour ce qui concerne le logiciel 50+1, la base de données recense, pour plus de 60 000 quartiers, l’ensemble des résultats électoraux passés (Européennes, municipales, régionales, cantonales, législatives, présidentielle…) ainsi que les chiffres de l’abstention et ce depuis 2007. Il permet également d’accéder à plus d’une centaine de variables sociodémographiques, économiques issues du recensement et ce à l’échelle de l’IRIS (Ilôts Regroupés pour l’Information Statistique : 2000 habitants par maille élémentaire), des données publiques accessibles grâce au mouvement d’Open Data. Le logiciel permet de visualiser sur un module de cartographie l’ensemble des analyses réalisées d’un territoire prédéfini et notamment le ciblage jusqu’à l’échelle du bureau de vote. Cela permet d’identifier les zones géographiques à prioriser en fonction des informations concernant les électeurs qui habitent le quartier mais aussi en fonction des évolutions des votes observées sur les dernières années concernant les votes mais aussi l’abstention.
Pour Vincent Pons, cofondateur de la start up LMP : « il s’agit ici de pouvoir identifier les zones prioritaires, là où il y a des voix à gagner. Cela concerne principalement les électeurs indécis mais aussi les convaincus mais qui ont une forte probabilité de s’abstenir ». A partir des résultats électoraux bureau par bureau, des données socio-économiques (exemple : taux de chômage par quartier, profil démographique, revenu médian etc…), de l’index de notoriété des candidats et même de l’impact des mesures gouvernementales, l’algorithme développé par la start up à base de Big data permet en effet de cibler quartier par quartier les efforts militants à fournir pour transformer ces deux catégories d’électeurs.
Le recrutement de militants actifs.
Une fois la stratégie de la campagne électorale établie, les élus ont besoin de faire appel, très en amont de l’élection, à de nombreux militants actifs et mobilisés pour faire campagne de manière professionnelle et organisée. Là aussi des solutions à base de Big data, en permettant de collecter et d’analyser des contacts d’une base de données avec des informations acquises sur le terrain et sur les réseaux sociaux, aident les élus à identifier ceux qui seront les plus susceptibles de devenir membres d’un parti politique ou d’une association. De quoi ici faciliter la quête de plusieurs dizaines de milliers d’adhérents. Il ne restera alors plus aux militants déjà recrutés qu’à nouer un lien physique afin d’accueillir le nouveau militant, de débattre avec lui puis de le fidéliser.
Une fois le nouveau militant convaincu, un logiciel tel que celui développé par LMP permet ensuite de mettre à disposition de l’équipe de campagne une plateforme d’administration pour mobiliser ces militants qui disposeront eux-mêmes d’une application mobile leur permettant de recevoir des courriels et SMS personnalisés. Le candidat pourra ainsi faire appel à ces militants en fonctions de leur localisation et ainsi préparer en amont ses déplacements en mobilisant les bonnes personnes, aux bons endroits, aux bons moments.
L’outil propose également plusieurs modules opérationnels pour organiser les actions de campagne sur le terrain et notamment un éditeur de « feuille de route » qui indique les électeurs prioritaires à cibler facilitant ainsi le porte à porte des militants. La stratégie peut alors être déclinée en plan d’actions.
Reste alors pour ces militants à aller les conquérir en face à face, immeuble par immeuble. Il s’agirait ici en effet du canal de transformation le plus rentable selon le livre de marketing politique, Get out the vote !, d’Alan Gerber et de Donald Green. Le livre précise en effet que ce canal permettrait de faire changer d’avis un électeur sur 14, contre un sur 38 au téléphone et un sur 100 000 par mail! Il s’agit là d’éviter de perdre du temps dans un quartier acquis au camp adverse et de concentrer les efforts là où il y a un potentiel de voix. Le candidat François Hollande a utilisé cette technique pour les présidentielles en 2012 et cela lui aurait permis de gagner 280 000 voix. Ce type de technique ne fera sans doute jamais gagner 10 points à un candidat, mais avec ce ciblage, un gain de 2 ou 3 points semble possible. De quoi faire basculer beaucoup de scrutins dans le millier de villes de plus de 10 000 habitants en France.
Pour Vincent Pons, il s’agit ici « d’utiliser des données au service de l’humain et de pouvoir remettre au gout du jour la technique du porte à porte ». Une technique utilisée à très grande échelle par Emmanuel Macron. Celui qui n’était encore que Ministre a en effet lancé à l’été 2016 son opération La Grande Marche, une enquête d’opinion géante, portée par 6 000 bénévoles de mai à juin auprès de populations représentatives ciblées en fonction des indications du logiciel 50+1. Cette opération a permis de frapper à plus de 200 000 portes et de récolter sur le terrain les verbatim de 25 000 entretiens de 15 minutes afin de mieux cerner les opinions politiques des électeurs, leurs attentes et leurs craintes.
Le profiling précis des électeurs pour leur adresser le bon message.
Une fois la porte du potentiel futur électeur franchie par le militant, le logiciel va en effet une nouvelle fois être utilisé cette fois pour établir un profiling très précis de l’électeur ciblé. Si 50+1 permet d’importer facilement ses différentes bases de contacts préexistantes pour en disposer directement depuis l’interface utilisateur, il permet en effet également d’en créer de nouveaux au fur et à mesure des rencontres faites sur le terrain par les militants. Il est alors possible de les qualifier grâce aux différentes rubriques d’informations prévues à cet effet. Il est ainsi possible de renseigner les informations électorales (ville de résidence, scores de proximité politique et d’implication), militantes (niveau d’engagement, statut volontaire ou sympathisant), professionnelles (profession, employeur, CSP, lieu de travail), la qualité et l’étendue du réseau (statut ou non d’influenceurs et connexions), l’activité en ligne (réseaux sociaux ou site web) ou encore les problématiques pertinentes, etc. Dans le cadre de la Grande Marche, l’objectif était d’être capable de discerner les tendances de fond dans des milliers de témoignages et les problèmes concrets que dit rencontrer tel ou tel bassin de population et de pouvoir fournir une cartographique des préoccupations des Français. La Grande Marche a ainsi permis de mettre en avant les principales problématiques et d’y répondre au cas par cas, en fonction des différents profils des citoyens, maximisant les chances de toucher l’électorat. Les questionnaires des marcheurs via les différentes questions ouvertes ont ainsi apporté à Proxem, startup experte en analyse sémantique de big data textuelle, un corpus d’1,5 million de mots à analyser et ce sans aucun focus group, ni sondage.
Une fois les contacts obtenus et complétés, l’étape suivante consiste à les classer par affinités et à leur adresser le bon contenu via le bon canal ou média (e-mail, vidéo etc.). Il devient ainsi par exemple possible de regrouper les différents contacts en fonction de leur statut et centres d’intérêts grâce aux nombreux filtres disponibles et ensuite de les informer de l’actualité du candidat dans la circonscription. En seulement quelques clics, des campagnes d’emails ciblés peuvent ainsi être adressés aux contacts qui ont été sélectionnés. L’objectif étant ensuite que cet électeur devenu électeur convaincu puisse lui aussi convaincre des amis puis des amis d’amis… jusqu’à créer une communauté qui ne cessera de grandir de jour en jour.
Il est également possible pour le candidat ou pour son équipe de campagne de composer sa propre bibliothèque d’emails types pour des envois ponctuels ou réguliers (newsletters, messages aux nouveaux arrivants, mobilisation des volontaires avant, pendant et après la campagne). Une fois la campagne lancée, il devient possible de suivre toutes les interactions avec chacun des contacts du répertoire en consultant les statistiques d’envoi d’emails. Il est ainsi possible de savoir si le mail a été lu ou non, quels liens web ont été consultés, à quelle fréquence, sur quelle durée de lecture, etc… L’outil gardera la trace des différents échanges avec les électeurs, afin de développer une relation personnalisée avec chacun d’entre eux. Pour le candidat, il s’agit aussi ici de connaitre les thématiques qui ont le plus intéressé et de s’en servir potentiellement contre son adversaire. Pour l’illustrer, l’équipe de Nathalie Kosciusko-Morizet a observé que les lettres d’info sur les rythmes scolaires étaient très lues lors des municipales 2014, elle a ainsi pu appuyer son discours sur cette thématique contre sa rivale socialiste. Une technique qui peut d’ailleurs être complétée par d’autres algorithmes à base de Big data qui permettent de surveiller ses adversaires en analysant leur activité sur Twitter ou sur Facebook ou en mesurant leur e-réputation et ce quartier par quartier.
Big Data, vers une adoption massive pour les législatives 2017 ?
Big data, réseaux sociaux et autres canaux et outils de communications digitales, comparé à d’autres secteurs d’activité, celui de la politique semble avoir entamé sa mutation digitale à marche forcée. Une tendance de fond qui sera, selon Vincent Pons, massivement adoptée par les différents candidats aux prochaines législatives 2017. Avec un coût plus faible que celui pratiqué par les instituts de sondage et un niveau d’analyse proche, l’adoption du Big data et donc de son logiciel 50+1 ne ferait même aucun doute selon lui. Une évolution qui ne devrait cesser de croître pour les élections suivantes grâce à une analyse de plus en plus fine, une évolution qui sera permise dans les mois à venir par la start up via l’intégration de données issues cette fois des réseaux sociaux à son logiciel.