Interview
Emmanuel Rivière est directeur général France de Kantar Public
C’est le marronnier des périodes électorales. Après avoir égrainé à longueur d’articles les évolutions des intentions de vote, les médias et le public vont certainement jeter aux orties les sondages dès la fin des élections, les accusant de s’être trompés et d’avoir trompé les français. Comment peut-on améliorer les techniques de prévision des sondages ? Comment les nouvelles technologies telles que le big data et le web social, peuvent aider à fiabiliser les résultats ? C’est ce que Survey-Magazine a voulu savoir en allant à la rencontre d’Emmanuel Rivière, directeur général de Kantar Public.
Survey-Magazine : Le Big Data peut-il permettre d’améliorer la prédiction des résultats ?
Emmanuel Rivière : L’enjeu principal est d’améliorer, non pas la prévision, mais la précision des sondages. Nous gagnerions d’ailleurs à cesser de considérer les sondages électoraux comme des pronostics, lorsque par définition, ils servent à montrer les inflexions et les dynamiques que les événements de campagne produisent sur un corps électoral particulièrement instable. S’ils ne peuvent mesurer ce qui n’est pas encore advenu, les outils d’analyse de l’opinion doivent à tout le moins montrer ce qui est structurellement stable et ce qui peut varier, dans quel sens, et en fonction de quoi, et le faire en temps réel. Sur ce point, les enseignements tirés des médias sociaux viennent utilement compléter les outils plus classiques, par leur réactivité et leur capacité à saisir très tôt les dynamiques à l’œuvre. En outre, les réseaux sociaux sont aussi des lieux d’expression parfois prisés par des groupes de population, qui par ailleurs répugnent à répondre aux sondages.
Pouvez-vous nous préciser les données issues du web que vous prenez en compte ?
Emmanuel Rivière : Les données que nous considérons comme les plus significatives lors d’une campagne électorale, principalement issues des réseaux sociaux, sont celles qui traduisent un engagement positif à l’égard des candidats (retweets, like et partages) que nous combinons et mettons en rapport avec l’activité digitale des candidats (tweets et post). Notre manière de faire n’est pas si éloignée des approches que nous avons développées depuis bien longtemps pour l’analyse des sondages d’opinion : identifier ce qui est significatif, écarter le bruit, isoler les prises de paroles militantes, distinguer la visibilité et l’influence, l’intérêt et l’engagement. Les indicateurs que nous avons construits et mis en œuvre à l’occasion des élections primaires ont ainsi pu saisir la capacité de François Fillon, plus tard de Benoît Hamon, à susciter l’intérêt, puis à créer de l’engagement autour de ses propositions en dehors d’un cercle restreint de militants. Mais aussi lorsque la campagne digitale d’Alain Juppé semblait plus atone, et celle de Nicolas Sarkozy réduite à un affrontement entre des supporters et des adversaires, créant un buzz abondant mais souvent négatif. L’analyse des requêtes effectuées sur les candidats ou leurs propositions sur les moteurs de recherche est aussi une ressource qui peut nous permettre de mesurer la curiosité ou l’intérêt pour les candidats, et d’anticiper sur la possibilité que cet intérêt se transforme en engagement. A ce titre, l’étude des réseaux sociaux peut être un outil d’anticipation. Cela est moins simple qu’on ne pourrait l’imaginer, car ni l’intérêt ni certaines formes d’engagement ne sont univoques. L’intérêt porté à François Fillon lors des rebondissements des affaires qui le touchent n’est pas de même nature que celui porté à Emmanuel Macron lors de la présentation de son programme. Selon le contexte, un retweet peut être une manifestation de soutien, ou d’ironie, comme lorsque récemment d’anciens messages du candidat LR fustigeant l’assistanat ou réclamant la sévérité de la justice ont été exhumés et retweetés en pleine affaire Pénélope.
Quelle approche défendez-vous ?
Emmanuel Rivière : De cette expérience, inscrite dans une séquence électorale qui a conduit à mettre en doute la fiabilité des sondages, nous voulons tirer trois leçons. D’abord améliorer la qualité et la représentativité de nos échantillons et la pertinence de nos questionnements, pour ne pas sous-estimer certains segments de l’électorat, et afin de bien comprendre les intentions comme les hésitations des électeurs. Ensuite, il faut sans doute, avec nos partenaires média qui publient nos sondages, que nous fassions plus d’effort pour montrer la part d’incertitude inhérente à l’exercice, ce qui n’est en rien un aveu de faiblesse car au fond ce qui est intéressant dans les sondages c’est de bien comprendre à la fois ce qui est en train de se passer et ce qui peut arriver à l’avenir. Pour cela, il faut montrer la différence entre la mesure instantanée d’un rapport de force et le potentiel de chaque candidat, qui permet d’étudier et d’anticiper différents scenarii possibles. Enfin, nous avons résolument choisi de compléter nos sondages en nous dotant d’outils de mesure de la capacité d’influence des candidats sur les médias et les réseaux sociaux, afin de mieux saisir les dynamiques au moment où elles se produisent, de mieux les comprendre aussi, et d’améliorer notre capacité à hiérarchiser les scenarii d’évolution.
Quel est votre avis sur les promesses annoncées par l’intelligence artificielle ?
Emmanuel Rivière : L’un des défis de l’analyse des réseaux sociaux, qui produisent des centaines de milliers de messages quotidiens sur un thème comme la vie politique, c’est de savoir non seulement les quantifier mais les analyser qualitativement, donc les comprendre. Les outils d’analyse textuels et de codification automatique, indispensables quand il y a une telle quantité de données, sont souvent mis à l’épreuve dans des espaces d’expression où le second degré est extrêmement présent. Mais des progrès considérables sont attendus. Les acteurs du commerce en ligne, les modérateurs des principaux espaces de trafic sur le web, et nombres d’institutions vont avoir besoin de gérer des volumes d’échanges et de dialogues tels que des community manager n’y suffiront pas. Il est vraisemblable que, pour y faire face, la capacité de robots intelligents capables d’interpréter le langage réel dans la subtilité des différents registres va se développer. Si c’est le cas, nous aurons là des outils qui amélioreront considérablement notre aptitude à lire une campagne électorale et ses dynamiques à travers les réseaux sociaux, en discernant les thèmes porteurs, les arguments qui fonctionnent, et même les traits d’image. Nous nous approchons peut-être d’un temps où l’analyse des contenus digitaux remplacera les sondages. Ce n’est pas tout à fait une certitude, car le jour où les outils d’analyses du web endosseront dans les campagnes un rôle aussi impactant que les sondages aujourd’hui, il y aurait aussi des robots intelligents capables de générer au profit de tel ou tel candidat des dizaines de milliers de messages afin de tromper l’intelligence des robots chargés de les interpréter, rendant le tout illisible. L’un des avantages de nos bons vieux sondages, c’est que les militants ne peuvent pas décider d’y répondre pour pousser leur champion.