Damien de Foucault, Directeur Business Development & Innovation Europe, Kantar Media Ad Intelligence :
Les instituts d’études ne seront plus forcément propriétaires de leurs outils de collecte des informations.
Le basculement des comportements des individus vers le digital est un lieu commun, certes, mais c’est une réalité qui change fondamentalement l’approche des études. Cela va bien au-delà de la faculté d’interroger un échantillon en ligne, ce que tous les instituts sont capables de faire depuis plus de 12 ans maintenant.
D’ores et déjà, compte tenu du taux de connexion de la population dans les marchés occidentaux, la représentativité d’un échantillon ou d’un panel dit « on-line » n’est plus remis en question. Mais ce basculement des comportements en ligne rend ces mêmes comportements traçables. Dès lors, la faculté d’exploiter – dans le respect des règles de confidentialité – ces données, permet d’écarter 2 obstacles longtemps inhérents aux études : 1) il n’y a plus de biais déclaratif car le recueil est passif et 2) il n’y a plus non plus de biais d’échantillon, puisque c’est l’ensemble des données des utilisateurs (ou des consommateurs) qui peut être recueilli. On parle de « census data » en référence au recueil semblable à un recensement, par opposition au « sample data » qui désigne de la donnée échantillonnée. Il est intéressant de noter que l’INSEE a fait, depuis quelques années, le chemin inverse en passant d’un recueil « censitaire » (le fameux recensement) à un recueil permanent : une fraction seulement de la population est interrogée mais la collecte est plus fréquente. Cette méthode se prête plus volontiers à la mesure des évolutions démographiques. Mais c’est l’exception.
Aujourd’hui, beaucoup d’organisations recueillent de la donnée, parfois sans très bien savoir comment l’exploiter mais en ayant conscience qu’elle a de la valeur : ce sont les bases de CRM d’une entreprise, le trafic du site web d’un éditeur, etc.
Seul hic : cette donnée est beaucoup plus volumineuse. Sa gestion requiert donc des compétences techniques radicalement différentes. Les bons instituts d’études seront ceux qui sauront exploiter non plus des bases mais des flux de données, en temps réel. Ces données seront parfois de sources différentes, donc hétérogènes, et les meilleurs « Data Scientists » seront ceux qui sauront détecter les corrélations entre ces données pour y ajouter de la valeur ajoutée et, précisément, répondre aux questions que leurs clients se posent. Une autre tendance de fond est l’individualisation du recueil. Il y a encore une demi-douzaine d’années, l’unité de recueil des études en ligne (donc d’échantillonnage, en quelque sorte) était le PC ; c’est désormais le smartphone. Cette individualisation de l’observation des comportements combinée à l’étendue fonctionnelle galopante de ces terminaux mobiles, vont engendrer une croissance exponentielle du volume de données potentiellement recueillies … dont on sait par ailleurs qu’elle est déjà géo-codable. La dizaine d’années qui se présente devant nous sera celle des fameux objets connectés. Il n’est donc pas interdit de penser que les lunettes Google permettront non seulement à leurs utilisateurs de bénéficier d’un ensemble de services et de contenus mais constitueront également un moyen pour des marques, pour des organisations, de recueillir de la donnée, de photographier ou de filmer des environnements, …avec le consentement des utilisateurs que nous sommes, naturellement.
Enfin, une autre tendance de fond est le développement de modèles mathématiques prédictifs. Plutôt que d’interroger un échantillon d’individus sur ses intentions, on exploitera des volumes massifs de données pour prévoir des phénomènes. Les opérateurs téléphoniques et les moteurs de recherche ne sont-ils pas capables de détecter une pandémie grâce à la seule observation des sms ou des mots-clés saisis ?
Cet exemple un peu simpliste, mais il permet de comprendre que les instituts d’études ne seront plus forcément propriétaires de leurs outils de collecte des informations. Mais ça n’est pas très grave : ceux des instituts d’études qui tireront le meilleur profit de ces évolutions sont ceux qui sauront faire un usage pertinent de la donnée, y trouver les réponses aux questions que leurs clients se posent, déceler les corrélations que ces données cachent, bref, interpréter ces données.