Que valent les sondages pré-électoraux ?

Dans Marché des études
Par Gérard Danaguezian

Dimanche 22 avril 2012. 20h00. Les premières estimations de résultats du 1er tour s’affichent sur nos écrans de télévision. Aussitôt, les commentateurs et les hommes politiques se relaient sur les plateaux pour réagir aux résultats de l’élection et critiquer immanquablement les sondages, accusés soit de s’être trompés, soit d’avoir eu un impact sur les résultats en avantageant/désavantageant l’un ou l’autre des candidats.
La polémique se poursuit ensuite entre les deux tours, alimentée notamment par le perdant annoncé et ses équipes, tandis que le candidat donné vainqueur au final se refuse à commenter les sondages tout en se félicitant de leurs estimations. Car, comme l’a relevé récemment un humoriste, « les sondages, c’est comme les photos » : on les déchire lorsqu’ils sont ratés et on les montre partout lorsqu’ils nous avantagent.
En tout cas, une chose est sûre : les sondages occupent une place centrale dans la vie politique, dans la presse et sur les ondes. On les cite, les commente, les critique, les décortique. Ils alimentent d’incessantes polémiques mais on ne peut absolument pas s’en passer. Et leur importance est telle qu’on finit par en attendre un résultat précis, plusieurs mois avant le scrutin.
D’où vient ce mélange d’espérances, de rejets et de passions ? Les sondages méritent-ils vraiment tout l’intérêt qu’on leur porte ? Que valent-ils vraiment et sont-ils en mesure de prédire avec exactitude les résultats d’une élection ?
Pour se faire une idée objective, analysons en détail la technique des sondages et évaluons ensemble la dimension scientifique des méthodologies mises en œuvre par les instituts en analysant en détail les différents paramètres pouvant impacter la qualité des résultats.

L’histoire des sondages

Gallup, l’américain

Remontons à l’année 1936 pour commencer au commencement.
Nous sommes à la veille du scrutin qui va opposer, aux Etats-Unis, le président en exercice Franklin D. Roosevelt à son concurrent républicain Alf Landon. Cette année marque la véritable naissance des sondages politiques. Landon est donné largement vainqueur par les journaux américains qui ont recours à leur technique traditionnelle de « vote de paille » (straw-votes) : il s’agit de solliciter les lecteurs en leur demandant d’adresser un coupon indiquant le candidat pour lequel il vont voter. Suite au dépouillement de près de deux millions de bulletins, le Literary Digest annonce la victoire de Landon.
Un an avant l’élection, un statisticien et sociologue du nom de Georges Gallup fonde dans le New Jersey, l’American Institute of Public Opinion. Suite à un sondage effectué sur un échantillon représentatif de 4000 électeurs, il pronostique la victoire du président sortant. L’élection lui donne raison et impose définitivement la crédibilité des sondages, comme outils de prévision fiables. A partir de cette date, le recours aux sondages pré-électoraux se généralise et le nom de Gallup, cité quotidiennement dans la presse, est associé à cette technique.
Cette crédibilité est cependant menacée par les performances des sondages lors des élections de 1948, toujours aux USA. Confiants dans leurs études, les trois principaux instituts américains (Gallup, Roper et Crossley) arrêtent d’interroger les électeurs plusieurs semaines avant la date des élections. Le républicain Thomas E. Dewey, pronostiqué vainqueur est battu par Harry Truman. Ce dernier s’affiche, le lendemain de l’élection, avec la une du Chicago Daily Tribune qui avait titré prématurément, sur la foi des sondages, » Dewey Defeats Truman » !
Cet épisode illustre bien l’un des biais des sondages, qui ne sont qu’une photo d’une situation à un moment donné. Or l’opinion publique est versatile et peut basculer en quelques semaines, parfois même en quelques jours ou heures, à la suite d’évènements particuliers.

Stœtzel, le français

Dès 1938, le sociologue Jean Stœtzel s’inscrit dans les pas de Gallup (qu’il a rencontré aux Etats-Unis) et fonde à Paris l’Institut Français de l’Opinion Publique (IFOP). C’est lui qui invente d’ailleurs le terme « sondage » auquel il trouve une bonne consonance scientifique.
Les estimations de vote du soir de l’élection, incontournables aujourd’hui, remontent à 1965 seulement. Cette année-là, les instituts annoncent à des millions de téléspectateurs français médusés, la mise en ballottage du Général de Gaulle par son adversaire socialiste François Mitterrand. A partir de ce moment, les sondages politiques s’imposent vraiment en France et prennent une importance croissante, d’élection en élection.
Interdite jusqu’en 1977 dans la semaine précédant l’élection, la publication des sondages est autorisée en 2002, jusqu’au vendredi minuit précédent le week-end électoral. Il faut dire qu’Internet avait mis à mal cette règle lors des présidentielles de 1995 et des législatives de 1997, avec la publication des estimations de résultats sur les sites Internet de nos voisins suisses mais aussi de certains médias hexagonaux.

Les bases théoriques des sondages

Le concept mathématique de probabilité

La théorie des sondages repose sur le concept mathématique de probabilité. L’idée est que l’on peut déduire les avis d’une population donnée à partir de ceux d’un échantillon représentatif de cette population. Ainsi, pour savoir ce que pensent les Français, il suffirait d’interroger un petit groupe, en veillant à ce que les caractéristiques de ce groupe soient les mêmes que ceux de l’ensemble de la population. La taille de ce groupe détermine la marge d’erreur de l’extrapolation à la population globale.
En théorie, la bonne manière d’obtenir un échantillon représentatif est de procéder à un tirage complètement aléatoire, en veillant à ce que chaque français ait exactement la même probabilité d’être choisi. Cette méthode étant quasiment impossible à mettre en œuvre et extrêmement coûteuse, les instituts ont pris l’habitude d’utiliser l’approche par quotas. Cette approche consiste à inclure des personnes dans l’échantillon en fonction de caractéristiques qui doivent être, pour l’ensemble de l’échantillon, les mêmes que pour la population de référence. Les caractéristiques utilisées dans les sondages politiques sont généralement de type signalétique, à savoir l’âge, le sexe, la profession…

Les marges d’erreurs

Bien entendu, plus la taille de l’échantillon est importante, plus la fiabilité de l’extrapolation est grande. Cependant l’amélioration de la fiabilité ne croit pas aussi fortement que la taille de l’échantillon. Ainsi, un échantillon de 5.000 personnes n’est pas 5 fois plus fiable qu’un échantillon de 1.000 personnes. La fiabilité est exprimée en marge d’erreur à + ou – x% de la valeur obtenue, en fonction du niveau de confiance souhaité (habituellement 95%). Ainsi, lorsqu’on utilise un échantillon de 1.000 personnes comme c’est le cas dans les sondages politiques, la marge d’erreur au seuil de confiance de 95% est de + ou – 3,1% pour une réponse donnée par 50% des personnes interrogées. Concrètement, cela veut dire, pour une valeur de 50% obtenue qu’on a 95% de chances de ne pas se tromper en affirmant que la véritable valeur dans la population globale se situe entre 46,9% et 53,1%.

où p est le pourcentage de réponse et n l’échantillon

Le tableau ci-dessous fournit quelques marges d’erreurs au niveau de confiance de 95% :

Ce tableau met en évidence l’importance de la répartition des réponses dans le niveau de fiabilité des résultats. On voit qu’une répartition à 50/50 est associée à une marge d’erreur bien plus importante que pour une répartition à 90/10. La fiabilité des scores attribués aux petits candidats est donc plus forte que celle des grands favoris. De même, la fiabilité des estimations pour le premier tour sont de meilleure qualité que celles du second tour de l’élection où les scores tournent généralement autour de 50/50.
Une autre caractéristique importante est également à noter : aussi surprenant que cela puisse paraître, la taille de l’échantillon à interroger n’est lié que très marginalement à la taille de la population-mère. C’est pour cela que les sondages politiques utilisent généralement 1.000 personnes, que ce soit en France, en Suisse ou aux Etats-Unis (qui comptent plus de 270 millions d’habitants !).

NB : La méthode des quotas n’autorise pas, en théorie, un calcul de marge d’erreur comme indiqué ci-dessus. En pratique, on le fait quand même, en considérant que l’on obtient des résultats comparables à ceux des sondages effectués par tirage aléatoire, lorsque l’échantillon dépasse une certaine taille.

Comment se mène un sondage politique ?

Les modes d’interrogation

Aujourd’hui, les sondages d’intentions de vote sont réalisés soit avec des questionnaires administrés par téléphone (enquêtes CATI : Computer Assisted Telephone Interviewing) soit par l’intermédiaire de questionnaire auto-remplis sur Internet (enquêtes CAWI : Computer Assisted Web Interviewing). Pour les enquêtes par Internet, le recrutement préalable est souvent effectué en amont, par téléphone. Plus aucun des grands instituts n’a recours, pour les sondages politiques, aux enquêtes à domicile, comme c’était le cas dans le passé (où les enquêteurs se heurtaient dans leur pratique quotidienne à de nombreuses difficultés : digicodes, insécurité dans certains quartiers, refus de répondre ou de donner ses coordonnées pour vérification…).

L’utilisation du support téléphonique s’est imposée à partir des années 80, en raison du taux d’équipement des ménages en téléphones fixes, considéré comme suffisant pour permettre de contacter toutes les catégories de populations. Le CATI a apporté une rapidité inconnue dans les enquêtes à domicile et du confort dans l’administration de l’enquête et la gestion des quotas.

Le support web s’est imposé, quant à lui, beaucoup plus récemment (vers 2007 / 2008), après avoir été combattu par beaucoup de professionnels des études qui lui déniaient la qualité de représentativité et lui associaient des biais importants. Aujourd’hui ce support a trouvé une place de choix en complément ou en substitution du téléphone, en raison notamment de sa généralisation dans les foyers, de sa souplesse et des gains importants en coûts et en productivité (d’ailleurs pas toujours répercutés aux clients finaux par les instituts !).

Les méthodes d’échantillonnage

Généralement, les sondages portent sur un échantillon représentatif d’environ 1.000 personnes, âgées de 18 ans et plus et constitué « selon la méthode des quotas sur le sexe, l’âge et la profession du chef de ménage, après une stratification par région et catégorie d’agglomération ». Cette mention qui figure quasiment à l’identique avec chaque sondage est censée nous apporter une indication claire du mode d’échantillonnage retenu. La stratification consiste à découper la population d’ensemble en partitions composées des couples région/catégorie d’agglomération. La méthode des quotas s’applique ensuite à l’intérieur de chaque partition où l’on cherche à faire interroger des sous-échantillons représentatifs sur les trois critères du sexe, de l’âge et de la CSP. On a donc l’impression, que les sondages prennent en compte l’ensemble des régions de France, en adressant, dans chacune, toutes les tailles d’agglomérations et en assurant, dans chaque unité, une répartition de l’échantillon qui respecte celle de la population pour chaque combinaison de critères signalétiques.

Regardons cela de plus près : la France comporte 27 régions en tout (en comptant les DOM-TOM); pour ce qui est des catégories d’agglomération, plusieurs découpage sont possibles mais on peut difficilement considérer moins de 5 strates (allant des petites communes rurales aux grandes villes de plus d’1 million d’habitants). On se retrouve donc déjà avec 27×5 soit 135 strates. Si on considère les 2 sexes, 5 tranches d’âge et 9 CSP, on se retrouve déjà avec 90 combinaisons. Même si certaines combinaisons sont improbables (retraité de moins de 25 ans !), on arrive à environ 12.000 personnes à interroger, pour n’avoir, simplement qu’un représentant de chaque catégorie dans chaque strate !

Bien entendu, ce n’est pas comme cela que la sélection du millier de personnes à interroger est effectuée. On ne considère généralement pas toutes les régions mais seulement certaines d’entre elles. Le principe consiste à tirer aléatoirement, dans une matrice qui croise les régions avec les tailles d’agglomérations, un certain nombre de combinaisons, dans lesquelles on cherchera à appliquer les quotas. En outre, ces derniers seront appliqués à plat : on cherchera donc à obtenir une répartition conforme à celle de la population, pour chacun des critères signalétique, sans croiser les différentes catégories (prise en compte indépendante de la répartition homme/femme, de la répartition par tranche d’âge et de la répartition par CSP).

Le redressement des résultats

Comme dans beaucoup d’enquêtes utilisant la méthode des quotas, les sondages politiques font l’objet de redressements. Un premier objectif est de faire correspondre l’échantillon interrogé avec les quotas visés, pas toujours facile à atteindre. Mais un objectif plus spécifique aux enquêtes politiques consiste à pondérer les déclarations des personnes interrogées, pour aboutir à des estimations plus exactes.
En effet, dans ce domaine sensible que constitue l’intention de vote, on constate un niveau de dissimulation ou de fausse déclaration supérieur à ce qu’on voit dans des enquêtes moins engageantes. C’est notamment le cas pour les intentions de vote qui concernent les candidats « extrêmes » ou pour les abstentionnistes. Le manque de franchise peut également provenir d’un calcul politique de certains électeurs.
Pour arriver à estimer correctement les intentions de vote déclarées, les sondeurs cherchent à les redresser en fonction des résultats connus pour les suffrages précédents. Le principe consiste à demander à chaque interviewé ce qu’il a voté lors du précédent scrutin et d’apporter aux valeurs obtenues les coefficients de redressement nécessaires. Ainsi, si 10% des interviewés indiquent avoir voté pour un parti et que ce parti avait obtenu en réalité 14% des suffrages, on affecte aux 10% de répondants un coefficient de 1,4.
Cette méthode a toutefois ses limites dans les situations sans référentiel ou avec un référentiel incertain. C’est le cas, dans l’élection de 2012 pour Marine Le Pen ou Jean-Luc Mélenchon.

Pourquoi leur arrive-t-il de se tromper ?

Les erreurs liées à la communication

Avant de parler d’erreurs techniques, il convient de mettre l’accent sur la manière avec laquelle les résultats sont communiqués au public. En effet, lorsqu’ils en font état, les journalistes accompagnent rarement l’énoncé des prévisions des nécessaires précautions sur les marges d’erreurs. On énonce des valeurs et on commente des différences de l’ordre du demi-point, alors que les marges d’erreurs sont généralement d’au moins +/- 3 points. On peut les comprendre. Car il est certes difficile d’indiquer que tel homme politique se situe entre 25 et 31% des intentions de vote alors que son concurrent est entre 24,5 et 30,5%. De telles valeurs « parlent » beaucoup moins que 28% pour l’un et 27,5% pour l’autre ! Mais la réalité est pourtant dans le premier énoncé, et le second est porteur de déceptions futures.

L’interprétation des chiffres donne également lieu à des méprises volontaires ou involontaires. Oubliant que les chiffres valent pour la question posée, des commentateurs de bonne foi et des hommes politiques plus intéressés tirent rapidement des conclusions sur d’autres aspects. Ainsi, une bonne opinion sur un homme politique n’est pas une intention de vote. Bayrou est bien placé pour le savoir. De même, une mauvaise opinion n’implique pas obligatoirement un vote contraire, l’opposant politique pouvant être encore moins apprécié.

D’autres fausses interprétations et raccourcis sont liés à un manque de bon sens statistique et mathématique, plus courant qu’on ne le pense : combien de fois entend-on des journalistes ou des politiciens additionner des pourcentages d’une élection à l’autre ou d’un tour à l’autre, sans se soucier des bases de calcul ou en les ajustant selon ses priorités partisanes.

Les biais méthodologiques

Attaquons maintenant les vraies erreurs qui peuvent survenir dans la réalisation du sondage, d’autant plus que ces opérations sont souvent réalisées dans des délais très serrés, exigés par l’environnement politique ou les commanditaires de l’étude.
Revenons d’abord au système d’échantillonnage évoqué dans la diapositive précédente et qui recèle d’importants risques. En effet, si les sondeurs veillent à la représentativité de l’échantillon sur les critères âge, sexe et CSP, il n’est pas évident que les personnes sondées soient représentatives sur d’autres critères signalétiques importants. Ainsi, le niveau d’études, le nombre d’enfants ou le secteur d’activité (et non seulement la CSP) peuvent également avoir une influence sur le vote.

Les critères signalétiques utilisés peuvent également refléter de manière imprécise certains statuts. Ainsi, la fameuse catégorie des inactifs rassemble des personnes dans des situations très diverses. Il peut s’agir de jeunes en recherche d’emploi, de femmes au foyer, de retraités. Ces derniers se regroupent d’ailleurs dans des sous-catégories diverses, selon le métier d’origine.

Un autre frein qui nuit à la représentativité de l’échantillon est le refus de certaines personnes de répondre aux sondages politiques (et parfois à tous types d’enquêtes). Ces récalcitrants sont sous-représentés dans certaines catégories (CSP +, femmes…) et surreprésenté dans d’autres (abstentionnistes, jeunes, ouvriers…). Pour pallier la difficulté à atteindre ces groupes, des redressement sont souvent effectués et finissent par attribuer des coefficients exagérément élevés à certaines cibles difficiles à atteindre. D’ailleurs, cette difficulté de contacter certains groupes est parfois aggravée par l’environnement technique de ces populations : on peut évoquer notamment l’abandon par certaines population de la ligne de téléphone fixe au profit exclusif du téléphone mobile, pour lequel les sondeurs ne disposent pas d’annuaires exhaustifs.

La qualité dans la réalisation du terrain

En plus des problèmes inhérents à la communication des résultats et aux biais associés à l’échantillonnage, il existe très clairement dans l’univers des enquêtes téléphoniques (de manière générale, pas seulement les sondages politiques), un gros problème de qualité qui se manifeste de plusieurs manières :

- le métier de télé-enquêteur est, par nature, un emploi précaire et fastidieux, qui attire surtout des étudiants, des chômeurs, des femmes au foyer et parfois des retraités. Bien entendu, cela n’empêche pas d’avoir des personnes consciencieuses mais il y a également un risque de tomber sur des télé-enquêteurs peu professionnels, qui ne déroulent pas toujours les questionnaires de manière optimale et qui n’appliquent pas systématiquement les consignes. Les superviseurs sont là pour suivre le terrain et apporter les ajustements nécessaires. Mais ils peuvent facilement être débordés, surtout si le sondage doit être fait dans des délais très courts. L’un des biais est d’ailleurs associé au mode de rémunération au questionnaire, qui incite à privilégier la conclusion rapide de l’entretien plutôt que la qualité d’administration. On obtient alors des litanies de réponses citées à toute vitesse, qui ne laissent aucun temps de réflexion à la personne interrogée (On vous cite 10 mesures en les enchaînant d’une traite puis on vous demande d’indiquer celles pour lesquelles vous êtes le plus sensible !).
- les concepteurs de sondages ne font pas toujours preuve d’une grande finesse dans la définition du questionnaire. Certaines questions posées donnent au sondé le sentiment de ne pas être à la hauteur et le déstabilisent pour la suite de l’enquête. Ainsi, certains demandent à ce qu’on leur cite 2 ou 3 propositions qu’ils ont retenues dans le programme d’un ou plusieurs candidats. Beaucoup de personnes ont du mal à isoler ainsi des propositions précises ou à les énoncer clairement, ce qui les met mal à l’aise et les incite à répondre rapidement pour écourter l’entretien.
- les sondés n’ont pas toujours un avis tranché. Pour respecter leurs consignes et obtenir une réponse, les télé-enquêteurs cherchent parfois à faire le forcing. Beaucoup de sondés choisissent alors, sans beaucoup de conviction, l’une de ces possibilités proposées avec autant d’insistance. Devant une hésitation persistante, certains télé-enquêteurs ont tendance à influer sur la réponse « Bon, on met untel alors ? ».

Ce ne sont là que quelques biais d’administration. Le web regorge de témoignages d’anciens ou d’actuels télé-enquêteurs qui ont œuvré dans les grands instituts et qui racontent les mauvaises conditions et les à-peu-près dans le déroulement des entretiens et dans le management qu’ils ont subi. Il est vrai qu’on ressent aussi chez certains une bonne dose de mauvaise volonté et un esprit critique exacerbé, ce qui ne doit pas vraiment aider à obtenir des résultats de qualité.

L’avenir des sondages politiques

Une activité très médiatique

En France, les sondages politiques sont réalisés principalement par huit grands instituts : BVA, CSA, Ifop, Ipsos, Harris Interactive, LH2, Opinion Way, et TNS Sofres. Pour ces instituts, les études politiques et enquêtes pré-électorales représentent surtout un élément de notoriété et une occasion régulière d’être visibles auprès de leurs véritables cibles que sont les entreprises. Il faut dire que la couverture média de chaque publication de sondage est telle qu’elle représente pour chacun des intervenant une vitrine de luxe et un équivalent inestimable en termes de communication tous azimuts : presse écrite, radio, télévision, web…

En termes de chiffres d’affaires, les sondages politiques représentent généralement une part minime du CA pour les principaux instituts. D’après le rapport sénatorial « Sondages et démocratie » établi en 2010, cette part est, en 2009, de 1% seulement pour BVA et IPSOS, de 3 à 5% pour LH2 et de 6% pour Opinion Way. Seul CSA et IFOP affichent une part significative (respectivement 16% et 20 à 25%). Tout cela n’empêche pas la France de faire partie des pays qui produisent et « consomment » le plus de sondages politiques au monde.

Le rapport cité ci-dessus a été établi dans le cadre d’une mission d’information sur les sondages en matière électorale. Il a émis quinze recommandations pour des sondages plus sincères et transparents, un meilleur encadrement législatif des sondages et un renforcement de la légitimité et l’efficacité de la commission des sondages. Le rapport et ses recommandations sont accessibles en cliquant ici.

Un bon sujet de polémique

Quelles que soient les règles, les organismes et les lois qui encadrent l’univers des sondages politiques, il semble que cette activité ait, par nature, une bonne propension à susciter des polémiques.
La tendance à la volatilité de l’électorat et à l’augmentation du nombre d’indécis jusqu’au jour de l’élection ne vont certainement pas participer à la fiabilisation des résultats et par conséquent, à la réduction des débats sur les sondages. En effet, sans parler des estimations effectuées en début de campagne et qui sont quasi systématiquement démenties (voir notre article sur le sujet), que peuvent prévoir les sondages lorsqu’une bonne partie de l’électorat se dit encore susceptible de changer d’avis dans la semaine précédant les élections ?
On a beau répété que les sondages ne sont qu’une photographie d’une situation à un instant T et que les chiffres fournis ont nécessairement une marge d’erreur. Les journalistes, hommes politiques et la société dans son ensemble ne sont pas prêts à l’admettre et continueront toujours à attendre des prédictions exactes. La déception est, en général, à la mesure de cette sur-confiance non justifiée.
Pour éviter que l’opprobre n’arrive par ricochet sur l’ensemble des études et sondages effectués dans le domaine des affaires, les instituts ont intérêt à mieux communiquer sur les limites de leurs chiffres. Masi peut-on l’espérer, dans une société qui va si vite et où l’instantanéité fait perdre de vue les objectifs globaux ?