Le traitement des données  

Le traitement des données

L’objectif ici n’est pas de détailler tous les types de traitements et analyses possibles sur les enquêtes, ni d’expliquer les modes d’exploitation des résultats et de présentation du rapport d’étude.

Nous nous contenterons donc de présenter rapidement ci-dessous les principaux traitements effectués généralement sur les données d’enquêtes.

Le redressement d’échantillon

Avant de parler des tris, il convient d’évoquer cette étape nécessaire notamment dans le cas où la répartition des quotas n’a pas pu être respectée, ou encore, si l’on a délibérément choisi de sur-évaluer un groupe peu représenté pour avoir un minimum de réponses.

Le redressement d’échantillons a pour objectif de rétablir les bonnes proportions en affectant un poids (coefficient de redressement) à chaque individu en fonction de ses caractéristiques. Le calcul des coefficients s’entend généralement sur plusieurs critères en même temps. Il ne peut se faire qu’à l’aide d’un logiciel adapté. Les fonctions de redressement d’échantillons sont d’ailleurs disponibles en standard dans les outils d’analyse de données (Stat’Mania…). Pour plus de détails sur les méthodes et principes de redressement d’échantillons, nous vous renvoyons au dossier publié à ce sujet dans le numéro de Septembre 2003 de Survey-Magazine.

Les types de tris

Les logiciels actuels permettent d’effectuer un très grand nombre de tris et de les présenter sous forme de tableaux et de graphiques.

Tabulations

Il s’agit des traitements les plus fréquents et les plus compréhensibles par tout le monde. Les tabulations consistent à indiquer la répartition des réponses obtenues.

Le tri-à-plat dans sa forme habituelle, donne la répartition des réponses pour une seule question (ex : hommes : 43%, femmes : 57%).

Le tri croisé est un traitement qui porte généralement sur deux questions et qui indique la répartition des réponses aux différentes combinaisons de réponses (homme > 25 ans : 17%, etc…). Les tris croisés présentent généralement un effectif et trois pourcentages : le % ligne, le % colonne et le % total. Certains logiciels peuvent indiquer pour chaque tri croisé la valeur du khi2, test statistique qui mesure la liaison entre les deux variables du tri, pour indiquer la probabilité pour que la répartition observée soit ou non dûe au hasard. Il est également parfois possible de demander l’affichage de la contribution de chaque case au khi2 global, ce qui renseigne sur les combinaisons de modalités qui influent le plus sur la liaison entre variables.

Au delà de leur forme simple, les tris croisés peuvent être étendus à plusieurs variables. On parle alors de tris croisés NxN ou combinés NxN. Les premiers présentent au même niveau les modalités des variables en lignes ou en colonnes alors que les seconds les combinent.

Les tris multiples sont généralement des analyses applicables sur un tableau de questions identiques (échelles, notes…). Ils présentent de manière synthétique les résultats de l’ensemble des critères du tableau.

Tris pondérés

Alors que les tris à plat, croisé ou multiples comptabilisent les individus correspondants à chaque modalité ou combinaison de modalités, les tris pondérés remplacent ce comptage d’individus par une opération de moyenne ou de somme sur une autre question appelée variable de pondération.

Ces tris sont extrêmement utiles pour obtenir des tableaux synthétiques avec des notes moyennes de critères, selon les combinaisons de réponses à différentes questions.

Les tris pondérés peuvent être à plat, croisés ou multiples. Certains logiciels comme Ethnos permettent également de réaliser des tris pondérés étendus, qui permettent par exemple, d’obtenir, en une seule opération, la note moyenne de satisfaction sur un grand nombre de critères, par magasin, jour ou toute autre variable de croisement. Des scores peuvent être attribués dynamiquement au traitement, à chaque modalité de l’échelle d’évaluation (ex : 100 pour Très satisfait, 75 pour Satisfait, etc.).

Analyses statistiques avancées

Alors que les tabulations sont directement utilisables et compréhensibles par tous, les analyses statistiques avancées font appel à des connaissances en la matière et nécessitent, lors de la présentation des résultats, davantage d’explications.

Certains logiciels comme Stat’Mania offrent à ce niveau une approche simplifiée permettant d’élargir l’accès à ces méthodes, notamment en facilitant la définition des analyses et en rendant plus explicites et plus communicants les tableaux et graphiques de résultats.

On peut citer parmi les analyses avancées qui apportent une valeur ajoutée importante dans le traitement des enquêtes :

- la matrice importance-satisfaction, qui calcule automatiquement l’importance de différents critères de détail, par rapport à un critère de satisfaction globale, et qui indique les critères sur lesquels il faut agir en priorité pour améliorer la satisfaction globale,
- la recherche des croisements les plus significatifs, qui permet de détecter automatiquement les couples de variables ayant la plus forte dépendance,
- la régression multiple, qui permet de modéliser la relation entre une variable principale et un ensemble d’autres variables dans le but de pouvoir prédire la valeur de la variable principale en fonction des valeurs des autres variables,
- les analyses factorielles, qui permettent de résumer plusieurs variables sur un plan en deux dimensions,
- les typologies, qui permettent de ranger les personnes interrogées en groupes homogènes,
- la segmentation, qui cherche à expliquer une variable qualitative par plusieurs autres.

La présentation et l’exploitation des résultats

C’est là l’objectif final de l’étude. Savoir est une chose importante mais savoir communiquer et transformer les enseignements de l’étude en actions passe par un rapport final clair et opérationnel. Il est donc important de chercher à présenter de manière attractive et compréhensible les éléments clés de l’étude.