L’ACP s’applique à un ensemble de variables numériques. Elle
permet de positionner les individus sur un plan en deux dimensions, en fonction de la proximité
de leurs réponses aux questions sélectionnées. Les variables sont également représentées sur le
mapping, mais de manière indépendante des points-individus.
L’ACP permet ainsi de mettre en
évidence la structuration des réponses en montrant le regroupement des individus selon des
combinaisons de réponses aux questions prises en compte.
Les axes du mapping ne correspondent généralement pas à l’une ou l’autre des variables mais à un
regroupement optimal de plusieurs variables (ex : revenu et niveau d’études peuvent participer
ensemble à la formation d’un axe dans la mesure où elles peuvent être fortement corrélées).
L’ACP est très pratique lorsque l’on travaille sur un ensemble limité et identifié d’individus statistiques. Ainsi, si l’on souhaite analyser des points de vente en fonction de différents critères numériques (surface, personnel, CA, nombre de pièces vendues…), l’ACP permet d’obtenir une cartographie intéressante, qui regroupe les points de vente selon tous les critères retenus et qui permet ainsi de les catégoriser et d’identifier notamment, d’un coup d’œil, les cas hors norme (ex : surface et personnel importants mais CA faible…).
Le tableau de départ de l’ACP comporte les individus en ligne et les
variables en colonne, avec, dans chaque case, la réponse numérique de l’individu à la question
correspondante. Les questions qualitatives ordinales, c’est-à-dire, celles dont les réponses
peuvent être ordonnées entre elles (échelles, fréquences…) peuvent être recodifiées pour entrer
dans le tableau de l’ACP.
Cette recodification doit être généralement préparée à l’avance.
Toutefois, certains logiciels d’analyse statistique comme STAT’Mania, permettent de réaliser
cette recodification en direct, lors du choix des variables à faire entrer dans l’ACP.
L’algorithme de l’ACP effectue sur la matrice individus/variables différentes opérations
(centrage-réduction desdonnées, diagonalisation de la matrice, extraction de valeurs propres et
devecteurs propres…), en vue de passer du nombre de variables initial à un petit nombre de
variables obtenues par combinaison des premières.
L’ACP s’applique à un ensemble de variables numériques. Elle permet de positionner les individus
sur un plan en deux dimensions, en fonction de la proximité de leurs réponses aux questions
sélectionnées. Les variables sont également représentées sur le mapping, mais de manière
indépendante des points-individus.
Ces nouvelles composantes forment les axes du mapping. La première composante est celle qui
résume le mieux les informations contenues dans le tableau. La deuxième apporte un pourcentage
inférieur mais complémentaire d’information, et ainsi desuite.
Le mapping d’ACP représente d’abord la première composante (axe horizontal)
et la seconde (axe vertical). La somme des pourcentages d’explication des deux composantes
renseigne sur le taux de déperdition d’information à partir des données de base. Ainsi, si la
première composante résume 62% du tableau et la seconde 21%, l’information représentée sur le
mapping est de 83%. L’information « perdue » est donc de 17%.
Les points-individus sont
représentés sur le mapping en fonction de leur coordonnées sur les facteurs. Les points proches
correspondent à des individus ayant des profils proches, a priori, quant aux réponses aux
variables prises en compte dans l’analyse.
Les points-variables sont également représentés sur le mapping, mais de manière complètement
indépendante des individus.
Leur représentation indique leur corrélation avec les facteurs, à l’intérieur d’un cercle de
rayon 1 défini avec une échelle arbitraire (qui peut être changée à loisir sans affecter la
représentation des points-individus).
Ces points variables renseignent sur le sens à donner aux axes. Ainsi, une variable proche
du cercle de corrélation (corrélation forte) et proche d’un axe participe beaucoup à la
formation de cet axe.
Les angles inter-variables (en partant de l’origine) renseignent sur les corrélations entre
elles. Ainsi, deux variables formant un petit angle sont fortement corrélées, alors qu’un angle
droit signifierait qu’elles sont indépendantes.