L’analyse multivariée regroupe les méthodes statistiques qui s’attachent à l’observation et au traitement simultané de plusieurs variables statistiques en vue d’en dégager une information synthétique pertinente. Les deux grandes catégories de méthodes d’analyse statistique multivariées sont, d’une part, les méthodes dites descriptives et, d’autre part, les méthodes dites explicatives. Les méthodes descriptives ont pour objectif d’aider à structurer et résumer un ensemble de données issues de plusieurs variables, sans privilégier particulièrement l’une de ces variables. Toutes les variables sont donc prises en compte au même niveau. Les traitements et représentations graphiques visent à apporter une vision globale la plus exacte possible de l’ensemble des données analysées, en minimisant la déperdition d’information.
Les méthodes descriptives d’analyse multivariée les plus utilisées dans le
traitement des enquêtes sont :
- l'ACP ou analyse en composantes principales,
- l'AFC ou analyse factorielle des correspondances,
- l'ACM ou analyse des correspondances multiples,
- la typologie,
- les méthodes de classification.
Les méthodes explicatives ont, quant à elles, pour objectif d’expliquer l’une
des variables (dite dépendante) à l’aide de deux ou plusieurs variables explicatives
(dites indépendantes). Les principales méthodes explicatives utilisées dans les enquêtes sont :
- la régression multiple,
- la segmentation,
- l'analyse de la variance ou ANOVA,
- la régression logistique,
- l'analyse discriminante,
- l'analyse conjointe,
- les arbres de décision.
Le choix de l’une ou l’autre des méthodes d’analyse se fait en fonction de l’objectif recherché (décrire ou expliquer) mais également du type et de la nature des variables disponibles dans l’ensemble de données. Ce que l’on désigne en France par « Analyse de données » correspond à une partie des analyses multivariées.