“Segmentation“ fait partie de ces termes fréquents dans l’univers du marketing, qui font référence à plusieurs notions parfois très différentes.
Avant d’aborder les techniques statistiques de découpage des clients en groupes homogènes (qui est le sujet qui nous intéresse ici), il convient de lever quelques ambiguïtés.
La segmentation des marchés
Le mot segmentation est souvent accolé à la notion de marché. On parle de segments de marchés pour désigner les différents périmètres sur lesquels opère l’entreprise.
Cette segmentation de marché est réalisée généralement de manière empirique, sur la base de la connaissance par l’entreprise de son activité et de son environnement. Elle est issue de la réflexion stratégique d’un responsable ou d’un groupe de responsables et vise à définir un positionnement et une stratégie marketing. L’une des approches utilisées consiste à établir une matrice “produit/marché”, puis à estimer, pour chaque segment ainsi établi, ses éléments distinctifs, les attraits qu’il offre, les avantages concurrentiels que l’entreprise pourrait y faire prévaloir, etc.
Cette démarche ne correspond donc pas à des techniques statistiques particulières.
La segmentation des clients
Dans la segmentation des marchés, la notion de clients est bien sûr présente : les différents marchés concernent généralement différents types de clients, avec des profils et des besoins particuliers.
Toutefois, lorsqu’on parle de segmentation de clients, on pense davantage au découpage de cette population de clients en sous-groupes, en utilisant des critères propres à ces clients plutôt que des critères liés aux marchés (et donc aux produits). C’est donc une démarche inverse à la segmentation du marché (sans bien sûr s’y opposer).
L’approche empirique
Comme la segmentation des marchés, celle des clients est le plus souvent effectuée de manière empirique, avec une démarche raisonnée.
Ainsi, beaucoup d’entreprises utilisent des critères perçus comme pertinents, pour définir des segments de clientèles. Certains critères choisis s’apparentent au découpage de marchés, comme la segmentation géographique.
Mais le plus fréquemment, les critères de segmentation empirique des clients sont d’ordre socio-démographique. En effet, on considère naturellement que les besoins et les comportements de consommation des clients sont étroitement liés avec leur âge, leur sexe, leur profession, leurs revenus, etc. De plus, ces critères sont factuels et donc plus facile à obtenir.
Or cette approche présente des risques importants (et croissants). En effet, on se rend compte et de plus en plus, que les caractéristiques socio-démographiques ne s’appliquent souvent pas. Un téléphone portable ou une voiture bas de gamme ne sont pas toujours achetés par les plus pauvres mais aussi par des personnes plus aisées qui accordent peu d’importance à la valeur image du produit et privilégient sa valeur d’usage. De même, certains types de vêtements de marque ou de produits de luxe (alimentaires, technologiques…) sont achetés par différentes couches de la population.
D’autres modes de segmentation sont donc nécessaires. Il s’agit de la définition des groupes de clients non pas à partir de ce qu’ils sont mais plutôt de ce qu’ils font.
La segmentation fondée sur les comportements peut difficilement faire l’objet d’une approche raisonnée car elle correspond, par définition, à un objet de recherche et de découverte plutôt qu’à un thème de réflexion.
La démarche empirique est donc fatalement limitée. Elle ne peut, de toutes les manières, qu’être ponctuelle alors qu’une segmentation se doit de vivre dans le temps en s’adaptant très régulièrement à l’environnement.
L’approche statistique
Nous allons maintenant nous intéresser à la démarche statistique permettant de répondre à l’objectif de segmentation.
Or on se trouve, là aussi, devant une ambiguïté : la technique statistique de “segmentation” existe et correspond bien à une méthode de découpage d’une population en plusieurs segments. Toutefois, comme nous allons le voir ci-dessous, ce vocable ne couvre qu’une seule méthode de découpage de la population parmi d’autres et qui n’est d’ailleurs pas celle qui se rapproche le plus de ce qu’on en attend dans notre contexte.
L’algorithme de segmentation
La segmentation opère un découpage de l’échantillon sur un critère unique qu’il faut spécifier en amont. Il peut s’agir de la rentabilité, du renouvellement de l’achat, ou de tout autre critère que l’on cherche à expliquer.
L’algorithme de segmentation cherche alors à classer les variables explicatives que l’on prend en compte dans l’analyse, en fonction de leur pouvoir discriminant par rapport à cette variable à expliquer.
Schématiquement, la méthode fonctionne de la manière suivante :
- On commence par choisir la variable que l’on souhaite expliquer
(produit acheté, par exemple) et les variables susceptibles d’entrer en
jeu (variables signalétiques, par exemple).
- L’algorithme de segmentation calcule la répartition des individus
sur la variable à expliquer (dans notre exemple, le nombre de personnes
ayant acheté chacun des produits).
- Chaque variable explicative est “testée” : l’algorithme divise
l’échantillon global en plusieurs échantillons correspondant aux
modalités de la variable explicative si elle est qualitative ou à
différentes tranches si elle est numérique. La répartition des individus
sur la variable à expliquer est recalculée pour chacun des
sous-échantillons. La variable permettant la répartition la plus
différenciée est sélectionnée comme premier indicateur.
- Le processus est ensuite reconduit sur chacun des
sous-échantillons issus de ce découpage.
Le résultat final s’exprime sous la forme d’un arbre de décision. Cet arbre permet de prédire le comportement de n’importe quel individu nouveau (pour lequel les variables explicatives sont connues), par rapport aux différentes modalités de la variable à expliquer.
Comme on peut le constater, et malgré la puissance et l’intérêt de cette méthode, le résultat ne correspond pas tout à fait à la notion de segmentation telle qu’on l’entend de manière opérationnelle.
L’analyse typologique
La typologie correspond également à une méthode de découpage d’échantillons. Comme on va le voir, son fonctionnement et ses résultats se rapprochent davantage de ce que l’on attend généralement lorsqu’on parle de segmentation.
Contrairement à la segmentation qui privilégie une seule variable à expliquer, la typologie prend en compte toutes les variables choisies pour l’analyse, sur le même plan.
Ces variables sont utilisées pour découper le groupe d’individus initial en sous-groupes aussi différents que possibles les uns des autres et avec des individus aussi semblables que possibles à l’intérieur de chacun des groupes, ce qui est exactement ce que l’on recherche lorsqu’on évoque ordinairement la notion de segmentation.
Schématiquement, l’algorithme de la typologie fonctionne de la manière suivante :
- L’utilisateur indique le nombre de groupes qu’il souhaite obtenir
et choisit les variables qui doivent participer à la composition de ces
groupes. Généralement, les variables utilisées sont numériques (même si
les algorithmes peuvent, en théorie, prendre en compte des variables
qualitatives, en partant d’un tableau de similarité au lieu d’utiliser
les valeurs des variables).
- L’algorithme commence par effectuer un tirage aléatoire d’un
individu pour chacun des groupes à constituer. Ces individus sont
considérés comme étant les centres provisoires des classes à constituer.
- L’algorithme s’intéresse ensuite à chacun des autres individus
qu’il rattache au centre de la classe dont il est le plus proche.
L’arrivée d’un individu dans chaque classe modifie le centre (qui est
donc mobile) et permet au fur et à mesure, d’affiner les groupes.
- L’algorithme continue à affecter puis à réaffecter les individus
aux différents groupes, jusqu’à ce qu’il n’y ait plus de réaffectation
possible.
Cet algorithme a des variantes qui interviennent notamment lors du processus de sélection des individus initiaux. Ainsi, la méthode des “nuées dynamiques” remplace l’individu initial sélectionné aléatoirement pour chaque groupe par un “noyau” de plusieurs individus. En réduisant ainsi les biais possibles, la qualité de l’analyse est améliorée.
Quelle que soit l’algorithme utilisé, l’analyse typologique fournit au final, un tableau indiquant le nombre d’individus présents dans chaque classe et la variance interne à chaque classe. Cette variance intra-classe renseigne sur l’homogénéïté du groupe ainsi obtenu. La somme des différentes variances intra-classe donne une indication de la pertinence du découpage obtenu.
La démarche opérationnelle
Comme on vient de le voir, la typologie permet de découper ses clients en plusieurs segments homogènes sur un certain nombre de critères.
C’est donc cette technique statistique que nous vous conseillons de choisir lorsque vous cherchez à déterminer vos segments de clients.
Quelles variables choisir ?
Généralement, on s’attend à ce que les segments que l’on obtient puissent être décrits de manière claire dans des termes comme : “Les clients du segment 1 sont des jeunes actifs, de CSP +, avec enfants. Ils fréquentent notre magasin une fois par semaine, généralement le soir et ont un panier moyen de 100 Euros”.
Le néophyte qui part de ce type de description pour réaliser sa segmentation (ou plutôt sa typologie) aura tendance à vouloir intégrer, dans les critères de calcul, l’âge, la CSP, le nombre d’enfants, la fréquentation, le moment de la visite et le panier moyen.
Plus généralement, étant donné qu’on peut chercher à décrire le comportement des segments pour toutes les variables disponibles dans les fichiers, on n’aurait qu’à les sélectionner toutes dans l’analyse.
Ce n’est bien sûr pas comme cela que l’on procède. Il est conseillé de sélectionner au départ un petit nombre de variable importantes, censées caractériser globalement le client. Il s’agit généralement de variables numériques caractérisant l’importance du client pour la société : volume d’achat sur une période, moyenne par achat, potentiel, etc.
On peut aussi y adjoindre des éléments liés à des niveaux de satisfaction.
Comment choisir une typologie ?
Il faut savoir que l’algorithme de typologie n’aboutit généralement pas, s’il est lancé plusieurs fois, à un résultat identique. Le regroupement opéré dépend du choix des individus initiaux, même si les algorithmes de calcul cherchent à réduire les écarts et à aboutir à des résultats stables.
Généralement, les logiciels évolués, comme STAT’Mania par exemple, permettent d’enchaîner plusieurs typologies pour s’arrêter sur celle qui semble la plus pertinente.
Le choix s’opère sur deux éléments : la comparaison de la somme des variances intra-classe déjà évoqué mais aussi, la logique opérationnelle des classes obtenues, qui doit être appréciée par l’homme de marketing.
Comment caractériser les groupes ?
A l’issue du calcul d’une typologie, on obtient généralement pour chaque groupe les valeurs moyennes (et d’autres indices statistiques) pour les différents critères qui ont été sélectionnés dans le calcul.
Cette première caractérisation permet de nommer les groupes. On peut ainsi étiquetter les “Gros acheteurs”, les “Poids morts”, etc.
Un second niveau de caractérisation est obtenu en croisant les groupes
par les autres variables disponibles. Il peut s’agir notamment de
variables qualitatives et signalétiques.
On peut ainsi déterminer le profil de chaque groupe et arriver à une
description du type de celle évoquée plus haut, concernant le choix des
variables.
Pérenniser l’approche
La segmentation est un processus dynamique. Les besoins et comportements des clients évoluent.
Il est donc utile de chercher, dès la première démarche de segmentation, à se donner les moyens de reproduire cette démarche très régulièrement (une fois par an, par exemple), à défaut de pouvoir l’automatiser complètement.
Une exploitation pas toujours évidente
La nécessité de segmenter ses clients est souvent perçue comme une évidence qui n’a pas besoin d’être expliquée ou discutée. On segmente pour mieux cibler les clients. On suppose que si l’on a identifié des groupes de clients homogènes, on améliorera tout naturellement les performances commerciales. Or l’équation “cibler = vendre plus” a des limites.
La première réside dans la difficulté de mise en oeuvre de la segmentation elle-même : le processus de préparation de données pertinentes est long et fastidieux ; les méthodes statistiques ne sont pas toujours faciles à appréhender et à mettre en oeuvre ; les résultats sont parfois difficiles à interpréter et à généraliser. Cela transforme parfois l’outil que constitue la segmentation en une fin en soi, un objectif à atteindre. C’est d’autant plus vrai que la segmentation est un concept dynamique et évolutif ce qui accroît encore la complexité de la tâche en nécessitant une adaptation et des efforts permanents.
Une autre difficulté réside dans le dilemme auquel est confronté l’homme de marketing devant les segments homogènes qu’il a constitués : généralement, la segmentation met en évidence un groupe (parfois plus) beaucoup plus intéressant(s) que les autres (forte rentabilité, forte croissance…). Inversement, plusieurs groupes semblent moins intéressants. La question qui se pose est de savoir si l’on doit adopter une stratégie de concentration des efforts sur le segment vedette ou si, au contraire, on doit mettre en oeuvre une stratégie multi-segments avec des approches différenciées et ciblées. Dans le premier cas, le risque est de réduire considérablement sa base d’acheteurs potentiels et d’hypothéquer l’avenir. Dans le deuxième cas, on peut se heurter à des problèmes de moyens humains ou matériels et à une complexification de la démarche marketing.
Cette problématique fait penser à la matrice BCG d’analyse stratégique des marchés qui, en croisant la part de marché relative de chaque produit de l’entreprise avec le taux de croissance du marché concerné, permet de distinguer 4 segments : les vedettes, les vaches à lait (PDM forte et croissance faible), les dilemmes (PDM faible et croissance forte) et les poids morts. Les préconisations stratégiques issues de cette matrice et dont on peut s’inspirer, consistent à maintenir les vaches à laits sans y investir trop de ressources, de porter ses efforts sur la consolidation des vedettes mais aussi des dilemmes puis de rentabiliser au maximum les poids morts avant de les abandonner (sauf si des perspectives de développement se profilent).