La saisie de données d’enquêtes par questionnaires peut être une
tâche fastidieuse et le traitement de ses données s’avérer
complexe si jamais la procédure ne respecte pas une démarche rigoureuse.
Les technologies de lecture automatique de questionnaires permettent de
remédier aux délais et biais engendrés par une ressaisie manuelle de
chaque réponse. Correspondant à des besoins distincts, la lecture
optique et la scannérisation sont les techniques les plus avancées pour
mener à bien des enquêtes aussi bien quantitatives que qualitatives et
se rapportant à tous les secteurs d’activité.
Si aujourd’hui la numérisation des méthodes d’enquête et les
démarches écologiques font que le questionnaire papier est de moins en
moins utilisé, il reste inévitable pour des actions de grande ampleur et
certains types d’enquêtes comme les épreuves scolaires par
QCM.
L’équipement de lecture automatique nécessaire est simplement
composé d’un micro-ordinateur, d’un logiciel de pilotage de la lecture
et d’un périphérique de lecture qui peut être soit un lecteur optique,
soit un scanner, chacun comportant ses propres avantages. Nous allons
aborder, dans les diapositives suivantes, ces deux technologies avec les
démarches et utilisations correspondantes.
La technologie de lecture optique
La lecture optique de marques que l’on désigne généralement par
l’abréviation américaine OMR (Optical Mark Reading) est une technologie
connue et éprouvée, largement utilisée dans l’enseignement (correction
de QCM), dans le domaine hospitalier (demandes d’analyses…), dans
l’univers spécifique du vote d’assemblées mais également pour tous types
d’enquêtes.
La technologie OMR se caractérise par une grande vitesse de lecture
effective (jusqu’à 7.000 documents/heure). L’analyse du contenu du
document lu se passe au niveau du lecteur optique qui dispose d’une
intelligence propre et dédiée (micro-processeur intégré).
Le lecteur se connecte simplement au micro-ordinateur par le port série,
sans paramétrages ou installations particulières.
En début de session de lecture, l’utilisateur lance son logiciel de
lecture optique et télécharge, en quelques secondes, dans la mémoire du
lecteur, le programme de traitement du questionnaire à lire .
A partir de ce moment, le lecteur est capable d’analyser le
questionnaire correspondant, de détecter les incohérences (ex : double
marquage) et d’envoyer instantanément au micro-ordinateur les seules
informations utiles. Ce processus de décodage en amont permet de définir
le niveau de performance au niveau du lecteur et non par rapport à
l’ordinateur utilisé.
Par ailleurs, en raison des systèmes d’identification optique utilisés,
la technologie OMR présente un niveau de fiabilité très élevé du
résultat de la lecture. Le matériel de lecture lui-même est également
extrêmement robuste et s’apparente d’avantage à un équipement industriel
qu’à un appareil bureautique.
Un lecteur OMR peut être manuel, semi-automatique ou automatique. Dans
ce dernier cas, il peut disposer d’un bac de rejet, destiné à recevoir
les questionnaires écartés automatiquement car mal remplis ou détériorés
(qui peuvent être repris ensuite par un opérateur).
La plupart des modèles de lecteurs acceptent une double tête de lecture,
permettant de lire en un seul passage les deux faces d’un questionnaire.
Certains modèles peuvent également disposer en plus d’une ou plusieurs
têtes code-à-barre, permettant de lire des codes de personnalisation
imprimés ou collés sur le questionnaire (étiquettes).
Enfin, les appareils les plus sophistiqués peuvent intégrer une tête de
lecture OCR, permettant de décoder une ou plusieurs lignes d’un texte
dactylographié sur le questionnaire, dans des polices de caractères
définies.
En France, dans le domaine spécifique de la saisie automatique de
questionnaires d’enquêtes, la technologie OMR est depuis longtemps
adoptée pour le dépouillement rapide des questionnaires de plusieurs
très grands instituts d’études. L’offre actuelle en termes de
lecteurs optique est variée et permet à aux entreprises de toute taille
de s’équiper selon leur budget, leurs prix restant malgré tout
supérieurs à ceux des scanners (1,5 K€ à 15 K€).
La technologie de lecture par scannerisation
Tout le monde connaît les périphériques de scannage de documents qui
récupèrent l’image d’un document pour la restituer à l’écran ou sur
papier : scanners bureautiques, fax, copieurs numériques…
Lorsqu’on parle de lecture automatique de questionnaires ce type
d’appareil sert de référentiel dans l’esprit des non-initiés. En effet,
si je peux scanner une image, pourquoi ne pourrais-je pas scanner un
questionnaire ?
En réalité, tout le problème n’est pas de savoir récupérer l’image du
document mais de le faire vite, et de savoir analyser son contenu et le
récupérer dans l’application appropriée.
Contrairement aux lecteurs optiques, les scanners ne disposent pas d’une
intelligence “embarquée”. Il faut donc scanner l’image, la transmettre à
l’ordinateur de la manière la plus rapide et la plus compacte possible
puis la décoder à ce niveau. L’inconvénient de scanner un document
entier est le poids d’une page A4 qui est de plusieurs dizaines de
milliers d’octets (à comparer aux quelques dizaines d’octets que
transmet un lecteur optique !). Il faut donc prévoir un espace de
stockage adapté pour un nombre de répondants important.
Pourtant, la technologie de la scannérisation a de nombreux atouts dont
le premier est sans doute la possibilité de prendre en compte les
réponses à des questions ouvertes.
Ainsi, dans la mesure où le scanner récupère l’image du document, il est
possible de stocker et dans certains cas d’analyser automatiquement
l’image de la zone manuscrite contenant la réponse.
Si cette zone manuscrite est libre (écriture cursive normale sans
écartement des lettres), il est techniquement impossible aujourd’hui de
reconnaître automatiquement l’écriture et de transformer la réponse en
texte. Le seul moyen de prendre en compte l’information est de stocker
l’image en tant que telle pour permettre ensuite à un opérateur humain
de visualiser sur son écran les réponses données et de ressaisir leur
contenu manuellement.
En revanche, si la réponse est écrite en respectant certaines
conventions, dont la plus courante est de placer une lettre majuscule ou
un chiffre unique dans des cases prévues à cet effet, certains logiciels
du marché arrivent à reconnaître automatiquement ces caractères avec une
fiabilité satisfaisante et à les stocker dans le fichier des données.
Cette possibilité est le plus souvent utilisée pour prendre en compte un
nom, un code ou une note mais pas vraiment une zone de réponse à une
vraie question ouverte.
La mise en forme du questionnaire
Quelle que soit la technologie utilisée, la lecture automatique implique
l’utilisation de questionnaires mis en forme selon des normes
spécifiques.
La technologie de la lecture optique exige des documents normalisés avec
des petits rectangles noirs sur la droite de chaque page. Ces marques
sont appelées “pistes-horloges” et indiquent à la tête de lecture la
position des cases à cocher (appelées “alvéoles”) sur la page.
L’utilisation de documents prévus à cet effet est également très
fortement conseillée dans le cadre de la lecture scanner même si
certains logiciels permettent de partir de documents existants pour les
codifier à posteriori (ce qui ne donne pas toujours de bons résultats).
Il n’existe pas pour la scannérisation des normes internationales comme
pour la lecture optique. Les documents doivent plutôt correspondre à ce
qu’attend le logiciel de lecture. En général, les règles minimales
habituellement utilisées sont la présence de marques de repérages
(angles ou traits de positionnement) et l’utilisation de cases
particulières.
Pour concevoir des questionnaires normalisés, il existe 2 solutions : la
première consiste à utiliser un logiciel spécialement prévu à cet effet,
comme OMR Manager, qui permet à l’utilisateur de concevoir son
questionnaire sans se soucier des normes puisque les cases sont placées
automatiquement à des positions optimales. OMR
Manager va d’ailleurs jusqu’à générer automatiquement le
programme de pilotage du lecteur optique en incluant tous les contrôles
de cohérence nécessaires (nombre de cases à cocher par question,
contrôles des bornes pour les zones à cocher numériques et les dates,
etc…).
La deuxième solution consiste à utiliser un logiciel de mise en page de
type PAO, qui offre certainement beaucoup plus de possibilités
graphiques et de gestion des couleurs mais qui nécessite une
connaissance parfaite des normes de positionnement des cases. Le
document ainsi conçu doit ensuite faire l’objet d’une programmation dans
un langage compréhensible par le lecteur et/ou le logiciel de lecture
utilisés afin de pouvoir être lu automatiquement. La complexité de ce
processus le réserve à la production de documents sophistiqués et/ou
particuliers (formats spécifiques…) par des spécialistes du
domaine.
Exemples pour la technologie de lecture optique
Intégration d’un système d’enquêtes en lecture optique dans une enseigne de vente spécialisée
Une célèbre enseigne de grande surface spécialisée est équipée depuis
plusieurs années d’un système de création, lecture automatique et
analyse statistique de questionnaires composé des logiciels ETHNOS
et OMR
Manager ainsi que d’un lecteur optique Axiome 930
recto-verso.
L’internalisation du processus d’enquête par questionnaire en lecture
optique qui s’est traduit par la mise en place du système complet ainsi
que la formation à son utilisation, a permis à l’entreprise de diviser
par 2 le coût que représenterait une seule enquête annuelle de
satisfaction confiée à l’extérieur. L’opération visant à réaliser le
baromètre de satisfaction annuel de la clientèle se déroule dans la
quinzaine de magasins situés en France et à l’étranger auprès de 17 000
clients. Les enquêtes, d’une page recto-verso sont administrées par des
enquêteurs recrutés pour l’occasion, et encadrés en interne. Les
questionnaires remplis sont lus au fur et à mesure. Les résultats
définitifs sont ainsi disponibles à peine 2 ou 3 jours après
l’administration du dernier questionnaire.
La souplesse du système permet à cette entreprise de réaliser de
nombreuses autres études et de répondre toute l’année aux différentes
demandes provenant de ses services, qu’il s’agisse de petites opérations
sur 200 clients (acheteurs d’un produit particulier…) ou
d’enquêtes de grande envergure (pré et post-tests publicitaires,
enquêtes quanti, questionnaires internes…). La dernière
application réalisée a consisté à systématiser les enquêtes
post-réclamation, en reliant les applicatifs de lecture automatique à
l’application de suivi des réclamations.
Ci-dessous, un exemplaire d’une page d’un questionnaire de
satisfaction d’un club de vacances :
1. Pistes-horloge
Il s’agit de cet ensemble de marques, positionnées sur le côté droit de la feuille (à une distance précise du bord). Leur objectif est de signaler au lecteur la présence sur la même ligne de cases à lire et à décoder. La plupart des imprimantes ne peuvent imprimer en standard ces marques si près du bord de la page ce qui rend difficile la production autonome de questionnaires. OMR Manager intègre des astuces permettant de contourner automatiquement cette difficulté (simule une impression dans un format plus large).
2. Alvéoles
On désigne ainsi les cases à cocher que le lecteur doit analyser. Il existe deux normes de têtes de lecture qui analysent respectivement 40 (Europe) ou 48 (USA) alvéoles par ligne. Ces têtes sont équipées du nombre équivalent de diodes qui s’intéressent chacune à une colonne de la feuille. De ce fait, les alvéoles doivent être positionnées à des emplacements précis avec un espacement fixe entre elles. Il est conseillé, quand on le peut, d’imprimer ces alvéoles en rouge, pour assurer une qualité de lecture optimale. En effet, le rouge est une couleur neutre non lue par le lecteur optique. Ainsi, une alvéole rouge à bords plus épais ne perturbe pas la lecture tout en assurant une meilleure lisibilité du questionnaire pour la personne qui le remplit. Sur demande, le fabricant peut fournir un lecteur optique qui lit le rouge (et ignore une autre couleur).
3. Consignes
Il est très important d’indiquer au répondant la méthode de remplissage des alvéoles très distinctement. En cas de remplissage approximatif de plusieurs questionnaires, la phase de lecture risque de s’allonger drastiquement.
Exemple pour la technologie de lecture par scannérisation
Exemplaire d’une page de questionnaire de demande d’information dans le milieu de la santé réalisé avec OMR Manager :
1. Zones manuscrites
Comme les réponses sont ressaisies sur ordinateur, ces zones doivent être assez larges pour permettre aux répondants de s’exprimer avec une lecture lisible.
2. Cases à cocher plus volumineuses que pour la lecture optique
Comme pour les zones manuscrites, le remplissage des cases à cocher ne doit pas prêter à confusion. Pour cela, il est aussi impératif de présenter un modèle de bonne démarche (3).
4. Cases manuscrites chiffrées
Ces cases (ici pour indiquer une date) prennent beaucoup moins de place que les grilles utilisées pour la lecture optique.
Retrouvez plus d’exemple de questionnaires OMR par lecture optique ou par scannérisation en cliquant-ici.