Méthodologie d'enquête

d'enquête » . En tant que domaine des statistiques appliquées centré sur les enquêtes auprès des populations , la méthodologie des enquêtes étudie l' échantillonnage d'unités individuelles au sein d'une population et les techniques associées de collecte de données , telles que la construction de questionnaires et les méthodes visant à améliorer le nombre et la précision des réponses. La méthodologie des enquêtes cible les instruments ou les procédures qui posent une ou plusieurs questions auxquelles il est possible de répondre ou non.

Les chercheurs réalisent des enquêtes statistiques afin d'en tirer des conclusions sur la population étudiée ; ces conclusions dépendent fortement des questions posées. Les sondages d' opinion , les enquêtes de santé publique, les études de marché , les enquêtes gouvernementales et les recensements illustrent tous la recherche quantitative qui utilise la méthodologie d'enquête pour répondre à des questions concernant une population. Bien que les recensements ne reposent pas sur un « échantillon », ils reprennent d'autres aspects de la méthodologie d'enquête, tels que les questionnaires, les enquêteurs et les techniques de relance des personnes n'ayant pas répondu. Les enquêtes fournissent des informations importantes pour de nombreux domaines de la recherche et de l' information publique , comme les études de marché , la psychologie , les études des transports (l'étude des déplacements des personnes et des marchandises), les systèmes de santé et la sociologie .

les enquêtes reposent presque toujours sur un échantillon de la population, leur succès dépend de la représentativité de cet échantillon par rapport à la population cible du chercheur. Cette population cible peut aller de la population générale d'un pays donné à des groupes spécifiques au sein de ce pays, en passant par la liste des membres d'une organisation professionnelle ou la liste des élèves inscrits dans un établissement scolaire (voir aussi échantillonnage (statistiques) et échantillonnage d'enquête ). Les personnes qui répondent à une enquête sont appelées les répondants , et selon les questions posées, leurs réponses peuvent les représenter à titre individuel, en tant que membres de leur ménage, employeurs ou autres organisations qu'ils représentent.

La méthodologie des enquêtes, en tant que domaine scientifique, vise à identifier les principes relatifs à la conception de l'échantillon, aux instruments de collecte de données, à l'ajustement statistique des données, à leur traitement et à leur analyse finale, susceptibles d'engendrer des erreurs systématiques et aléatoires. Ces erreurs sont parfois analysées en lien avec le coût de l'enquête. Les contraintes budgétaires sont parfois envisagées sous l'angle de l'amélioration de la qualité à moindre coût, ou inversement, de la réduction des coûts pour un niveau de qualité donné. La méthodologie des enquêtes constitue à la fois un domaine scientifique et une profession : certains professionnels du domaine étudient les erreurs d'enquête de manière empirique, tandis que d'autres conçoivent des enquêtes visant à les réduire. Pour les concepteurs d'enquêtes, la tâche consiste à prendre de nombreuses décisions concernant des milliers de caractéristiques individuelles d'une enquête afin de l'améliorer.

Les défis méthodologiques les plus importants d’un méthodologue d’enquête consistent notamment à prendre des décisions sur la manière de :

Identifier et sélectionner les membres potentiels de l'échantillon.
Contacter les personnes sélectionnées et recueillir des données auprès de celles qui sont difficiles à joindre (ou réticentes à répondre).
Évaluer et tester les questions.
Sélectionnez le mode de formulation des questions et de collecte des réponses.
Former et superviser les intervieweurs (le cas échéant).
Vérifier l'exactitude et la cohérence interne des fichiers de données.
Ajuster les estimations de l'enquête pour corriger les erreurs identifiées.
Compléter les données de l'enquête avec de nouvelles sources de données (le cas échéant).

Sélection d'échantillons

le biais de sélection . Ce biais survient lorsque les procédures de sélection d'un échantillon entraînent une surreprésentation ou une sous-représentation d'un aspect significatif de la population. Par exemple, si la population étudiée est composée de 75 % de femmes et de 25 % d'hommes, et que l'échantillon est composé de 40 % de femmes et de 60 % d'hommes, les femmes sont sous-représentées tandis que les hommes sont surreprésentés. Afin de minimiser les biais de sélection, on utilise souvent l'échantillonnage aléatoire stratifié . Cette méthode consiste à diviser la population en sous-populations appelées strates, et à prélever des échantillons aléatoires dans chacune des strates, ou à sélectionner des éléments pour constituer l'échantillon de manière proportionnelle.

Modes de collecte de données

des effets de mode qui modifient la façon dont les répondants répondent, et les différentes méthodes présentent des avantages différents. Les modes d’administration les plus courants peuvent être résumés comme suit :

Téléphone
Courrier (poste)
Enquêtes en ligne
enquêtes mobiles
Enquêtes personnelles à domicile
enquête personnelle en centre commercial ou en interception de rue
Modes mixtes

plans de recherche

Il existe plusieurs modèles, ou structures générales, qui peuvent être utilisés dans la recherche par sondage. Les trois types généraux sont les études transversales, les études par échantillons indépendants successifs et les études longitudinales.

Études transversales

Dans les études transversales, un ou plusieurs échantillons sont prélevés dans la population concernée et étudiés une seule fois. Une étude transversale décrit les caractéristiques de cette population à un moment donné, mais ne peut donner aucun aperçu des causes de ces caractéristiques, car il s'agit d'une étude prédictive et corrélationnelle.

Études successives sur des échantillons indépendants

Un plan d'échantillonnage indépendant successif consiste à prélever plusieurs échantillons aléatoires au sein d'une population à un ou plusieurs moments. Ce plan permet d'étudier les changements au sein d'une population, mais pas les changements chez les individus, car ces derniers ne sont pas interrogés plus d'une fois. De telles études ne permettent donc pas nécessairement d'identifier les causes des changements au fil du temps. Pour qu'un plan d'échantillonnage indépendant successif soit efficace, les échantillons doivent provenir de la même population et en être parfaitement représentatifs. Si les échantillons ne sont pas comparables, les changements observés entre eux peuvent être dus à des caractéristiques démographiques plutôt qu'au temps. De plus, les questions doivent être posées de la même manière afin de permettre une comparaison directe des réponses.

Études longitudinales

Les études longitudinales mesurent un même échantillon aléatoire à plusieurs reprises au cours du temps . Contrairement aux études à échantillons indépendants successifs, ce type d'étude permet d'observer l'évolution des réponses des participants au fil du temps. Ainsi, un chercheur peut potentiellement identifier les causes des changements de réponse en analysant les différences dans les expériences des répondants . Les études longitudinales constituent la méthode la plus simple pour évaluer l'effet d'un événement naturel, tel qu'un divorce , qui ne peut être étudié expérimentalement.

Cependant, les études longitudinales sont à la fois coûteuses et difficiles à réaliser. Il est plus complexe de trouver des participants prêts à s'engager dans une étude de plusieurs mois ou années que dans un entretien de 15 minutes, et il arrive fréquemment que les participants abandonnent l'étude avant l'évaluation finale. De plus, ces études exigent parfois que la collecte de données soit confidentielle ou anonyme, ce qui complique davantage le suivi des réponses des participants au fil du temps. Une solution potentielle consiste à utiliser un code d'identification auto-généré (CIAG). Ces codes sont généralement créés à partir d'éléments tels que le « mois de naissance » et la « première lettre du deuxième prénom de la mère ». Certaines approches récentes de CIAG anonymes ont également tenté de minimiser davantage l'utilisation de données personnelles, en utilisant par exemple des questions comme « le nom de votre premier animal de compagnie ». Selon l'approche utilisée, il est possible que la possibilité d'apparier une partie de l'échantillon soit perdue.

De plus, l'attrition globale des participants n'étant pas aléatoire, les échantillons peuvent devenir moins représentatifs au fil des évaluations. Pour pallier ce problème, un chercheur peut comparer les répondants ayant abandonné l'enquête à ceux qui sont restés, afin de déterminer s'il s'agit de populations statistiquement différentes. Les répondants peuvent également chercher à maintenir une certaine cohérence dans leurs réponses malgré les modifications apportées à celles-ci.

Questionnaires

Les questionnaires sont l'outil le plus couramment utilisé dans les enquêtes par sondage. Cependant, les résultats d'une enquête sont inutiles si le questionnaire est mal conçu. Les questionnaires doivent produire des mesures valides et fiables des variables démographiques et permettre de mettre en évidence des disparités individuelles valides et fiables, telles que celles que permettent les échelles d'auto-évaluation.

Les questionnaires comme outils

Les variables démographiques constituent une catégorie de variables fréquemment mesurées dans les enquêtes, car elles permettent de décrire les caractéristiques des personnes interrogées dans l'échantillon. Ces variables incluent notamment l'origine ethnique, le statut socio-économique , la race et l'âge. Les enquêtes évaluent souvent les préférences et les attitudes des individus, et nombre d'entre elles utilisent des échelles d'auto-évaluation pour mesurer leurs opinions et leurs jugements sur différents éléments présentés sur une échelle. Ces échelles servent également à examiner les disparités entre les individus concernant les items de l'échelle. Généralement présentées sous forme de questionnaire, ces échelles d'auto-évaluation sont parmi les instruments les plus utilisés en psychologie ; il est donc essentiel que les mesures soient construites avec soin, tout en étant fiables et valides.

Fiabilité et validité des mesures d'auto-évaluation

La fiabilité des mesures d'auto-évaluation se définit par leur cohérence. Ainsi, une mesure d'auto-évaluation fiable produit des résultats cohérents à chaque passation. La fiabilité d'un test peut être mesurée de plusieurs manières. Premièrement, on peut calculer sa fiabilité test-retest. La fiabilité test-retest consiste à administrer le même questionnaire à un large échantillon à deux reprises. Pour qu'un questionnaire soit considéré comme fiable, les participants n'ont pas besoin d'obtenir des scores identiques à chaque passation ; leur position dans la distribution des scores doit plutôt être similaire lors des deux passations. Les mesures d'auto-évaluation sont généralement plus fiables lorsqu'elles comportent de nombreux items mesurant un construit. De plus, les mesures sont plus fiables lorsque le facteur mesuré présente une plus grande variabilité parmi les individus de l'échantillon testé. Enfin, la fiabilité est accrue lorsque les instructions pour remplir le questionnaire sont claires et lorsque l'environnement de passation est exempt de distractions. À l’inverse, un questionnaire est valide si ce qu’il mesure correspond à ce qu’il était initialement censé mesurer. La validité de construit d’une mesure correspond au degré auquel elle mesure le construit théorique qu’elle était initialement censée mesurer.

Élaboration d'un questionnaire

Six étapes permettent de construire un questionnaire produisant des résultats fiables et valides. Premièrement, il faut déterminer le type d'informations à recueillir. Deuxièmement, il faut définir la méthodologie du questionnaire. Troisièmement, il faut élaborer une première version du questionnaire. Quatrièmement, le questionnaire doit être révisé. Ensuite, il convient de le prétester. Enfin, le questionnaire doit être finalisé et les modalités d'utilisation doivent être précisées.

Règles pour formuler efficacement les questions

La formulation d'une question peut avoir un impact considérable sur la réponse des participants à une recherche. Par conséquent, les chercheurs doivent être attentifs au choix des mots lors de la rédaction de leurs questions. Il est important de garder à l'esprit que l'interprétation de certains mots et expressions peut varier selon les individus, les cultures et les sous-cultures. Deux types de questions sont utilisés dans les questionnaires : les questions ouvertes et les questions fermées. Les questions ouvertes sont formulées de manière ouverte, tandis que les questions fermées sont généralement à choix multiple. Les questions ouvertes présentent l'avantage d'offrir une plus grande liberté de réponse, mais elles sont également plus difficiles à enregistrer et à analyser, nécessitant un codage approfondi. À l'inverse, les questions fermées sont plus faciles à analyser et à coder, mais elles limitent l'expressivité et la spontanéité des répondants. En général, le vocabulaire des questions doit être simple et direct, et la plupart des questions doivent comporter moins de vingt mots. Chaque question doit être reformulée pour plus de clarté et éviter les questions orientées ou biaisées . Enfin, si plusieurs items sont utilisés pour mesurer un même concept, la formulation de certains items doit être inversée afin d'éviter les biais de réponse.

La réponse d'un répondant à une question ouverte peut être codée ultérieurement dans une échelle de réponse, ou analysée à l'aide de méthodes plus qualitatives.

Ordre des questions

Les chercheurs menant des enquêtes doivent veiller à l'ordre des questions dans un questionnaire. Pour les questionnaires auto-administrés, les questions les plus intéressantes devraient figurer au début afin de capter l'attention du répondant, tandis que les questions démographiques devraient être placées vers la fin. En revanche, si une enquête est menée par téléphone ou en face à face, les questions démographiques devraient être posées au début de l'entretien afin de renforcer la confiance du répondant. Il convient également de prêter attention à l'ordre des questions car un effet d' amorçage peut influencer les réponses aux questions suivantes .

Traduire un questionnaire

La traduction est essentielle pour recueillir des données d'enquête comparables. Les questionnaires sont traduits d'une langue source vers une ou plusieurs langues cibles, par exemple de l'anglais vers l'espagnol et l'allemand. Une approche collaborative est recommandée pour la traduction, impliquant des traducteurs, des experts du domaine et des personnes pouvant apporter leur aide.

Les bonnes pratiques de traduction de questionnaires incluent la traduction parallèle, les discussions d'équipe et les prétests auprès de personnes réelles. Il ne s'agit pas d'un processus mécanique de placement de mots. Le modèle TRAPD (Traduction, Révision, Évaluation, Prétest et Documentation), initialement développé pour les Enquêtes sociales européennes , est aujourd'hui largement utilisé dans la communauté internationale de recherche par sondage, même s'il n'est pas toujours désigné comme tel ni mis en œuvre dans son intégralité. Par exemple, la sociolinguistique fournit un cadre théorique pour la traduction de questionnaires et complète le modèle TRAPD. Cette approche stipule que, pour que la traduction d'un questionnaire produise un effet communicatif équivalent à celui de la langue source, elle doit être linguistiquement appropriée tout en intégrant les pratiques sociales et les normes culturelles de la langue cible.

Réduction des non-réponses

Les méthodes suivantes ont été recommandées pour réduire la non-réponse dans les enquêtes téléphoniques et en face à face :

Lettre d'information préalable. Une brève lettre est envoyée en amont pour informer les personnes sélectionnées de l'enquête à venir. Le style de la lettre doit être personnalisé, sans être excessif. Elle annonce d'abord qu'un appel téléphonique sera effectué ou qu'un enquêteur souhaite prendre rendez-vous pour un entretien en face à face. Ensuite, elle décrit le sujet de l'étude. Enfin, elle permet à la fois d'exprimer la reconnaissance de l'enquêteur envers les personnes qui y participent et de poser des questions sur l'enquête.
Formation. Les enquêteurs reçoivent une formation approfondie sur la manière de poser des questions aux personnes interrogées, sur l'utilisation des ordinateurs et sur la planification des rappels aux personnes interrogées qui n'ont pas pu être jointes.
Brève introduction. L’intervieweur doit toujours commencer par une brève présentation. Il doit indiquer son nom, l’établissement pour lequel il travaille, la durée et l’objectif de l’entretien. Il peut également être utile de préciser qu’il ne s’agit pas d’une offre commerciale : il a été démontré que cela permet d’obtenir un taux de réponse légèrement supérieur.
Questionnaire d'enquête facile à comprendre pour les répondants. Les questions posées doivent être claires, non offensantes et faciles à répondre pour les sujets étudiés.

La brièveté est souvent citée comme un facteur d'augmentation du taux de réponse. Une revue de la littérature de 1996 a toutefois apporté des résultats mitigés concernant cette affirmation, tant pour les enquêtes écrites que orales, concluant que d'autres facteurs sont souvent plus importants. Une étude de 2010 portant sur 100 000 enquêtes en ligne a révélé une baisse du taux de réponse d'environ 3 % à 10 questions et d'environ 6 % à 20 questions, cette baisse se ralentissant ensuite (par exemple, une réduction de seulement 10 % à 40 questions). D'autres études ont montré que la qualité des réponses se dégradait vers la fin des enquêtes longues.

Certains chercheurs ont également évoqué le rôle ou la profession du destinataire comme facteur potentiel influençant la gestion des non-réponses. Par exemple, si le fax est rarement utilisé pour diffuser des enquêtes, une étude récente a montré que les pharmaciens le préféraient parfois, car ils reçoivent fréquemment des ordonnances par fax au travail, mais n'ont pas toujours accès à un courrier adressé à une adresse générale.

Effets de l'intervieweur

Les méthodologues des enquêtes ont consacré de nombreux efforts à déterminer dans quelle mesure les réponses des personnes interrogées sont influencées par les caractéristiques physiques de l'enquêteur. Parmi les principales caractéristiques de l'enquêteur dont l'influence sur les réponses a été démontrée, on retrouve l'origine ethnique , le sexe et le poids corporel relatif ( IMC ) . Ces effets liés à l'enquêteur sont particulièrement marqués lorsque les questions portent sur ses caractéristiques. Ainsi, il a été montré que l'origine ethnique de l'enquêteur influence les réponses aux questions relatives aux attitudes raciales , son sexe influence les réponses aux questions portant sur les questions de genre et son IMC influence les réponses aux questions relatives à l'alimentation et aux régimes . Bien que les effets liés à l'enquêteur aient été principalement étudiés dans le cadre d'enquêtes en face à face, leur existence a également été démontrée pour les modes d'entretien sans contact visuel, tels que les enquêtes téléphoniques et les enquêtes en ligne avec vidéo. L'explication généralement avancée pour ces effets est le biais de désirabilité sociale : les participants à l'enquête peuvent chercher à projeter une image positive d'eux-mêmes afin de se conformer aux normes qu'ils attribuent à l'enquêteur. Les effets de l'intervieweur sont un exemple d'effets de réponse à un sondage .

Le rôle du big data

Depuis 2018, les méthodologues spécialisés dans les enquêtes s'intéressent à la manière dont le big data peut enrichir les méthodologies d'enquête afin de permettre aux chercheurs et aux praticiens d'améliorer la production et la qualité des statistiques d'enquête. Le big data présente un faible coût par point de données, applique des techniques d'analyse via l'apprentissage automatique et l'exploration de données , et inclut des sources de données diverses et nouvelles, telles que les registres, les médias sociaux, les applications et d'autres formes de données numériques. Trois conférences Big Data Meets Survey Science (BigSurv) ont eu lieu en 2018, 2020 et 2023, et une conférence est prévue en 2025 Un numéro spécial de la Social Science Computer Review , un numéro spécial du Journal of the Royal Statistical Society [ et un numéro spécial d' EPJ Data Science [ ainsi qu'un ouvrage intitulé Big Data Meets Social Sciences par Craig A. Hill et cinq autres membres de l'American Statistical Association .