Module 8 : Stratégies d’analyse des informations collectées

36 Saturation, triangulation et catégorisation des données collectées

Honorine Pegdwendé Sawadogo

Présentation du thème et de l’autrice du chapitre

La triangulation consiste à mettre en œuvre plusieurs démarches en vue de la collecte de données pour l’étude des phénomènes sociaux. L’approche par méthodes multiples tente ainsi de comprendre la complexité des problématiques en les étudiant de plus d’un point de vue. Nous entreprendrons de montrer comment la conception de la recherche sur les logiques de mendicité des mères de jumeaux[1] à Ouagadougou combine différentes techniques d’observation et différentes sources de données. Ce recueil d’informations diversifiées sur le même sujet favorise la saturation des données.

Honorine Pegdwendé Sawadogo est actuellement attachée de recherche à l’Institut des Sciences des Sociétés du Centre National de Recherche Scientifique et Technologique. Elle est docteure en sociologie (PhD), avec une thèse soutenue en février 2020 à l’Université Laval, à la Faculté des sciences Sociales. Son sujet de thèse a porté sur « les logiques sociales de la pratique de la mendicité par des mères de jumeaux dans la ville de Ouagadougou ». Elle s’intéresse aux problématiques de l’exclusion et de la pauvreté féminine, des stratégies de survie et de l’autonomisation des femmes en milieu urbain. Aussi, son axe de recherche porte-t-il sur « genre, éducation et mutations sociales ».

La phase exploratoire d’une recherche permet de constater la complexité du sujet de recherche : son originalité, sa dynamique, ses liens avec d’autres problématiques et sa sensibilité. Afin de saisir au mieux l’objet de recherche dans toute sa complexité, le chercheur ou la chercheuse se doit d’adopter une démarche qui lui donne accès à cette complexité. La triangulation qui consiste, dans l’étude d’un même phénomène, à recouper les informations issues de sources différentes et de méthodes indépendantes (Denzin, 1978; Jick, 1979), est alors nécessaire. La triangulation est importante dans une recherche où il y a peu de participant-e-s (recherche qualitative) de manière à diversifier les sources. La triangulation n’est pas obligatoire dans une recherche, mais fortement conseillée lorsque possible. En général, on a recours à un, voire à deux types de triangulation dans une même recherche; l’usage de tous les types est fort rare. L’usage de plusieurs outils et de plusieurs sources n’est pas en lui-même gage de validité, cela participe plutôt d’un ensemble de mesures visant la validité de la recherche.

La triangulation

La triangulation est une procédure visant la validité des savoirs produits par la recherche.

La triangulation consiste à mettre en œuvre plusieurs démarches en vue de la collecte de données pour l’étude du comportement humain. L’approche par méthodes multiples tente ainsi d’atteindre la complexité du comportement humain en l’étudiant de plus d’un point de vue. (Yana, 1993 : 1)

Comme le mentionnent Mayer, Ouellet, St-Jacques et Turcotte (2000), le fait de recourir à plusieurs sources et de les interroger différemment permet une triangulation des données. On peut aussi se servir une triangulation des méthodes (Reidy et Mercier, 1996), en utilisant plus d’une technique de recueil des informations (ex : entrevues individuelles et observation directes des pratiques) ou plusieurs stratégies d’analyse des informations. La triangulation consiste à confronter des méthodes d’investigation différentes et complémentaires. C’est ainsi que la triangulation, en combinant les données issues de plusieurs instruments, compense les biais propres à chacun (Savoie-Zajc, 1996b) et permet d’assurer la validité (justesse et stabilité), par ricochet, des analyses effectuées. La triangulation est ainsi intrinsèquement liée à la validité et à la scientificité. De ce point de vue, la triangulation est nécessaire à la prise en compte et au compte-rendu de la complexité de l’objet observé et elle implique que plusieurs traces prises à partir de plusieurs points de vue soient confrontées avant de pouvoir croire qu’une certaine approximation du complexe a été atteinte. Ainsi, on peut distinguer 5 grandes catégories de triangulation :

  1. La triangulation théorique prévoit que les chercheurs et chercheuses mettent à profit plusieurs cadres théoriques, voire plusieurs points de vue disciplinaires, pour analyser et interpréter les résultats de leur recherche. Beuker et ses collaborateurs et collaboratrices (2016) recourent aux perspectives de trois disciplines, soit la psychologie, les sciences de la gestion et la sociologie, pour coder indépendamment, à l’aide d’un logiciel, vingt entretiens menés dans quatre entreprises différentes sur la thématique de la flexicurité (équilibre entre la flexibilité et la sécurité en milieu de travail). Ils et elles font ensuite la comparaison des trois cadres d’analyse, relèvent les termes mis en tension et les interprètent selon les divers points de vue disciplinaires.
  2. La triangulation des outils de cueillette renvoie au fait de faire usage de plus d’un outil (par exemple, utiliser des entrevues, des observations, de l’analyse de documents). Encore appelée la triangulation des données (ou des méthodes), cette méthode consiste à mettre en place des dispositifs de recherche qui combinent deux ou plusieurs modes de collecte de données dans une perspective de recherche de complémentarité, de corroboration. Les modes de collecte de données combinés sont le plus fréquemment l’entretien individuel associé à l’observation. On retrouve aussi le focus group combiné à l’entretien individuel ou l’analyse documentaire qui suit l’entretien individuel ou de groupe. Bref, plusieurs combinaisons sont présentes.
  3. La triangulation des chercheurs et chercheuses pour laquelle la recherche a recours aux points de vue de plus d’un chercheur ou d’une chercheuse (différent-e-s observateurs et observatrices ou intervieweurs et intervieweuses réalisent le travail). Les chercheurs et chercheuses impliqué-e-s prévoient dans la structure même de leur recherche des moments de rencontre avec d’autres chercheurs et chercheuses afin de se distancier de leur terrain et ventiler conjointement leurs points de vue. Cette forme d’objectivation existe par exemple dans la nature même des liens entre les doctorant-e-s et leur comité de recherche. De plus, elle est utilisée par certain-e-s chercheurs et chercheuses qui approchent des collègues afin de renforcer leur perspective critique concernant les pistes d’interprétations soulevées.
  4. La triangulation des sources signifie que les données sont recueillies auprès de plusieurs sources différentes. C’est la diversité des points de vue qui est alors recherchée pour dégager une vision plus riche d’une thématique. Par exemple, Veyrié (2017) écrit que la recherche qualitative est bien outillée pour étudier des problématiques sensibles (l’euthanasie dans son cas). Compte tenu de son intérêt de recherche, la chercheuse a conduit des entretiens semi-dirigés auprès de médecins, d’infirmières et d’infirmiers, de travailleurs sociaux et travailleuses sociales, de psychologues ainsi que de malades.
  5. Enfin, la triangulation « écologique » (ou indéfinie) renvoie aux analyses et aux interprétations qui sont soumises à la vérification auprès des sujets participant à la recherche. C’est le cas de recherches qui prévoient, dans leur parcours, un retour aux participant-e-s afin de valider les interprétations et aussi recueillir de nouvelles données lors de ce retour. Ainsi, Faucher (2012) étudie le raisonnement clinique en optométrie. Une fois les données collectées et analysées, elle organise un groupe de discussion avec des optométristes pour discuter avec eux et elles de ses interprétations. Bourgeois-Guérin et Beaudoin (2016), dans un riche texte sur le travail interprétatif de la recherche qualitative, rappellent non seulement l’horizon historique dans lequel est ancrée une interprétation, mais aussi sa partialité. D’où l’importance d’établir non seulement une relation réciproque avec l’autre, mais aussi de considérer que dans toute recherche « la norme du tiers médiateur nous rappelle l’importance du recours à la communauté, à d’autres analystes, voire aux participants de la recherche comme procédé de validité de l’interprétation » (p. 35).

La triangulation ne concerne pas que les méthodes qualitatives. On peut également combiner des méthodes qualitatives avec des méthodes quantitatives. Le terme de « mixed methods » est utilisé pour désigner cette forme de triangulation.

Exemple de triangulation de sources, de méthodes et de mixed method

Pour ma recherche doctorale, afin de saisir la complexité des logiques de mendicité des « mères de jumeaux » dans la ville de Ouagadougou, trois types de triangulation ont été utilisés : la triangulation de sources qui a consisté à avoir plusieurs catégories d’interlocuteurs et d’interlocutrices (les personnes en situation de mendicité, les usagers et usagères de la route, les agent-e-s de la police chargé-e-s de réguler la circulation, les agent-e-s du ministère en charge de l’action sociale, des leaders d’opinion, etc.); la triangulation des outils de collecte de données qui a consisté à combiner trois méthodes de collecte (l’observation, les relevés géographiques et les entretiens individuels semi-dirigés); et la mixed method qui a consisté à combiner la méthode qualitative avec une méthode quantitative à travers une collecte de données quantitatives grâce à une fiche d’identification. Pourquoi cette combinaison de méthode? L’objectif est de bénéficier des différents avantages des approches qualitatives (plus de détails, de profondeur), spatiales (une répartition spatiale) et quantitatives (taille de l’échantillon, caractéristiques sociodémographiques des enquêté-e-s) réduisant ainsi les faiblesses de chacune par la complémentarité de l’autre. Ainsi, la corroboration des résultats de recherche peut renforcer la validité de l’étude. L’approche qualitative a été centrale dans la présente étude compte tenu que l’objectif principal vise à comprendre les logiques de mendicité des « mères de jumeaux ». L’approche spatiale apporte un complément non négligeable en permettant d’avoir la répartition spatiale des femmes en situation de mendicité dans l’espace urbain. De même, l’approche quantitative complète les informations concernant les profils socio-démographiques des « mères de jumeaux » en situation de mendicité.

Une triangulation rigoureuse permet d’atteindre une saturation.

La saturation

La saturation (Savoie-Zajc, 1996a) renvoie au point où, dans une recherche, toute donnée nouvelle n’apporte aucun élément nouveau à la compréhension du phénomène à l’étude. Les participant-e-s, les outils de collecte et les contextes doivent être minutieusement sélectionné-e-s précisément pour permettre la diversification et la saturation des données. Avec les différents outils de collecte et les multiples interlocuteurs et interlocutrices rencontré-e-s, le phénomène à l’étude a été progressivement cerné au fil de la collecte de données. Il ne s’agit pas de rendre compte du phénomène dans sa totalité, mais plutôt d’un critère méthodologique qui indique au chercheur ou à la chercheuse à quel moment il ou elle doit arrêter sa collecte de données. Le principe de saturation s’associe au principe de diversification qui relève d’une intention de dresser un portrait global à l’intérieur d’un groupe donné. Pires (1997) distingue alors la saturation empirique de la saturation théorique. Selon cet auteur, la saturation empirique est atteinte quand le chercheur ou la chercheuse confronte une catégorie conceptuelle à différents contextes empiriques pour éclairer les contours de la question et s’assurer de sa pertinence théorique. Alors que la saturation « théorique » est liée au sens donné à la pratique.

En recherche qualitative, la représentativité des sources se justifie de deux façons différentes. D’abord, leur pertinence réfère à leur capacité de produire de l’information en rapport avec le problème. Ensuite, leur contribution à la modélisation informe la possession de caractéristiques qui en font des éléments importants dans la construction d’une maquette (ou modèle réduit) de la population étudiée. Quelque fois, il y a une autre question non moins importante qui est posée : celle du nombre, c’est-à-dire de l’échantillon représentatif. La saturation constitue une des réponses formulées. On dit qu’il y a saturation lorsque l’ajout d’une source n’apporte plus d’information. Il ne s’agit pas de n’importe quelle source, mais d’une source différente. Ainsi, on ne dispose d’un échantillon suffisant que lorsque l’ajout d’une source qui varie par un trait majeur par rapport au problème posé n’apporte pas d’information supplémentaire. La saturation ne peut pas être réduite à la redondance sans le critère de rajout d’une nouvelle source pertinente mais différente des sources antérieures d’information. C’est pourquoi, une lecture et une analyse progressive des données est nécessaire afin de juger leur pertinence et tester leur état de saturation.

Exemple de saturation

Dans le cadre de ma recherche doctorale, les données rattachées aux questions relatives à la nature de la pratique de mendicité par les « mères de jumeaux » ont atteint leur point de saturation « empirique » à l’issue de la géolocalisation des sites, de l’identification et de l’entretien avec les « mères de jumeaux » en situation de mendicité. Alors que la saturation « théorique », liée au sens donné à la pratique, donc liée aux perceptions de l’ensemble de la population ouagalaise, a été atteinte à l’issue des entretiens individuels à l’adresse des différent-e-s participant-e-s.

Subjectivité, analyse et catégorisation des données

La véritable plus-value de la triangulation ne tient pas seulement dans la multiplication des outils de recueil et d’informateurs et d’informatrices sur le terrain, mais dans la mise en relation des analyses des données collectées pour donner sens à la complexité (Pourtois & Desmet, 2007). C’est dire que l’analyse des données est un volet essentiel quant à la validité du travail de recherche. Même s’il existe plusieurs stratégies d’analyse des données qualitatives, elles réfèrent habituellement à l’analyse inductive de contenu thématique, c’est-à-dire au processus de construction de catégories à partir de l’analyse des propos des participant-e-s. En pratique, les étapes suivies pour ce type d’analyse sont :

  • la transcription intégrale du matériel d’entrevue;
  • la lecture du matériel à plusieurs reprises afin de se familiariser avec les données à la lumière de la question de recherche;
  • un travail de codage est nécessaire : il peut s’agir d’un codage manuel ou un recourt à des logiciels appropriés (NVivo, HyperResearch ou QDA Miner). Cela permet le choix des unités de signification ou unités de sens, l’identification des thèmes généraux, la catégorisation et la classification. À la lecture des retranscriptions, le texte est codé, fragment par fragment, et réarrangé en une liste de catégories faisant émerger les thèmes principaux. Ce travail nécessite de lire et de relire les données pour identifier les thèmes et catégories sous-tendus par des phrases ou des comportements. Des concepts sont définis, une cartographie des différents registres est dressée et des associations sont recherchées.

Il faut noter que l’utilisation de logiciels d’analyse informatisés des données tels que le NVivo ou QDA Miner peuvent aider le chercheur ou la chercheuse au repérage et à l’organisation des données. Toutefois, de tels logiciels ne se substituent pas à son travail d’analyse et ne constituent pas en soi une garantie de qualité méthodologique.

Exemple d’analyse de données

Dans le cadre de ma recherche doctorale, toutes les données collectées ont été rigoureusement traitées par des logiciels appropriés afin de permettre une analyse fine de leur contenu.

  • Les données cartographiques

Les données cartographiques sont traitées à l’aide du système d’information géographique ArcGIS 10 pour faire ressortir la cartographie des lieux de mendicité afin de voir leur inscription dans la ville. J’ai procédé comme suit :

    • Insertion des coordonnées géographiques des lieux permanents de mendicité dans la base de données géographiques de la ville de Ouagadougou PIGEO;
    • Cartographie des lieux de mendicité grâce à PIGEO afin de voir leur inscription dans la ville;
    • Production de cartes sur les lieux de mendicité, le nombre de femmes mendiant aux points fixes, des liens entre les quartiers de résidence des femmes et leur lieu de mendicité.
  • Les données quantitatives

Les données quantitatives sont traitées à l’aide du logiciel Excel, puis saisies à l’aide du logiciel statistique SPSS, et organisées de manière à faciliter leur analyse statistique, dans le but de faire ressortir les caractéristiques sociodémographiques des « mères de jumeaux » mendiantes.

  • Les données issues des entretiens

L’analyse des données des entrevues individuelles s’est inspirée des démarches proposées par L’Écuyer (1990) et Miles et Huberman (2003). J’ai privilégié une approche d’« analyse de contenu ». Cette analyse de contenu a été facilitée par l’emploi du logiciel QDA Miner, utilisé dans l’analyse de données qualitatives en recherche (Karsenti et Savoie- Zajc, 2018). Elle s’est faite suivant ces étapes :

    • Transcription et transfert du corpus dans le logiciel QDA Miner;
    • Première ébauche de catégorisation : une lecture du corpus intégré dans le logiciel a permis d’identifier les catégories (ou thèmes) émergentes;
    • Étape de codage qualitatif : qui consiste à isoler des unités minimales de sens auxquelles j’ai attribué un code faisant sortir une première grille de codes;
    • Validation des codes et catégories qui a permis l’élaboration des premiers schémas théoriques.

Cette analyse thématique des contenus a permis une analyse plus fine du verbatim des entrevues individuelles semi-dirigées réalisées.

Question de réflexion

Peut-on parler de critère de scientificité en recherche qualitative?

Les avis sur la question des critères de scientificité en recherche qualitative sont très contrastés. Aussi, les critères d’évaluation de la « scientificité » de la recherche qualitative sont-ils diversement appréciés. Toutefois, on peut retenir que la valeur d’une recherche scientifique dépend fortement de l’habileté du chercheur ou de la chercheuse à démontrer la crédibilité de ses découvertes (Drapeau, 2004). Le plus important est la rigueur à toutes les étapes, de la méthode à la présentation des résultats, en passant par l’analyse complexe des données. La validité en recherche qualitative est surtout interne et consiste à vérifier si les données recueillies représentent la réalité. Une des façons d’y parvenir est de recourir à la technique de triangulation des sources et des méthodes. La triangulation permet de comparer les résultats obtenus à partir d’au moins deux techniques de recueil de données (exemple : entretiens et observations), ou plus simplement d’au moins deux sources de données (exemple : entretiens avec étudiant-e-s et enseignant-e-s). Ensuite, les résultats de l’analyse peuvent être soumis aux acteurs et actrices qui ont participé à la recherche pour les corroborer. Dans un second temps, les résultats sont confrontés aux données de la littérature qui avaient sous-tendu l’élaboration des premières hypothèses. La crédibilité des résultats de recherche est tributaire de la qualité méthodologique de l’étude dans son ensemble.

Certain-e-s chercheurs et chercheuses se réservent de parler de validité externe en recherche qualitative, car ses méthodes ne visent pas à former un échantillon représentatif susceptible d’une généralisation statistique; sa portée n’étant pas universelle, mais contextuelle. Il s’agit plutôt d’une généralisation théorique comme le relève Yin (2012 : 18) : «[…] analytic generalizations depend on using a study’s theoretical framework to establish a logic that might be applicable to other situations ». Toutefois, il est important de discuter cette notion de transférabilité de l’étude (validité externe) qui réfère à la notion de généralisation des résultats existante en recherche quantitative. Tout d’abord, les participant-e-s et les contextes sont minutieusement sélectionné-e-s précisément pour permettre la diversification et la saturation des données. Ensuite, l’analyse en profondeur d’un ou de plusieurs aspects d’une problématique et ce, à partir de plusieurs sources d’informations, produit de nouvelles connaissances (processus, concepts, théories). Enfin, comme en recherche quantitative, ce sont ces nouvelles connaissances qui peuvent être vulgarisées.

Conclusion

La triangulation des sources, la réflexivité sur le processus et la prise en compte des cas contrastés sont des voies qui concordent avec l’approche qualitative (Laperrière, 1997). Le recueil des informations diversifiées sur le même sujet doit favoriser la saturation des données, c’est-à-dire contribuer à ce que le chercheur ou la chercheuse ait la compréhension la plus complète possible du sujet étudié et qu’il ou elle s’assure que l’ajout de nouveaux ou de nouvelles  participant-e-s n’apporterait pas de nouvelles données utiles à la compréhension du phénomène. Une mise en relation des différentes données ainsi collectées est nécessaire pour saisir la complexité du réel.

Bibliographie commentée

Beuker, L., De Cia, J., Dervaux, A., Orianne, J. F., Pichault, F. et Travaglianti, F. (2016). Analyse qualitative interdisciplinaire du discours de travailleurs à l’aide d’un logiciel collaboratif : le cas de la flexicurité. Recherches qualitatives, 35(1), 29-55.

Cet article permet ainsi de concrétiser l’intérêt et les limites de l’utilisation d’un logiciel d’analyse qualitative dans le cadre d’un travail interdisciplinaire.

Bourgeois-Guérin, V. et Beaudoin, S. (2016). La place de l’éthique dans l’interprétation de la souffrance en recherche qualitative. Recherches qualitatives, 35(2), 23-44.

Ce texte montre comment l’interprétation et la compréhension de la souffrance en recherche qualitative se relient à l’éthique.

Denzin, N. K. (1978). Triangulation: A case for methodological evaluation and combination. Sociological methods, 339-357.

Ce texte classe les approches de triangulation en quatre types distincts, à savoir la triangulation méthodologique, la triangulation des données, la triangulation des enquêteurs et enquêtrices et la triangulation multiple.

Deslauriers, J.-P. (1997). L’induction analytique. Dans J. Poupart, J.-P. Deslauriers, L. H. Groulx, A. Laperrière, R. Mayer et A. Pires (dir.), La recherche qualitative. Enjeux épistémologiques et méthodologiques (p. 293-308). Gaétan Morin éditeur.

Karsenti, T. et Savoie-Zajc, L. (2018). La recherche en éducation: Étapes et approches (4e éd.). ERPI.

L’intérêt d’un dispositif collaboratif qui intègre le point de vue de praticien-ne-s à la construction de savoirs professionnels sur la pratique de l’évaluation formative informelle. L’analyse des données de cette recherche a été facilitée par un traitement à l’aide du logiciel QDA Miner.

Miles, M. B. et Huberman, A. M. (2003). Analyse des données qualitatives. De Boeck Supérieur.

Cet ouvrage rassemble de manière cohérente et progressive un ensemble d’outils efficaces d’analyse de données, encourage leur utilisation et surtout, leur perfectionnement.

Pires, A. (1997). Échantillonnage et recherche qualitative: essai théorique et méthodologique. Dans J. Poupart, J.-P. Deslauriers, L. H. Groulx, A. Laperrière, R. Mayer et A. Pires (dir.), La recherche qualitative. Enjeux épistémologiques et méthodologiques (p. 113-169). Gaétan Morin éditeur.

Ce texte examine de plus près les notions d’« échantillon » et de « population » dans les démarches qualitatives et quantitatives et donne une définition claire des notions de saturation empirique et saturation théorique.

Références complémentaires

Drapeau, M. (2004). Les critères de scientificité en recherche qualitative. Pratiques psychologiques, 10(1), 79-86.

Faucher, C. (2012). Développement d’un modèle de raisonnement clinique par son explicitation auprès d’optométristes de deux niveaux d’expertise contrastants. Recherches qualitatives, 31(2), 79-107.

Jick, T. D. (1979). Mixing qualitative and quantitative methods: Triangulation in action. Administrative science quarterly, 24(4), 602-611.

Laperrière, A. (1997). Les critères de scientificité des méthodes qualitatives. La recherche qualitative. Enjeux épistémologiques et méthodologiques, 1, 365-389.

Mayer, R., Ouellet, F., St-Jacques, M.-C., Turcotte, D. et coll. (2000). Méthodes de recherche en intervention sociale. Gaëtan Morin éditeur.

Pourtois, J.-P. et Desmet, H. (2007). Épistémologie et instrumentation en sciences humaines. Éditions Mardaga.

Reidy, M. et Mercier, L. (1996). La triangulation. Dans M. F. Fortin (dir.), Le processus de la recherche: de la conception à la réalisation (p. 317-334). Decarie Éditeur.

Savoie-Zajc, L. (1996). Triangulation (technique de validation par). Dans. A. Mucchielli (dir.), Dictionnaire des méthodes qualitatives en sciences humaines et sociales (p. 261-262). Armand Collin.

Veyrié, N. (2017). Enjeux épistémologiques et éthiques d’une recherche qualitative pluridisciplinaire sur les « demandes d’euthanasie » formulées auprès des professionnels de la santé. Recherches qualitatives, 36(2), 8-28.

Yin, R. K. (2012). A (very) brief refresher on the case study method. Applications of case study research, 3-20. https://study.sagepub.com/sites/default/files/a_very_brief_refresher_on_the_case_study_method.pdf

Yana, S. D. (1993). Un essai de triangulation méthodologique : La recherche sur les relations entre la fécondité, la famille et l’urbanisation chez les Bamiléké et les Bëti (Cameroun). Bulletin de l’APAD, 6, 1-6. https://doi.org/10.4000/apad.2543


  1. Les « jumeaux » ne seront pas féminisés dans ce texte puisqu'il réfère au concept de « mères de jumeaux » tel que mobilisé par l'autrice.