Le diagnostic et l’autodiagnostic comme faits culturels et discursifs
Cette recherche considère que le diagnostic psychiatrique en tant que résultat d’une pratique d’autodiagnostic ne constitue pas un énoncé médical fondé sur une procédure clinique, et qu’il peut être investi comme fait social et discursif, mobilisé dans des contextes variés et selon des logiques hétérogènes. Il est ici appréhendé non comme un critère de validité, mais comme un signifiant socialement circulant, objet de controverses, de réappropriations et de reformulations.
Dans cette perspective, l’autodiagnostic est envisagé non comme une pathologie de la réception médicale ou une dérive individuelle, mais comme une pratique culturelle située, produite dans un contexte où les discours d’expertise cohabitent avec des formes de savoir profane, de reconnaissance communautaire, et de narration de soi. Il constitue un acte discursif performatif par lequel un individu se reconnaît dans une catégorie diagnostique, se l’approprie ou la revendique, souvent en tension avec les canaux institutionnels de légitimation.
L’analyse ne portera donc ni sur la validité médicale des diagnostics invoqués, ni sur l’adéquation des discours à une norme clinique, mais sur la manière dont ces discours construisent des régimes de vérité, des appartenances, des positionnements sociaux ou militants autour de la santé mentale.
Cette posture implique :
- de considérer les usages du terme « diagnostic » (et ses déclinaisons) comme des objets langagiers, et non comme des catégories médicales à évaluer ;
- d’analyser l’autodiagnostic comme une pratique discursive, à la fois individuelle et collective, engageant des formes de reconnaissance, de visibilité et parfois de contestation ;
- d’observer les effets produits par ces discours : quelles formes de savoir circulent ? quelles autorités sont convoquées ? quels rapports aux institutions, aux pairs, au langage médical sont exprimés ?
Stratégie de constitution du corpus pour l’étude cyberethnographique sur l’autodiagnostic en santé mentale
Contexte et objectifs de l’étude
Dans le cadre d’une cyberethnographie exploratoire sur l’autodiagnostic en santé mentale, il s’agit de constituer un corpus de publications publiques en langue française afin d’analyser les formations discursives autour de ce phénomène. Les recherches préliminaires suggèrent que l’autodiagnostic en ligne n’est pas un simple acte individuel isolé, mais un nœud discursif où se croisent des logiques concurrentes d’expertise et de subjectivité . Autrement dit, différents discours publics – scientifiques, profanes, militants, professionnels – reconfigurent les catégories diagnostiques et questionnent les frontières entre savoir médical institutionnel et expérience personnelle en ligne .
L’objectif de cette stratégie est donc de recueillir un corpus limité mais diversifié de contenus publics, permettant une analyse mixte (qualitative et quantitative légère) des discours sur l’autodiagnostic. Ce corpus exploratoire servira de base pour cartographier les positions et enjeux discursifs, avant de les confronter à des entretiens qualitatifs avec patients et soignants dans un second temps. Il convient d’adopter une méthodologie rigoureuse pour sélectionner ces données tout en respectant des principes éthiques stricts propres à l’ethnographie en ligne.
Périmètre et sources du corpus
Pour assurer la légalité, l’éthique et la pertinence des données, le périmètre du corpus sera défini comme suit :
- Publications en ligne accessibles publiquement : uniquement des contenus ouverts ne nécessitant ni inscription ni autorisation spécifique pour être consultés, dont la portée est explicitement publique. Sont inclus par exemple : les vidéos YouTube (et leurs commentaires éventuels), les billets de blogs, les articles de sites web ou de presse en ligne, les messages de forums publics et les articles de vulgarisation scientifique ou de blogs zététiques.
- Langue française uniquement : tous les contenus seront rédigés ou sous-titrés en français, afin de se concentrer sur les dynamiques discursives propres à l’espace francophone.
- Plateformes autorisées : YouTube, blogs personnels ou collectifs, espaces publics d’information sur des forums web ouverts, articles de médias en ligne, publications scientifiques en accès libre. Ces plateformes sont explicitement publiques, et dans une approche cyberethnographique, jalonnent le parcours d’un individu qui souhaite s’informer sur l’autodiagnostic.
- Plateformes exclues : tout réseau à accès restreint, au contenu éphémère ou à fort effet bulle de filtre (Parisier, 2012), tels que TikTok, Snapchat, Instagram, ou Facebook. De même, les espaces demandant une identification (forums privés, Discord, etc.) seront écartés à ce stade. L’étude se focalise sur des données librement accessibles, pour des raisons éthiques et pratiques.
- Périmètre thématique : les contenus doivent porter explicitement sur l’autodiagnostic en santé mentale. Cela peut inclure des discussions sur le fait de se diagnostiquer soi-même un trouble psychique (ex : autodiagnostic de TSA, TDAH, bipolarité, dépression, etc.), des arguments pour ou contre cette pratique, des récits de vécu d’autodiagnostic, ou des analyses du phénomène. S’il s’avère nécessaire d’équilibrer le corpus une fois la catégorisation par sphère discursive effectuée, nous nous autorisons à inclure des items sur l’autodiagnostic en santé physique. En définissant clairement ces sources et limites, on garantit que le corpus sera cohérent avec la problématique étudiée tout en évitant les écueils juridiques (contenus privés) et en restant gérable en volume.
Catégorisation exploratoire des sphères discursives
L’un des objectifs de cette étude est de documenter les circulations discursives autour de la notion d’autodiagnostic en santé mentale, en repérant comment cette notion est investie dans différents cadres sociaux d’énonciation. À cette fin, les publications du corpus seront catégorisées a posteriori selon des sphères discursives, c’est-à-dire des espaces de production de discours relativement cohérents du point de vue de leurs énonciateurs, de leurs finalités, et de leurs ressources linguistiques.
Plutôt que de prédéfinir strictement ces sphères dès la phase de constitution du corpus, la démarche retenue repose sur une construction inductive appuyée sur les critères d’analyse suivants :
- Le cadre énonciatif (statut et rôle de l’auteur dans l’interaction : professionnel, usager, pair, observateur, etc.)
- Le lexique mobilisé (vocabulaire clinique, subjectif, militant, sceptique, etc.)
- La posture discursive (témoigner, conseiller, contester, vulgariser, etc.)
- La visée pragmatique (informer, alerter, revendiquer, partager, etc.)
- Les références implicites ou explicites (rattachement à une communauté, à un paradigme théorique ou à une tradition professionnelle)
Cette catégorisation permettra de faire émerger, en fonction des corpus sélectionnés, un espace discursif structuré, que l’on pourra ensuite modéliser en sphères sociales de production de discours sur l’autodiagnostic.
Trois grands pôles sont hypothétiquement attendus (discours scientifiques et sceptiques, discours militants et subjectifs, discours professionnels de santé), mais ces catégories ne seront validées qu’à l’issue de l’analyse. Cette posture permet de ne pas préempter les frontières entre sphères, de laisser apparaître les zones de friction ou de chevauchement, et de rendre compte des tensions sémantiques au cœur du phénomène étudié.
Méthodologie de repérage et de collecte des données
La collecte du corpus suivra une démarche systématique en plusieurs étapes, afin de garantir la rigueur du repérage des publications tout en respectant la contrainte de limiter le volume de données. Voici la stratégie proposée :
-
Recherche multi-plateformes : En utilisant ces mots-clés, on effectuera des recherches ciblées sur différentes plateformes :
- Moteurs de recherche web (Google, Bing) en précisant la langue française et éventuellement en ciblant certains sites (par ex. site:forum.doctissimo.fr autodiagnostic trouble pour chercher dans Doctissimo, ou site:wordpress.com autodiagnostic santé mentale pour des blogs). On utilisera la navigation privée ou des outils de veille pour éviter la personnalisation des résultats.
- YouTube : utiliser la barre de recherche YouTube avec les mots-clés (ex. autodiagnostic santé mentale, psy autodiagnostic) pour repérer des vidéos pertinentes. Consulter les chaînes de vulgarisateurs scientifiques (ex : La Tronche en Biais, PsyLab) et de professionnels de santé, ainsi que d’éventuels témoignages vidéo de patients. On veillera à activer les sous-titres ou à obtenir une transcription des passages utiles pour l’analyse textuelle.
- Forums et espaces communautaires : identifier un ou deux forums de santé mentale grand public (par ex. Doctissimo, Psychologie/forums aufeminin, Reddit en français dans les communautés r/aspergers, r/DepressionFR, etc.). Rechercher au sein de ces forums des discussions où des internautes mentionnent s’être auto-diagnostiqués ou demandent l’avis des autres sur un autodiagnostic. Ces discussions fournissent du discours spontané et dialogué. Par exemple, un fil Reddit intitulé “L’autodiagnostic est une étape nécessaire pour obtenir un diagnostic” présente des arguments de participants justifiant l’auto-évaluation préalable avant de consulter .
- Médias et blogs : visiter les sites web identifiés comme ressources dans chaque sphère. Par exemple, dans la sphère scientifique/zététique, consulter La Menace Théoriste (qui a déjà publié sur le sujet ), Sciences et Avenir, Le Temps (pour la Suisse) ou The Conversation (FR) pour des articles de vulgarisation récents. Pour la sphère militante, parcourir des blogs spécialisés (comme Pourquoi pas Autrement ? dont un article en 2020 est un manifeste en faveur de l’autodiagnostic ) ou des sites d’associations de patients. Dans la sphère soignante, relever des tribunes ou interviews de cliniciens (par ex. magazines WhatsupDoc, Psychomedia, ou billets de psychologues sur LinkedIn).
- Réseaux sociaux textuels (optionnel, en gardant les contraintes à l’esprit) : si nécessaire, on pourra explorer des threads Twitter (désormais X) publiés par des spécialistes ou militants sur le sujet de l’autodiagnostic, car ces tweets sont publics et peuvent contenir des réflexions intéressantes. Cependant, on évitera de collecter des données personnelles et on privilégiera les threads thématiques bien identifiés.
-
Sélection d’un échantillon limité et diversifié : La moisson initiale de contenus sera sans doute abondante. Il faudra donc trier pour ne retenir qu’un échantillon restreint, représentatif de chaque sphère discursive et varié dans ses formats. Concrètement, on vise un corpus d’environ 20 à 30 items au total, par exemple ~6 à 10 items par sphère. Les critères de sélection incluront :
- Pertinence discursive : chaque item retenu doit illustrer de façon saillante le discours de sa sphère sur l’autodiagnostic (par ex. un post de forum où un jeune décrit son autodiagnostic de TDAH correspond bien à la sphère subjective). Si un contenu est trop périphérique ou n’aborde le sujet qu’anecdotiquement, on l’écarte.
- Diversité interne : au sein de chaque sphère, choisir des contenus variés pour éviter les doublons. Par exemple, dans la sphère militante, ne pas prendre uniquement des témoignages sur l’autisme mais aussi sur d’autres troubles (TDAH, bipolarité…), ou des sources aux tonalités différentes (un témoignage personnel et un article militant théorique). De même, la sphère scientifique pourra inclure un article de blog sceptique et une vidéo de vulgarisation académique, etc.
- Accessibilité et longueur : privilégier des contenus de longueur raisonnable et exploitables dans le cadre de l’analyse. Par exemple, une vidéo de 2 heures sera évitée au profit d’une vidéo plus courte ou bien chapitrée. Un thread de forum de 200 messages pourra être résumé ou on en extraira seulement quelques messages clés si nécessaire. Le corpus doit rester peu dense : suffisant pour repérer des tendances discursives, mais pas surchargé au point de rendre l’analyse qualitative impossible dans le temps imparti.
- Qualité et clarté : s’assurer que les contenus sont compréhensibles (langue claire, pas de jargon incompréhensible hors contexte), et qu’ils proviennent de sources relativement fiables ou identifiées (par exemple, on peut privilégier un billet de blog argumenté à un simple commentaire anonyme isolé, sauf si ce dernier illustre très bien un discours typique).
-
Collecte et enregistrement des données : Pour chaque item sélectionné, on procédera à une archivage rigoureux :
- Capturer le contenu : selon le type, cela peut impliquer de sauvegarder l’URL, de copier-coller le texte dans un document de travail ou un tableur, de télécharger la vidéo ou sa transcription, ou d’utiliser des outils d’archivage web. On notera la date de consultation et on vérifiera que le contenu est stable (risque de suppression faible – éventuellement faire des captures d’écran si nécessaire à des fins de preuve).
- Métadonnées : documenter pour chaque item son titre, auteur ou pseudonyme, date de publication, plateforme/source, et toute autre info contextuelle (par ex. nombre de vues ou de commentaires pour une vidéo – indicateur d’audience, ou le contexte d’un post sur un forum : rubrique « dépressions » du forum X, etc.). Ces métadonnées faciliteront le tri et l’analyse ultérieure.
- Organisation : stocker l’ensemble des contenus et métadonnées dans un tableau de suivi (voir section « Grille de codage et suivi ») afin d’avoir une vue d’ensemble du corpus. Chaque item recevra un identifiant unique dans ce tableau. En suivant ces étapes, l’objectif n’est pas de produire une couverture exhaustive, mais de constituer un corpus varié et contrasté de discours accessibles, tels qu’ils peuvent être rencontrés par un internaute non spécialiste en quête d’informations sur l’autodiagnostic. La démarche s’inspire d’une logique d’exposition : on cherche à observer les discours les plus susceptibles d’apparaître lors de recherches spontanées en ligne (via moteurs de recherche ou navigation dans des espaces publics à forte visibilité). La sélection des contenus repose donc sur des critères de pertinence discursive et de visibilité pragmatique, tout en veillant à préserver une certaine diversité thématique et formelle. La méthodologie est itérative et ajustable : les critères de sélection pourront être affinés au fil de la collecte, notamment pour équilibrer les registres discursifs ou les types de trouble représentés. Chaque inclusion ou exclusion sera documentée de manière transparente dans le tableau de suivi, afin de maintenir une traçabilité complète des choix opérés.
Analyse discursive et critères d’observation
L’analyse qualitative portera sur les caractéristiques discursives des publications sélectionnées. L’objectif n’est pas de classer a priori les items dans des sphères prédéfinies, mais de faire émerger des regroupements à partir d’un ensemble d’observables linguistiques, énonciatifs et pragmatiques.
Ces éléments seront documentés dans la grille de suivi pour chaque item, et constitueront la base d’une catégorisation ultérieure, appuyée sur des régularités discursives. Ce cadre d’analyse est ouvert, itératif et sensible au contexte.
Dimension observée | Questions posées | Exemples d’indices |
---|---|---|
Cadre énonciatif | Qui parle ? En quel nom ? Depuis quelle position sociale ou symbolique ? | Statut affiché (psy, patient, militant, vulgarisateur…), usage de la 1ʳᵉ personne, invocation d’une expérience vécue ou d’un titre d’expertise |
Lexique et terminologie | Quels mots sont employés ? Relèvent-ils d’un registre clinique, militant, profane ? | Termes cliniques (DSM-5, trouble), langage subjectif (je me sens), langage militant (validisme, neurodiversité), écriture inclusive |
Registre discursif | Quel ton est adopté ? Quel type de discours ? | Témoignage, mise en garde, vulgarisation, plaidoyer, ironie, récit, argumentation, émotionnel, analytique |
Posture et visée | Quelle est l’intention apparente ? Quelle position vis-à-vis de l’autodiagnostic ? | Visée informative, critique, légitimante, revendicative ; posture d’autorité, d’empathie, de doute, de dénonciation |
Cible du discours | À qui s’adresse le contenu ? (communauté, pairs, public général, soignants…) | Usage du nous, tutoiement, adresse directe, hashtags communautaires, présence de références explicatives ou pédagogiques |
Support et format | Où et comment est publié le contenu ? | Plateforme (YouTube, blog, forum…), format (vidéo, article, commentaire…), structure du contenu (narratif, didactique, désorganisé, chapitré, etc.) |
Références externes | Le discours se rattache-t-il à une autorité, un courant, une communauté ? | Citations d’études, liens vers articles médicaux, mentions de collectifs, d’expériences partagées, hashtags revendicatifs ou sources scientifiques |
Ces dimensions serviront à documenter finement chaque item et à mettre en évidence les régularités ou tensions discursives. Les regroupements en sphères sociales ou en types de discours ne seront effectués qu’à l’issue de cette description croisée, et ne sont pas prédéfinis. Il sera possible d’observer des cas hybrides ou ambigus, sans chercher à tout prix à trancher — ce sont ces frictions elles-mêmes qui constituent l’objet de la recherche.
Diversité et équilibre exploratoire du corpus
Dans cette phase exploratoire, il ne s’agit ni d’atteindre une représentativité statistique, ni de viser une couverture exhaustive des discours portant sur l’autodiagnostic en santé mentale. L’objectif est de constituer un corpus de taille maîtrisée, reposant sur une logique de diversité écologique, c’est-à-dire apte à rendre compte de la pluralité des formats, des postures énonciatives et des contextes d’énonciation susceptibles d’être rencontrés par un internaute profane en recherche d’informations.
Principes de construction
- Volume raisonné : Un corpus composé de 20 à 30 items est envisagé, afin de permettre une analyse qualitative approfondie tout en maintenant une diversité suffisante pour identifier des régularités discursives contrastées.
- Variété des supports : La sélection intégrera des formats médiatiques hétérogènes (articles, vidéos, billets de blog, forums, commentaires), afin d’examiner les effets potentiels du support sur les formes et registres du discours. Seront notamment distingués :
- les contenus structurés (ex. : tribunes, conférences, vidéos chapitrées) et les formes plus spontanées (ex. : posts de forum, témoignages personnels),
- les formats courts et longs,
- les contenus principaux et les prolongements discursifs qui leur sont associés (commentaires, fils de discussion, etc.).
- Pluralité des cadrages discursifs : Le corpus cherchera à faire émerger une diversité de positions énonciatives et finalités pragmatiques (témoignage, analyse critique, vulgarisation, plaidoyer, etc.), sans présupposer une répartition fixe. Ces cadrages seront décrits à partir des critères définis dans la grille d’observation, et constitueront une base pour d’éventuels regroupements post-analytiques.
- Éventail thématique : Le fil conducteur demeure l’autodiagnostic en santé mentale, mais une attention particulière sera portée à la diversité des troubles évoqués (troubles du neurodéveloppement, troubles de l’humeur, troubles anxieux, etc.) ainsi qu’à la variété des contextes d’énonciation (âge, statut social, trajectoire de soin, rapport aux institutions ou aux communautés).
Logique de sélection
La sélection repose sur une démarche contrastive et itérative, visant à assurer un équilibre qualitatif entre les différents cadrages rencontrés :
- En cas de surreprésentation d’un type de discours dans les premières occurrences, une régulation sera opérée afin de ne pas biaiser l’analyse par homogénéité thématique ou énonciative.
- À l’inverse, certains cadrages discursifs minoritaires, mais heuristiques au regard des tensions discursives étudiées, pourront être intégrés de manière ciblée.
Ce dispositif vise la constitution d’un échantillon discursif cohérent bien que hétérogène, permettant d’interroger la manière dont l’autodiagnostic est thématisé, justifié ou contesté dans l’espace numérique. Les éventuels regroupements en « sphères sociales d’énonciation » seront envisagés a posteriori, à partir des régularités observables dans le matériau collecté.
Grille de codage et tableau de suivi
Pour piloter cette collecte et préparer l’analyse, on mettra en place une grille de codage sous forme de tableau de suivi (par ex. un fichier tableur ou un outil type Airtable/Excel). Cette grille servira à la fois de journal de bord de la collecte et de support d’analyse exploratoire. Elle comportera notamment les colonnes ou entrées suivantes pour chaque item du corpus :
- ID : un identifiant unique (numéro ou code) pour référencer l’item aisément. Par exemple, S1-1 pour « Sphère 1, item 1 », S2-3 pour « Sphère 2, item 3 », etc.
- Type de source/Format : ex. vidéo YouTube, article de blog, fil de forum, tweet, article de presse, etc. Ceci permettra de filtrer par type lors de l’analyse (pour voir, par ex., si tous les forums présentent des similarités indépendamment de la sphère).
- Intitulé ou description synthétique : Lorsque le contenu est doté d’un titre (ex. : article de blog, vidéo), celui-ci sera enregistré tel quel. En l’absence de titre explicite, une description synthétique neutre sera formulée par le chercheur afin d’identifier rapidement la nature du document (ex. : « Post de forum évoquant un auto-diagnostic de trouble bipolaire », « Vidéo de témoignage publié sur une chaîne personnelle »).
NB : aucune information permettant d’identifier directement l’auteur, même sous pseudonyme, ne sera conservée dans ce champ.
- Contexte énonciatif : Cette entrée vise à décrire brièvement la position d’énonciation adoptée dans le contenu (ex. : « témoignage personnel », « vulgarisation scientifique », « point de vue professionnel », « discussion entre pairs », etc.), ainsi que, lorsque cela est pertinent, la manière dont l’auteur se présente lui-même (ex. : « psychologue clinicien.ne », « personne concernée », etc.).
Seules les informations strictement nécessaires à l’analyse seront conservées. Les pseudonymes ou noms publics, même s’ils apparaissent dans la source, ne seront pas enregistrés dans le tableau de suivi.
- Date : date de publication du contenu (et date de collecte si différente, pour archive). Ceci est important pour savoir de quand datent les discours (par ex. voir si beaucoup de contenus militants datent de 2020-2021 avec l’essor de certains mouvements, ou si les contenus sceptiques sont postérieurs, etc.).
- Lien URL : le lien hypertexte vers la source originale, ou vers une archive si la source a été enregistrée différemment. Cela permet de revisiter le contexte si nécessaire. On s’assurera que tous les liens sont valides au moment de la collecte.
- Résumé ou extrait : quelques phrases résumant le contenu ou bien un court extrait significatif. Par exemple, pour un article long, résumer le propos central (e.g. « L’auteur met en garde contre les effets de mode sur TikTok et cite des études sur des “tics fonctionnels” imitant la Tourette . »). Pour un témoignage, noter le point focal (e.g. « L’auteur raconte son errance médicale et comment l’autodiagnostic d’autisme l’a aidé à mettre un mot sur ses difficultés. »). Cette synthèse facilite ensuite le travail d’analyse thématique.
- Codes initiaux / observations : une ou plusieurs colonnes pour annoter l’item avec des codes qualitatifs initiaux. Étant en phase exploratoire, ces codes seront principalement descriptifs : on peut y indiquer les thèmes abordés (ex. contestation du système médical, fiabilité des sources internet, identité et appartenance, peur de se tromper, etc.), la posture (pro-autodiag, anti-autodiag, neutre), ou tout élément remarquable (humour, émotion, mention d’une théorie…). Ces codes ne sont pas figés a priori mais émergent en parcourant le contenu – on peut les ajuster au fil de la collecte (approche itérative de codage ouvert). L’objectif est d’identifier des tendances ou motifs qui apparaissent dans chaque sphère et de préparer le terrain à une analyse plus approfondie.
- Orientation discursive (provisoire) : Cette entrée vise à documenter, de manière hypothétique, l’ancrage socio-discursif dominant de chaque item, sur la base des critères énonciatifs, lexicaux et pragmatiques observés. En cas de chevauchement ou d’ambiguïté (par exemple, un contenu mêlant témoignage personnel et analyse à visée explicative), une justification argumentée sera précisée dans une note annexe. Ce champ a vocation à alimenter ultérieurement un travail de regroupement analytique plus affiné.
- Justificatifs de classement : il peut être utile d’ajouter une colonne de remarque indiquant pourquoi on classe cet item dans telle sphère, en se référant aux critères précédemment définis. Par exemple « Lexique médical abondant, auteur médecin – classé en sphère soignante » ou « Témoignage à la première personne, posture militante (utilise “on” pour la communauté) – classé sphère subjective ». Cela servira de mémo lors de la rédaction de l’analyse, pour ne pas re-débattre du classement ultérieurement.
Le tableau de suivi jouera ainsi le rôle de cartographie du corpus. Il permettra de vérifier à tout moment l’équilibre (on pourra par exemple faire un tri par sphère pour voir s’il y a bien ~8 items par catégorie, etc.), de repérer des lacunes éventuelles (si une catégorie de discours attendu n’a pas d’item, il faudra combler avant de finaliser la collecte), et de débuter l’analyse transversale. Par exemple, on pourra filtrer par le code “contestation de la psychiatrie” pour voir si ce thème n’apparaît que dans la sphère militante ou aussi ailleurs.
Cette grille étant conçue pour une phase exploratoire, elle restera relativement souple. On n’y intégrera pas encore de codage quantitatif lourd, juste de quoi orienter la suite. Enfin, on pourra prévoir une évolution de ce tableau pour la suite du projet, par exemple en ajoutant des codes issus des entretiens ultérieurs et en triangulant avec les données du corpus en ligne.
Considérations éthiques de la collecte et de l’analyse
L’approche cyberethnographique de ce corpus impose une vigilance éthique particulière. Même si les données sont publiques, le chercheur se doit de respecter les personnes et communautés observées en ligne. La stratégie intègre donc les principes suivants :
- Contenus publics et respect de la vie privée : Tous les items proviendront d’espaces publics, où les utilisateurs ont partagé volontairement du contenu accessible à n’importe quel lecteur. Selon les recommandations éthiques en recherche en ligne, de tels contenus peuvent être utilisés comme objets de recherche sans consentement préalable des auteurs, à condition de ne pas nuire à ceux-ci. Néanmoins, par précaution, aucune information d’identité réelle ne sera recherchée au-delà de ce qui est affiché publiquement. Si un auteur utilise un pseudonyme, on ne cherchera pas à découvrir son identité civile. Aucune tentative de contact ou d’interaction avec les personnes observées n’a lieu durant cette phase – le chercheur reste observateur passif.
- Anonymisation systématique : Les noms, pseudonymes et identifiants personnels des auteurs de contenus analysés ne seront pas conservés ni mentionnés, à l’exception éventuelle des figures publiques s’exprimant en tant que telles. Les extraits cités seront, le cas échéant, paraphrasés ou fragmentés afin de limiter leur traçabilité, en particulier lorsqu’ils contiennent des éléments sensibles. Chaque publication sera traitée comme un énoncé discursif et non comme l’expression individuelle d’un sujet identifiable.
- Respect de l’anonymat contextuel : L’analyse des contenus s’inscrit dans une logique de non-identification des auteurs. Aucun nom, pseudonyme ou identifiant personnel ne sera conservé ni mentionné, à l’exception éventuelle de figures publiques s’exprimant dans un cadre professionnel explicite. De même, aucun recoupement interplateformes ne sera opéré, même en cas de similarité d’identifiants. Chaque item est analysé comme un énoncé discursif autonome, sans tentative de reconstitution de trajectoires individuelles. Les extraits éventuellement cités seront anonymisés ou partiellement reformulés afin de préserver leur invisibilité dans les moteurs de recherche et de garantir la non-traçabilité des personnes concernées.
- Consentement et retour d’information : Étant donné qu’il s’agit de discours publics, le consentement formel des auteurs n’est pas requis pour l’analyse. Cependant, par éthique, si ultérieurement certains auteurs de contenus clés sont contactés pour des entretiens (ce qui pourrait être une suite possible de l’étude), ce sera dans un cadre séparé, avec consentement éclairé, sans lien avec leurs propos publics à moins qu’eux-mêmes ne les évoquent. En outre, on pourra décider en fin de recherche de publier un retour accessible au public (par ex. un article de blog ou un résumé des résultats) afin que les communautés en ligne bénéficient aussi des conclusions – c’est une bonne pratique en ethnographie en ligne de rendre à la communauté sous une forme appropriée.
- Respect des conditions d’utilisation des plateformes : La collecte de données sera effectuée de manière manuelle ou assistée par des outils conformes aux conditions générales d’utilisation des sites consultés. Aucune extraction automatisée massive ne sera pratiquée. Les citations directes seront limitées aux contenus librement accessibles et clairement réutilisables ; dans les autres cas, l’analyse reposera sur la paraphrase. Les sources seront systématiquement référencées de manière non intrusive, en évitant les liens directs vers des contenus susceptibles de contenir des éléments sensibles ou identifiants.
- Positionnement éthique dans l’analyse : Le corpus sera constitué exclusivement de contenus publics produits dans des espaces destinés à l’échange d’informations, d’opinions ou d’arguments (vidéos, articles, forums ouverts, blogs, etc.). Les publications sélectionnées ne relèveront pas de récits intimes ou de situations de détresse manifeste. L’analyse portera sur les formes discursives et les dynamiques de controverse, et non sur les trajectoires individuelles. Bien que des éléments de vécu puissent apparaître au sein des énoncés, ceux-ci ne seront pas traités comme objets d’analyse en tant que tels. L’ensemble de la démarche s’inscrit dans une posture distanciée et non normative, attentive à ne pas essentialiser les locuteurs et à restituer les discours dans leur contexte d’énonciation.
En appliquant ces principes tout au long de la constitution et de l’exploitation du corpus, on se conforme aux standards de la recherche académique et de la néthique (éthique des études internet). L’analyse portera sur les discours en tant que tels, considérés comme des productions culturelles publiques, et non sur la vie privée des individus.
Conclusion
Cette stratégie de constitution de corpus fournit une feuille de route détaillée pour recueillir et organiser des données en ligne sur l’autodiagnostic en santé mentale, dans une optique exploratoire. En synthèse, elle préconise une sélection raisonnée de sources françaises publiques, structurée autour de trois sphères complémentaires (scientifique, militante, soignante), et assortie d’une méthode de codage initial pour faire émerger les tendances discursives tout en gardant trace des métadonnées et justifications. Le tout est encadré par une démarche éthique stricte, considérant les discours publics comme des objets de recherche à manipuler avec respect.
Le corpus ainsi constitué servira de base à une analyse qualitative et légèrement quantitative : on pourra par exemple y repérer la fréquence de certains mots ou arguments par sphère, cartographier les interactions ou oppositions entre discours (par ex. comment les militants répondent aux arguments des médecins, etc.), et identifier des questions saillantes. Ces questions alimenteront la préparation des entretiens semi-directifs avec des patients et des soignants, prévus dans la phase suivante de l’étude. Les résultats de l’analyse du corpus en ligne permettront en effet d’orienter les entretiens (en suggérant des thèmes à aborder, des paradoxes à éclaircir, des terminologies à discuter avec les participants). Inversement, les entretiens viendront ensuite enrichir la compréhension des discours en donnant la parole directe aux acteurs de terrain, en complément des observations en ligne.
Ainsi, cette stratégie garantit que la collecte de données en ligne soit utile, exploitable et éthiquement solide, au service d’une recherche plus large sur la construction du sens autour de l’autodiagnostic en santé mentale dans l’espace public numérique. En articulant finement corpus exploratoire et investigation qualitative ultérieure, on maximise les chances de produire une analyse fouillée des dynamiques discursives, tout en restant attentif aux implications sociales et humaines de ce phénomène contemporain.
Précision sur la nature des données traitées (RGPD)
Bien que le corpus de cette étude porte sur des discours relatifs à la santé mentale, il ne s’agit pas de données de santé au sens de l’article 4.15 du Règlement général sur la protection des données (RGPD).
En effet, l’étude ne vise en aucun cas l’identification de personnes ni la collecte d’informations permettant de caractériser l’état de santé d’un individu.
Les contenus analysés sont des énoncés publics produits dans des espaces d’expression en ligne, étudiés comme des objets discursifs et culturels. L’objectif de la recherche est de décrire des formes de discours collectifs, leurs cadrages, leurs dynamiques de circulation et leurs usages sociaux dans le contexte numérique.
Ainsi, les données mobilisées relèvent de la catégorie des données librement accessibles à des fins de recherche, et sont traitées dans le respect :
- du principe de minimisation des données,
- de l’anonymat des auteurs,
- de la non-reconstitution d’identités ou de trajectoires individuelles.
Cette approche permet de cadrer l’étude dans une logique non-inductive sur la personne, excluant toute finalité de diagnostic, d’évaluation ou de profilage des individus mentionnés ou auto-désignés dans les contenus analysés.
Références
Pariser, E. (2012). The filter bubble : What the Internet is hiding from you. Penguin books.