Cette page n’a pas pour vocation d’être exhaustive : je vais simplement lister les outils qui me concerne ou pourraient me concerner.

Collecte de données

Entretiens

Lorsque l’on interroge des enquêtés, dans une perspective#éthique-données , il faut maîtriser la chaîne de traitement. Voici un article de blog qui pose plusieurs questions à ce sujet.

”Rendez-vous” de RENATER

Pour faciliter ce travail, RENATER propose une instance cryptée de bout-en-bout de Jitsi, sur son outil “Rendez-vous”. Celle-ci est accessible gratuitement avec un compte institutionnel universitaire.

La chaîne de traitement des données s’arrête à qui se connecte, avec quel type d’appareil. Et aucune donnée personne identifiante n’est conservée à la suite de la réunion. Les enregistrements sont locaux (sur la machine). Idéal pour des réunions jusqu’à 4 personnes.

Bigbluebutton

À privilégier pour des réunions de plus de 4 personnes.

Tixeo

Très performant, OK RGPD, mais n’est pas gratuit. Voici un article de blog qui traite de la sécurité des données.

Transformation des données

Transcription

NoScribe

TéléchargementDocumentationFormations
MacOS, Windows & Linux/Non-nécessaire, l’outil est facile à prendre en main.

Traduction de la présentation sur Github : Un logiciel basé sur l’IA qui retranscrit des entretiens pour une recherche sociale qualitative ou une utilisation journalistique noScribe est gratuit et open source (GPL-3.0) Il fonctionne entièrement en local sur votre ordinateur. Aucune donnée n’est envoyée sur Internet. Pas de cloud, pas de soucis Il peut distinguer différents locuteurs et comprend 99 langues (plus ou moins, voir ci-dessous) Il comprend un éditeur sympa pour réviser, vérifier et corriger la transcription résultante Il se tient sur les épaules de géants : Whisper d’OpenAI, faster-whisper de Guillaume Klein et pyannote d’Hervé Bredin.

Pourquoi utiliser noScribe ?

La plupart des doctorants recommandent d’utiliser la transcription de Microsoft office word. Cependant cette transcription envoie l’audio vers un serveur de Microsoft pour renvoyer sur l’ordinateur la transcription. Cette façon de faire ne permet pas de garantir la confidentialité des données de l’entretien. noScribe permet de garder la main sur les données, aucun serveur n’est sollicité, et il fonctionne très bien sans connexion. Attention en revanche, c’est gourmand en ressources ! De plus, contrairement à d’autres logiciels, noScribe permet une segmentation (ça facilite l’écoute-correction) et une identification des interlocuteur. L’export est en HTML, directement éditable dans l’interface.

Alternative si on ne possède pas d’ordinateur assez puissant : Les dossiers de transcription de Huma-num.fr, qui embarquent Whisper en tout confidentialité. Pensez simplement à citer Huma-num.fr comme tiers pour le traitement des données.

Traitement de données

Datavisualisation

Palette couleur daltoniens ColorBrewer

Gephi

TéléchargementDocumentationFormations
MacOS, Windows & Linux/Régulières dans le réseau URFIST
Base tutorielle

Gephi est un logiciel de visualisation et d’analyse de données en réseau, développé par l’Institut des Systèmes Complexes de Paris (ISC-PIF). Il est conçu pour aider les chercheurs et les professionnels à comprendre et à analyser les structures et les dynamiques de réseaux complexes.

Plugins Gephi utiles :

Hyphe

Hyphe nous a été recommandé pour les mêmes applications, à des corpus plus grands. Ils ont une démo ouverte.

Iramuteq

TéléchargementDocumentationFormations
MacOS Big Sur & LinuxOfficielleRégulières dans le réseau URFIST

Iramuteq est un logiciel de traitement et d’analyse de données textuelles, développé par l’équipe de recherche en sciences sociales de l’Université de Paris. Il est conçu pour aider les chercheurs et les professionnels à analyser et à comprendre les données textuelles, notamment les textes écrits et les discours.

Recommandé par L. Alidières et F. Perea dans le cadre du Master Humanités numériques.

Nettoyage de données

OpenRefine

OpenRefine est un outil de traitement et de nettoyage de données, conçu pour aider les utilisateurs à préparer et à transformer leurs données pour une analyse ou une visualisation ultérieure. Il est développé par l’équipe de Google et est maintenant maintenu par la communauté OpenRefine.

Data Research Management

QUARTO

TéléchargementDocumentationFormations
MacOS, Windows & LinuxOfficielle - Base templates univ
Régulières dans le réseau URFIST

QUARTO est un outil de gestion de données et de métadonnées conçu pour les chercheurs et les institutions de recherche. Il permet de gérer et de partager des données de recherche de manière efficace et efficiente, tout en garantissant leur qualité et leur sécurité.

Tropy

Gestionnaire de corpus d’images.

TéléchargementDocumentationFormations
MacOS, Windows & LinuxOfficielle
Blog
Un outil de gestion d’images conçu spécifiquement pour les chercheurs et les historiens. Il permet de cataloguer, d’organiser et d’analyser des collections d’images, notamment des photographies et des diapositives.

Tropy offre plusieurs fonctionnalités intéressantes, telles que :

  • La création de métadonnées pour les images, comme des descriptions, des dates et des lieux
  • La possibilité de créer des collections et des dossiers pour organiser les images
  • Des outils d’analyse et de recherche pour trouver des images spécifiques
  • La possibilité d’exporter les métadonnées et les images vers d’autres outils, comme Obsidian, Omeka, etc