le 9 avril 2026
  • Recherche

Publié le 16 mars 2026 Mis à jour le 16 mars 2026

Séminaire ONuSeL: Explorer et analyser un corpus avec Lodex

  • Date : 9/04/2026  de 11h à 12h30

  • Titre : Explorer et analyser un corpus avec Lodex

  • Intervenant : Mathilde Huguin, ingénieure de recherche CNRS, Inist (UAR76), équipe Textes & Corpus - Istex

  • Lieu : 

  • Résumé : Cette intervention vise à présenter Lodex comme un environnement web dédié à la structuration, à l’enrichissement et à la visualisation de jeux de données structurés, quels que soient leur nature ou leur domaine (publications scientifiques, transcriptions d’entretiens annotées, corpus de tweets, extraits de littérature, etc.). Lodex prend en entrée plusieurs formats de données (TEI, JSON, TXT, CSV, etc.) et permet de transformer un corpus en un dispositif d’exploration et d’analyse reposant sur des filtres et des visualisations interactives.

    La présentation s’appuiera sur un corpus de publications en sciences humaines et sociales consacré aux langues signées, constitué à partir des données Istex. L’objectif de ce corpus est d’analyser quelles langues sont les plus documentées et sous quels aspects linguistiques (syntaxe, sémantique, pragmatique, etc.). Il s’agira de montrer comment Lodex permet d’importer et de structurer les données, puis d’enrichir progressivement le corpus en mobilisant des web services développés à l’Inist-CNRS (extraction de termes, détection d’entités nommées, génération de résumés par IA, etc.). La séance montrera ensuite comment ces enrichissements peuvent être exploités pour produire des visualisations interactives facilitant l’exploration du corpus, par exemple afin de comparer les langues étudiées, les thématiques abordées ou leur évolution temporelle. L’intervention soulignera enfin que Lodex reste accessible sans compétences préalables en programmation, tout en offrant des possibilités de traitements plus avancés (Lodash, Vega-Lite).

    Liens utiles

    Github Lodex : https://github.com/Inist-CNRS/lodex

    Demande d’hébergement : https://lodex.istex.fr/

    Documentation : https://www.lodex.fr/docs/documentation/

    Liste de diffusion : https://groupes.renater.fr/sympa/subscribe/lodex