Vous êtes ici :
- Unité de recherche
- CY LT2D
- Accueil
- Ressources
- Textes méthodologiques
le 17 juin 2025
France2030
Linguistique
Publié le 18 juin 2025– Mis à jour le 18 juin 2025
Guide : les données de la recherche et leur valorisation au laboratoire LT2D
Alors que la recherche en sciences humaines repose de plus en plus sur le traitement de grandes quantités de données, la bonne gestion de celles-ci est un enjeu essentiel pour la recherche. En accord avec les initiatives d’état pour la science ouverte 1, les données de la recherche se doivent d’être diffusées et accessibles lorsque cela est possible. Il existe déjà de nombreuses ressources (guides, outils, plateformes, etc.) mais les informations qu’elles contiennent n’arrivent pas toujours jusqu’aux personnes qui pourraient en avoir besoin. C’est pour faire ce lien (en mettant l’accent sur les pratiques liées aux lexiques, textes, discours et dictionnaires) que l’idée de ce guide est née. Notre objectif n’est donc pas de produire de nouvelles recommandations mais plutôt de faire le point sur les pratiques et les recommandations existantes (gouvernement, consortiums, etc.).
Pourquoi valoriser les données de la recherche ? Les enjeux sont grandissants, notamment concernant la sauvegarde, la visibilité ainsi que la réutilisation des données. La prise en compte des principes éthiques et légaux au début d’un projet permet d’envisager la valorisation dès la constitution des données. Pour la récolte, l’annotation et la mise en forme des données, il existe de nombreuses ressources et outils issus de différentes disciplines. Une fois les données constituées, il existe différentes pratiques de partage et de valorisation (appliquer une licence, renseigner des métadonnées, identifier les données de manière pérenne, héberger les données sur un dépôt spécialisé ou non, écrire un data paper, faire de la vulgarisation, etc.).
Ce guide est produit dans le cadre de la Chaire de Professeure Junior « Ressources numériques en Sciences Humaines et Sociales » financée par l’Agence Nationale de la Recherche et portée par Marine Delaborde au laboratoire LT2D (Lexiques, Textes, Discours, Dictionnaires, UR 7518) de CY Cergy Paris Université. Il s’inscrit dans une démarche de valorisation des ressources du laboratoire et de création de nouveaux outils pour accompagner les membres du laboratoire dans leurs recherches.
Ce guide est partagé en accès libre, sous licence ouverte et pourra servir à des personnes issues d’autres laboratoires.
- Suivi des modifications :
- Version 1.0 (03/03/2025) : version initiale
- Version 1.1. (17/06/2025) - version actuelle : modification des données sensibles et ajout de 3.1.3 Rendre ses recherches accessibles