Recherche Data Gouv

La plateforme nationale des données de la recherche

Dans le cadre de la politique nationale de soutien à la science ouverte et du second Plan national pour la science ouverte, le ministère de l’Enseignement supérieur et de la Recherche a lancé à la fin du premier semestre 2021 la création d’une plateforme nationale fédérée des données de la recherche (Recherche Data Gouv). L’ambition est double : offrir une solution souveraine et maîtrisée pour la diffusion de données de la recherche et mettre en œuvre des services d’accompagnement aux chercheurs.

Date de publication : février 2024

Le développement des modules « entrepôt » et « catalogue » de la plateforme a été confié à INRAE qui a acquis une expertise multidisciplinaire en diffusant depuis 2018 des données de différents domaines scientifiques dans son entrepôt institutionnel Data INRAE, s’appuyant sur Dataverse, la solution libre développée par l'université Harvard et largement adoptée par la communauté scientifique internationale. INRAE met en œuvre ce projet en collaboration avec les universités de Grenoble, Strasbourg, Lorraine, Paris Nanterre, Paris Cité, Lille et le CNRS (INIST).

De quoi s’agit-il ?

La plateforme nationale fédérée des données de la recherche contribue à répondre aux enjeux d’ouverture des données en mettant à disposition un entrepôt pluridisciplinaire dans lequel tout chercheur français pourra déposer et publier des données. Elle sera particulièrement utile dans les cas où il n’existe aucun entrepôt disciplinaire de confiance.

Où en est-on actuellement et qu’est-ce que cela apporte concrètement ?

La plateforme Recherche Data Gouv a été officiellement inaugurée le 8 juillet 2022 avec notamment l’ouverture du portail de Recherche Data Gouv et de l’entrepôt de données  dont la mise en œuvre a été pilotée par les équipes de la DipSO et la DSI INRAE. Un centre de ressources pilote, composé de membres du projet, opère les services associés à la plateforme, en parallèle de la poursuite du projet.

Depuis l’ouverture de l’entrepôt de données, à ce jour, le centre de ressources a reçu dix-huit demandes de création d’espaces institutionnels. Chaque établissement d’enseignement supérieur ou de recherche peut en effet demander la création d’un espace institutionnel afin de déposer et publier ses données de recherche, dont il assure l’administration et la curation. Jusqu’à présent, en plus de l’espace INRAE, 35 espaces institutionnels ont été créés et publiés. Un espace générique destiné aux scientifiques dont les établissements ne disposent pas encore d’espace institutionnel a également été créé. L’entrepôt Recherche Data Gouv compte à l’heure actuelle un peu plus de 30 000 fichiers de données qui totalisent environ 336 000 téléchargements.

L

Perspectives

Depuis janvier 2024, l’Entrepôt-Catalogue-Portail est porté par une unité mixte de service (UMS) dont le directeur est en cours de recrutement. L’organisation cible (ressources humaines et gouvernance) sera opérationnelle en 2025 et se mettra en place progressivement tout le long de l’année 2024. Les tutelles envisagées de l’UMS sont les universités de Lorraine, Strasbourg, Grenoble, Lille et France Comté.
 

Les grands chantiers 

L'équipe projet travaille sur plusieurs chantiers parmi lesquels :

  • l'amélioration continue des fonctionnalités du portail et de l'entrepôt ;
  • la conception et la mise en œuvre d'une nouvelle architecture de la plateforme dans le but de proposer une disponibilité, une extensibilité et une rapidité de reprise sur panne les plus élevées ;
  • la mise en œuvre du module Catalogue pour permettre le signalement de données de la recherche française disponibles dans d'autres entrepôts, notamment des entrepôts de données thématiques.

Contact : num4sci-contact@inrae.fr