Recherche Data Gouv

Action phare 1 : Recherche Data Gouv

La plateforme nationale des données de la recherche

Dans le cadre de la politique nationale de soutien à la science ouverte et du second Plan national pour la science ouverte, le ministère de l’Enseignement supérieur et de la Recherche a lancé à la fin du premier semestre 2021 la création d’une plateforme nationale fédérée des données de la recherche
(Recherche Data Gouv). L’ambition est double : offrir une solution souveraine et maîtrisée pour la diffusion de données de la recherche et mettre en œuvre des services d’accompagnement aux chercheurs.

Date de publication : février 2023

Le développement des modules « entrepôt » et « catalogue » de la plateforme a été confié à INRAE qui a acquis une expertise multidisciplinaire en diffusant depuis 2018 des données de différents domaines scientifiques dans son entrepôt institutionnel Data INRAE, s’appuyant sur Dataverse, la solution libre développée par l'université Harvard et largement adoptée par la communauté scientifique internationale. INRAE met en œuvre ce projet en collaboration avec les universités de Grenoble, Strasbourg, Lorraine, Paris Nanterre, Paris Cité, Lille et le CNRS (INIST).

De quoi s’agit-il ?

La plateforme nationale fédérée des données de la recherche contribue à répondre aux enjeux d’ouverture des données en mettant à disposition un entrepôt pluridisciplinaire dans lequel tout chercheur français pourra déposer et publier des données. Elle sera particulièrement utile dans les cas où il n’existe aucun entrepôt disciplinaire de confiance.

Où en est-on actuellement et qu’est-ce que cela apporte concrètement ?

La plateforme Recherche Data Gouv a été officiellement inaugurée le 8 juillet 2022 avec notamment l’ouverture du portail de Recherche Data Gouv et de l’entrepôt de données  dont la mise en œuvre a été pilotée par les équipes de la DipSO et la DSI INRAE. Un centre de ressources pilote, composé de membres du projet, opère les services associés à la plateforme, en parallèle de la poursuite du projet.

Depuis l’ouverture de l’entrepôt de données, à ce jour, le centre de ressources a reçu dix-huit demandes de création d’espaces institutionnels. Chaque établissement d’enseignement supérieur ou de recherche peut en effet demander la création d’un espace institutionnel afin de déposer et publier ses données de recherche, dont il assure l’administration et la curation. Jusqu’à présent, en plus de l’espace INRAE, dix espaces institutionnels ont été créés et publiés, cinq autres ont été créés mais ne sont pas encore publiés et trois sont en cours de traitement. Un espace générique destiné aux scientifiques dont les établissements ne disposent pas encore d’espace institutionnel a également été créé. L’entrepôt Recherche Data Gouv compte à l’heure actuelle un peu plus de 1 800 jeux de données avec plus de 28 000 fichiers de données qui totalisent environ 253 000 téléchargements.

L

Perspectives

L'équipe projet travaille sur plusieurs chantiers parmi lesquels :

  • l'amélioration continue des fonctionnalités du portail et de l'entrepôt ;
  • la conception et la mise en œuvre d'une nouvelle architecture de la plateforme dans le but de proposer une disponibilité, une extensibilité et une rapidité de reprise sur panne les plus élevées ;
  • la mise en œuvre du module Catalogue pour permettre le signalement de données de la recherche française disponibles dans d'autres entrepôts, notamment des entrepôts de données thématiques ;
  • la proposition d’une structure organisationnelle (ressources humaines et gouvernance), du modèle économique et d’une structure juridique dans la perspective d’inscrire Recherche Data Gouv dans la liste des infrastructures nationales.

Contact : num4sci-contact@inrae.fr