Recherche Data Gouv

La plateforme nationale des données de la recherche

Dans le cadre de la politique nationale de soutien à la science ouverte et du second Plan national pour la science ouverte, le ministère de l’Enseignement supérieur et de la Recherche a lancé à la fin du premier semestre 2021 la création d’une plateforme nationale fédérée des données de la recherche (Recherche Data Gouv). L’ambition est double : offrir une solution souveraine et maîtrisée pour la diffusion de données de la recherche et mettre en œuvre des services d’accompagnement aux chercheurs.

Date de mise à jour : juin 2025

Le développement des modules « entrepôt » et « catalogue » de la plateforme a été confié à INRAE qui a acquis une expertise multidisciplinaire en diffusant depuis 2018 des données de différents domaines scientifiques dans son entrepôt institutionnel Data INRAE, s’appuyant sur Dataverse, la solution libre développée par l'université Harvard et largement adoptée par la communauté scientifique internationale. INRAE a mis en œuvre ce projet en collaboration avec les universités de Grenoble, Strasbourg, Lorraine, Paris Nanterre, Paris Cité, Lille et le CNRS (INIST).

De quoi s’agit-il ?

La plateforme nationale fédérée des données de la recherche contribue à répondre aux enjeux d’ouverture des données en mettant à disposition un entrepôt pluridisciplinaire dans lequel tout chercheur français pourra déposer et publier des données. Elle est particulièrement utile dans les cas où il n’existe aucun entrepôt disciplinaire de confiance.

La plateforme Recherche Data Gouv a été officiellement inaugurée le 8 juillet 2022 avec notamment l’ouverture du portail de Recherche Data Gouv et de l’entrepôt de données  dont la mise en œuvre a été pilotée par les équipes de la DipSO et la DSI INRAE. Un centre de ressources pilote, composé de membres du projet, opère les services associés à la plateforme, en parallèle de la poursuite du projet.

L

Où en est-on actuellement et qu’est-ce que cela apporte concrètement ?

Chaque établissement d’enseignement supérieur ou de recherche peut demander la création d’un espace institutionnel afin de déposer et publier ses données de recherche, dont il assure l’administration et la curation. Fin 2024, soixante établissements bénéficient d’une collection institutionnelle sur la plateforme. On note une augmentation significative du volume stocké qui atteint 22 To (moins de 14 To en 2023). Sur la période juillet 2022-décembre 2024, les fichiers déposés ont été téléchargés 1,65 millions de fois. Le développement du catalogue se poursuit suite à la publication des entrepôts recommandés par le Comité pour la Science Ouverte.

Le travail sur l’architecture technique cible, prenant en compte des enjeux de sécurité, de souveraineté et d’évolutivité est initié. Il doit permettre de migrer courant 2025 sur des data centres labellisés de l’ESR (ADAGE, GRICAD, DrOcc). La participation à une proposition de projet européen coordonnée par le CSC, FIDELIS, a été couronnée de succès. Ce projet commencera début 2025 avec l’ambition de créer un réseau des entrepôts de confiance à l’échelle européenne.

Le nouveau directeur de l’unité mixte de service (UMS) en charge de la plateforme de données a pris ses fonctions en septembre 2024. Sa priorité est de constituer et organiser son équipe et d’obtenir de nouvelle source de financement via des réponses à des appels à projet.

La convention constitutive de l’UMS en charge de la plateforme avec les universités de Grenoble, Lorraine, Strasbourg et Franche Comté est en cours de finalisation, ce qui permettra  un lancement officiel chez tous les partenaires début 2025.

Perspectives

La plateforme de données est une des composantes de Recherche Data Gouv qui doit déposer un dossier de candidature pour être reconnu comme infrastructure de recherche de type IR dans la feuille de route nationale des IR révisée en 2025.

Des réponses à des appels à projets (Fonds de transformation de l’action publique, Appel à projet européen EuroHPC – AI Factory française , appels à projets EOSC) doivent permettre d’accompagner les développements de l’entrepôt et du catalogue de données.

La certification Core Trust Seal devrait être obtenue en 2025.

 

Contact : num4sci-contact@inrae.fr