Plus de 60 collections institutionnelles sur la plateforme de données de Recherche Data Gouv 

 

L’entrepôt de données et catalogue Data INRAE, déployé en 2017, est devenu la plateforme de données de recherche.data.gouv.fr en 2021, à la demande du ministère de l'Enseignement supérieur et de la Recherche. Développée en moins d’un an et inaugurée par la ministre le 8 juillet 2022, elle offre aux acteurs de l’ESR français un dispositif fédéré et mutualisé évitant à chacun de lourds investissements. Elle s’intègre dans l’écosystème français et européen des données de la recherche (entrepôts thématiques et disciplinaires, EOSC, etc.). 

 

Contexte et enjeux

INRAE porte avec ses partenaires le développement de la plateforme de données de Recherche Data Gouv. Des équipes des directions pour la Science ouverte (DipSO) et des Systèmes d’information (DSI) sont impliquées depuis 2021. Ce type de plateforme fédérée et mutualisée doit offrir des services de qualité pour être considérée comme un « entrepôt de confiance » pour les données de recherche. Une démarche de certification « Core Trust Seal » est engagée, à l’image de HAL pour les publications.

Résultats 

Fin 2024, soixante établissements bénéficient d’une collection institutionnelle sur la plateforme. On note une augmentation significative du volume stocké qui atteint 22 To (moins de 14 To en 2023). Sur la période juillet 2022-décembre 2024, les fichiers déposés ont été téléchargés 1,65 millions de fois. Le développement du catalogue se poursuit suite à la publication des entrepôts recommandés par le Comité pour la Science Ouverte. Le travail sur l’architecture technique cible, prenant en compte des enjeux de sécurité, de souveraineté et d’évolutivité est initié. Il doit permettre de migrer courant 2025 sur des data centres labellisés de l’ESR (ADAGE, GRICAD, DrOcc). La participation à une proposition de projet européen coordonnée par le CSC, FIDELIS, a été couronnée de succès. Ce projet commencera début 2025 avec l’ambition de créer un réseau des entrepôts de confiance à l’échelle européenne. 

Le nouveau directeur de l’unité mixte de service (UMS) en charge de la plateforme de données a pris ses fonctions en septembre 2024. Sa priorité est de constituer et organiser son équipe et d’obtenir de nouvelle source de financement via des réponses à des appels à projet. 

La convention constitutive de l’UMS en charge de la plateforme avec les universités de Grenoble, Lorraine, Strasbourg et Franche Comté est en cours de finalisation, ce qui permettra  un lancement officiel chez tous les partenaires début 2025.
 Perspectives

La plateforme de données est une des composantes de Recherche Data Gouv qui doit déposer un dossier de candidature pour être reconnu comme infrastructure de recherche de type IR* dans la feuille de route nationale des IR révisée en 2025.

Des réponses à des appels à projets (Fonds de transformation de l’action publique, Appel à projet européen EuroHPC – AI Factory française , appels à projets EOSC) doivent permettre d’accompagner les développements de l’entrepôt et du catalogue de données.

La certification Core Trust Seal devrait être obtenue en 2025.
 

Références bibliographiques

Recherche data Gouv. (s. d.). Recherche Data Gouv. Un écosystème au service du partage et de l'ouverture des données de la recherche. Consulté le 9 avril 2025. https://recherche.data.gouv.fr/fr   

 

Vous avez une question ?

Contactez-nous