Recommandations et bonnes pratiques

Plan de gestion des données

Pour permettre à chaque projet ou unité de prendre en compte l’archivage dès la production des données et durant tout le cycle de vie de celles-ci, il est essentiel de renseigner un plan de gestion de données. Ainsi, il est possible de traiter l’ensemble des questions liées aux données dans le cadre d’un projet, dont le devenir de celles-ci sans oublier les documents qui participent à leur compréhension (cahier de laboratoire par exemple).

Durée de conservation et sélection des données

Toutes les données produites par un projet de recherche n’ont pas un intérêt à être conservées. Les données peuvent être conservées si elles ont une valeur juridique, scientifique ou patrimoniale et détruites dans le cas contraire.

Il est important de lister l’ensemble des données produites dans le cadre d’un projet (données recueillies, collectées, acquises, brutes, données intermédiaires ou travaillées, données de résultat) et de réfléchir aux données à conserver et pour quelles raisons.

Pendant la durée du projet puis entre 5 et 10 ans après la fin de celui-ci, les données à conserver sont notamment celles permettant la validation des résultats et celles ayant une valeur de preuve ou un potentiel de réutilisation.

Au-delà de cette période les questions suivantes peuvent être posées afin d’envisager une conservation plus longue : les données sont-elles documentées et organisées ? Sont-elles lisibles et enregistrées dans des formats pérennes ? Sont-elles reproductibles et à quel coût ? Pourront-elles faire l’objet de traitements complémentaires ? Pourront-elles être exploitées ultérieurement pour d’autres usages? Sont-elles uniques et quelles seraient les conséquences d’une perte de celles-ci ?

Pour les données à caractère personnel, une durée de conservation est à déterminer avant le lancement du projet. Celles-ci devront être détruites sauf si elles présentent une valeur scientifique, statistique ou historique.

La réflexion concernant la sélection des données à conserver et la durée pendant laquelle les conserver pourra être menée en plusieurs temps au gré du projet et évoluer dans le temps.

Gestion physique des données

Les données sont à organiser en les classant selon un plan et en instaurant des règles de nommage.

Un lieu de stockage est à définir. Celui-ci peut-être un espace intermédiaire pour un temps avant une pérennisation grâce au recours à une plateforme d’archivage numérique.

Prérequis techniques pour la préservation

Métadonnées

L’identification des données est primordiale. Les métadonnées donnent ainsi davantage de valeur aux données décrites. Elles permettent également de faciliter l’accès aux données, de les rendre intelligibles et réutilisables.

Il est préconisé d’utiliser autant que possible des standards de métadonnées. Des métadonnées de plusieurs types sont à renseigner : métadonnées descriptives (au minimum : identifiant, nom de l’unité ou du projet, auteur, nature des données, type, date), de gestion (au minimum : durée de conservation, sort final) et techniques (au minimum : format, logiciel de lecture). Ces métadonnées permettront d’envisager la pérennisation des données cependant un travail complémentaire sera à mener.

Format

Le format des données est également un préalable pour la pérennisation de celles-ci. Il est recommandé d’utiliser des formats spécifiés, ouverts ou libres de droit et normalisé ou largement diffusés.

Afin qu’il soit possible de pérenniser un format, celui-ci doit être valide et bien formé par rapport à ses spécifications. L’outil FACILE du CINES permet d’effectuer ces vérifications.