Documenter ses données revient à les décrire au moyen de métadonnées, ce qui permet de faciliter leur stockage, leur consultation et leur réutilisation, par vous-même ou pas un tiers.
Les métadonnées complètent les données, en apportant des informations sur leur collecte, leur provenance, leur auteur, leur interprétation, etc. Certaines métadonnées sont générées automatiquement lors de la production des données (la date et l’heure de production par exemple), d’autres doivent être saisies manuellement.
Mais pour qu’elles soient réutilisables, ces métadonnées doivent être organisées de manière standardisée : c’est pourquoi il est préférable de choisir un schéma de métadonnées préexistant.
Un schéma de métadonnées décrit l’organisation logique des différentes métadonnées. Il permet de préciser l’information décrite, le type d’information souhaitée (par exemple du texte, ou des chiffres entiers) et la norme selon laquelle ces informations doivent être indiquées (par exemple, la norme ISO 8601 indique qu’une date doit être écrite selon le format AAAA-MM-JJ).
Il existe différents schémas de métadonnées en fonction du type de données, de la discipline, ou encore de l’entrepôt choisi. Choisir le bon schéma est essentiel pour favoriser l’interopérabilité et la réutilisation de ses données.
Quelques exemples de schémas :
- Dublin Core, un modèle généraliste (https://www.dublincore.org/)
- NeXus data format, pour l’analyse et la visualisation de données provenant de méthodes basées sur des neutrons, des rayons X ou des muons (http://www.nexusformat.org/)
- LIDO, pour la description d’objets des cultures matérielles (https://cidoc.mini.icom.museum/working-groups/lido/lido-overview/)
- EAD pour les archives et manuscrits (https://www.bnf.fr/fr/ead-encoded-archival-description)
- TEI pour la représentation numérique de données textuelles (https://tei-c.org/)
Pour vous aider à choisir le schéma le plus adapté à votre cas, voici quelques répertoires de standards de métadonnées :
- https://www.dcc.ac.uk/guidance/standards/metadata
- http://rd-alliance.github.io/metadata-directory/tools/
- https://fairsharing.org/
Il est possible d’enrichir la description en associant à vos données des fichiers supplémentaires de documentation, tels qu’un plan de gestion de données, un fichier décrivant la méthodologie de production, une liste des abréviations, une liste des unités de mesure, etc.
Liens utiles :
- A propos du choix de standard de métadonnée : https://doranum.fr/metadonnees-standards-formats/standard-metadonnees_10_13143_y5py-w521/
- Pour aller plus loin sur la documentation de ses données : https://guides.etalab.gouv.fr/qualite/documenter-les-donnees/#description-generale-du-jeu-de-donnees