EvocSpa

Elaboration d'un vocabulaire contrôlé pour les sciences du patrimoine

Responsabilité scientifique :

  • Loïc Bertrand
  • Caroline Corbières
  • Sophie David

Partenariat :

  • DIM PAMIR

Financement :

  • DIM PAMIR

ID projet : IDF-DIM-PAMIR-2023-A-004

Descriptif :

L’objectif de ce stage est de construire un vocabulaire contrôlé bilingue en sciences du patrimoine interrogeable par une chaîne de traitement pour créer des requêtes bibliographiques, et par suite de faire de la veille documentaire. La construction du vocabulaire contrôlé s’appuiera sur l’extraction de mots-clés issus des titres, résumés et mots-clés du corpus mis au point dans le cadre du projet OBISPA et sur des entretiens avec des spécialistes des sciences du patrimoine. Les activités du stagiaire sont les suivantes :

  • faire un état de l’art des vocabulaires en sciences du patrimoine existants ; construire un vocabulaire contrôlé bilingue de mots-clés en sciences du patrimoine ;
  • proposer une chaîne de traitement requêtant le vocabulaire contrôlé pour faire de la veille bibliographique ;
  • évaluer les résultats de la chaîne de traitement ; rédiger un rapport rendant compte des résultats obtenus.

Pour réaliser ce travail, on s’appuiera sur les outils utilisés et développés par les membres du projet OBISPA, à savoir :

  • Zotero pour accéder au corpus ;
  • les codes Python et Javascript développés par les bibliothécaires – sous forme de notebooks Jupyter – pour analyser le corpus augmenté (analyse lexicale et analyse des réseaux de citation) ;
  • Jupyter notebook pour développer un code Python requêtant le vocabulaire contrôlé ; Git pour déposer le code développé ;
  • les bases bibliographiques Google Scholar, Hal, Scopus et Web of Science pour faire des requêtes bibliographiques.