Aperçu du modèle de données

Cette section décrit les liens entre Fedora Commons, Solr, Django, eulfedora et liberuditarticle.

Résumé

  • Les modèles Django décrivent les objets stockés dans Fedora Commons;
  • Les articles et revues sont stockées dans Fedora Commons;
  • Django utilise eulfedora pour récupérer les objets Fedora Commons;
  • liberuditarticle est utilisé pour parser le contenu des articles;
  • Les documents Solr sont des descriptions des objets Fedora Commons.

Modèles Django

Les trois modèles suivants sont utilisés pour récupérer les données des articles scientifiques:

  • Journal (une revue, scientifique ou savante)
  • Issue (une publication de cette revue)
  • Article

Le modèle suivant est utilisé pour récupérer les données des Thèses:

  • Thesis

Récupération des données dans Fedora

Les modèles Django implémentent le FedoraMixin. Le mixin implémente une méthode get_full_identifier() qui retourne l’identifiant qui permet de récupérer l’objet dans Fedora. FedoraMixin utilise la librairie eulfedora. pour se connecter à Fedora et retourne un objet d’un type défini dans le module erudit.fedora.objects Chaque type d’objet contenu dans Fedora présente des particularités. Le module objects permet de faire abstraction de ces particularités.

Par exemple, on peut accéder à la page couverture d’un numéro avec le code suivant:

issue.get_fedora_object().coverpage

liberuditarticle

Certain champs de l’objet Fedora sont en format XML. Nous utilisons la librairie liberuditarticle pour extraire l’information pertinente des objets Fedora.

Solr

Cette section décrit les champs d’un document indexé dans Solr.

Correspondance entre le document indexé dans Solr et les modèles Django

On utilise les identifiants de l’article pour faire la correspondance entre le document Solr, Django et Fedora.

  • ID: identifie l’article dans Fedora. Correspond au localidentifier d’un Article
  • NumeroID: identifie le numéro dans Fedora. Correspond au localidentifier d’un Issue
  • RevueID identifie la publication dans Fedora. Correspond à localidentifier de Journal

Recherche générale

  • Titre_fr, Titre_en: titres de l’article en français et en anglais;
  • Resume_fr, Resume_en: résumé de l’article en français et en anglais;
  • Auteur_tri: (à vérifier) auteur principal de l’article;
  • Auteur_fac: liste des auteurs de l’article;
  • AuteurNP_fac: (à vérifier) liste des auteurs de l’article dans un format plus pratique pour la citation;
  • Affiliation_fac: affiliation de l’auteur;
  • RefBiblio_aff: références bibliographiques de l’article;
  • ISSNNum: ISSN de l’article;
  • ISBNNum: ISBN du livre;

À identifier: mots clé, ouvrage recensé.

Recherche par Types

  • Corpus_fac: identifie le corpus duquel fait partie le document. Utilisé pour faire la recherche par type. Prend une des valeurs suivantes:
    • Article: article de revue scientifique;
    • Culturel: article de revue culturelle;
    • Actes: actes de colloque;
    • Thèses: thèses;
    • Livres: livres;
    • Depot: document déposé dans le dépôt de données (littérature grise)

Recherche par Date

  • AnneePublication: année de publication de l’article;
  • DateAjoutErudit: date d’ajout de l’article dans érudit

Recherche par Fonds

  • Fonds_fac: identifie le fond duquel l’article fait partie. Utilisé pour la recherche par fonds. Prend une des valeurs suivantes:
    • Érudit: stocké sur Érudit;
    • UNB: University of New-Brunswick;
    • Persée: Persée;