Bienvenue sur DokuPedia, wiki universitaire consacré à la documentation. Vous êtes invités a créer un compte et à contribuer, en ajoutant un nouvel article ou en modifiant celui-ci.
Vous pouvez également utiliser le moteur ou l'améliorer
Google Custom Search

STAR : numérisation des thèses

Un article de DokuPedia.

Une thèse est l’aboutissement des recherches scientifiques d’un doctorant sur un sujet qu’il a choisi d’étudier. Au bout de 3 ans (en général) il soutient sa thèse (sorte de mémoire plus complexe) devant un jury afin d’obtenir le diplôme de doctorat.

Pour une meilleure valorisation une thèse doit être rédigée et structurée suivant une procédure définie que le doctorant trouve dans le « le guide pour la rédaction et la présentation des thèses », rubrique présentation d’une thèse ou dans son établissement d’origine qui l’informe sur la structuration de la thèse et la feuille de style.

Suite à l’arrêté du 7 août 2006 relatif aux modalités de dépôt, de signalement, de reproduction, de diffusion et de conservation des thèses ou des travaux présentés en soutenance en vue du doctorat, l’établissement peut choisir le dépôt sous forme papier ou électronique.

Dans le cas où c’est le dépôt électronique qui est choisi il s’effectuera par l’application STAR (Signalement des Thèses, Archivage et Recherche).


Sommaire

La numérisation des thèses : TEF

L'AFNOR (Association française de normalisation) organisme français de normalisation, a défini un jeu de métadonnées pour les TEF[1]. TEF comprend un ensemble de métadonnées structurées afin de favoriser l’échange et la diffusion d’informations sur le plan national et international des thèses.


Métadonnées

Les thèses étant à la fois un travail scientifique (jugé par des experts), une réalisation intellectuelle (assujettie, au droit de la propriété intellectuelle) et un document administratif (débouchant sur un diplôme) les métadonnées de TEF suivent ces trois dimensions de la thèse.

Les métadonnées qu’il regroupe sont descriptives et de gestion:

  • Métadonnées descriptives sont des données bibliographiques : trouver, identifier, sélectionner une œuvre.
  • Métadonnées de gestion regroupent 3 métadonnées :
    • Métadonnées administratives : nom de l’auteur, titre de la thèse, membres du jury…
    • Métadonnées de droits : droit de la propriété intellectuelle…
    • Métadonnées de conservation : archivage pérenne


Entités

TEF, en s’appuyant sur le modèle FRBR (Functional Requirements for Bibliographic Records[2]), expose 5 entités, leurs propriétés et leurs relations. Ces entités sont la thèse, la version, l’édition, le fichier et la ressource externe.

  • Thèse : œuvre présentée devant un jury, aboutissant au diplôme de doctorat.
    • Propriétés: titre, sujet, type de ressource, langue, auteur, numéro national, diplôme, directeur de thèse, autorisation du chef de l’établissement, autorisation de l’auteur…
  • Version : comprend soit le texte intégral de la thèse validée par le jury (version complète) soit une version tronquée (version incomplète).
    • Propriétés: contenu (ressources externes présentes ou manquantes), identifiant, état juridique.
  • Édition : manifestation (matérialisation d’une expression) de la thèse comprenant une édition:
    • Propriétés: format, taille, identifiant, éditeur, date d’édition.
      • XML
      • HTML
      • ou deux éditions différentes XML ou PDF.

Une édition peut correspondre à un (en général pour du PDF) ou plusieurs fichiers (en général pour du XML et HTML).

  • Fichier: correspond à une partie de manifestation qui est un fichier électronique. Cette partie est matériellement indépendante de tout.
    • Propriétés: encodage, format, structure, taille…
  • Ressource externe : qui existe avant la thèse, dont l’auteur s’est servi pour son œuvre (empruntée à un tiers).
    • Propriétés: titre, auteur, autorisation ayant-droit…

Des agents (personnes physiques ou morales) tendent autour de ces entités : Auteur - établissement de soutenance - directeur de thèse - président du jury - membre du jury - partenaire de recherche – éditeur.


Format XML

C’est le format XML (Extensible Markup Language[3]) qui détermine la structure et le contenu d’une notice TEF. C’est un format d’échange et un outil de validation. Il s’appuie sur le schéma: *METS (Metadata Encoding and Transmission Standard), vocabulaire XML, qui permet de structurer différentes métadonnées se référant à un thème numérique complexe comme les sites web, les revues numériques…

  • TEF est un format d’échange qui accepte que différentes applications puissent échanger des données de thèses grâce à ses opérations d’exportation et d’importation.


STAR

Introduction

Image:Dico.jpg Suite à l’arrêté du 7 août 2006la production et la diffusion des thèses sous forme électronique prennent une dimension nouvelle.

Ces changements interviennent dans les modalités de dépôt, de signalement, de reproduction, de diffusion et de conservation des thèses.

  • L’ABES( Agence Bibliographique de l’Enseignement Supérieur) a développé une nouvelle application baptisée STAR (Signalement des Thèses, Archivage et Recherche).
  • STAR servira d’intermédiaire entre l’établissement de soutenance (modalités de dépôt) et le signalement par le Sudoc: Système universitaire de documentation, catalogues locaux, la diffusion par le CINES: Centre Informatique National de l'enseignement supérieur, établissements de soutenances... et la conservation des thèses (CINES).

STAR jouera le rôle de plate forme de dépôt des thèses.


Les objectifs et le rôle de STAR

Les objectifs

  • Enregistrement du dépôt de la thèse ( édition de diffusion, édition d’archivage et métadonnées de la thèse).
  • Signalement de la thèse dans le catalogue et le portail Sudoc.
  • Attribution d’une URL (Uniform Resource Locator[4]) pérenne.
  • Envoi de l’édition d’archivage, même dans le cas où une thèse est non diffusable, au CINES.

Si l’établissement le demande,l'on peut envoyer les métadonnées et/ou la diffusion de la thèse vers les sites de diffusion qu’il aura désignés.


Son rôle

L’application STAR joue un rôle d’intermédiaire. STAR permet de collecter les métadonnées descriptives et de gestion de la thèse, d’enregistrer son dépôt, d’en extraire ses métadonnées qui déclenchent le signalement et l’indexation de la thèse au SUDOC[5] et l’archivage par le CINES, et d’attribuer à la thèse un identifiant permanent et gestion des ses liens avec les différents URL de manière à permettre l’accès pérenne de la thèse quel que soit le serveur de diffusion. En résumé les fonctionnalités de STAR sont l’archivage, le signalement et la diffusion. Attention STAR n’est ni un catalogue SUDOC des thèses, ni un outil de diffusion, ni une chaine de transformation.


Les acteurs de STAR

Pour enregistrer les métadonnées descriptives et les métadonnées de gestion (administration, droit, conservation) l’application STAR fait appel à 4 acteurs de l’établissement de la thèse:

  • L’acteur DÉPOSANT:
    • Il représente l’administration locale de l’établissement. Il est responsable du dépôt de la thèse. Son rôle est de saisir les métadonnées de gestion (identité du doctorant, discipline, date de soutenance, directeur de thèse, président du jury, rapporteur, titre de la thèse etc..) et les métadonnées juridiques (thèse soumise à une période de confidentialité? Autorisation du doctorant à diffuser sa thèse, par quels usages? Ressources des tiers et des droits liés).
    • L’acteur déposant valide son travail dans l’application STAR.
  • L’acteur DOCTORANT:
    • Il doit saisir certaines métadonnées descriptives : les mots clés et le résumé de sa thèse.
    • L’acteur doctorant ne peut pas valider son travail.
    • Son intervention n’est pas obligatoire, si elle est inexistante c’est l’acteur bibliothèque qui se substituera à l’acteur doctorant.
  • L’acteur BIBLIOTHÈQUE :
    • Il est responsable des métadonnées descriptives (saisie du numéro national de thèse, des mots clés et du résumé de la thèse si l’acteur doctorant absent, liens aux autorités Sudoc …).
    • S’il n’est pas d’accord avec l’acteur déposant au sujet du titre de la thèse il peut bloquer la validation du dépôt de la thèse jusqu’à ce que les corrections aient été faites.
  • L’acteur VALIDATEUR :
    • Il représente l’établissement délivrant le diplôme. Il vérifie les données saisies des autres acteurs, ensuite il valide le dépôt de la thèse électronique.
    • Si l’acteur validateur est en désaccord avec un autre acteur il a la capacité d’annuler la validation de cet acteur.
    • C’est l’acteur validateur qui par sa dernière validation permet à l’application STAR de déclencher le signalement, l’archivage, l’indexation, l’URL pérenne.


STAR : comment ça marche ?

STAR est utilisé via internet (pas de logiciel à installer par l’établissement). Il est recommandé d’utiliser l’application STAR à l’aide du navigateur Firefox.


La fiche de thèse

Une fois connecté au site de STAR, l’acteur déposant crée la fiche de thèse en la renseignant sur le doctorant et sa thèse. La fiche de thèse est ensuite alimentée par les acteurs déposant, doctorant et bibliothèque. Une fois remplie et validée (sauf pour l’acteur doctorant) la fiche est soumise à l’acteur validateur qui approuve ou non.

S’il approuve l’application STAR lance le processus de validation et de diffusion.


Importer/Exporter la thèse dans STAR

  • Les établissements ne devront envoyer à STAR que du TEF. Pour cela ils pourront utiliser soit du TEF incomplet, alimenté par d’autres logiciels, comme APOGEE, ou du TEF complet.
  • Pour un dépôt électronique de la thèse le format du document doit être:
    • Pour la conservation pérenne sous la forme XML ou PDF/A (PDF Archive).
    • Pour la diffusion c’est l’établissement qui choisit, les formats HTML ou PDF sont les plus courants.


Questions juridiques

La thèse est considérée comme un document administratif mais aussi scientifique:

  • Le doctorant donne son accord ou non pour la diffusion et la reproduction de sa thèse. Si le doctorant a utilisé des passages ou images d’autres auteurs dans sa thèse sans leur accord elle ne peut pas être publiée dans son intégralité, alors ce sera une thèse incomplète (sans les images ou passages des autres auteurs) qui sera diffusée. En revanche s’il y a un accord avec l’auteur ou si le doctorant n’a pas utilisé d’image ou de passage d’un tiers, ce sera une thèse complète qui sera diffusée.
  • La responsabilité des droits des autres ayants-droit incombe au doctorant.
  • C’est le président de l’établissement d’origine qui établit le caractère confidentiel (durée limitée) d’une thèse. Une thèse à caractère confidentiel ne peut ni être reproduite ni être communiquée.
  • La communication et la diffusion des thèses (sauf celles qui sont confidentielles) se fait par l’établissement d’origine.

Références

  1. Thèses Electroniques Françaises
  2. Spécifications fonctionnelles des notices bibliographiques
  3. langage de balisage extensible
  4. localisateur uniforme de ressource
  5. Système universitaire de documentation


Liens internes

Liens externes

DokuPedia sémantique