Bienvenue sur DokuPedia, wiki universitaire consacré à la documentation. Vous êtes invités a créer un compte et à contribuer, en ajoutant un nouvel article ou en modifiant celui-ci.
Vous pouvez également utiliser le moteur ou l'améliorer
Google Custom Search

Thésaurus

Un article de DokuPedia.


Sommaire

Le Thésaurus

Qu'est-ce qu'un Thésaurus?

Le Thésaurus est un système codé utilisé pour marquer chaque document appartenant au même fond documentaire, d’un indice, et de le classer à sa place selon cet indice. Le thésaurus est donc un index.

À la différence du classement des ouvrages par ordre alphabétique d’auteur, par numéro d’enregistrement, ou par taille d’ouvrage, la classification par indexation est basée sur le contenu de l’ouvrage.

L’indice attribué individuellement à chaque document va permettre, à chacun d'eux, d’être classé individuellement et logiquement, parmi les autres, ainsi que d’être retrouvé facilement à sa place, exclusivement en fonction du contenu de chaque unité documentaire.

L’utilisation d’un thésaurus permet donc d’articuler un classement documentaire global cohérent, en fonction du thème.

Le Thésaurus sert également à représenter les trames de relations qui s’établissent entre chacun de ces thèmes ainsi qu’à les classifier hiérarchiquement.

Étant donné qu’il s’agit d’un système codé ayant pour but de rendre un contenu initial, sous une forme secondaire plus apte au traitement et à l’utilisation de l’information, on dit qu’il s’agit d’un Langage Documentaire.

Quel est l’objectif du Thésaurus?

Le Thésaurus est un outil de travail

Le thésaurus est un outil de travail essentiel à toute construction de systèmes d’information. En participant à l’organisation de la connaissance, il facilite l’analyse documentaire:

  • par thèmes
  • par termes
  • par relations entre termes

Le thésaurus permet aux chercheurs d’informations d’identifier et de récupérer du vocabulaire, alors qu’il facilite aux indexeurs la prévision des mots qui peuvent être utilisés pour référencer un concept.

Le Thésaurus a cinq fonctions principales

Les Fonctions du Thésaurus
Fonction nº1Caractériser le sujet contenu dans un document.
Fonction nº2Lister sélectivement les termes les plus appropriés en fonction d’un domaine de la connaissance.
Fonction nº3Contrôler/ restreindre le vocabulaire.
Fonction nº4Clarifier l’ensemble de signifiants qu’un terme est sensé couvrir.
Fonction nº5Optimiser l’accès à l’information contenue dans un document ou bien dans une base de données.

De quoi est constitué un Thésaurus?

Un Thésaurus est constitué de :


Les Éléments constitutifs du Thésaurus
1. termes - (unitermes) ou bien de descripteurs
  • S’agissant d’un seul mot, on le désignera « terme ».
  • S’agissant d’un ensemble de deux mots ou plus, on parlera de « descripteurs ».

Chacun de ces termes peut être :

    • un Terme Générique (TG) ;
    • un Terme Associé (TA) à un autre ;
    • un Terme Spécifique (TS) ;
    • un Terme Préféré (pour les termes les plus suggérés aux indexeurs/ chercheurs)
    • un Terme Non Préféré (pour les termes qui ne doivent pas être utilisés par les indexeurs/ chercheurs)
    • un synonyme
    • un synonyme interdit
2. relations entre termesIl s’agit de relations sémantiques entre un terme A et un terme B qui aident à diriger vers le terme correct et qui aident à mieux comprendre le sens d’un terme.


Les Trois Principes de Base du Thésaurus

Les Trois Principes de Base du Thésaurus
Principe nº 1 - Un Seul Descripteur par Concept

Pour créer un thésaurus, il faut décomposer le document sous analyse en autant d’éléments signifiants pour la recherche. Une seule entrée lexicale regroupe :

    • un descripteur
    • des mots outils sans signification indépendante
    • des termes équivalents, synonymes
Principe nº 2 - Un Langage Univoque et post-coordonné

Exemple de langage univoque :

    • Produits agricoles
      • Agriculture biologique

C’est un langage qui a recours aux opérateurs booléens pour l’usage de la post coordination :

  • ET
  • OU
  • SAUF


Principe nº 3 - des termes relationnés entre eux
  • Relations d’équivalence ou de synonymie
    • (EM) - Employer - Derme (EM) Peau
    • (EP) - Employer Pour - Peau (EP) Derme


  • d'autres genres de relations d’équivalence :
    • Quasi synonymie : Panthère - Jaguar
    • Évolution de concepts : Calculateur électronique - Ordinateur
    • Noms de marque : Réfrigérateur - Frigidaire
    • Appellations courantes : Hifi - Haute Fidélité
    • Origines linguistiques différentes : Géomagnétisme - Magnétisme Terrestre


  • des relations hiérarchiques ou de filiations
    • (TG) - Terme Générique - Automobile
      • berline
      • break
      • coupé


  • des termes Spécifiques'(TS)' - -
    • écran (TS)
      • de Périphérique


  • des relations d’association ou de voisinage

Elles indiquent des relations de proximité entre des termes situés en des hiérarchies différentes. Ce sont des passerelles entre différents champs sémantiques du domaine.

    • (VA) - Voir Aussi - Maladie de Carence (VA) Malnutrition
    • (TA) - Terme Associé - Physiologie Végétale (TA) Botanique


Méthodes et Principes de Construction du Thésaurus

Méthodes et Principes de Construction du Thésaurus

La construction d’un thésaurus suit l’une des méthodes suivantes :


  • 1- Principe de la Méthode Déductive :

Les concepts sont extraits de documents et de questions des utilisateurs, ou à partir des index d’une base de données. On part d’un support existant et on caractérise le sujet du document, ses termes et ses relations entre termes.


  • 2- Principe de la Méthode Inductive :

On collecte des mots à partir de sources de références génériques, telles que dictionnaires, nomenclatures, thésauri voisins, etc..


  • 3- Principe de la Méthode Mixte :

On utilise une combinaison des deux méthodes précédentes, ce qui permet de bien refléter le vocabulaire d’origine et de vérifier l’exhaustivité de la collecte.



Les Deux Types de Thésauri

On peut classifier les types de Thésauri en deux catégories :

  • 1 - Les Thésauri Énumératifs qui listent explicitement tous les termes préférés.
  • 2- Les Thésauri partiellement synthétiques qui listent indirectement les termes préférés.


La Présentation du Thésaurus

En ce qui concerne la présentation, le Thésaurus est constitué de trois élements :

  • une liste alphabétique des descripteurs.
  • une arborescence des descripteurs (champs sémantiques avec léger décalement vers la droite, ou de façon graphique, du genre schéma fléché.
  • un index permuté des termes qui permet de regrouper les termes des noms composés qui se trouvents dispersés dans la liste alphabétique.

Le Thésaurus et les Normes

  • La Norme Nationale qui règlemente le Thésaurus
    • Norme Z47100 :1981


  • Les Normes Internationales qui règlementent le Thésaurus
    • une norme s’appliquant au Thésauri Monolingues : ISO 2788 :1986
    • une norme s’appliquant au Thésauri Multilingues : ISO 5964 :1985


impression

Voir aussi

DokuPedia sémantique