Vous pouvez également utiliser le moteur ou l'améliorer
Thésaurus
Un article de DokuPedia.
Sommaire
|
Le Thésaurus
Qu'est-ce qu'un Thésaurus?
Le Thésaurus est un système codé utilisé pour marquer chaque document appartenant au même fond documentaire, d’un indice, et de le classer à sa place selon cet indice. Le thésaurus est donc un index.
À la différence du classement des ouvrages par ordre alphabétique d’auteur, par numéro d’enregistrement, ou par taille d’ouvrage, la classification par indexation est basée sur le contenu de l’ouvrage.
L’indice attribué individuellement à chaque document va permettre, à chacun d'eux, d’être classé individuellement et logiquement, parmi les autres, ainsi que d’être retrouvé facilement à sa place, exclusivement en fonction du contenu de chaque unité documentaire.
L’utilisation d’un thésaurus permet donc d’articuler un classement documentaire global cohérent, en fonction du thème.
Le Thésaurus sert également à représenter les trames de relations qui s’établissent entre chacun de ces thèmes ainsi qu’à les classifier hiérarchiquement.
Étant donné qu’il s’agit d’un système codé ayant pour but de rendre un contenu initial, sous une forme secondaire plus apte au traitement et à l’utilisation de l’information, on dit qu’il s’agit d’un Langage Documentaire.
Quel est l’objectif du Thésaurus?
Le Thésaurus est un outil de travail
Le thésaurus est un outil de travail essentiel à toute construction de systèmes d’information. En participant à l’organisation de la connaissance, il facilite l’analyse documentaire:
- par thèmes
- par termes
- par relations entre termes
Le thésaurus permet aux chercheurs d’informations d’identifier et de récupérer du vocabulaire, alors qu’il facilite aux indexeurs la prévision des mots qui peuvent être utilisés pour référencer un concept.
Le Thésaurus a cinq fonctions principales
| Les Fonctions du Thésaurus | |
| Fonction nº1 | Caractériser le sujet contenu dans un document. |
| Fonction nº2 | Lister sélectivement les termes les plus appropriés en fonction d’un domaine de la connaissance. |
| Fonction nº3 | Contrôler/ restreindre le vocabulaire. |
| Fonction nº4 | Clarifier l’ensemble de signifiants qu’un terme est sensé couvrir. |
| Fonction nº5 | Optimiser l’accès à l’information contenue dans un document ou bien dans une base de données. |
De quoi est constitué un Thésaurus?
Un Thésaurus est constitué de :
| Les Éléments constitutifs du Thésaurus | |
| 1. termes - (unitermes) ou bien de descripteurs |
Chacun de ces termes peut être :
|
| 2. relations entre termes | Il s’agit de relations sémantiques entre un terme A et un terme B qui aident à diriger vers le terme correct et qui aident à mieux comprendre le sens d’un terme. |
Les Trois Principes de Base du Thésaurus
| Les Trois Principes de Base du Thésaurus | |
| Principe nº 1 - Un Seul Descripteur par Concept |
Pour créer un thésaurus, il faut décomposer le document sous analyse en autant d’éléments signifiants pour la recherche. Une seule entrée lexicale regroupe :
|
| Principe nº 2 - Un Langage Univoque et post-coordonné |
Exemple de langage univoque :
C’est un langage qui a recours aux opérateurs booléens pour l’usage de la post coordination :
|
| Principe nº 3 - des termes relationnés entre eux |
Elles indiquent des relations de proximité entre des termes situés en des hiérarchies différentes. Ce sont des passerelles entre différents champs sémantiques du domaine.
|
Méthodes et Principes de Construction du Thésaurus
Méthodes et Principes de Construction du Thésaurus
La construction d’un thésaurus suit l’une des méthodes suivantes :
- 1- Principe de la Méthode Déductive :
Les concepts sont extraits de documents et de questions des utilisateurs, ou à partir des index d’une base de données. On part d’un support existant et on caractérise le sujet du document, ses termes et ses relations entre termes.
- 2- Principe de la Méthode Inductive :
On collecte des mots à partir de sources de références génériques, telles que dictionnaires, nomenclatures, thésauri voisins, etc..
- 3- Principe de la Méthode Mixte :
On utilise une combinaison des deux méthodes précédentes, ce qui permet de bien refléter le vocabulaire d’origine et de vérifier l’exhaustivité de la collecte.
Les Deux Types de Thésauri
On peut classifier les types de Thésauri en deux catégories :
- 1 - Les Thésauri Énumératifs qui listent explicitement tous les termes préférés.
- 2- Les Thésauri partiellement synthétiques qui listent indirectement les termes préférés.
La Présentation du Thésaurus
En ce qui concerne la présentation, le Thésaurus est constitué de trois élements :
- une liste alphabétique des descripteurs.
- une arborescence des descripteurs (champs sémantiques avec léger décalement vers la droite, ou de façon graphique, du genre schéma fléché.
- un index permuté des termes qui permet de regrouper les termes des noms composés qui se trouvents dispersés dans la liste alphabétique.
Le Thésaurus et les Normes
- La Norme Nationale qui règlemente le Thésaurus
- Norme Z47100 :1981
- Les Normes Internationales qui règlementent le Thésaurus
- une norme s’appliquant au Thésauri Monolingues : ISO 2788 :1986
- une norme s’appliquant au Thésauri Multilingues : ISO 5964 :1985
Voir aussi
- Trouver la notion thésaurus sur l'internet des sciences de l'information et de la communication
- Thésaurus en médecine
- Thésaurus Motbis
- Descripteurs - Site dédié aux thésaurus et vocabulaires contrôlés francophones pour l'information

