Bienvenue sur DokuPedia, wiki universitaire consacré à la documentation. Vous êtes invités a créer un compte et à contribuer, en ajoutant un nouvel article ou en modifiant celui-ci.
Vous pouvez également utiliser le moteur ou l'améliorer
Google Custom Search

Thésaurus en médecine

Un article de DokuPedia.

Cet article sur les thésaurus en médecine ne reprend pas les caractéristiques des thésaurus en général qui sont déjà abordées dans l’article Thésaurus. Cet article est écrit dans un langage aussi accessible que possible pour des personnes n’ayant pas étudié la médecine. Certains exemples peuvent paraître complexes mais cela permet de comprendre le système. Néanmoins, il peut en résulter des imprécisions pour les spécialistes.


Sommaire

Définition

Le thésaurus est utilisé pour décrire le contenu intellectuel d’un document par des termes précis.

« Un thesaurus peut être défini selon sa fonction ou selon sa structure 
Du point de vue de sa fonction, un thesaurus est un instrument de terminologie utilisé pour traduire en un langage artificiel moins libre (langage documentaire d’informations) le langage naturel employé dans les documents et par les indexeurs ou les utilisateurs, ainsi que pour revenir au langage naturel à partir du langage artificiel. Du point de vue de sa structure, le thesaurus est un vocabulaire organisé et dynamique de termes ayant entre eux des relations sémantiques et génériques et qui s’applique de façon exhaustive à un domaine particulier de la connaissance. Cette distinction entre fonction est structure servira à différencier les thesauri » : Marie-Thérèse Lautreille[1]

Les thésaurus sont définis par les normes AFNOR[2] et ISO[3]


Historique

La CIM

Les prémisses de la Classification Internationale des Maladies (CIM) s’amorcent en 1700 à Londres, lorsque J. Graunt établit les premières statistiques de cause de décès d’enfants en se basant sur des tables mortuaires. Ses études sont poursuivies par William Farr en 1853. Puis l’International Statistical Institute charge Claude Bertillon, en 1893, de préparer une "Nomenclature internationale des causes de Décès". La première révision de l’OMS (Organisation Mondiale de la Santé) date de 1900, elle s’appelait alors « Classification internationale des maladies, Traumatismes et Causes de Décès » puis à partir de 1948, « Classification internationale des maladies ». Son objectif est d’analyser et d’interpréter la mortalité (décès) et la morbidité (maladie) dans différents pays. Elle sera publiée en français dès 1974.


La SNOMED CT ® Internationale

Plus récente et plus étendue, la "Systematized NOmenclature of MEDicine" du College of American Pathologists (CAP), couvre tous les champs de la médecine. D’abord appelée en 1965 “Systematized NOmenclature of Pathology” (SNOP), elle est nommée en 1976 ; “Systematized Nomenclature of Médicine” puis en 1993 ; “ the Systematized NOmenclature of human and veterinary of MEDicine” (SNOMED III). Son but est d’établir précisément un compte-rendu anatomique et pathologique. Elle appartient à l'IHTSDO (International Health Terminology Standards Development Organization). SNOMED CT


Le MeSH

Enfin le Medical Subject Headings signifie en français « vedettes-matières » ou « descripteurs » dans le domaine médical. Ce thésaurus conçu en 1960 contient les termes biomédicaux de la National Library of Medicine (NLM- Bethesda ; USA) utilisé dans la base de données bibliographiques Medline.

Sa version française est disponible à l’ INSERM (Institut National de la Santé et de la Recherche Médicale) .

La classification médicale réalisée par les médecins est donc un des prémices du thésaurus. C’est ce qui lui vaut sa particularité d’intégrer encore aujourd’hui la classification dans le thésaurus.


Caractéristiques

Public

Les thésaurus en médecine sont créés et utilisés par des médecins et chercheurs puis plus largement par les personnels para-médicaux et toute personne ayant une activité d’action et de prévention de la santé (guide de montagne, secouriste…).


Structure

Les thésaurus en médecine associent la classification à l’organisation sémantique. Chaque terme est suivit du chiffre de sa catégorie. Ainsi l’utilisateur peut repérer les différents champs sémantiques auquel il appartient et cliquer sur les liens hypertextes pour naviguer dans les différentes catégories du thésaurus.


Terminologie

Vocabulaire

L’utilisation du grand public pour ces thésaurus est limitée par son utilisation, à cause de son vocabulaire précis non vulgarisé:

  • Exemple: on ne trouvera pas le terme « mal de tête » mais « céphalée ».

Ces thésaurus répondent donc à une recherche médicale qui comprend :

  • l’étude d’une maladie (nosologie) et comment la personne malade l’a contractée (étiologie).
  • ses agents pathogènes (germes, virus…).
  • son mode de contamination (interhumaine, zoogène…) et les traitements (médicaments, posologie, effets).


Evolution

Il arrive aussi que par l’évolution de la science ou par l’usage, les termes des maladies changent ou utilisent plusieurs dénominations ;

  • Exemple: Angor ou Angine de poitrine.


Usage

Les noms des médicaments n’apparaissent pas dans les thésaurus. Seuls les principes actifs (DCI : Dénomination Commune Internationale définie par l’OMS) sont répertoriés mais ces noms varient aussi:

  • Exemple :
    • Nom de marque : Aspirine ®
    • Principe actif : acide acétylsalycilique ou Acesal ou Acatosal

Le terme du matériel utilisé qui prend souvent le nom d’une marque dans le langage médical apparaitra dans le thésaurus par son nom commun:

  • Exemple:
    • CATHLON ® (nom de marque)
    • Cathéter (nom commun)

Illustration d’un exemple dans le langage courant :

  • Exemple:
    • Frigidaire est une marque
    • réfrigérateur est un nom commun


Multilinguisme

Les thésaurus en médecine sont traduits en plusieurs langues. Les difficultés rencontrées sont les synonymies dans une même langue et l’homonymie entre les langues. En effet seul des thésaurus très perfectionnés comme le MeSH sont capables de gérer cela. C'est-à-dire de créer des relations pour chaque langue et entre les langues avec les notes d’applications respectives. Les logiciels documentaires sont souvent limités à la traduction exacte du terme à partir du français. Dans ce dernier cas, l’utilisateur devra donc « penser » en français pour trouver le terme équivalent en anglais. Ceci limite considérablement la pertinence de recherche d’utilisateurs n’ayant pas l’usage de la langue française.

Exemple: en français on recherchera un médicament par nom de marque «Aspirine» tandis qu’en anglais la recherche se fera par le principe actif « aspirin » (acétyl-salicylique en français).


Les thésaurus

Il existe plus de 150 classifications ou nomenclatures en médecine. Je vais décris les thésaurus et les classifications les plus utilisés en médecine et en santé publique.


L’UMLS

L’UMLS (Unified Medical Language System), qui pourrait se traduire par Système d’unification de la langue médicale, traduit et conçoit une source d’information médicale. Ce métathésaurus comprend 250 000 concepts et plus de 500 000 termes différents. Sa base a été utilisée par le MeSH et la CIM. Il prend en charge les relations sémantiques:

  • synonymes
  • renvois
  • termes associés
  • hiérarchie (termes génériques et spécifiques).

Il inclut le Read Codes (classification pour les soins de santé primaire) ainsi que l’OPUS 4 (classification anglaise de chirurgie).

Le PMSI (Programme de Médicalisation du Système d’Information) est une classification pour le traitement de l’information. Cette base de terminologie médicale est produite par la NLM. Actuellement des chercheurs scientifiques comme Pierre Zweigenbaum du STIM (laboratoire de statistiques et d’informatique médicale) essaient de coder ce langage pour le transcrire en langage naturel (projet UMLF).


Le Thesam

Le ThesAM est un Thésaurus des Activités Médicales élaboré par J.Chevalier. Il lie les 28 000 termes médicaux et leurs synonymes par un code. Il est considéré comme un référentiel pour le codage des diagnostics et des actes selon les diverses classifications. C’est un instrument d'aide au codage utilisé en France et dans les pays francophones. Il permet de conserver la classification choisie par le médecin en attribuant à chaque catégorie un code Thésam afin de faciliter les correspondances entre les catégories.


Le MeSH

Le Medical Subject Headings (MeSH) signifie en français « vedettes-matières » ou « descripteurs » dans le domaine médical. Ce thésaurus contient les termes biomédicaux de la National Library of Medicine. Il existe des « MeSH dépendants » comme le CISMEF ainsi que les DDRT, Cliniweb et Omni dans l’espace francophone. Le MeSH d’origine est conçu en langue américaine mais il existe aussi une version en français et en anglais (la version anglaise a été réalisée par l’INSERM (Institut National de la Santé et de la Recherche Médicale) ainsi que dans une vingtaine de langues . Ce thésaurus est utilisé dans la base de données Medline et l’index Medicus (support papier de Medline, composés de 12 volumes/an).


Contenu

Il contient plus de 24 357 descripteurs organisés en 13 arborescences et 11 niveaux hiérarchiques, sa mise à jour est annuelle. Chaque document est indexé par 10 à 12 termes. Les descripteurs sont majeurs (TG) ou mineurs (TS). Les relations d’équivalence et de synonymie sont exprimées par « see » entre un terme et un descripteur et par « X » entre un descripteur et un terme. Les relations de voisinage entre deux descripteurs majeurs sont exprimées par les expressions « see related » et « XR ». Les relations hiérarchiques entre un descripteur mineur et un descripteur majeur par l’expression « see under » et son inverse « XU ».


Recherche

La recherche par terme s’effectue dans le MeSH Database accessible sur Pubmed. Plus développé, le Mesh Brower(moteur de recherche du Mesh) permet pour chaque terme recherché, la navigation dans les 16 domaines principaux ; accessible uniquement sur le site du MeSH.

  • Les grands domaines du MeSH :
    • A: Anatomie
    • B: Organismes
    • C: Maladies
    • D: Produits chimiques et médicaments
    • E: Équipements et techniques analytiques, diagnostiques et thérapeutiques
    • F: Psychiatrie et Psychologie
    • G: Sciences biologiques
    • H: Sciences naturelles
    • I: Anthropologie, enseignement, sociologie et phénomènes sociaux
    • J: Technologie, industrie et agriculture
    • L: Sciences de l’information et de la communication
    • M: Individus
    • N: Santé

Chaque descripteur possède un code alpha numérique qui correspond à son emplacement dans l’arborescence du thésaurus. Ainsi une maladie est recensée par appareil:

  • Exemple: l'appareil circulatoire génère des maladies cardio-vasculaires qui sont classées dans la catégorie "C14". Ces différentes maladies correspondent à un code précis. Cependant un même descripteur peut figurer dans plusieurs catégories (Maladies puis Médicaments).


Voici un autre exemple :

  • Dans la catégorie "D produits chimiques et médicaments", figure : acétylsalycilique, [D02.241.511.392.700.075]. Le code alphanumérique du MeSH permet de situer un terme dans son arborescence. Ainsi lors d’une recherche, l’indice relie le terme aux catégories auxquelles il se rattache grâce au code alphanumérique en lien hypertexte. Ce qui permet de cliquer sur ces indices pour accéder directement à d’autres parties de l’arborescence.

Il est possible de rechercher un terme français dans l’arborescence MeSH mais c'est la langue américaine qui sert de référence. Lors de la recherche si un terme correspond à ceux du MeSH, les réponses s’affichent sinon il convient de le choisir dans la liste proposée. Des renvois sont également effectués lorsqu’il s’agit d’un terme courant vers un terme scientifique ;

  • Exemple:
    • péronné vers fibula et la vitamine h vers biotine (fibula et biotine sont descripteurs).


Acquisition

Ce thésaurus est téléchargeable sous réserve d’accord avec l’Inserm qui envoie alors une « convention de concession et de droit d’utilisation ». Il n’est pas disponible pour les particuliers. Le format du fichier est en XML, sa taille est de 14 Mo zippé soit 300 Mo décompressé. Il n’existe plus de version papier.


La BDSP

La Banque de Données en Santé Publique a créé son thésaurus. La quatrième version va être éditée en 2007. La version éditée en 2001 comptait : 10992 termes dont 6186 descripteurs, répartis en 57 sous-domaines (appelés également « champs » ou « micro-thésaurus ») et 4806 synonymes, ou « non-descripteurs », qui renvoient vers un descripteur valide. Les catégories de ce thésaurus s’étendent au-delà de la médecine vers la géographie, la politique ou le travail. Son organisation et sa présentation se rapprochent du thésaurus Motbis réalisé par le CRDP (Centre Régional de Documentation Pédagogique).


Les classifications

La CIM 10

La CIM (Classification Internationale des Maladies) et des problèmes de Santé connexes de l'OMS est traduite en 37 langues. Son objectif est d’analyser et d’interpréter la mortalité (décès) et la morbidité (maladie) dans différents pays. Elle est constituée de 3 volumes :

  • analytique (description de la classification)
  • les règles d’utilisation
  • le volume alphabétique (index et aide à l’utilisation).


La SNOMED CT ® Internationale

La Systematized NOmenclature of MEDicine du College of American Pathologists (CAP), couvre tous les champs de la médecine. La dernière version utilisée est la SNOMED III. Elle comprend la médecine humaine et vétérinaire. Sa dernière dénomination est "Systematized Nomenclature of Medicine-Clinical Terms". Cette nomenclature est classée en 11 modules:

  • topographie
  • morphologie
  • fonction
  • organismes vivants
  • produits chimiques
  • agents physiques
  • profession
  • diagnostics
  • procédures
  • contexte social
  • modificateurs généraux (adjectifs).

Le but est d’établir précisément un compte-rendu anatomique et pathologique. Elle appartient à l'IHTSDO (International Health Terminology Standards Development Organization). Traduite en 11 langues, cette nomenclature est utilisée dans les hôpitaux à l’échelon international pour nommer et classer les activités cliniques en les normalisant. Elle comporte 50 000 termes et 165 000 codes. La version française de 1997 ne comporte que 7 axes (modules) et 12 500 termes. Cette classification hiérarchique s‘étend sur 2 à 3 niveaux. Un logiciel de codage automatique encode les données en SNOMED puis les transcode en code CIM. Ces bases de données enregistrent pour chaque maladie ; les circonstances d’apparition et le diagnostic qui constituent le dossier de chaque personne soignée. Bientôt la CCAPS (Classification commune des actes des professions de santé) y sera intégrée. Le stockage de ces données et leur évaluation facilitent la décision thérapeutique et évaluent l’activité médicale. Cet outil est en cours de développement au Canada et sera bientôt disponible en France.

  • Les sept axes sont :
    • T: Topography
    • M: Morphology
    • E: Etiology
    • F: Function
    • D: Disease
    • P: Procédure
    • O: Occupation

Pour coder la maladie « Tuberculose » on utilisera les indices suivants :

  • Topography : T-28000 Poumon, T-28080 Hiles pulmonaires, T-28100 poumon droit
  • Morphology : M-44060 Granulome
  • Function : F-03003 Fièvre
  • Disease : D-0188 Tuberculose

Pour coder un ganglion situé dans le cou avec la CIM :

  • Conclusion d’examen histologique :
    • Ganglion lymphatique du cou - région occipitale
    • exérèse : aspect compatible avec un lymphome malin diffus de type centroblastique B.


La CANDO

La Classification Alpha Numérique de la DOcumentation Médicale et pharmaceutique a été créée par J. Chevallier. Sa dernière édition date de 1996. Elle contient un index thématique et un index alphabétique. Cette classification alphanumérique, recense:

  • 24 domaines de A à Z (sauf les lettres I et O)
  • les grandes rubriques (deux lettres)
  • Les catégories (deux lettres et deux chiffres)
  • les subdivisions (deux lettres, deux chiffres et une lettre).

Cette classification est constituée de deux parties:

  • la première partie traite des « Notions générales sur la médecine »
  • la deuxième partie des « Caractéristiques générales, propriétés physiques et constituants élémentaires de l’organisme humain » seront classés les états pathologiques par organe.

La cote est constituée par les indices de chaque catégorie qui correspondent à : l’organe, la maladie, le traitement et le médicament.

  • Exemple:
    • Le terme « Tuberculose pulmonaire » est codé KF 56 qui correspond à K ; appareil respiratoire, KF ; poumon, et 56 tuberculose

Il reprend l’idée de la classification décimale Dewey en accolant la subdivision à la cote initiale. Il existe aussi des renvois entre les différentes catégories.


Exemples de cote Cando :

  • Première partie: Notions générales sur la médecine:
    • Pathologie
    • 56 : Tuberculose
    • 56 -01 : Etude générale
    • 56 -30 u : Vaccination par BCG
    • 56 a : Primo-infection tuberculeuse
    • 56 a -32 : Traitement de la primo-infection tuberculeuse

Mais il faut aussi penser à regarder dans la catégorie pneumologie (KF 01), l’appareil respiratoire (KA 01)


  • Deuxième partie : Caractéristiques générales, propriétés physiques et constituants élémentaires de l’organisme humain:
    • K: Appareil respiratoire
    • KF: Poumon: abcès du poumon, cancer secondaire du poumon, emphysème pulmonaire, pneumoconioses, pneumopathies non suppurées, tuberculose pulmonaire.
    • KF 56: Tuberculose pulmonaire
    • KF 56 –ZC: Tuberculose pulmonaire de l’enfant


TOTHEM

Cet auteur vient de publier également une nouvelle version appelée Tothem. L’auteur autorise le téléchargement de sa classification. "La TOpographie THEMatique du domaine de la santé permet de classer et d’indexer tout ce qui concerne de près ou de loin l’organisme humain". Elle est compatible avec la CIM 10. Le fichier de diagnostic rassemble 46 885 libellés issus du tome 1 de la CIM 10. Cette classification est à la fois topographique (environnement semblable à la première partie de la Cando) et thématique (comme la deuxième partie de la Cando). Cette classification est utilisable dans fichier Excel et Access et prend en charge les caractères booléens ; ET, SAUF. L’avantage de cette version est que l’utilisateur ne doit plus penser à chercher son terme dans d’autres catégories puisque les codes correspondants sont rappelés lors de l’interrogation dans une base de données relationnelle. Nous rejoignons ici le même système utilisé pour le MeSH.

Notes

  1. Lautreille Marie-thérèse. Le thésaurus : Son rôle, sa structure, son élaboration. Villeurbanne : Presses de l’ENSB, 2e éd, 1981.-88 p.
  2. AFNOR: Association Française de Normalisation
  3. Organisation Internationale de normalisation


Bibliographie

  • AFNOR, "Documentation, Présentation des publications, traitement documentaire et gestion des bibliothèques", Tome 1, 6e éd., 1996.- 651 p.


Liens externes

DokuPedia sémantique