Vous pouvez également utiliser le moteur ou l'améliorer
Métadonnée
Un article de DokuPedia.
Définition : « Une métadonnée est une donnée servant à définir ou décrire une autre donnée quelque soit son support (papier ou électronique) ».
|
Origine des métadonnées
Rôle de la gestion documentaire
Depuis toujours, les bibliothécaires ont rédigé des notices, ou des index, pour décrire les documents disponibles. De nos jours, dans les bibliothèques numériques (médiathèques), on a pris l'habitude d'utiliser des notices bibliographiques pour décrire le contenu et les aspects normatifs d'un document. Elles facilitent ainsi la gestion interne des ressources documentaires et, pour les usagers, permettent d'optimiser la recherche et la localisation des documents électroniques. En effet, ces «données à propos de données» s'appliquent particulièrement bien aux pages Web. On peut ainsi coder de façon claire certains renseignements essentiels tel que le titre, l'auteur, la date, les mots-clefs, etc. De ce fait, grâce aux métadonnées, le travail des moteurs d'indexation et de recherche a été grandement facilité car elles permettent d'extraire automatiquement de nombreuses informations sur le document, ainsi que reconstituer les relations qui existent entre les documents (par exemple, on peut savoir qu'une page est la cinquième d'un ensemble cohérent de quinze pages chaînées les unes aux autres).
Création d'un protocole
Cependant, il est nécessaire que tous les acteurs (publicateurs, éditeurs de logiciels clients, etc.) partagent une définition et une nomenclature communes des métadonnées. En effet, aucun échange ne serait possible si la liste des mots-clefs était parfois nommée «keywords», d'autres fois «key-words», ou parfois «mots-clefs». Ainsi, les langages de balisage type GML, puis SGML et HTML, ont permis d'introduire des métadonnées dans les documents. Les Communautés européennes adoptèrent le langage SGML dès 1984. Dès 1988, la Bibliothèque du Congrès, aux États-Unis, proposait un protocole pour la recherche d’information (Z39.50), basé sur des éléments de données, qui fut revu en 1992, puis en 1995. De même, la notion de métadonnées utilisables par les ordinateurs fut proposée assez tôt dans l'histoire du Web, dès 1994, par son inventeur Tim Berners-Lee, lors de la conférence WWW 94 où fut annoncée la création du W3C. Car les métadonnées sont au coeur de l'architecture Web. Partant de ce constat, un certain nombre d'équipes impliquées dans la sémantique sur le Web organisèrent un atelier à Dublin (Ohio) en 1995 où ils définirent une liste précise de quelques métadonnées liées aux pages Web. Ce jeu de métadonnées fut surnommé «Dublin Core metadata». Il fut adopté par l'Union européenne en 2002.
Utilisation des métadonnées
Principe
Le Dublin Core définit un certain nombre de champs de métadonnées utilisables pour les pages Web. Mais il ne décrit en aucun cas la façon de représenter ces métadonnées en pratique. Ainsi, il existe plusieurs représentations utilisées, et d'autres sont envisageables. Les champs de métadonnées du Dublin Core sont appelés éléments ; la signification de certains d'entre eux peut être précisée à l'aide de raffinements. Un raffinement restreint la signification d'un élément, mais sans la changer fondamentalement. L'utilisation des raffinements est facultative. Dans une description utilisant le Dublin Core, des valeurs sont donc associées aux champs de métadonnées. Ces valeurs peuvent être données dans un format libre (chaînes de caractères interprétables par des humains, mais sans signification particulières pour les machines), mais elles peuvent aussi se conformer à des formats de données bien définis. En effet, le Dublin Core référence un certain nombre de formats de données officiels.
Fonctionnement
Les métadonnées sont des balises que l'on introduit dans les fichiers ou dans les langages de programmation appropriés, comme les langages de balisage XML (Extended Mark up Language: mark up signifie balise). Les balises ont pour effet d'améliorer l'efficacité des recherches d’information par rapport aux recherches plein texte. Il est très important de noter que les ressources numériques balisées transportent avec elles leurs propres métadonnées lorsqu'elles sont téléchargées, copiées, répliquées, transmises par des messageries électroniques. Ceci s'applique à tous les types de ressources numériques (texte, son,image, multimédia). C’est le principe de « l’interopérabilité ».
Normalisation
Pour les bibliothèques, l'initiative la plus ancienne pour définir des troncs communs d'éléments standardisés de métadonnées remonte aux années 1960, avec le standard MARC développé par la Bibliothèque du Congrès. Le schéma MODS, développé par la Librairie du Congrès, est un compromis entre la complexité de MARC et la simplicité du Dublin Core. Sur Internet, des travaux et des volontés convergent pour utiliser «intelligemment» ces données avec des moteurs de recherche en décrivant les ressources numériques ou physiques et en établissant des relations avec d'autres ressources. La principale initiative dédiée à ces questions émane du « Dublin Core » qui y travaille depuis 1995. C'est un schéma de métadonnées générique qui peut servir de base à des registres de métadonnées. Le Dublin Core comprend 16 éléments de description : formels (titre, auteur, éditeur) ; intellectuels (sujet, description, langue…) ; et relatifs à la propriété intellectuelle. Chaque élément de description a plusieurs raffinements possibles.
L'utilisation de ce tronc commun doit impérativement être accompagnée d'une organisation en registre de métadonnées. Le gouvernement américain conseille fortement de s'appuyer sur les recommandations de la norme ISO/IEC 11179. Certains informaticiens ne sont toutefois pas conscients du caractère sensible de ce tronc commun d'éléments sur le plan de la protection du patrimoine informationnel. Il est important de noter qu'il n'existe pas de traduction officielle du référentiel Dublin Core en français. (Voir : Projet de traduction française de la norme internationale de métadonnées Dublin Core)
Ainsi, le système de publication d'OpenWeb (Présentation des métadonnées « Dublin Core ») est basé sur ce tronc commun : Gestion électronique des documents et archivage. La norme ISO 15836:2003 est la transposition normative de ce référentiel. Elle est utilisée par plus de huit gouvernements dans le monde. En France, on l'emploie dans la Gestion électronique des documents (GED) ou dans les Systèmes d’archivage électronique (SAE).
De même, le Web a pour cadre de référence le RDF (Resource Description Framework) qui comporte des modèles de graphe destinés à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. Le RDF est défini par le W3C (World Wide Web Consortium), référentiel de base du Web sémantique.
Applications
Le terme «métadonnée» peut être employé dans plusieurs domaines. Dans le champ des technologies de l’information, on le trouve associé plus particulièrement à l’informatique industrielle, à la géomatique, aux entrepôts de données, aux langages XML et HTML (par exemple, les balises Méta sont un type de métadonnées). Ainsi, en documentation numérique, les notices (qui sont des métadonnées) contiennent des informations sur la source du document (titre, auteur, date, sujet, éditeur, etc…), la nature du document (monographie, périodique, etc…), son contenu informationnel (descripteurs, mots-clés, résumé) et sa localisation physique (cote). Les métadonnées sont également utilisées pour d'autres types de ressources informatiques contenant des images ou du son (cd-rom, dvd-rom). Les métadonnées servent donc à vulgariser le contenu informationnel d'une ressource informatique, une notice de contenu intégrée en quelque sorte (dans l'en-tête des documents HTML côté code source ou en tant que fichier XML autonome par exemple). Les métadonnées concernent aussi tous les secteurs de l’économie à travers la gestion de contenu, puisque tous les organismes gèrent des ressources documentaires sous forme électronique (les Administrations centrales et territoriales, les Entreprises, les Universités et Grandes écoles, les Centres d’études et de recherches, les Médiathèques. De même, les métadonnées sont appelées à être utilisées dans tous les réseaux d'innovation européens (pôles de compétitivité) et mondiaux.
Formats et logiciels
Recommandations générales
· Dublin Core : recommandation appliquée aux États-Unis, elle a inspiré le moteur de recherche Google.
· Resource Description Framework (RDF) : modèle de graphe destiné à décrire de façon formelle les ressources web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. RDF est développé par le W3C, c'est le langage de base du Web sémantique.
· XMP : format de métadonnées basé sur XML, utilisé dans les applications PDF, de photographie et de graphisme, applicable au web. Il a été lancé par Adobe Systems en avril 2001.
Utilisation dans les langages informatiques
Les métadonnées ont d'abord été utilisées dans les langages XML, SGML, XHTML et GML.
Elles sont décrites dans des formats d'interface : XMI (XML Metatata Interface) ou encore JMI (Java Metadata Interface) car les langages du type Java emploient des interfaces pour la gestion des métadonnées.
Ainsi, dans le cas d’une application HTML, il est possible d'inclure les métadonnées relatives à un document HTML directement à l'intérieur de ce document. Elles prennent place dans des balises <meta>, à l'intérieur de l'en-tête (section <head>).
Par exemple, le système de publication d'OpenWeb est basé sur l'utilisation du Dublin Core : les articles sont automatiquement classés par son système de gestion de contenu en fonction des informations contenues dans leur en-tête. Pour voir ce que cela donne en pratique, il faut demander à son navigateur d'afficher la source d'une page du site et repérer les balises <meta …> qui correspondent aux métadonnées du Dublin Core.
Utilisation dans les systèmes d'exploitation
Les métadonnées sont utilisées dans le nouveau système d'exploitation Microsoft Windows Vista qui succède à Windows XP.
De même, dans les messageries électroniques, ou encore pour créer des flux RSS.
Utilisation par types de fichier
Fichiers bureautiques
Des formats de fichiers tels que PDF, Word, Excel, ou OpenOffice.org utilisent des métadonnées. Elles sont visibles et peuvent être complétées à partir du menu « Fichier > propriétés du document » dans l'interface des applications correspondantes.
Fichiers MP3
Les métadonnées sont utilisées par le format MP3 dans les tags ID3. On peut en effet y insérer des informations comme le nom de la chanson, de l'interprète, ou encore la date de sortie.
Conclusion
Les métadonnées servent donc à :
Faciliter la recherche d'information
- décrire le contenu et les relations entre les fichiers d'un site,
- classer le contenu suivant un degré de difficulté ou un public cible,
- mieux référencer un site ou une page sur Internet.
Faciliter l'interopérabilité
- partager et échanger des informations.
Faciliter la gestion et l'archivage
- informer sur le cycle de vie des documents,
- gérer des collections de ressources,
- gérer des archives électroniques.
Gérer et protéger les droits
- les droits de propriété intellectuelle,
- les droits d'accès à des pages web (restrictions de consultation).
Authentifier un texte
- encoder une signature électronique pour valider un texte sur Internet.
Liens
Liens internes
Archives ouvertes et patrimoine culturel numérisé
Liens externes
- Trouver la notion métadonnée sur l'internet des sciences de l'information et de la communication
- Metadata standards ISO/IEC JTC1 SC32 WG2
- Library of Congress Digital Repository Development Core Medata Elements
- The Dublin Core Metadata Initiative :organisme faisant la promotion de l'utilisaton et l'interopératibilité des métadonnées
- Métadonnées dans le progiciel de gestion intégrée SAP
- Métadonnées, normes et standards, dossier sur les métadonnées
- Des métadonnées pour bien utiliser les ressources électroniques, sur le site de la BNF
- Languages pour la metadonnée - une vue d'ensemble
- Les métadonnées, élaboré par le SCÉRÉN
- Questions fréquentes sur les métadonnées
- Les métadonnées : à quoi ça sert ?
- XHTML dans OpenWeb


