Bienvenue sur DokuPedia, wiki universitaire consacré à la documentation. Vous êtes invités a créer un compte et à contribuer, en ajoutant un nouvel article ou en modifiant celui-ci.
Vous pouvez également utiliser le moteur ou l'améliorer
Google Custom Search

Formats ouverts

Un article de DokuPedia.

Cet article est une ébauche à compléter, vous pouvez partager vos connaissances en le modifiant...

A l'ère du numérique, la circulation de l'information, des données, se fait de façon dématérialisée. Cette nouvelle donne produit de nouveaux usages dans nos façons de communiquer et de travailler car le document numérique impose d'autres règles que celles du document papier. Au travers de la Direction Générale de la Modernisation de l'Etat (DGME) - qui supplante l'Agence pour le Développement de l'Administration Electronique (ADAE) - l'administration française s'est engagée dans une simplification des démarches administratives, notamment par le développement de l'administration par voie électronique. Dans ce cadre, un groupe de travail, constitué notamment de professionnels de l'information-documentation (Aproged pour l'émission du rapport mais aussi Adbs, Direction des archives de France), a élaboré un rapport (téléchargeable ici) sur la maîtrise du cycle de vie du document numérique. Il s'agit en fait d'un guide de bonnes pratiques, énoncées au travers d'un certain nombre de recommandations. Parmi ces recommandations, certaines sont attachées aux conditions nécessaires à l'échange des données, et à leur archivage, deux points cruciaux. L'échange des données suppose que le document qui les renferme puisse être réceptionné et lu par le récepteur, l'archivage suppose que les données restent accessibles, lisibles, de façon pérenne.

C'est ici que surgit la problématique des formats. Comme l'énonce clairement la recommandation suivante : "(...)le choix d’un format de diffusion (qui peut être différent du format de conservation) doit permettre la lisibilité du document par le destinataire, ce qui conduit à éliminer ou à restreindre l’emploi de formats propriétaires." Et en ce qui concerne l'archivage : "Par ailleurs, il est nécessaire de faciliter et de sécuriser la consultation des archives courantes et intermédiaires et de préparer leur versement en tant que archives définitives. Dans cette optique, la notion de format offrant des garanties sur sa lisibilité en tant qu’archives définitives pour le long, voire le très long terme, prend toute sa dimension et ne peut se satisfaire d’un effet de mode ou d’une solution propriétaire." Propos extraits de La maîtrise du cycle de vie du document numérique

Ces recommandations proscrivent clairement les formats propriétaires, ce qui nous amène à nous interroger sur l'importance des formats et notamment des formats ouverts.

Sommaire

Qu'est-ce qu'un format ouvert ?

Définition du format

Lorsque l'on écrit un courriel, créé un document ou visualise des photos, on utilise des fichiers où sont stockées à l'état brut les informations qui sont ensuite lues à l'écran. Le stockage de ces informations écrites en langage binaire - le seul langage compréhensible par l'ordinateur - nécessite au préalable une codification pour être interprétable par un logiciel : c'est le format. Au sens informatique, un format est une convention utilisée pour la description des données (on parle de spécification).

Un format est représenté par l'extension du nom de fichier : par exemple, mapage.html est un fichier au format html qui est celui utilisé par mon navigateur. Il existe des formats pour tous les types de fichiers (textes, audios, vidéos, graphiques).

Format ouvert, format fermé

Pour pouvoir travailler sur un fichier, c'est-à-dire pour pouvoir le lire, modifier et enregistrer ses modifications, ou bien pour créer un nouveau fichier, il est nécessaire d'utiliser un logiciel qui interprète le format. Il se présente alors deux cas de figure :


  • Le format est fermé
Lorsque la spécification comporte des zones d'ombre et qu'elle n'est pas dans le domaine public, on parle de format fermé ou format propriétaire. En effet, ces formats sont créés par des éditeurs de logiciels qui en sont propriétaires. Le format n'est interprétable que par l'application développée par l'éditeur, à l'exclusion de toute autre. Le format "doc" par exemple, développé par Microsoft, ne peut être lu que par le logiciel de traitement de texte Word développé par cet éditeur. Un format fermé est le corollaire d'un logiciel propriétaire, qui nécessite d'acquérir une licence d'utilisation. Le format, tout comme le logiciel, est protégé juridiquement : on ne peut chercher à en connaître la composition, on ne peut l'étudier sous peine d'être hors-la-loi. La caractéristique du format propriétaire est la dépendance qu'il engendre pour l'utilisateur vis-à-vis de l'éditeur, puisqu'il lui faut le logiciel idoine pour pouvoir lire ledit format. D'autre part - c'est le cas pour les produits Microsoft - les spécifications du format peuvent évoluer avec les versions du logiciel, obligeant l'utilisateur à racheter une licence pour la version suivante et le rendant ainsi complètement dépendant d'une technologie propre à un éditeur. Toutes ces caractéristiques font qu'un format propriétaire ne permet pas l'interopérabilité, qui est la possibilité, pour plusieurs systèmes hétérogènes, de communiquer entre eux.


  • Le format est ouvert
Lorsque la spécification est clairement documentée et qu'elle appartient au domaine public, on parle de format ouvert. Au niveau législatif, la loi n° 2004-575 du 21 juin 2004 pour la confiance dans l’économie numérique (LCEN) en donne une définition officielle sur le site Legifrance : On entend par standard ouvert tout protocole de communication, d'interconnexion ou d'échange et tout format de données interopérable et dont les spécifications techniques sont publiques et sans restriction d'accès ni de mise en oeuvre. D'après un site consacré aux formats ouverts, il s'agit donc de protocoles et de formats de données indépendants d'un logiciel particulier, d'un système d'exploitation ou d'une société et qui s'opposent aux formats propriétaires. Ces particularités s'accompagnent de spécifications techniques documentées, publiées, non payantes, sans brevet dessus, sans royalties dessus. A l'inverse d'un format propriétaire, un format ouvert peut être librement étudié et implémenté dans un logiciel. Il est possible d'en faire l'audit, donc de l'étudier, de l'améliorer, ce qui est impossible avec un format fermé (à l'exception de l'éditeur lui-même). Il permet l'interopérabilité et supprime toute dépendance à un éditeur. Internet - qui n'appartient à personne - repose sur des formats ouverts. Les formats ouverts sont ceux adoptés par le mouvement du Logiciel libre.

Interopérabilité

Qu'est-ce-que l'interopérabilité ? D'après le Dico du net c'est une notion désignant plusieurs systèmes capables de communiquer entre eux, qu'ils soient semblables ou de natures différentes. L'interopérabilité nécessite que les communications obéissent à des normes. Ces documents techniques définissent souvent des exigences, parfois accompagnées de recommandations plus ou moins optionnelles. Si la norme est correctement écrite, deux systèmes qui satisfont aux exigences doivent dialoguer ensemble sans souci.

On parle parfois de compatibilité, de standard quand on évoque l'interopérabilité, mais ces trois notions se différencient comme le montrent très clairement les 3 schémas ci-dessous[1] :

Les principaux formats ouverts

Multimédia

  • Les formats de fichiers utilisés sur le web : html, xhtml, xml...
  • Ogg Vorbis : format audio compressé, alternative libre au format MP3.
  • Ogg Theora : format vidéo compressé
  • PNG (Portable Network Graphics): format d'image sans perte, alternative libre au format GIF.
  • MNG (Multiple-image Network Graphics) : format d'image animée, alternative libre au format GIF animé.
  • SVG (Scalable Vector Graphics) : format d'image vectorielle, alternative au format Shockwave-Flash.


Bureautique

  • ODF (Open Document Format) : format pour les applications bureautiques utilisé par la suite OpenOffice, alternative libre aux formats utilisés par la suite bureautique Office de Microsoft. Ce format est devenu un standard suite à sa normalisation au sein de l'ISO le 1er mai 2006. (voir à ce sujet le chapitre "ODF en vedette")
  • PDF (Portable Document Format) : format de présentation de document, qui, bien qu'ouvert n'est cependant pas libre. Il a été créé par la société Adobe qui autorise des programmes tiers à l'utiliser mais qui en reste propriétaire.

Quels sont les enjeux ?

Dépendance informationnelle

L'utilisation de formats propriétaires est très répandue car ces formats sont ceux adoptés par nombre de logiciels courants (bureautique, traitement d'image..). L'absence d'interopérabilité entre ces applications restreint - voire interdit - les possibilités d'échange d'informations, à moins que la grande majorité ne soit pareillement équipée...L'omniprésence des outils bureautiques de la suite Microsoft va dans ce sens, ce qui a transformé certains formats utilisés par cet éditeur en standards de fait. Que se passe-t-il si le format n'est plus utilisé par l'éditeur ? Quid de l'accessibilité des données si l'éditeur disparaît ? Quid de cette dépendance informationnelle sans commune mesure ? Ces questions mettent en évidence la notion de pouvoir lié à la détention de l'information. Comme l'explique bien Tristan Nitot, Président de Mozilla Europe sur son blog cette problématique touche les citoyens, la société civile, mais aussi l'Etat :

  • Elle concerne l'utilisateur final et ses choix possibles pour que la question de l'accessibilité à ses données soit indépendante d'un fournisseur informatique, particulièrement lorsqu'il s'agit de documents bureautiques,
  • Elle concerne les États dans leurs modalités d'échanges avec les citoyens, toujours au moyen de documents bureautiques. Faut-il imposer aux citoyens un format propriétaire qui imposerait d'acquérir la licence d'utilisation du logiciel associé alors qu'il s'agit de Service Public ?

La problématique des formats va donc bien au-delà de l'aspect technique. Elle comporte une dimension sociale, politique et économique.

Guerre des formats : un enjeu politique et économique

La problématique des formats, qui rejoint celle du mouvement du logiciel libre, touche des enjeux économiques, sociaux, relayés par les politiques. Pour preuve, un certain nombre de gouvernements se sentent concernés par ces enjeux et ont décidé de basculer vers le libre (le Pérou en 2005, la Norvège en 2005, par exemple). En France, le député Bernard Carayon est à l'origine du rapport "A armes égales" [2], remis le 14 septembre 2006 au Premier Ministre, en faveur d'une véritable politique nationale en matière de logiciel libre. Il est rejoint dans cette démarche par un autre député, Richard Cazenave, à l'origine de la migration des postes de l'Assemblée nationale sous Linux début 2007 et fervent partisan du libre comme il l'exprime dans cette interview réalisée par Veni vidi libri un des sites de la communauté Framasoft, clairement engagé dans la promotion du logiciel libre. Les enjeux du libre - et des formats ouverts - peuvent se résumer par :

  • l'absence de souveraineté économique : à l'heure actuelle, beaucoup de grands éditeurs (propriétaires) étant nord-américains,
  • la réappropriation du système d'information : le code peut être audité, modifié, réutilisé..,
  • l'indépendance des administrations vis-à-vis d'un fournisseur unique,
  • la perennité des données,
  • la liberté de communication : l'interopérabilité permet une multiplication des possibilités d'échanges,
  • la réduction de la fracture numérique : les logiciels libres étant gratuits dans leur majorité, le coût de son appropriation par l'utilisateur est nul.

Vers une normalisation des formats ouverts

ODF en vedette

Le format Open Document est basé sur le langage XML. Il est celui utilisé par OpenOffice, suite bureautique libre (traitement de texte, tableur, présentation, base de données, diagramme). C'est donc un format ouvert qui respecte les conditions d'interopérabilité et il est implémenté sur de nombreux logiciels comme les traitements de texte StarOffice, KOffice (sous GNU/Linux), TextEdit (sous MacOS), les traitements de texte en ligne comme Writely par exemple, mais aussi sur une prochaine version de Lotus Notes, IBM ayant annoncé son intention d'implémenter ce format.

En mai 2005, le format Open Document a été adopté par l'OASIS, un consortium dédié à la standardisation et la normalisation de formats ouverts. Le travail a porté sur l'élaboration d'une spécification très documentée. Enfin, l'Organisation Internationale de Normalisation, l'ISO, a reconnu ce format qui est désormais désigné sous la norme ISO 26300.

Microsoft a lui aussi promulgué un format ouvert, l'Open XML, adopté par l'ECMA - organisme qui oeuvre pour la création de normes - et destiné à être reconnu par l'ISO. Ceci après que l'Open Document soit devenu une norme. Cette nouvelle a été accueillie avec [1] scepticisme par certains, voire un refus clair et net, comme IBM qui a voté contre ce format, arguant qu'il concurrençait le format ODF, le seul véritablement ouvert.

En réaction à l'apparition d'un autre format adossé au puissant éditeur américain, est née l'ODF Alliance pour promouvoir et défendre le format ODF. L'Open Document Format a rencontré un franc succès auprès des gouvernements dont ceux de la Belgique, la Norvège, le Massachussets, le Danemark pour ne citer qu'eux. La France n'est pas en reste avec l'élaboration du Référentiel Général d'Interopérabilité.

Référentiel Général d'Interopérabilité

Le RGI[3], en cours d'élaboration à la DGME, a supplanté le CCI (Cadre Commun d'Interopérabilité né sous l'égide de l'ADAE). Il se démarque de ce dernier par son caractère d'obligation : là où le CCI se contentait de recommandations en matière de normes et standards, le RGI a force d'obligation. Il est cité dans l'ordonnance N°2005-1516 du 8 décembre 2005, article 11 relative aux échanges électroniques dans l'administration, et notamment entre celle-ci et le citoyen. Le RGI est destiné à soutenir le format ODF et les formats ouverts comme l'y a encouragé Thierry Stoehr, rédacteur en chef de formats ouverts.org dans une lettre adressée au Directeur de la DGME, le 15 juin 2006.

Une consultation publique a été lancée pour ce référentiel par l'intermédiaire d'un wiki de consultation. Les commentaires sont à ce jour clos, et le référentiel est toujours à l'étude. Il a reçu également le soutien d'un groupe d'industriels, la CCIA (Computer & Communications Industry Association), au travers d'une lettre de son Président adressée au Directeur de la DGME.[4]

Notes et références

  1. proposés par Camille Moulin sous licence Creative Commons avec la clause by
  2. Voir notamment les pages 71 à 75 sur l'importance des formats ouverts
  3. D'après la très bonne présentation du site Apitux
  4. Voir l'article sur le site Linux.org

Voir aussi

Liens

- Interopérabilité et standards ouverts

- Logiciel libre (voir aussi les liens de la page consacrée à ce sujet)

- Les associations engagées dans la promotion du logiciel libre

- Les sites incontournables sur le logiciel libre

DokuPedia sémantique