Bienvenue sur DokuPedia, wiki universitaire consacré à la documentation. Vous êtes invités a créer un compte et à contribuer, en ajoutant un nouvel article ou en modifiant celui-ci.
Vous pouvez également utiliser le moteur ou l'améliorer
Google Custom Search

Les outils de GED

Un article de DokuPedia.

Les copieurs multifonctions ont aujourd'hui tous une fonction de numérisation et d'adressage du fichier par messagerie ou postage du fichier scanné sur un serveur. Ces outils d'entrée de gamme, tel DocuShare développé par Xerox, sont une première solution GED. A une autre échelle, existent des logiciels destinés à des grands comptes industriels, tel Documentum(société ECM) ou Alfresco(société éponyme) Ces outils gèrent les versions de fichiers, la confidentialité à travers la gestion de groupes, l'archivage électronique, la publication sur un intranet, etc.

Offres commerciales, logiciels Open Source, plusieurs solutions existent pour un individu qui veut bâtir une GED, professionnel de la gestion de l'information ou non.

Nous commencerons cet article en balayant les apports logiciels à la modélisation GED en parcourant les différentes étapes de traitement du document électronique : la contribution, la catégorisation, le stockage et la diffusion du document électronique. Les logiciels de GED intègrent ces besoins en proposant à leurs utilisateurs des outils de gestion des workflow et la dématérialisation des documents électroniques. La GED s'axe désormais vers la gestion de contenu (ECM), le choix des outils a donc été délibérement tourné dans cette optique. A chaque besoin et à chaque usage correspond un outil particulier, il s'agira alors de montrer et comparer les points forts des majors des solutions technologiques commerciales (Documentum) et Open Source (Alfresco).


Sommaire

L'acquisition ou contribution

C'est le point de départ de la GED:

Numériser un document disponible sur un autre support par l'utilisation d'un scanner.

  • Acquérir un fichier électronique : la communication entre 2 systèmes de gestion électroniquesne par l'utilisation de protocoles de transfert électronique.
  • Produire un fichier électronique : la rédaction isolée
  • Utilisation d'un groupware ou d'un workflow.

Les logiciels de GED gèrent aujoud'hui les conversions de fichiers, la création et la gestion de workflow, la publication des documents sur une page web (intranet, extranet, internet).

Les outils liés à la numérisation d'un document :

Le scanner ou le copieur multifonction assure la numérisation d'un document. Les premiers outils liés au scanner permettent la récupération du contenu du document:

  • L'OCR (Reconnaissance Optique du Caractère) du scanner gère la reconnaissance des caractères et permet une accessibilité au texte.
  • L'ICR (Reconnaissance Intelligente de Caractères) est une forme évoluée de l'OCR, elle permet de reconnaître l'écriture manuscrite et intègre un mécanisme de reconnaissance de nouveaux caractères.
  • La RAD (Reconnaissance Automatique de Documents) permet l'indexation automatique par la reconnaissance d'éléments connus sur le document : logo, mentions de termes prédéfinis, etc... Elle apporte des informations sur le type de document (facture, courrier d'un fournisseur, etc)
  • La LAD (Lecture Automatique de Documents) pemet de récupérer de l'information sur le contenu du fichier numérisé. Il faut que les documents soient structurés ou semi-structuré et de mise en forme relativement stable.

L'acquisition se fait par transfert de fichiers électroniques :

Les métadonnées associées aux fichiers sont transmises entre les outils de GED par l'utilisation d'une norme de transfert de données.

L'acquisition est réalisée par la production de fichiers électroniques :

Les fichiers peuvent être conçus par un individu ou par un groupe de personnes travaillant avec un groupware. Un système de workflow permet la rédaction, les modifications et la validation d'un document électronique par un groupe de collaborateurs. Les profils d'accès au document de travail et à la version finale sont gérés par ce système (rédacteurs, vérificateurs, administrateur du workflow).

A travers les différentes façons d'acquérir un document électronique, les outils de GED sont déjà présents, à la fois sous une forme relativement primaire, la numérisation par un copieur ou un scanner, l'adressage par mail du document numérisé ou l'enregistrement du fichier sur un répertoire ou un serveur, le passage en OCR, et l'enregistrement du document sous un format PDF jusqu'à la modélisation d'un document et sa validation à travers la gestion d'un workflow.

Le classement ou catégorisation

L'indexation va permettre d'appliquer des métadonnées au document. Celle-ci permettent de décrire le type de document et d'analyser son contenu intellectuel.

Application de métadonnées sur les propriétés du fichier :

Indication du nom du rédacteur du document, de la société, du titre, du type de document, sa version et/ou sa date d'application,... On utilisera ici les capacités du système d'exploitation à décrire ses fichiers.

Outils d'analyse du contenu du document :

Ces métadonnées vont être appliquées à l'identifiant du document et non au document lui-même :

  • Gestion d'un thésaurus ou d'un plan de classement)
  • Critères de diffusion du document (document confidentiel, à diffusion restreinte, à diffusion interne uniquement, à diffusion sur l'extranet, public).
  • Dématérialisation du document : seul le contenu intellectuel est indexé, le document disparaît au profit du contenu (on parle alors de Structured Content (l'information parcellisée), à l'opposé du Unstructured Content, (le document finalisé)).

L'outil GED ne parle pas de plan de classement mais de catégorisation. Les catégories sont gérées par l'administrateur de la base de données. Elles sont classées dans une arborescence hiérarchique allant du générique au spécifique.

Le stockage des documents

Ici, les outils de GED n'interviennent pas. Il ne faut cependant pas négliger cet aspect : le support (DVD, serveurs, bandes magnétiques), l'organisation du stockage (organisation par arborescence, par thématiques) et la durée de conservation des fichiers sont primordiaux pour que l'archivage des documents électroniques soit optimal. L'archivage électronique est une prolongation des outils de GED.

Diffusion des documents

La diffusion du document électronique peut se faire selon 2 axes :

  • Interne au réseau de l'entreprise(intranet, extranet)
  • Externe (internet).

Une interface 100% web de la base de données allège l'installation du logiciel GED tout en conservant la sécûrité d'accès.

La confidentialité du document s'articule autour de :

  • La gestion des droits d'accès en fonction des profils des utilisateurs : administrateur, contributeurs, approbateurs, lecteurs,...
  • La gestion informatique de groupes.

Gestion du cycle de vie des documents :

  • Le respect du cycle de vie du document est basé sur une accessibilité graduée du document : restreinte lorsque l'information est confidentielle, ouverte si l'information est diffusable en interne à la société, publique lorsque que l'on considère que l'information peut être diffusée à l'extérieur de l'entreprise. Les grands groupes industriels gèrent l'accès aux informations produits par ces niveaux d'autorisation graduels. Des outils (roadmap du cycle de vie, revue documentaire, etc.) permettent de suivre ce cycle de vie. Des programmations peuvent aussi être réalisées pour archiver automatiquement les informations devenues obsolètes.
  • La gestion des versions du document électronique : les différentes versions d'un même document sont archivées au fur et à mesure qu'un nouvel indice est mis à disponibilité sur l'outil de GED.
  • La gestion des archives de gérer les fichiers devenus obsolètes. Ces fichiers appartiennent à une arborescence dédiée dans la structure logicielle. Les droits de consultation sont appliqués sur ces documents.

Comparaison logiciel libre / logiciel commercial : Alfresco versus Documentum

La GED traditionnelle a aujourd'hui évolué vers la gestion de contenu d'entreprise (Entreprise Content Management). Il apparaît donc intéressant dans cette optique d'observer les aspects libres et commerciaux de ces outils contemporains.

  • Alfresco est la solution de GED de la société éponyme, fondée en 2005 par John Newton, co-fondateur de Documentum et John Powell, ancien COO de Business Objects. Alfresco a obtenu le prix du Pionner Technologique 2007 lors du forum mondial économique de Davos. Alfresco se définit comme un Content Management System, un outil de gestion de contenu. Il a cependant la gestion documentaire au sein de son fontionnement.

Alfresco est un projet open-source, multi plateforme, utilisant des standards ouverts, et massivement basé sur la technologie JEE. Alfresco a développé une architecture moderne qui utilise les derniers outils open-source pour optimiser les performances, et la Programmation Orienté Aspect (AOP) facilitant ainsi la modularité et l’adaptabilité de l’application.

  • Documentum est un fournisseur de solutions de gestion de contenu avec plus de 1000 clients parmi les plus grandes entreprises mondiales et les dotcoms Internet évoluant dans de multiples secteurs industriels. Fondée en 1990, Documentum a été acheté par le groupe EMC Software en 2005. Cet outil est devenu aujourd'hui un outil de gestion de contenu, au spectre commercial beaucoup plus large désormais que la seule gestion de documents électroniques.

Fourniture d’une plate-forme pour la gestion des documents de l’entreprise, capable de traiter chaque étape du cycle de vie des documents, depuis leur création et leur révision jusqu’à leur archivage et leur suppression, en passant par leur validation et leur livraison.

Gestion de l'interface utilisateur
  • Espaces collaboratifs intelligents : Espaces qui utilisent des règles pour simplifier la manipulation, la gestion et la transformation des documents (image ci dessous)
  • Règles de gestion de type 'messagerie' – Permet de configurer rapidement des règles de gestion automatique des documents (conversion automatique, déclenchement d'un workflow, ...)
  • Système de Fichier Virtuel – Remplace les fichiers partagés tout en conservant le même interface
  • Tableau de Bord (image ci-dessous)
  • Librairie de services documentaire
  • Interface administrateur web
  • Interface utilisateur / collaborateur web
  • Affiche les classeurs, les dossiers et leur contenu afin de pouvoir naviguer, enregistrer/extraire du contenu, apporter sa contribution, mettre à jour les versions, modifier les métadonnées du contenu et initier les processus métiers/workflow.
  • Affiche les objets récemment créés, révisés ou extraits.
  • Définit les dossiers utilisateur par défaut et affiche les objets de contenu présents dans les dossiers utilisateur.
  • Interface administrateur logicielle
  • Interface utilisateur / collaborateur logicielle ou web
Acquisition - Contribution
  • Mécanisme simple de contribution
  • Extraction automatique de méta-donnée et catégorisation
  • Gestion automatique de conversion de format
  • Synchronisation "porte-document" via protocole CIFS
  • Accès / Intégration Portail – JSR-168 (déploiement dans des portails open-source)
  • Fournit un emplacement permettant d'acheminer, de refuser et d'ignorer les tâches de workflow et d'afficher des notifications.
  • Gestion automatique de conversion de format
Classement - Catégorisation
  • Extraction automatique de méta-données et catégorisation à partir de tout type d'interface (messagerie, serveur, etc)
  • Possibilité d'incrémenter automatiquement la catégorisation à partir de l'interface logicielle
  • Extraction de documents par requêtes croisées sur les métadonnées.
Recherche
  • Recherche distribuée avancée
  • Recherche par catégorie
  • Affiche une hiérarchie navigable des catégories de contenu indexées dans l'emplacement cible.
  • Recherche et recherche avancée
  • Localise rapidement un contenu grâce à une recherche sophistiquée combinant la recherche en texte intégral et des critères d'attribut de contenu.
  • Abonnements
  • Permet d'accéder facilement aux modifications de contenu et de les contrôler à l'aide des dossiers et listes de contenu.
Gestion des versions
  • Check-In/Out : gestion des modifications sur le fichier : verouillage : déverouillage
  • Gestion des version majeures et mineures
  • Gestion automatisée du cycle de vie des documents
  • Check-In/Out
  • Gestion des versions majeures et mineures
  • Gestion automatisée du cycle de vie du document
Audit
  • Historique de création et de modification (qui? quand ? etc.)
  • Historique de création et de modification (qui, quand, quel type de modification (fichier ou métadonnées))
Diffusion
  • Référencement croisé de plusieurs documents – à travers plusieurs espaces et documents
  • Diffusion de la base de données par intranet et internet
Confidentialité
  • Gestion de la confidentialité par la gestion des utilisateurs, des fonctions et des groupes
  • Assignation d'un niveau de sécurité au document
  • Gestion de la confidentialité par la gestion des utilisateurs, des fonctions et des groupes
  • Assignation d'un niveau de sécurité au document

Conclusion

Alfresco est un logiciel libre offrant les mêmes possibilité de gestion que Documentum.

Son avantage est la communauté de développeurs et d'utilisateurs qui utilisent ce logiciel et la volonté clairement affichée par les fondateurs de cette solution d'en faire un outil majeur dans la gestion de contenu. Alfresco a toutes les cartes en main pour faire fléchir les logiciels propriétaires et s'affirmer comme l'un des leaders de la gestion de documents électroniques.

Documentum a quant à lui l'avantage d'être déployé dans les plus grands groupes industriels ou de service mondiaux (HP, Cadence, Elsevier, General Electrics, ...) Son historique fait la robustesse du logiciel. Le support et le déploiement des applications web collaboratives (E-room) adjointes au logiciel de gestion documentaire font de cet outil l'un des majors de la GED.

Les besoins des utilisateurs sont sur 2 outils relativement semblables. Aux administrateurs des bases de données et aux directeurs des services informatiques de déterminer donc leurs besoins en terme de support (service vendu avec le produit ou utilisation de la communauté d'utilisateurs du logiciel libre), de déploiement (interface web ou interface logicielle)et de coût.

Sources

Liens internes

A l'heure où la première version de cet article est publiée, les articles suivants n'ont pas encore été rédigés.

[impression]

DokuPedia sémantique