Vous pouvez également utiliser le moteur ou l'améliorer
Référencement et optimisation d'un site web
Un article de DokuPedia.
Sommaire |
Référencement d'un site web
Définitions
Référencement
Le référencement d'un site web est une notion parfois galvaudée et souvent mal connue. Il existe certainement autant de définitions de ce terme qu'il existe de référenceurs sur la planète Web. Mais on peut estimer que deux définitions reviennent le plus souvent :
- Définition 1 : Le référencement caractérise la phase d'inscription d'un site web dans les bases de données des outils de recherche (annuaires et moteurs). Cette phase va donc de la soumission d'un site jusqu'à sa présence effective dans les bases, les index, des outils. Cette définition ne prend pas en compte l'aspect "positionnement".
- Définition 2 : Le référencement désigne toute la phase de mise en relation entre un site web et un outil de recherche : audit, recherche des mots clés, soumission, vérification, inscription, positionnement, suivi.
Cette définition est donc plus large que la précédente. Les deux définitions sont employées de façon courante, aussi faut-il bien savoir de quoi l'on parle lorsqu'on emploie le terme de "référencement".
Source : Dico du Net : Dictionnaire en ligne : [1] SEO - Référencement - Search Engine Optimization
Référencement naturel
Les robots (ou "spiders" ou "crawlers") des moteurs de recherche scannent régulièrement les sites et pages web pour enrichir leurs index : c’est ce que l’on appelle le "crawling" . Il lisent les pages, les indexent, et rajoutent à leurs listes de pages à visiter toutes celles liées à la page en cours de traitement. L’indexation se fait donc naturellement, sans démarche nécessaire de la part de l’éditeur du site. Ils utilisent ensuite de nombreux critères dans leurs algorithmes pour positionner les sites. Le référencement naturel est gratuit contrairement au système de liens sponsorisés.
Liens sponsorisés
Avec les liens sponsorisés (ou liens promotionnels), on entre dans le champs de la stratégie marketing. La tendance croissante de l’e-buisiness incite les entreprises à créer des campagnes de liens commerciaux. Celles-ci achètent des mots-clés au "coût par clic" selon un système d’enchères. En contrepartie, leur site apparaîtra dans les premiers résultats répondant à ces mots-clés. Aujourd’hui, les liens sponsorisés sont clairement identifiés dans les pages de résultats comme de la publicité, et il n’y a plus de possibilité d’acheter son positionnement sans que l’internaute ne s’en aperçoive. Les services de liens sponsorisés francophones les plus importants sont : Google AdWords, Yahoo! Search Marketing et Miva.
Référencement et outils de recherche
Identification des principaux outils de recherche
- Les annuaires
Les annuaires généralistes les plus connus sont : l’Annuaire Yahoo! et l’Open Directory Project. Notons que de nombreux annuaires ont disparu, parmi lesquels ceux de Nomade, MSN, AOL et Voilà.
- Les moteurs de recherche
Les moteurs de recherche sont pléthore sur le web. Google, Yahoo!, Live Search (ex-MSN), Exalead, sont autant de noms devenus incontournables dans le monde des moteurs de recherche. Mais attention, il ne faut pas confondre moteurs de recherche et portails de recherche, ces derniers ne faisant qu’utiliser un moteur de recherche créé par d’autres pour fournir des liens de résultats. Les portails combinent ensuite les résultats fournis par le moteur à d’autres informations (copies d’écran, liens sponsorisés,…) pour enrichir les pages de résultats vues par l’internaute. AOL utilise ainsi le moteur de Google. L’intérêt en ce qui nous concerne est donc de savoir qui réalise les moteurs, et qui les utilise.
Pour plus d’informations, voir :
- sur Abondance : [2] - Annuaires et moteurs des principaux portails
- sur Search This : [3] - Search Engine Decoder
Une liste de sites spécialisés en science de l'information, documentation et communication est également disponible dans le Moteur de recherche international en documentation de DokuPedia.
- Répartition du trafic
Après avoir vu quels étaient les principaux outils de recherche, prenons connaissance de leur poids respectif pour connaître leurs parts de marché. Voici donc deux tableaux récapitulatifs des principaux outils utilisés par les internautes :
Source : Baromètre XiTi & 1ère position |
|
Source : "Nielsen//NetRatings MegaView Search, January 2007" disponible sur le site Nielsen // NetRatings
Aux Etats-Unis comme sur le web francophone, Google obtient la médaille d’or. En France, on peut même parler d’hégémonie. Pour être vu et lu sur le web, il est donc incontournable d’être référencé dans son index.
Technologies mises en œuvre par les moteurs de recherche
Les moteurs de recherche fonctionnent selon 3 principes :
- un robot (un logiciel) parcourt régulièrement le web à la recherche de nouvelles pages en suivant les liens des pages qu’il rencontre. Pour connaître les robots utilisés par les moteurs de recherche, voir : Indicateur.com : [4] - Les robots d’indexation ;
- les informations recueillies par le robot sont intégrées à un index (une base de données) ;
- l’internaute effectue un recherche par mots-clés dans l’interface de recherche du moteur : le moteur va alors rechercher les occurrences des mots-clés dans son index, et afficher une liste de résultats (les pages où les mots-clés apparaissent dans son index) en fonction de critères qui lui sont propres.
Optimisation d'un site web
Techniques pour le référencement dans les outils de recherche
Soumission d’un site dans les annuaires
Dans les annuaires généralistes, la soumission est gratuite. La démarche est très simple : dans le plan de classement de l’annuaire, on se rend d’abord dans la rubrique où l’on souhaite voir apparaître son site. Une fois la rubrique déterminée, il suffit de cliquer sur un lien du type "soumettre un site " pour que la demande soit prise en compte par l’annuaire.
- Pour suggérer un site dans l’Annuaire Yahoo!, voir l’aide : [5]
- Pour suggérer un site dans l’Open Directory Project, voir l’aide : [6]
Le délai entre la soumission d’un site et sa présence effective dans un annuaire peut prendre quelques semaines, voire plusieurs mois car contrairement aux moteurs de recherche qui utilisent des robots, l’inscription est validée par des "êtres humains".
Critères pris en compte par les moteurs de recherche
Comme pour les annuaires, la soumission manuelle est possible auprès des moteurs de recherche. Elle peut se faire directement sur leurs sites respectifs, ou à l’aide de logiciels de référencement. Cependant, l’inscription au moteur ne signifie pas pour autant que le site sera automatiquement indexé. Le moteur aura simplement pris connaissance de l’adresse du site, mais les questions suivantes se poseront : quand viendra-t-il le visiter ? enregistrera-t-il toutes les pages ? seront-elles bien classées dans les pages de résultats ? Actuellement, les professionnels du référencement recommandent de porter une attention particulière au référencement naturel en tenant compte des critères utilisés par les moteurs de recherche. En effet, les robots combinent de nombreux algorithmes pour indexer les sites et pondérer leurs résultats. On ne connaît pas tous les critères qu’ils utilisent car les technologies sont brevetées, mais ceux-ci se comptent par dizaines. En voici les plus connus :
- Les balises META (langage HTML)
Les principales balises META qui intéressent les moteurs sont :
- -La balise KEYWORDS : c’est à l’intérieur de cette balise que l’on inscrit les mots-clés correspondant à l’objet de la page.
- Suite à de nombreux abus (spamdexing), les moteurs ne tiennent plus compte de cette balise pour le positionnement d’une page. Elle pourra servir par contre lors de l’affichage des résultats, ou pour des pages basées sur des technologies non prises en compte par les robots, par exemple Flash.
- - La balise TITLE : elle donne un titre à la page, visible dans le navigateur. Elle doit décrire le contenu de la page avec des mots-clés pertinents.
- Les URL
La question du référencement se pose non pas après la mise en ligne d’un site mais pendant sa création. Au moment où le webmaster va construire l’arborescence sous forme de rubriques - les rubriques correspondant aux pages du site - il va être attentif aux URL qu’il associera à ces rubriques. C’est pourquoi il est conseillé :
- - d’intégrer des mots-clés pertinents dans l’URL de chaque page
- - d’éviter les signes de ponctuation (?-&-%, etc...) donnant une adresse du type : "www.monsite/perso/index.php?2006/07". Ecrire les URL complexes d'une manière plus lisible ("URL rewriting"), par exemple : "www.monsite/index.php/2006/07"
- - de créer des sous-domaines pour que le moteur affiche davantage de résultats liés au même site. Exemples : "www.catalogue.monsite.fr", "www.bibliographie.monsite.fr", "www.publications.monsite.fr"
- L’indice de popularité de Google : PageRank
Cette technologie est à l’origine du succès de Google. Elle consiste à évaluer la qualité d’un site selon les liens qui pointent vers le site en question (backlinks). L’idée est donc de dire : plus il y a de pages qui renvoient vers un site, plus celui-ci est populaire, donc "digne" d’être repéré et bien classé. On peut se faire une idée du PageRank (PR) d’une page en installant la barre d’outils de Google dans son navigateur. A chaque page web, un curseur PageRank indique son indice de popularité sur une échelle de 0 à 10. Outre la quantité de liens entrants, Google tient également compte de la qualité des liens. En effet, un lien depuis une page avec un fort PR a plus de poids et augmente le classement d’une page dans le moteur. Tout gestionnaire de site a donc intérêt à développer une politique d’échange de liens (netlinking) vers des sites complémentaires afin que Google repère son site via ses backlinks.
- L’indice de confiance de Google : TrustRank
Le TrustRank est un indice géré par des humains. L’algorithme est basé sur une liste de sites de confiance vérifiés manuellement. Si un lien depuis un site de confiance pointe vers une page, cela augmente sa popularité. Le TrustRank est complémentaire du PageRank et vise à lutter contre le spam dans les moteurs de recherche (spamdexing).
- Le fichier SiteMap
Il s’agit d’un fichier XML permettant d’indiquer au robot le plan d’un site. Il doit être installé sur le serveur d’un site. Il est important parce qu’il guide le robot dans son indexation. Pour chaque page, on peut par exemple lui indiquer la périodicité de mise à jour ou la manière dont on souhaite voir apparaître les résultats. Le fichier SiteMap est pris en compte par Google via son centre pour les webmasters, par Yahoo! et par Live Search.
Focus sur l’optimisation du contenu
Le contenu des pages intéresse de plus en plus les moteurs de recherche qui procèdent à une analyse du texte intégral. Pour optimiser ses pages, voici quelques idées :
- placer un maximum de mots-clés dans le texte pour augmenter l’indice de densité des mots-clés
- multiplier les pages de texte pour fournir un maximum d’informations au moteur
- procéder à une mise à jour régulière du contenu, notamment sur la page d’accueil
- les modules Flash et les frames ne sont pas pris en compte par les robots : il est important de fournir du texte en plus sur la page
Pièges à éviter
Définition du spamdexing
Traduction de l'anglais spamdexing (issue de spam et indexation), le référencement abusif désigne toutes les pratiques visant à tromper les moteurs de recherche afin d'améliorer artificiellement son positionnement.
Pratiques abusives
Dans le spamdexing, la technique la plus utilisée consiste à créer des pages dites satellites, c'est-à-dire une suite de sites web contenant un grand nombre de mots-clés et pointant vers le site cible. Les moteurs utilisent en effet entre autres le nombre de liens pointant vers un site pour juger de sa pertinence (PageRank).
Une autre technique existante est de remplir le contenu de sa page d'accueil de mots-clés, mais en dissimulant ces mots-clés pour l'internaute en utilisant une couleur identique à celle du fond.
Le référencement abusif peut être considéré comme de la fraude et un site peut être banni de certains moteurs lorsque cette technique est utilisée : il est alors inscrit sur une "black list" .
Voir aussi
Bibliographie
- Olivier Andrieu, Référencement 2.0, Abondance.com, 2006
Disponible par téléchargement en ligne uniquement : www.livre-referencement.com
- Référencement : la revanche du contenu, Dixxit, 2007
Disponible gratuitement à cette adresse : www.dixxit.fr/livre-blanc-referencement
Liens externes
par Olivier Andrieu
Informations sur le référencement et les moteurs de recherche.
voir aussi le site du Réseau Abondance
par Christophe Asselin
Recherche d’information sur Internet et intelligence économique.
blog de Sébastien Billard
Référencement : conseils, outils, actualité, forum.
Référencement et optimisation, outils gratuits.
Glossaire spécialisé dans le domaine des moteurs de recherche.
Dictionnaire en ligne collaboratif.

