Référencement: optimiser le contenu d'un site Web
Le référencement naturel passe avant tout par un contenu de qualité. Un contenu bien rédigé, mis en forme correctement et mis à jour régulièrement permet d'optimiser le positionnement d'un site dans les résultats d'un moteur de recherche
Mis à jour le 29/10/2008 | Imprimer | Envoyer Bien concevoir son site Web
Avant de consacrer de l'énergie à référencer un site sur les moteurs de recherche, il est important de s'assurer qu'il répond aux standards et bonnes pratiques en matière de développement Web, et que son code soit bien interprèté par les robots de moteurs de recherche. En résumé: est-il Search Engine Friendly?
Un site Web est composé de pages HTML Langage utilisé pour formater l'information sur Internet grâce notamment à des tags (qui indiquent comment mettre en page le document) et créer des liens hypertextes d'une page web vers d'autres pages web, internes ou externes au site. Le HTML est un langage de description permettant d'organiser le contenu d'une page Web à l'aide de balises (tags). Chaque balise est destinée à qualifier un contenu précis: titres, paragraphes, listes à puces ou numérotées, tableaux, citations, définitions, formulaires, etc. Ces balises peuvent être mises en forme par des "styles" qui déterminent l'affichage du contenu dans le navigateur. Mais elles font bien plus: elles sont aussi déterminantes dans le processus d'indexation et de référencement d'un site Web.
HTML ... retour à la source!
Trop longtemps associé à la présentation visuelle des contenus, le langage HTML (ou XHML) retrouve son rôle fondamental: structurer les pages et donner du sens à leur contenu.
Les robots se réfèrent aux balises HTML et au texte qu'elles contiennent pour indexer un site. Ils préfèrent les pages sans code javascript et styles embarqués, lesquels "polluent" le contenu des pages. Il est toujours préférable de stocker les scripts (.js) et les instructions de styles dans des fichiers externes (.css).
Utiliser du code HTML valide et conforme aux standards Web est un premier pas vers un site optimisé pour les moteurs de recherche.
Une utilisation correcte des différents niveaux de lecture (titres, sous-titres, paragraphes, listes, tables, etc.) et des mises en valeur du texte est très appréciée par les moteurs. Le contenu des balises de titre (<h1>, <h2>, <h3>) influence le positionnement d'une page. Il faut également veiller à ce que la chronologie soit respectée (pas de <h2> avant <h1>) et que les balises ne soient pas utilisées abusivement (tout un paragraphe dans les balises de titre). Une grande importance est aussi accordée au texte entouré de balises de mise en évidence <strong> ou <em>.
Soignez vos tableaux!
Les tableaux sont réservées aux présentations tabulaires de données. Différentes balises permettent de qualifier précisément le contenu d'un tableau. Ainsi pour le titre d'une colonne, on préférera utiliser une balise <th> (table-heading) plutôt qu'une balise <td> (table-data).
<table> vs <div>
Les tableaux ne doivent donc pas servir à structurer et organiser visuellement une page. Ce rôle est réservé aux balises div qui permettent de décrire des blocs de contenu, leur mise en forme et leur positionnement spécifique. Ainsi, l'encadré que vous êtes en train de lire est contenu dans une balise <div>.
Une bonne connaissance du langage HTML permettra d'utiliser d'autres balises spécifiques souvent méconnues: <cite>, <acronym>, <abbr>, etc.
Vidéos, images et javascript
Grâce au développement de l'Internet à haut et très haut débit, les contenus "riches" (rich media) se sont multipliés sur le Web. Ils posent cependant un problème d'indexation pour les moteurs de recherche.
Il est conseillé de prévoir un texte descriptif dans le code HTML pour ces différents médias:
- images: les fichiers images doivent être nommés en fonction de ce qu'ils illustrent (par exemple, logo_de_mon_entreprise.jpg plutôt que logo.jpg ou pire image1.jpg). Les attributs "title" et "alt" doivent être complétés dans la balise
<img>; - vidéos: à ce jour, la seule alternative est de prévoir un texte descriptif;
- javascript: dans la mesure du possible, insérer le contenu similaire à celui produit par le code javascript dans une balise
<noscript>.
Toutes ces recommandations sont aussi indispensables à l'accessibilité d'un site, notamment pour les outils destinés aux malvoyants (lecteurs vocaux).
Le Label Anysurfer, le web accessible à tous les citoyens
L'accessibilité des sites Web fait aujourd'hui l'objet d'une véritable attention. Le label AnySurfer est octroyé aux sites qui respectent les directives d'accessibilité Web. Il traduit la volonté de rendre l'accès au Web facile pour tous les citoyens
http://www.awt.be/web/gov/index.aspx?page=gov,fr,foc,100,056
Et AJAX?
AJAX Développement web basé sur Javascript pour effectuer des requêtes Web sur une page sans la recharger. AJAX fait appel à: (X)HTML et CSS pour la présentation visuelle, DOM (Document Object Model) pour la découpe d'une page en objets et à Javascript, en particulier l'objet XMLHTTPRequest pour manipuler des requêtes et des réponses est une technologie qui permet d'effectuer des requêtes sur une page sans la recharger entièrement. Au coeur de l'émergence du Web 2.0, AJAX permet le développement d'interfaces plus intuitives, plus rapides et plus conviviales pour l'utilisateur.
Par contre, son fontionnement sur des navigateurs plus anciens reste aléatoire et il peut causer des problèmes pour l'indexation du contenu qu'il manipule. On utilisera donc cette technologie avec prudence en la réservant à des usages apportant une plus-value réelle pour l'utilisateur.
Les Métadonnées
Les "meta-tags" ("keywords" et "description") et le "title-tag" sont des balises de code HTML qui décrivent le contenu d'une page Web (méta = information sur l'information), même si l'importance qui leur est accordée varie d'un moteur à l'autre. Pour espérer un bon positionnement dans les moteurs de recherche, il est recommandé d'optimiser le contenu de ces balises.
Le contenu du title-tag (<title></title>) ne doit pas être une simple succession de mots clés, mais bien une expression ayant du sens. Le titre est en effet utilisé pour l'affichage des résultats de recherche et apparaît également dans le cadre de la fenêtre du navigateur lors de l'affichage de la page. Le titre doit être spécifique à chaque page.
La balise <meta name="description"> permet de présenter un résumé du contenu de la page. Elle est d'autant plus importante qu'elle est très souvent retenue en plus du titre pour présenter les pages lors de l'affichage des résultats après une requête dans un moteur de recherche. Faute de description, le moteur risque d'afficher le début du code html de la page, ce qui n'aura guère de sens pour l'internaute. La taille de la description ne devrait pas dépasser 250 caractères. Il s'agit d'une zone idéale pour répéter quelques mots clés essentiels. La description doit être spécifique à chaque page. La description META permet d'améliorer le taux de clic sur une page, mais elle n'a aucune incidence sur son classement dans les résultats de recherche.
La balise <meta name="keywords"> permet d'ajouter quelques mots particulièrement importants et signifiants pour décrire un site. Pour les choisir, la question est la suivante: quels sont les mots qu'un internaute va le plus spontanément utiliser pour trouver un contenu spécifique sur un moteur de recherche? Un mot clé ne doit pas être répété plusieurs fois au risque de voir les moteurs de recherche pénaliser le site. Par contre, on peut proposer plusieurs orthographes différentes (masculin et féminin, singulier et pluriel, majuscules et minuscules ou encore les fautes d'orthographe les plus courantes). Comme la description, les mots-clés seront, au moins en partie, spécifiques à chaque page.
Outre ces balises essentielles, il en existe d'autres dont le contenu est pris en compte de manière aléatoire par les différents moteurs de recherche.
L'optimisation du contenu
Les moteurs déterminent le positionnement d'une page en fonction de sa pertinence par rapport à la recherche et de sa popularité sur le Web. Ils mesurent donc à la fois l'adéquation du contenu d'une page Web avec les mots-clés recherchés et le nombre de liens qui pointent vers la page.
Rédaction et mots-clés
Chaque page doit avoir un sujet relativement précis. La rédaction du contenu doit intégrer les mots-clés et les expressions-clés stratégiques relatifs au sujet traité. Tenter d'imaginer les requêtes des internautes pour trouver un contenu est une bonne technique pour rédiger une page. Il est plus facile de positionner une page sur des mots clés très spécifiques que sur des termes plus génériques.
Pour être efficace, chaque mot-clé doit apparaître plusieurs fois dans la page (critère de densité) et de préférence à des endroits stratégiques (titres, premiers paragraphes, liens). On évitera d'utiliser les mots-clé abusivement (répétition intempestive, énumération, etc.), ce qui conduira à un résultat inverse à celui attendu (éjection du site de l'index des moteurs).
Les moteurs n'accordent pas la même importance à tout le contenu d'une page: les premières phrases auront plus de poids que les dernières. Il vaut donc mieux mettre les informations importantes dans les permières phrases. Cette façon d'organiser le contenu est appelée "pyramide inversée": on commence par la conclusion et les idées directrices que l'on développe ensuite.
La fréquence des mises à jour et la structuration du contenu par les balises HTML influencent également le positionnement des pages.
Les liens et le pagerank
Le lien hypertexte est l'essence même du Web. En effet, le Web a notamment marqué sa différence par l'opportunité qu'il offre de passer d'une contenu à l'autre en cliquant sur les liens proposés. Dans ce contexte, il est évident qu'un site Web isolé, proposant peu de liens et vers lequel peu de liens pointent, ne sera pas apprécié des internautes et encore moins des moteurs de recherche.
Le pagerank est un paramètre important dans l'algorithme de Google. Il permet de déterminer le niveau de popularité d'une page Web. Au plus le pagerank d'une page est élevé, au mieux la page sera positionnée dans les résultats de recherche pour un mot clé donné: une page populaire est considérée comme plus pertinente et donc plus intéressante pour l'internaute.
Comment connaître le pagerank d'une page?
Il suffit de télécharger gratuitement la barre d'outil Google et d'activer l'affichage du classement PageRank pour connaître l'importance relative, déterminée par Google, de la page consultée.
De nombreux liens externes peuvent faire augmenter la popularité de votre site. Un lien venant d'un site populaire (avec un pagerank élevé) donnera plus de poid à une page. Un bonne stratégie de réfencement d'un site Web passera donc obligatoirement par la recherche de sites acceptant de proposer un lien vers celui-ci. Ces notamment dans cette optique que les annuaires, et spécifiquement les annuaires spécialisés, prennent toute leur importance. Des partenariats avec des acteurs dont les activités sont complémentaires sont également très intéressants. Ainsi, le site Web d'un restaurant peut proposer des liens vers un négociant en vin, des attactions touristiques proches, et inversément!
Les liens internes ont aussi une importance dans le calcul du pagerank. On peut ainsi opitimiser le pagerank de ses pages en les interconnectant par le biais de mots-clés ciblés.
Votre site est-il populaire?
Tapez "link:nom de domaine du site" dans la case de recherche de Google ou Yahoo! et vous obtiendrez la liste des pages qui pointent vers votre site.
Pour en savoir plus
- Référencement: pour bien commencer
Un site Web bien référencé sur les principaux outils de recherche est le gage d'un trafic important. L'AWT fait le point sur les notions de base pour bien comprendre comment fonctionne le référencement d'un site Web sur les moteurs de recherche
http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,101 - Référencement: optimiser l'organisation d'un site Web
En optimisant l'organisation des pages d'un site Web, on permet aux robots de les trouver, et donc de les indexer, plus facilement. Différentes techniques permettent d'atteindre cet objectif dès la mise en ligne du site
http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,104 - Référencement: les mauvaises pratiques
Pour améliorer le référencement de leur site à tout prix, certains mettent en oeuvre des pratiques qui risquent de produire l'effet exactement inverse. Elles peuvent même conduire à son exclusion pure et simple du site des index des moteurs de recherche
http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,103 - Référencement: les outils des moteurs de recherche
Les moteurs de recherche, et singulièrement Google, proposent des outils gratuits pour aider les Webmasters. Bien utilisés, ces outils permettent de contrôler et d'améliorer sensiblement le référencement d'un site Web
http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,107