Agence du Numérique (ex - Agence Wallonne des Télécommunications / AWT), la plateforme ICT de la Wallonie

lundi 5 décembre 2016

Référencement: optimiser l'organisation d'un site Web

En optimisant l'organisation des pages d'un site Web, on permet aux robots de les trouver, et donc de les indexer, plus facilement. Différentes techniques permettent d'atteindre cet objectif dès la mise en ligne du site
Twitter Facebook Delicious
Mis à jour le 20/10/2008 | Imprimer | Envoyer

Le nom de domaine

Le plus important est d'abord de choisir un nom de domaine qui a du sens et qui se rapporche le plus de la marque ou du produit.

Si on vend des meubles et que l'entreprise s'appelle Durant, un nom de domaine idéal pourra être www.meubles-durant.com. Il indique à la fois l'activité et le nom de la société. Il est préférable à www.meublesdurant.com, car sans le tiret, les robots ne seront pas capables de séparer logiquement les deux mots.

Certaines sociétés de gestion des noms de domaine permettent aujourd'hui d'enregistrer des noms de plus de 60 caractères. Attention toutefois à ne pas faire trop compliqué en voulant être trop complet.

Varier intelligemment les extensions!

Il peut être utile d'enregistrer plusieurs noms de domaine en profitant des différentes extensions disponibles (.com, .be, .eu, .net, etc.). On veillera cependant à rediriger ces différentes extensions vers le nom de domaine principal pour éviter le "duplicate content" et le blacklistage du site.

Le poids des mots dans les URLs

Les moteurs de recherche prennent en considération le nom des pages et des dossiers lors de l'indexation d'un site Web. La solution optimale est de les nommer suivant le thème développé dans le contenu. Par exemple, un fichier nommé "e-business.htm" aura plus de poids que "page4.htm". De même un dossier appelé "/contact/" sera mieux référencé que "/folder_32/".

Les mots-clés doivent être séparés par un tiret, seul séparateur de mot interprété correctement par les moteurs de recherche. Si le contenu de la page traite de l'assurance automobile, on pourra par exemple la nommer "assurance-auto.htm".

Pages dynamiques

Si les extensions des pages dynamiques comme .aspx ou .php ne posent pas de problème spécifique aux moteurs de recherche, il faut être plus attentif aux URL contenant des paramètres. On considère en général qu'au delà de 3 paramètres, les robots de moteurs de recherche n'indexent plus les pages.

Ainsi, l'URL "http://www.dupont.be/catalogue.cfm?produit=12" sera indexée.

Par contre "http://www.dupont.be/catalogue.cfm?produit=12&lang=fr&cate=345&souscate=345654&promo=true" sera ignorée par la plupart des moteurs de recherche.

Une technique de plus en plus utilisée est l'URL rewriting. Elle consiste à réécrire "à la volée" des adresses compliquées en adresses facilement interprétables par les moteurs de recherche. Cette réécriture est également profitable aux utilisateurs.

Réécrire une URL:

  • avant: http://www.dupont.be/catalogue.cfm?produit=chaise&couleur=rouge&marque=megachaise
  • après: http://www.dupont.be/catalogue/chaise-rouge-megachaise

La réécriture demande la mise en oeuvre de ressources techniques au niveau du serveur Web. Celles-ci varient en fonction de plateforme de développement utilisée.

La navigation

Les moteurs de recherche indexent le contenu d'un site Web en suivant les liens depuis la page d'accueil. La façon dont la navigation est organisée sur les pages d'un site est donc primordiale pour la bonne indexation de celui-ci.

Il est important de prévoir une navigation basée sur les liens "texte". Tout autre type de liens n'est pas interprété par les robots. Le niveau de profondeur ne doit pas accéder 4 clics, au-delà, les moteurs n'indexent plus les pages.

Parmi les éléments qui peuvent nuire à une navigation optimisée, on relèvera particulièrement:

  • les frames,
  • la navigation par formulaire,
  • les liens javascript,
  • les liens à l'intérieur d'un contenu flash,
  • les URLs à plusieurs paramètres,
  • les URLs trop longues,
  • les redirections temporaires,
  • les liens brisés,
  • les pop-up.

Il existe différentes techniques pour améliorer la navigation sur un site:

  • créer des liens permettant de relier les pages et les rubriques d'un site entre elles,
  • utiliser des liens porteurs de sens (éviter: "cliquer ici", "pour en savoir plus", etc.),
  • proposer un chemin de navigation permettant de revenir sur ses pas (fil d'Ariane),
  • proposer les liens vers les rubriques principales en bas de page.

Sitemap

Une sitemap permet de lister toutes les ressources accessibles d'un site Web. Ce "plan" permet d'indiquer facilement aux moteurs de recherche les pages du site à explorer.

Il s'agit d'un fichier au format XML qui répertorie les informations suivantes pour chaque page à indexer:

  • l'URL de la page,
  • la date de dernière modification,
  • la fréquence de mise à jour,
  • l'importance relative par rapport aux autres URL du site.

Le protocole sitemap est reconnu par Google, Yahoo! et Microsoft LiveSearch. Google permet d'ailleurs de publier des sitemaps destinés à Google vidéos et Google actualités.

Une carte du site en HTML peut également être mise à disposition des internautes pour faciliter la navigation à l'intérieur du site.

robot.txt

Les fichiers robot.txt sont des fichiers texte placés à la racine d'un site Web sur le serveur. Ils sont destinés uniquement aux robots (spiders) des moteurs de recherche pour leur indiquer les pages qui doivent être indexées ou pas. Ce fichier n'influence pas la navigation de l'utilisateur.

La syntaxe permet d'interdire l'accès à certaines pages ou à l'entièreté du site à tous les robots où certains spiders particuliers.

Pour en savoir plus

  • The Web robots pages Lien externe
    Informations à propos des robots (crawlers ou spiders) des moteurs de recherche, et notamment sur les spécifications du fichier robot.txt
    http://www.robotstxt.org
  • Sitemaps Lien externe
    Sitemaps permet aux webmasters d'indiquer facilement aux moteurs de recherche les pages de leurs sites à explorer
    http://www.sitemaps.org
  • Référencement: pour bien commencer
    Un site Web bien référencé sur les principaux outils de recherche est le gage d'un trafic important. L'AWT fait le point sur les notions de base pour bien comprendre comment fonctionne le référencement d'un site Web sur les moteurs de recherche
    http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,101
  • Référencement: optimiser le contenu d'un site web
    Le référencement naturel passe avant tout par un contenu de qualité. Un contenu bien rédigé, mis en forme correctement et mis à jour régulièrement permet d'optimiser le positionnement d'un site dans les résultats d'un moteur de recherche
    http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,102
  • Référencement: les mauvaises pratiques
    Pour améliorer le référencement de leur site à tout prix, certains mettent en oeuvre des pratiques qui risquent de produire l'effet exactement inverse. Elles peuvent même conduire à son exclusion pure et simple du site des index des moteurs de recherche
    http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,103
  • Référencement: les outils des moteurs de recherche
    Les moteurs de recherche, et singulièrement Google, proposent des outils gratuits pour aider les Webmasters. Bien utilisés, ces outils permettent de contrôler et d'améliorer sensiblement le référencement d'un site Web
    http://www.awt.be/web/ebu/index.aspx?page=ebu,fr,foc,100,107
Portail de la Région wallonne