Utilisation du Hash (#) dans les urls pour le SEO:

Le hash est le caractère “#” qu’on voit parfois dans certaines urls. L’utilisation du hash dans les urls est très simple à mettre en place et a une enorme utilité en terme de SEO notamment pour éviter le duplicate content !

Pourquoi utiliser le hash dans les urls? Tout simplement parce qu’il y a une semaine, le “Big 3″ des moteurs (Google, Yahoo et MSN) on annoncé la mise en place d’une balise Link avec rel”canonical” pour aider les webmaster à résoudre le problème de duplicate content. L’utilisation du hash est aussi un autre moyen de gérer justement ce problème de duplicate content.

Exemple de duplicate content:

  • Listing d’un produit sous plusieurs catégories
  • Problème des paramètres de navigation (ex: http://www.site.com/B00DK/ref=acc_glance_sw_ai_549_1_img)
  • Problème des URLs traquées en cas d’affiliation (ex: http://www.amazon.com/Logitech-Cordless-Laser-Mouse/?affid=1234)

…etc.

Problèmes générés par le duplicate content:

Il existe beaucoup de conséquences liées au duplicate conte! En voici les plus importantes:

  • En cas de contenu dupliqué, les moteurs de recherche choisissent une page à afficher sur les SERPs et peuvent ne pas choisir la version que vous souhaitez (la version Print Friendly)
  • Les moteurs peuvent aussi afficher la page avec les urls traquées (destinée à l’affiliation) et donc vous payerez une commission à votre plateforme d’affiliation pour un trafic issu des moteurs de recherche
  • Votre référencement en souffre parce que le PageRank est fortement dilué
  • Votre site peut ne pas être crawlé entièrement

…etc.

Utilisation du hash dans les urls

L’utilisation du symbole Diez (#) peut être très puissant pour le SEO. En effet, les moteurs de recherche ne savent pas interpréter le hash! Leur compréhension et indexation des urls s’arrête au symbole Direz! Ainsi, les deux urls ci-dessous dont identiques pour les moteurs de recherche:

www.seoland.fr
www.seoland.fr/#je_suis_invisible
contrairement à
www.seoland.fr/?je_sui_visible
qui est une autre url totalement visible aux yeux des moteurs.

Les deux premières urls peuvent donc afficher un seul contenu sans poser aucun problème de contenu dupliqué.

Dans quel cas utiliser le hash dans les urls?

Il existe 3cas au moins dans lesquels il est très conseillé d’utiliser le hash:

1. Canonicalisation ou en anglais “Canonicalization”:

L’attribut rel=”canonical” inventé par les moteurs en ce début de mois respecte le même principe que le hash dans les urls. En fait, en utilisant un hash, on permet de canonicaliser l’url avant le hash. Cela permet de ne montrer aux moteurs qu’un seul contenu par url et de centraliser le Page Rank sur l’url canonique!

2. Affiliation:

pour traquer les urls destinées à l’affiliation, il est préférable d’utiliser le hash plutôt que le point d’interrogation. Ex: http://www.amazon.com/Logitech-Cordless-Laser-Mouse/#affid=1234 ne présente aucun problème de duplicate content, par contre http://www.amazon.com/Logitech-Cordless-Laser-Mouse/?affid=1234 est un réel danger pou la page.

il est à noter que certains outils de tacking par exemple Xiti ou analytics, permettent nativement l’utilisation du hash pour traquer certaines urls.

3. Limiter l’indexation d’un contenu:

On peut aussi utiliser le hash pour empêcher l’indexation d’une partie du contenu d’une page de news par exemple! Si on a une news sur 4 pages et qu’on ne veut indexer que la première page, on peut utiliser le hash! De cette façon même si les internautes font des liens vers les autres parties de la news, grâce au hash dans les urls, ces parties ne seront jamais dans l’index. Ex:www.monsite.com/news.html et www.monsite.com/news.html#Part2

Pour aller plus loin, voici une présentation faite par Rand Fish, Intervenant de SeoMoz, et intitulée SEOmoz Whiteboard Friday – Using The Hash

12 Responses for this post

  1. Julien
    Julien
    | |

    C’est une très bonne technique. Elle a cependant le défaut d’être un détournement flagrant des standards. A la base, la partie de l’url suivant le #, doit désigner une ancre de page.

    Dans les faits, j’ai toujours trouvé des solutions plus propres permettant d’éviter d’y recourir, mais cela reste une solution dans la boite à outil d’un référenceur.

    Reply
  2. Immo
    Immo
    | |

    C’est pas Scott qui fait la présentation c’est Rand Fish…

    Reply
  3. Julien
    Julien
    | |

    ça dépend vraiment de la problématique à régler, le panel des solutions est large : cloaking pour Google comme peut le faire la fnac pour retirer certains paramètres de tracking, 301 sur les liens d’affiliation comme peut le faire Amazon, modification dans la structure des liens affiché (quitte à faire sortir le visiteur de la catégorie dans laquelle il navigue), ou encore utilisation du tout récent “canonical”… C’est la problématique qui va définir la solution à adopter. Chaque solution a ses avantages et ses inconvénients, le plus dur étant souvent de déterminer quand une solution est meilleure qu’une autre dans un cas particulier.

    Reply
  4. Julien
    Julien
    | |

    L’usage du cloaking dépend du contexte. Si c’est pour masquer des paramètres de tracking Google n’y voit pas d’inconvénient.

    En ce qui concerne l’affiliation, on a l’option #, 301 et canonical. Si cette dernière est efficace (à voir à l’usage), ce sera probablement la meilleure solution.

    De plus pour l’affiliation il existe des cas, ou on peut faire des 301, mais ou on n’a pas la main sur le format des paramètres d’affiliation.

    Reply
  5. jacquot
    jacquot
    | |

    merci pour cet article très intéressant…. et qu’en est-il de l’arobas ? apparemment les moteurs le considereraient de la même façon…

    Reply
  6. julien
    julien
    | |

    J’ai quand même un petit problème avec cette méthode.

    Mon serveur ne reçoit jamais ce qu’il y a après le “#”, normal c’est une information client.
    Donc si j’ai une url style http://www.monsite.com/blablab/#affid=8989 comment fait mon serveur pour traiter le parametre affid ?

    Reply
  7. Blog on travel
    Blog on travel
    | |

    J’ai mis en place un système de tracking d’affilié sur mon site. Seulement j’ai l’impression que j’ai fais une erreur. En effet j’ai construit l’url suivante: http://monsite1.com#affiliate1 sans slash entre le hash tag et le point com. Est-ce une erreur? dois-je rajouter le slash ainsi: monsite1.com/#affiliate1 pour que ganalytics le track?

    Reply

Leave a Reply

Name
Name*
Email
Email *
Website
Website