URLs canoniques: Règles de réécriture htaccess.

Qu’est ce qu’une l’URL canonique (canonical URL)

On dit qu’une adresse web est une URL canonique quand elle est l’adresse “officielle” d’une page web, celle qu’il est préférable d’utiliser pour accéder au contenu correspondant.
Peu de webmaster le savent, mais la plupart des sites sont accessibles via deux adresse différente: http://www.domaine.com et http://domaine.com
Pour les moteurs de recherche cela représente du duplicate content (ou contenu dupliqué).

Duplicate content?

Le duplicate content est le fait qu’une seule page web (avec un contenu unique) soit accessible via deux ou plusieurs urls différentes.


Dans le cas des urls canoniques, les moteurs considèrent que la page est dupliquée et donc peuvent choisir d’indexer l’une ou l’autre des adresse au détriment de la seconde.

Risque des URLs canoniques:

On peux avoir de sérieux problèmes de duplicate content. La sanction pour ce genre de transgression des guidelines n’est pas automatique mais peux être la goûte qui fera déborder le vase si vous cumulez les pratiques illicites dites aussi de blackhat.
Au delà du contenu dupliqué, il y a aussi un risque lié à la fuite du PageRank. En effet, si vous avez une page index.php accessible depuis l’adresse http://domaine.com/index.php et http://www.domaine.com/index.php, alors d’autres sites peuvent faire des liens vers la pages en utilisant l’une ou l’autre des urls. En terme de page rank, la page http://www.domaine.com/index.php ne recevra donc que ½ du PR des liens qui pointent vers elle au lieu d’en recevoir la totalité. Son Page Rank sera donc divisé en 2.

Interpretation des moteurs des URLs canoniques

Il est généralement constaté que les moteurs, Google notamment, deviennent de plus en plus intelligent et reconnaissent ce problème d’url canonique et donc choisissent l’url avec les “www” sans entreprendre des pénalités particulière contre le site. Cela dit il vaut mieux faire le choix de l’url qu’on veut utiliser que de laisser les moteurs choisir pour nous.

Forcer le sous domaine www

Il existe aussi des méthodes pour corriger ce problème d’url canoniques:

1. pour Google, depuis la plateforme de Google pour les webmaster tools:

il suffi de se rendre dans son compte Google Webmaster Tools, d’aller dans outils>choisir son domaine favoris> et vous choisissez le domaine que vous souhaitez. Enfin, validez votre choix

2. en utilisant un fichier htaccess (pour les serveurs apache)
Pour forcer le sous domaine www (et interdire l’indexation du site sans ce sous domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com$1 [QSA,R=301,L]

Au contraire, pour supprimer le sous domaine www (et interdire l’indexation du site avec ce sous domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :

RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]

Attention: aux cas particuliers, notamment si vous avez des sous domaines (autres que www).

4 Responses for this post

  1. jules
    jules
    | |

    Bonjour,

    je souhaite utiliser ce code .htaccess avec un sous domaine :

    RewriteEngine On
    RewriteCond %{HTTP_HOST} !^example\.com [NC]
    RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]

    l’exemple du sous domaine : exemple.com/sous-domaine

    comment il faut faire svp ?

    Merci d’avance pour vos différents articles..

    Reply

Leave a Reply

Name
Name*
Email
Email *
Website
Website