Qu’est ce qu’une l’URL canonique (canonical URL)
On dit qu’une adresse web est une URL canonique quand elle est l’adresse “officielle” d’une page web, celle qu’il est préférable d’utiliser pour accéder au contenu correspondant.
Peu de webmaster le savent, mais la plupart des sites sont accessibles via deux adresse différente: http://www.domaine.com et http://domaine.com
Pour les moteurs de recherche cela représente du duplicate content (ou contenu dupliqué).
Duplicate content?
Le duplicate content est le fait qu’une seule page web (avec un contenu unique) soit accessible via deux ou plusieurs urls différentes.
Dans le cas des urls canoniques, les moteurs considèrent que la page est dupliquée et donc peuvent choisir d’indexer l’une ou l’autre des adresse au détriment de la seconde.
Risque des URLs canoniques:
On peux avoir de sérieux problèmes de duplicate content. La sanction pour ce genre de transgression des guidelines n’est pas automatique mais peux être la goûte qui fera déborder le vase si vous cumulez les pratiques illicites dites aussi de blackhat.
Au delà du contenu dupliqué, il y a aussi un risque lié à la fuite du PageRank. En effet, si vous avez une page index.php accessible depuis l’adresse http://domaine.com/index.php et http://www.domaine.com/index.php, alors d’autres sites peuvent faire des liens vers la pages en utilisant l’une ou l’autre des urls. En terme de page rank, la page http://www.domaine.com/index.php ne recevra donc que ½ du PR des liens qui pointent vers elle au lieu d’en recevoir la totalité. Son Page Rank sera donc divisé en 2.
Interpretation des moteurs des URLs canoniques
Il est généralement constaté que les moteurs, Google notamment, deviennent de plus en plus intelligent et reconnaissent ce problème d’url canonique et donc choisissent l’url avec les “www” sans entreprendre des pénalités particulière contre le site. Cela dit il vaut mieux faire le choix de l’url qu’on veut utiliser que de laisser les moteurs choisir pour nous.
Forcer le sous domaine www
Il existe aussi des méthodes pour corriger ce problème d’url canoniques:
1. pour Google, depuis la plateforme de Google pour les webmaster tools:
il suffi de se rendre dans son compte Google Webmaster Tools, d’aller dans outils>choisir son domaine favoris> et vous choisissez le domaine que vous souhaitez. Enfin, validez votre choix
2. en utilisant un fichier htaccess (pour les serveurs apache)
Pour forcer le sous domaine www (et interdire l’indexation du site sans ce sous domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com$1 [QSA,R=301,L]
Au contraire, pour supprimer le sous domaine www (et interdire l’indexation du site avec ce sous domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]
Attention: aux cas particuliers, notamment si vous avez des sous domaines (autres que www).



novembre 6th, 2008
admin
Posted in
Tags:
[...] dupliqué sur un site web, on peut citer 3 des causes les plus répondus: 1. Le problème des URLs canoniques: les pages du sites sont accessibles avec ou sans les 3W “www” 2. la duplication de la [...]
[...] pour faire en sorte que ce liens-la ne soient pas perdus. Pour ce faire, il faudra toucher à votre fichier htaccess et rajouter des règles de réécriture avec redirection 301. Voici un exemple simple de règle de [...]
Bonjour,
je souhaite utiliser ce code .htaccess avec un sous domaine :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]
l’exemple du sous domaine : exemple.com/sous-domaine
comment il faut faire svp ?
Merci d’avance pour vos différents articles..
@jules
je ne comprends pas ta question. Tes regles de redirection me selble corrected. Il suffit juste de mettre ca dans ton htaccess.
rques:
1- faut mettre un /$1 et non /1
2- le flag “L” ne doit pas etre mis si tu veux appliquer d autres regles sur ces urls