sept
26
2012

Duplicate content: régler le problème du tracking dans Google Analytics

Duplicate content: régler le problème du tracking dans Google Analytics
4 votes, 5.00 avg. rating (96% score)

Comme vous le savez, google analytics vous permet de créer des “campaign”  afin de traquer les liens qui pointent vers votre site. Il suffit pour cela de rajouter à la fin de votre url, certains paramètres marketing pouvant contenir par exemple: le nom de la compagne, la source (google, monsite.com,…), le medium (cpc, bannière, email,…)…etc.

Le soucis, c’est que les urls ainsi paramètrées générent de la duplication de contenu.

Exemple d’url contenant un tracking via Google analytics

Prenons un exemple concret:

Supposons que le site www.seoland.fr lance une news-letter et souhaite suivre directement dans google analytics les taux de lecture de ces liens.

Pour cela, rien de plus simple: une fois la newsletter créée, il suffit de se rendre sur l’outil de création des urls traquées Goolge Url Builder et de renseigner les différents champs demandés:

Ainsi, si l’url à traquer est ma home page donc: http://www.seoland.fr/, l’outil Url Builder de Google me donnera une nouvelle url à utiliser qui est la suivante:

http://www.seoland.fr/?
utm_source=newsletter&utm_medium=email&utm_campaign=nouveautes

Je pense qu’on sera tous d’accord pour dire que la duplication d’url est flagrante dans ce cas.

Comment régler ce problème d’urls dupliquées?

Le problème vient du fait que les paramètres passants derrière un “?” sont considérés comme une partie à part entière de l’url. Ce n’est pas le cas du “Hash”. La solution serait donc passer les paramètres en hash, c’est à dire apres un “#”. Théoriquement, il suffit juste de remplacer le “?” par un “#”pour que ça fonctionne. Ce cas de duplication liée au tracking a déja été abordé et expliqué sur ce site.

Pendant longtemps, régler ce problème était très lourd en développement parce qu’aucun outil ne permettait de le gérer automatiquement. Aujourd’hui, les choses sont beaucoup plus simpte parce que les principaux outils de mesure de webanalytics permettent nativement de gérer ce problème (dans une optique de référencement naturel bien évidemment). Xiti et Google analytics permettent donc facilement de gérer ça. Je ne sais pas ce qu’il en est d’Omniture mais aux dernières nouvelles, il me semble qu’il ne le gérait pas du tout (à confirmer donc).

Tracking marketing, Google analytics, duplication de contenu et SEO

Même si tout  le monde ne le sais pas forcement, Google analytics nous donne le choix entre l’utilisation du “?” pour tracker les urls, et/ou le “#”. Par défaut, l’outil est porté sur l’utilisation du “?”, on peut facilement lui demander de switcher sur l’utilisation du hash en custumisant un peu le code de suivi et on lui rajoutant une petite ligne de code. Il suffit d’utiliser le tag _setAllowAnchor method qui informe Google analytics que vos paramètres de tracking sont désormais précedés par un “#” au lieu d’un “?”.

Le code Javascript

Concretement, dans votre code actuel, vous avez ces deux lignes de code:

var pageTracker._gat._getTracker(‘UA-xxxxxx-y’);
pageTracker._trackPageview();

et bien, il suffit de placer quelque part entre ces deux lignes le code défini plus haut, vous devriez avoir un truc comme ça:

var pageTracker._gat._getTracker(‘UA-xxxxxx-y’);
pageTracker._setAllowAnchor(true);
pageTracker._trackPageview();

Les urls de tracking

En utilisant ce nouveau tag, vous vous rajouter la possibilité d’utiliser le hash pour votre tracking. Normalement, vous n’aurez pas besoin de modifier vos urls traquées avec le “?”, car Google analytics va gérer l’un et l’autre.

La nouvelle url de tracking sera donc la suivante:

http://www.seoland.fr/
#utm_source=newsletter&utm_medium=email&utm_campaign=nouveautes

Notez bien que l’url suivant ne fonctionnera pas:

http://www.seoland.fr/
?utm_source=newsletter#utm_medium=email#utm_campaign=nouveautes

Voila, j’espère que ça vous aidera dans votre lutte contre le duplicate content ;)

 

 

About the Author: Hafid Mermouri

Hafid est fondateur et directeur conseil SEO chez l'agence SEO HAROBAZ

11 Comments + Add Comment

  • Bonjour et merci pour l’idée.
    Je n’avais encore rien lu sur ce type de solution :)
    Traquer et limiter le DC, c’est sûr que c’est important, cela dit, je ne suis pas convaincu que Google pénalise ces URLs alors que c’est bien lui qui nous les propose !

    • oh que si ! L’impact est moins visibles si tu utilise ce tracking pour des histoires d’emailing ou newsletter, si tu utilise ça pour le tracking des pages internes ou l’affiliation, cela impliquera de la DC, des dilution de PRI et tout le reste.
      Une des Best Practice aussi serait de bloquer ces paramètres dans la console pour les webmasters (wemaster tools).

      Cordialement,

  • Je viens de tester et en effet il n’y a pas de requêtes avec “#utm_source=” qui ressort dans les résultats.
    Ca m’a l’air d’être une bonne technique pour éviter le duplicate, voir même tracker des campagnes onsite…

  • Bonne idée en lieu et place de la balise canonical.
    EN revanche Google dans sa doc nous dit qu’elle est dépréciée. Es-tu sûr qu’on puisse encore l’utiliser ?

  • Comme c’est indiqué dans la documentation (ou dans mes formations ;-)), 3 solutions existent pour éviter le duplicate content causé par les paramètres Google Analytics

    – l’utilisation de _setAllowAnchor (comme dans ce billet) qui devrait être utilisé d’office dans le code de suivi GA
    – la déclaration des variables utm_X dans la console de Google Webmaster Tools
    – l’utilisation de la balise canonical

    • Merci Julien, c’est en effet les solutions que nous avons evoqué dans les commentaires précédents. Au dela du duplicate, il y a aussi des problématiques de crawl budget à prendre en compte, donc mieux vaut prévenir que guérir :)

  • Salut Hafid,

    Rien à redire sur ton article et sur le bénéfice de cette pratique.
    Juste une précision qui peut éviter des interrogations et déconvenues inutiles :
    l’ordre des lignes dans le marqueur est important (la ligne “pageTracker._setAllowAnchor(true);” doit absolument figurer avant
    “pageTracker._trackPageview();” )

    A bientôt

    Stéphane

    • Hello Stephane,
      oui merci pour la précision ! c’est ce que je disais dans l’article, il faut la placer quelque part entre
      var pageTracker._gat._getTracker(‘UA-xxxxxx-y’);
      et
      pageTracker._trackPageview();

      Encore merci Steph pour ta contribution :)
      see you

  • En plus du #, je rajoute le canonical ainsi qu’un parametrage dans Google webmasters tools.

  • Ça risque pas de mettre un peu le boxon lorsque certains intervenants extérieurs (du genre affiliation …) sont aussi susceptibles de rajouter des trackings ? Pas sur qu’ils jouent le jeu tout le temps, du coup on se retrouve avec des url trackees avec anchor et d’autres classiques avec le point d’interrogation. Vous avez déjà connu ce souci ?

Leave a comment

*