Interpretation des balises HTML par Google


Cette question peut sembler anodine pour quiconque est un tant soit peu familier des techniques SEO et autres recettes d’optimisation de pages web pour l’indexation et le positionnement dans les pages de résultats des moteurs mais eu égard aux nombres de question posées à leur sujet sur les forums de webmastering et de référencement une piqure de rappel ne peut faire de mal.
La partie HEAD.
Quasi totalement invisible aux visiteurs d’un site internet il s’agit pourtant d’une zone de code à ne pas négliger. Ainsi l’on a la confirmation que les balises (title) et (meta name=”description” content=”…”) sont bien prises en compte par Google et correctement interprétées. Il est d’ailleurs indiqué par l’auteur qu’elle sont le plus souvent affichées telles quelles dans la liste des résultats du moteur.
On apprend par la suite que les balises (meta name=”revisit-after” content=”14 days”) et (meta name=”keywords” content=”…”) (par omission d’en parler) ne servent quasiment à rien pour Google et la plupart des moteurs, l’auteur du billet consultable en anglais sur le blog officiel indiquant qu’il est d’ailleurs plus propice d’utiliser toutes les fonctions des fichiers sitemaps (lastmod et changefreq) pour espérer influencer sur la vitesse de crawl des moteurs.
Les balises (meta name=”robots” content=”…, …”) et (meta name=”googlebot” content=”…, …”) sont, c’est heureux, correctement interprétées par Google et ses conurrents, vous pourrez donc les utiliser avec leur cortège d’instructions : index, follow, noindex, nofollow, nosnippet (aucune description de votre pages dans les résultats), noodp (interdiction de reprendre la description de l’annuaire DMOZ), noarchive (ne pas proposer de lien de page archivé par le moteur), unavailable_after:[date] (date de péremption de la page).
Rappelons toutefois que ces 4 dernières indications ne sont pas respectées ou utilisées par tous les moteurs.
L’auteur traite ensuite de la balise (meta name=”google” value=”notranslate”) interprétée bien entendu uniquement par Google elle sert uniquement à indiquer à ce moteur de ne pas proposer de lien [ Traduire cette page ] à côté d’un lien vers votre site dans la liste des résultats.
L’auteur traite ensuite brièvement de la balise (meta equiv=”refresh” content=”…;url=…”) qui est celle de redirection de page, pour la déconseiller, il oublie toutefois d’indiquer qu’outre le fait qu’elle soit globalement mal interprétée elle peut entrainer votre blacklistage en cas de mauvaise utilisation (redirection quasi-instantanée par exemple).
A noter encore que l’auteur nous indique que Googlebot est quasi-insensible à la casse et que par conséquent il interprètera vos balises comme il le faut que vous employez des majuscules ou non.
Il ne s’agit pas pour autant de conclure après cet exposé car même sil Google accorde semble-t-il accorder une place plus importante que auparavant au contenu de la partie (head) des pages, il s’intéresse également à son contenu et plus particulièrement aux balises HTML qui s’y trouvent.
La partie BODY.
Si cela ne nous est pas dit il apparait toutefois de saines lectures que Google par exemple appuie son algorithme sur l’emploi de balises (h1)(h2)(h3)…(p) dans le corps des pages qu’il indexe, il convient donc de les utiliser plus encore que les CSS pour démarquer vos titres et sous-titres du contenu texte.
Il interprète également l’attribut alt=”” associée à un lien image, mais délaisse totalement l’attribut title=”” qu’il se trouve lui aussi dans un lien image ou dans un lien texte.
Chose curieuse, il semble également que Google interprète et ce serve des lignes de commentaires HTML du type (!– … –), ne vous précipitez pas pour autant les remplir d’une liste de mots clefs d’une taille comparable à notre header puisque cela pourrait être considéré comme du keyword stuffing.

Leave a Reply

Name
Name*
Email
Email *
Website
Website