Interview de Yannick Bouvard, expert en référencement (3924 lectures)
200612/02
Je remercie Yannick Bouvard, expert en référencement et auteur du livre Dreamweaver MX2004 et PHP MYSQL, d'avoir accepté de répondre à quelques questions de bases sur le référencement. Les questions n'ont pas pour but de donner tous les secrets du référencement, mais de lever le voile sur certaines idées reçues qui persistent encore dans le monde des développeurs, et surtout d'éviter les mauvaises pratiques, bien plus fréquentes qu'on ne le croit, et lourdes de conséquences.- Questions générales
- Blacklistage et mauvaises pratiques
- Sandbox
- Référencement et qualité
- Google Dance
- Le référencement sur Yahoo, MSN
- Questions diverses et conclusion
Général
Le Page Rank, qui détermine l'indice de popularité d'une page sur Google, existe t-il encore ? Si non, pourquoi parle t-on encore de PR sur de nombreux sites et pourquoi Dmoz effectue t-il un classement suivant le PR ?
Le PageRank existe toujours, et c'est toujours un indice de popularité d'une page, et pas plus. C'est une note donnée à une page par Google. Mais comme dans le sport, ce ne sont pas forcément ceux qui sont les meilleurs qui gagnent. Ici pareil : ce n'est pas forcément celui qui a le meilleur PageRank qui est classé premier.
Dmoz n'utilise pas le PR pour son classement. C'est l'annuaire Google, qui utilise l'index de DMOZ, en classant les sites de chaque catégorie par PR, et non pas par ordre alphabétique.
Un bon PR intervient-il sur le positionnement d'une page web ?
Il faut éviter de prendre le problème à l'envers en fait. Le PR n'intervient pas sur le classement. La popularité d'une page lui donne un bon PR et (en partie) lui donne un bon classement.
Pour qu'un site soit bien positionné sur une requête donnée (sous entendu avec un grand nombre de résultats), il faut :
Que ce site ait une certaine ancienneté ?
Un site ancien, qui est donc souvent et depuis longtemps connu et visité par Google est gage de confiance. Donc l'ancienneté joue sur le positionnement. Mais un site qui a été crée en 1998 et qui ne possède pas de popularité ne sera pas pour autant bien positionné. Il faut considérer en fait le nombre total de fois que le robot sera passé visiter votre site. Plus le site est ancien, plus il a de chances d'avoir été visité souvent par Google, mais il faut aussi que beaucoup de sites fassent un lien vers lui pour lui offrir des occasions de le visiter plus souvent.
Que ce site soit fréquemment mis à jour ?
Des changements réguliers du contenu de votre site donne l'impression évidente que le site est vivant, et donc est gage de qualité pour Google. Cependant, pour lutter contre les scripts qui modifient aléatoirement le contenu, l'algorithme contient sûrement des choses qui vérifient que ces changements sont "normaux".
Que ce site reçoive beaucoup de liens en durs ?
L'algorithme de Google étant basé sur des gages de qualité, un site qui est cité un peu partout sur le web est sûrement un site de qualité. C'est pour cela que les liens en dur sont importants. Ces liens permettent également au robot de google de passer plus souvent sur vos pages, donc ça lui donne l'occasion d'indexer plus rapidement et plus profondément votre site.
Qu'il ait un bon PR ?
Encore une fois, le PR est un indice, une note, qui découle de l'algo, pas l'inverse.
Plus un site a un fort PR, plus souvent il est parcouru par Google et les moteurs ?
Là encore, c'est plutôt l'inverse. C'est parce qu'un site est souvent parcouru par Google qu'il lui attribue un bon PR (pas seulement, mais ça va plus dans ce sens).
Plus une page web fait de liens externes, plus elle va perdre en popularité ?
Une théorie difficile à prouver. Pour certains le PR se dilue en fonction du nombre de liens sur la page. Personnellement, je pense que c'est vrai, mais je pense que dans la limite d'un nombre de liens "normaux", c'est quelque chose qui joue assez peu.
Quelle définition tu donnerais à une page satellite ?
Une page crée artificiellement, ne faisant pas vraiment partie de l'architecture du site, destinée uniquement à se positionner sur les moteurs.
Quelle est l'incidence des technologies utilisées (html, php) ?
Ca n'a pas d'incidence puisque comme un navigateur, le robot du moteur de recherche ne lit que l'html (mis à part quelques exceptions : xml, pdf..., mais là n'est pas le débat
Comment maintenir un référencement lors d'une mise à jour fondamentale du site (par exemple d'un site statique vers un php/mysql avec changement des noms des pages) ?
Tenter de conserver les mêmes url, à défaut faire des redirections serveur (301...)
Quel est le rôle de l'URL rewriting ?
Pouvoir passer d'un site statique à dynamique sans changer les url, mettre les mots clés dans l'url, afficher des url intelligentes, supprimer les facteurs qui font que les moteurs n'indexent pas les pages (url trop longues, présence de certains paramètres...), raccourcir les urls...
Google, blacklistage, mauvaises pratiques
L'attribut display:none est beaucoup utilisé par les développeurs pour permettre une meilleure ergonomie et mise en page. D'autres l'utilisent pour cacher du texte aux internautes mais permettre que ce texte soit lu par les moteurs. Google va t-il ne plus lire le texte qui sera en display:none ?
Toute pratique concernant le cloacking (montrer des pages différentes aux moteurs et aux visiteurs dans le but de se positionner sur les moteurs) ne peut être efficacement détectée automatiquement par les moteurs. En effet, les techniques utilisées pour cacher du contenu (Javascript et CSS display:none ou visibility: hidden) , peuvent très bien servir à la construction d'un menu en calques ou autre. Google ne peut donc pas sanctionner des sites qui ne trichent pas. Par contre, les vérifications faites par des humains permettent de repérer rapidement ces techniques. Et là la sanction est directe, c'est le blacklistage. On a eu le cas récemment avec www.bmw.de et www.ricoh.de (http://www.mattcutts.com/blog/ramping-up-on-international-webspam/)
Dans le même ordre d'idée, on pourrait aussi bien utiliser les attributs CSS text-indent avec des valeurs négatives très fortes (-9000px) ou letter-spacing. Est-ce que ces pratiques sont courantes dans le monde du référencement ? Comment Google les interprètes ?
La technique est effectivement possible, mais moins courant car tant qu'à tricher, autant utiliser display:none ;) Par contre, pour le reste c'est pareil. impossible à détecter, mais sanctionné quand même.
On dit souvent que Google sait repérer la couleur du texte pour voir si une série de mots-clés n'est pas invisible aux internautes. Mais comment Google, avec la possibilité donnée par les CSS, peut-il déterminer la couleur d'un fond répété si ce fond est une image de la même couleur que le texte ? Le « mauvais » référenceur peut alors insérer tous les mots-clés qu'il souhaite dans sa page sans qu'ils soient visibles aux internautes ?
Même réponse.
SandBox
L'effet SandBox consiste selon les uns à défavoriser les nouveaux sites qui feraient un référencement « forcé » et selon les autres à favoriser les anciens sites, sans se soucier pour autant du contenu de ces nouveaux sites. Un nouveau site est étiqueté comme nouveau nom de domaine. Ainsi, pour contourner cet effet Sandbox, il suffirait à une société d'acheter son nom de domaine le plus tôt possible, quitte à n'avoir qu'un site web (entendu comme pages web) que bien plus tard pour échapper à l'effet Sandbox de 6 mois ?
Non, cet effet n'est pas basé que sur l'âge du domaine. Pour sortir de la sandbox, il faut connaître une évolution "normale" en terme de nombre de pages, liens pointant sur le site... C'est un filtre très efficace pour contrer le spam. Par contre, il est idiot dans le sens ou il pénalise aussi des sites qui ont tout de suite un contenu de qualité.
Toujours sur cette même idée autour du SandBox et des critères qualitatifs de Google. Pourquoi dans ce cas un nouveau site, déclaré pourtant comme commercial, se verrait plus pénalisé par rapport à un autre, qui recevra par exemple un nombre considérable de back-links grâce aux réponses des blogs qui prennent en compte les liens ? En d'autres termes, l'algorithme de Google est peut-être très bon techniquement parlant, mais il n'est pas forcément le plus pertinent qu'on puisse espérer attendre d'un point de vue utilisateur ?
Evidemment, ce filtre est un peu trop restrictif, il sanctionne tous les sites nouveaux, même ceux qui ne rentrent pas dans le cadre de la lutte anti-spam. Par exemple, les sites de marketing viral ne peuvent pas compter sur le référencement.
Référencement et qualité du site
La conformité aux standards du web favorise le positionnement à contenu égal ?
Disons qu'utiliser les techniques de positionnement en CSS allège le code, et augmente aussi le rapport contenu / code. C'est en cela que ça aide pour le référencement.
La qualité de l'indexation d'un site dépend aussi de son architecture, et du fait que toutes les pages présentes sur le serveur soient reliées entres-elles afin d'éviter les pages satellites isolées.
La qualité du maillage d'un site est important. Un plan de site, des liens bien tissés permettent un meilleur référencement.
Un sitemap est indispensable pour un bon positionnement ?
Non, ça peut aider à indexer son site, particulièrement au début. C'est une aide non négligeable, mais pas indispensable.
Si la balise H1 est la plus appréciée à l'intérieur des balises Body, pourquoi ne pas alors employer cette balise autant de fois que souhaité puisque les CSS permettent de la formater comme on veut ?
Tout est une question de mesure. Google évalue une page selon des critères. Dépasser la marge normale des critères est compris comme une triche. Trop de H1 tue le h1 :)
Google aime t-il toujours le disco ?
Dans le milieu du référencement, on parle beaucoup de Google Dance pour signifier la période pendant laquelle le moteur de recherche recalcule le PageRank des pages de son index. Existe-t'elle encore ? Si non, comment Google procède aujourd'hui brièvement ?
Google dansait avant, pour remettre tout en ordre dans les classements selon de nouveaux critères. AUjourd'hui, les mises à jour sont quotidiennes, au fur et à mesure. La Google dance est uniquement une liste à jour des PR affichés (le PR réel est aussi mis à jour sans arrêt) et des backlinks affichés.
Et les autres moteurs ?
Comment peut-on expliquer la grande différence de positionnement des pages entre Google et Yahoo ? Pour ma part, je constate que Yahoo prend beaucoup les liens fait vers une page, là où Google ne les voient que peu. Faut-il une stratégie très différente pour se positionner sur les 2 moteurs de recherche ?
La différence de positionnement s'explique par la qualité de l'algo, tout simplement. Les règles sont différentes. Aujourd'hui, difficile de travailler sur plusieurs stratégies. MSN et Yahoo sont encore tellement minoritaires qu'il vaut mieux bien se concentrer sur Google et espérer que ça marchera aussi pour les autres.
L'idée générale pour avoir un bon référencement serait :
De respecter les standards (sémantique du code, utilisation des bonnes balises, etc.) ?
C'est mieux. Mais inutile de passer sa vie à essayer de valider une page XHTML strict. Utiliser les CSS sera déjà bien suffisant.
D'acheter le NDD dès que la société est créée afin que celui-ci ait au moins 6 moins d'existence pour ne pas être dans la Sandbox ?
Disons plutôt que si on commence un projet sur un NDD neuf, déjà poser une page et faire un ou deux liens dessus, puis ajouter régulièrement des pages et des liens, pour gagner un peu de temps.
De créer le plus de liens vers le site ? (mais au moins 6 mois après le lancement du site)
Le plus de liens de qualité. Plus d'intérêt d'avoir des milliers de liens sur des pages isolées. Il vaut mieux réussir à avoir des liens depuis des sites déjà bien indexés, bien populaires.
De créer du Google Bombing depuis d'autres sites pour des requêtes spécifiques concurrentielles ?
Le principe du Google Bombing est de détourner Google pour lui faire sortir un site particulier sur une requête particulière, en se basant sur l'importance du texte en lien. Un jeu qui n'a pas grand chose à voir avec une stratégie de référencement pour son site. Par contre, toujours se rappeler que le texte qui fera lien vers le site est important.
Evidemment, de ne pas tricher (pages satellites, textes de même couleur que le fond de la page, etc.).
Si on veut éviter de gâcher des mois ou des années de travail, il vaut mieux éviter de tricher :)
D'éviter les liens sortants directs, sauf à utiliser l'attribut nofollow ?
Eviter de les distribuer sans compter oui, mais ne pas en faire un objectif prioritaire.
Je dois proposer du référencement professionnel. L'idée première qui me vient serait d'avoir le plus de sites possibles (annuaires ou non), avec une existence certaine et de plus de 6 mois afin de proposer du lien selon les mots-clés voulus. Vrai ou faux ?
Celui qui peut offrir un maximum de liens de qualité a un avantage non négligeable :)
Autre chose, sans livrer des secrets de fabrication ? Des questions essentielles que j'aurais oubliées ?
Pour plaire à Google, il faut surtout faire des choses logiques. L'algo se base de plus en plus sur des principes de détection de la qualité du site (popularité, ...) Donc pour bien référencer un site, il faut offrir du contenu de qualité, en grande quantité. A partir du moment ou on respecte les principes fondamentaux du référencement et qu'on a un site de qualité, on gagnera rapidement du positionnement grâce à la qualité intrinsèque du site.
Dernière modification : 06/07/2008
Catégorie : Web - Référencement / SEO -
A découvrir également :
Google, le nouvel ogre du monde informatique
Web 2.0 : une nouvelle bulle internet ou un effet marketing ?
Commentaires
Les commentaires sont désactivés.

