Forum dédié au moteur de recherche et aux techniques d'optimisation par #taggle
Vous n'�tes pas identifi�.
Je crois que je commence à comprendre comment Google gonflerait ses stats pour faire croire qu'il a indexé plus de pages qu'avant.
Regardez cette page de résultats :
http://www.google.fr/search?q=%22Les+ba … p;filter=0
J'ai un site... si on peut appeler ça comme ça ... de 4 pages. www.banque-mag.com
Google a indexé non seulement les 4 pages... mais aussi ces 4 pages sans le www.
Les pages normales sont indexées correctement... et les pages sans le www sont labelisées "Résultat complémentaire"
Je n'aurais jamais découvert ça si je n'avais pas eu un site aussi petit
Hors ligne
Bien vu Americas, y'a un vrai bordel avec le nombre de pages affiché en ce moment avec Google et c'est en double, triple, quadruple ...
Ce qui est significatif par contre, c'est que une copie est en résultats supplémentaire et l'autre en normal, donc dans deux bases différentes.
Vraiment étrange.
Hors ligne
L'indexation des URLs avec et sans www a été longuement discutée sur webmasterworld lors de l'update bourbon. Beaucoup ont vu dans cette double indexation (et donc ce duplicate content) la cause de leurs malheurs. Face à ce problème, les "victimes" ont mis en place des 301 d'une des 2 urls vers l'autre par .htaccess. Je ne sais pas si ça leur a permis d'en sortir.
Hors ligne
Si c'était une cause de duplicate pratiquement tous les sites seraient dans le bourbon.
On peut essayer avec tous les noms de domaines, on retrouve les url avec ou sans le www. et je doute que tous les sites aient placé des redirections 301 vers le www.
Je ne crois pas que les technicos de Google soient assez paf pour avoir oublier de mettre ce genre de filtre qui dirait : "si www.popol.com et popol.com sont identiques alors la règle du duplicate content ne s'applique pas"
Google indexe les deux formes d'Url car on peut y accéder depuis la nuit des temps par ces deux formes.
Maintenant, une des deux formes devaient rester dans un index secondaire. Le problème est de savoir pourquoi les deux index se sont mélangés. Bug ou volonté de gonfler les stats par cette astuce ?
Hors ligne
Une discussion en cours sur le sujet: http://www.webmasterworld.com/forum30/30274-1-10.htm
Une intervention de googleguy dans laquelle il parle du sujet:
ggguy a �crit:
Once you've picked a root page and decided on www vs. non-www, make sure that all your links follow the same convention and point to the root page that you picked. Also, I would use a 301 redirect or rewrite so that your root page doesn't appear twice. For example, if you select http://www.yourdomain.com/ as your root page, then if a spider tries to fetch http://yourdomain.com/ (without the www), your web server should do a permanent (301) redirect to your root page at http://www.yourdomain.com/
http://www.webmasterworld.com/forum30/29720.htm , msg#7
Sorry c'est de l'english
Hors ligne
Et voici la traduction donnée par Systran (option informatique) :
Une fois que le you\'ve sélectionnait une page de racine et décidait de WWW contre non-WWW, assurez-vous que tous vos liens suivent la même convention et se dirigent à la page de racine que vous avez sélectionnée. En outre, j'utiliserais des 301 réoriente ou récris de sorte que votre doesn\'t de page de racine apparaissent deux fois. Par exemple, si vous choisissez http://www.yourdomain.com/ en tant que votre page de racine, alors si une araignée essaye de chercher http://yourdomain.com/ (sans WWW), votre web server fait une constante (301) réorientent à votre page de racine à http://www.yourdomain.com/
Hors ligne
Americas a �crit:
Google indexe les deux formes d'Url car on peut y accéder depuis la nuit des temps par ces deux formes.:
Je ne suis pas d'accord avec ça . Sur la plupart de mes sites j'ai obligé par 301 un nom unique de domaine ( avec ou sans le WWW a mon choix ) et je peux t'assurer que GGle suit la consigne je n'ai que monsite.com indexé par ex et en aucun cas www. monsite.com
Hors ligne
Je suis bien d'accord avec toi Erazor... Google suit tes consignes avec tes recommendations.
Mais cela n'empêche pas qu'il a toujours indexer les deux dormes d'URL... sur les sites qui ne font pas de redirections... ce qui doit représenter 99% du web
Hors ligne
Siddartha a �crit:
Ce qui est significatif par contre, c'est que une copie est en résultats supplémentaire et l'autre en normal, donc dans deux bases différentes.
Vraiment étrange.
Bien vu Americas
La course au nombre de pages dans l'index serait le pourquoi du comment ou c'est involontaire ?
Bien vu bis Sid
Est-ce que ça impliquerait que l'index de garage n'est pas en relation avec l'index classique ?
Je vois ça comme une possibilité.
Hors ligne
Ce n'est pas une possiblité, c'est même une certitude.
Google utilise en permanence 3 bases :
- fresh bdd (celle ou on voit une date de refresh avec le title, desc)
- bdd 'normale'
- bdd 'supplemental results'
Les positions acquises arrivent dans le même ordre
Hors ligne
Ben fondamentalement le www est juste un sous domaine par défaut. Le 'vrai' nom de domaine est bien celui sans le www.
Et vu qu'il considère que chaque sous domaine est un site à part entière, c'est pas déconnant de penser ne pas faire la disctinction entre ces deux cas, puisque comme toujours, il cherche à traiter tous les cas possibles, mais toujours de manière générale.
Hors ligne
C'est le sous domaine par défaut, mais uniquement pour raison historique et par les usages qui en ont été fait.
Mais si le World Wide Web se serait appelé le Zorld Zide Zed, on aurait aujourd'hui du sous domaine par défaut en zzz
Hors ligne