Forum dédié au moteur de recherche et aux techniques d'optimisation par #taggle
Vous n'�tes pas identifi�.
hello
depuis quelques temps je viends de voir que Google indexait parfois les URL sans le rewrite ?
C'est avec des tests non homologués et totalement incompréhensible que je viends de voir ça :
http://www.google.fr/search?sourceid=na … s+new+page
il donne cette URL :
Chocoku Land, le temple du chocoku :: Voir le sujet - virus new pagevirus new page Aller à la page Précédente 1, 2, Voir le sujet suivant ... fuck & fessee - Hymne Chocoku (voir tout en haut de la page ! Laughing ) ...
chocokuland.xavfun.com/ viewtopic.php?p=10426&sid=b25f37f0f9c2c2ce295f4d3e431e84a7 - 53k - En cache - Pages similaires
pourtant le forum URL rewrité
avec la commande site je vois les pages rewrité et les pages classique de Google
http://www.google.fr/search?sourceid=na … vfun%2Ecom
ça sert plus à rien le rewrite PHPBB sur Google ou quoi ?
Hors ligne
Ton forum n'est il pas mal rewrité
Un début de réponse : http://chocokuland.xavfun.com/search.ph … unanswered
Hors ligne
j'ai rien compris à ton début de réponse
Si t'as une réponse complète, ça serait mieux pour moi
Hors ligne
Tu dis que GG indexe ton forum non rewrité mais sur la page que je t'ai montré dans le post ci dessus, tes urls ne sont pas rewrites.
En gros, ton forum n'est pas entierrement rewrité donc GG s'emmellent les pinceaux !
Hors ligne
ben justement j'ai pas compris comment tu trouves les pages qui ne sont pas rewritées
Hors ligne
En haut de ton forum, sans être loggué :
Voir les messages sans réponses
Marquer tous les forums comme lus
Hors ligne
bah ça donne que 22 pages qui merde et des messages sans réponses, c'est plutôt rare.
je vais aller répondre n'importe quoi au 22 messages pour voir
par contre la page que je montrais sur Google était une page avec réponses puisqu'il y a 3 pages
ps : je crois pas que je puisse trouver l'erreur, je vais laisser Google se perturber avec les 2 styles
c'est quand même bizarre par contre que Google indexe des pages de PHPBB sans rewrite ?
Hors ligne
xavfun, je suis comme toi en ce moment, j'ai pas mal de sites qui utilisent phpBB voir d'autres type de scripts, et j'ai en effet remarqué, qu'un des bots de google (ils en existent pour moi 2 sortes, le premier qui passe en force et te créé plusieurs dizaines de sessions à la minute et garde toujours la même IP, et le second qui lui change d'ip à chaque nouvelle session créée, et reste raisonable quand au nombre de sessions créés), et donc je parle du premier type de bot, avait tendance à essyer de dénicher des URLs bidons ou non rewrités, alors qu'elles ne sont pas forcément présentes.
Dans ton cas il est vrai que quelques URLs non rewritées peuvent entrainer des crawl non désirés.
En fait j'ai l'impression que l'un des bots de Google se comporte exactement comme les bots de MSN. Il essaye de se logguer, il scan des pages dont il connait à l'avance l'url bien que ces pages lui soit normallement innacessible, bref, il tente ! J'ai un gros site où j'ai observé le phénomène, je n'ai trouvé de mieux que détecter l'url utilisé par le bot, vérifier que cette url soit rewritée, et si ce n'est pas le cas, je lui fais une redirection 301 avec la bonne URL mais ce qui m'oblige à faire un appel en base de donnée... A priori cette méthode fonctionne bien, et j'ai moins de soucis depuis 2 semaines.
Hors ligne
ben c'est trop complexe pour moi ton truc, je vais le laisser indexer tout, et puis si il double les pages dans son indexe, on verra bien si je suis en plein "duplicate content"
c'est vrai que depuis le temps Google pourait indexer les pages sans rewrite puisque msn le fait sans soucis
Hors ligne