• Index
  •  » Google
  •  » Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

#1 01-12-2005 23:08:56

Anonymus
Crying Freeman
Lieu: lat:45.387842, long:4.78314
Date d'inscription: 04-07-2005
Messages: 1164
Site web

Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Je ne pense pas que ce soit normal que les résultats valsent autant. Même pour Google, le résultat qui change tous les jours ne peut pas être une raison d'être. La première page devrait être figée, pour une requète donnée, et apparemment la mise à jour, pour n'importe quelle requète, traine des pieds...

L'idée de ce post est d'émettre des hypothèses sur le 'pourquoi' d'une mise à jour qui tend à se poursuivre de jours en jours.

A mon avis, il pourrait y avoir plusieurs causes :
- Ils ont un problème au niveau de l'algo. Ce problème pourrait être causé par les 12 milliards de pages qu'ils doivent stocker pour atteindre Yahoo.
- A force de multiplier les DC,  ils se rendent compte qu'ils ont une version de chaque site sur chaque serveur, et c'est cela qu'ils essaient d'enrayer.
- Ils décident de passer en 'full crawl', 'indexation continue' et rank en temps réel (j'entends par là le classement qui change non pas tous les jours, mais en fonction de la température du web),

On peut supposer que ces évenements sont à rapprocher de la lancée peu glorieuse des services de stats.. Ils auraient des problèmes au niveau de leur matos..

Vous auriez d'autres hypothèses ??

Hors ligne

 

#2 02-12-2005 00:14:35

Lafleur
Survivors
Lieu: Toulouse
Date d'inscription: 08-07-2005
Messages: 1715

Re: Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Ce que je me dis rejoint tes idées. Il est possible qu'il aient tellement de filtres, de critères à prendre à compte, qu'ils les appliquent successivement, les uns après les autres, à l'ensemble des pages ou par roulement. Ca peut donner l'impression d'ajustements en continu.

Les plans genre Bourbon, Florida, Jagger et compagnie correspondraient à une fin et une mise en ligne de résultats du recalcul des réseaux de site et à une note données à ces réseaux, valable quelques mois, le reste étant de l'affinage.

Hypothèse pifométrique et sans prétention, hein !

Hors ligne

 

#3 02-12-2005 12:08:04

Jan
Tagglers
Date d'inscription: 21-06-2005
Messages: 1587
Site web

Re: Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Ce qui se passe avec jagger n'est pas facile à décrypter. Des choses ont changé, mais il est difficile de dire quoi.

Pifométriquement moi aussi, j'ai l'impression que google a essayé de faire une hiérarchie dans le poids donné aux BLs. Il y a de plus en plus les "bons BLs", bénéfiques aux ranking, et les BLs inutiles (voire nuisibles?). Peut-être une façon pour google d'essayer de diminuer le spam par mise en place massive de BLs qui marchait plutôt bien.

Le gros problème de google aujourd'hui me semble être son filtre "duplicate content". Il leur permet de combattre le spam, notamment en éliminant pas mal de pages satellites, mais il crée de nombreux dommages collatéraux sur des pages qui sans être des pages de spam ont le tort de trop "ressembler" à d'autres (j'ai déjà parlé de mes déboires, sans doute liés à ce filtre dans un autre thread).

Facteur aggravant du problème de duplicate, google n'a toujours pas complètement règlé ses problèmes d'"url canonique" malgré sa promesse que jagger3 y remédierait. Le changement visible de jagger3 a été de classer les pages par importance sur la commande site:, mais c'est un changement purement cosmétique. Le problème de fond reste (presque) entier.

Les 2 problèmes combinés font que des pages se retrouvent éliminées au profit de pages qui les recopient ou qui leur ressemblent sur un autre site ou sur son propre site. Google a visiblement du mal à déterminer la page la plus importante, et élimine souvent l'original au profit de la copie.

Concrètement, j'ai constaté ce phénomène sur des blogs dotclear. Pour un billet donné , l'architecture de dotclear va présenter à googlebot:
- la page du billet
- la page d'accueil qui au moment de la publication du billet va contenir en haut de page le titre et le chapô de ce billet
- la page de la catégorie du billet qui elle aussi, au moment de la publication du billet, va contenir en haut de page le titre et le chapô de ce billet
- la page des billet du mois, idem
- la page du jour accessible par le calendrier, idem
La logique voudrait que google conserve en priorité la page dédiée au billet et la page d'accueil. La réalité est que dans certains cas, la page du billet et la page d'accueil du blog passent en mode listing (et perdent leur ranking) au profit par exemple de la page qui présente les billets du jour pourtant enfouie beaucoup plus profondément dans l'architecture du blog.

J'ai d'ailleurs du mal à comprendre pourquoi google peine sur ce point. Il me semble qu'une simple comparaison des BLs internes et externes de ces différentes pages au contenu "voisin" devrait lui permettre de trouver la page la plus pertinente très facilement. De là à penser que ce comportement qui semble erroné est volontaire de la part de gg... :rolleyes:

A titre d'expérimentation, j'ai d'ailleurs passé les liens du calendrier dotclear en rel=nofollow sur un de mes blogs. On verra bien...

La dernière chose qui me semble avoir changé est la façon de crawler de googlebot. Mes pages sont moins crawlées qu'avant. De façon flagrante sur des pages PR6 qui avaient systématiquement droit depuis des mois à au moins une visite du bot tous les jours. Aujourd'hui c'est terminé pour certaines d'entre elles. Le bot ne passe que tous les 3 ou 4 jours.

En contrepartie de cette baisse, googlebot semble procéder de temps en temps à des crawls très très deep des sites. il est allé chercher des pages enfouies dans l'architecture de certains sites.

Mon hypothèse (à vérifier) est que la fréquence des crawls serait maintenant pondérée par la fréquence de mise à jour des pages constatée par gg lors de ses derniers crawls. En gros si une page ne change jamais, inutile d'aller la voir tous les jours, même si elle a un PR élevé. Ceci dit je n'ai pas mis en place de sitemaps, et serais intéressé de savoir si ceux qui l'ont fait constatent des comportements différents des bots.

Quant à la durée de jagger je me pose des questions. La propagagtion de cet update est incroyablement lente. Ca donne en effet l'impression de ne jamais devoir se stabiliser. Google est-il cassé? :lol: Sans doute pas. Mais en attendant jagger n'a pas été un pas notable vers une meilleure pertinence. Pas mal de pages "scrappers" arrivent à truster les bonnes positions. Il faut peut-être attendre un peu avant d'en juger. Après jagger, gg va peut-être remettre en place certains filtres qu'il a levés le temps de l'update et qui permettront de faire le ménage dans son index.

Hors ligne

 

#4 02-12-2005 12:51:38

berberber
So White Hat
Lieu: Warszawa, Pologne
Date d'inscription: 25-06-2005
Messages: 516
Site web

Re: Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

>Mon hypothèse (à vérifier) est que la fréquence des crawls serait maintenant pondérée par la >fréquence de mise à jour des pages constatée par gg lors de ses derniers crawls.

Ca n'a jamais ete autrement selon moi, le pagerank est juste une influence de plus (effectivement mieux vaut savoir ce qu'il y a sur une page vers laquelle on envoie bcp de visiteurs)

Hors ligne

 

#5 02-12-2005 13:32:40

appollo
Rémy BLANCHARD
Lieu: Lyon
Date d'inscription: 04-09-2005
Messages: 1272
Site web

Re: Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Tous comme Berberber je constate que les sites qui ont des MAJ régulière sont beaucoup plus crawl que les gros sites statiques.

Hors ligne

 

#6 02-12-2005 13:42:12

Jan
Tagglers
Date d'inscription: 21-06-2005
Messages: 1587
Site web

Re: Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Ca existait déjà, c'est vrai, mais le phénomène s'est accentué. Pour certaines pages  jamais mises à jour, un PR6 suffisait à garantir un crawl quotidien. Ce n'est plus le cas.

Hors ligne

 

#7 02-12-2005 15:03:35

coyote
Moderateur -
Lieu: le Perche
Date d'inscription: 22-06-2005
Messages: 2252
Site web

Re: Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Aucun changement pour mes sites statique ou non
Mon hypothèse a moi c' est qu il mettent en oeuvre beaucoup moins d' énergie sur leurs moteur que par le passé et beaucoup plus sur ce qu il pourrais assurer leurs avenir donc jagger n'est pas finis et pas rependu sur tout les datas certain fonctionnent avec les anciens filtres et d' autres avec le nouveaux tongue


Boxe thai + Ok Bébé au Poker en ligne = plus de
sos croquettes

Hors ligne

 

#8 02-12-2005 20:22:14

Americas
Survivors
Lieu: Argentine
Date d'inscription: 04-07-2005
Messages: 4603
Site web

Re: Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Mon site principal est toujours autant visité... les sites secondaires attendent beaucoup plus longtemps les nouvelles indexations... appararament... je rejoindrais Coyote quant au rythme des indexations de Google... peu de changement.. excepté... et c'est nouveau pour moi parce que je me suis mis très tard aux blogs wink... dans ce cas précis... je constate une indexation régulière alors que mon blog est récent et ne possède pas de PR.
Cette indexation régulière du blog me fait même frémir neutral ... car je passe beaucoup moins de temps que sur les autres sites et je me rend compte que les indexations sont fréquentes également sur la plupart des blogs... et quand on sait la piètre la qualité de ces bidules en général... si Google poursuit de cette manière... le 20 premiers résultats de chaque requêtes feront apparaitre uniquement des blogs.

Bon... c'est décidé... tout nouveau site que je ferai sera un blog lol

Hors ligne

 
  • Index
  •  » Google
  •  » Jagger 1, 2, 3, ... Jusqu'où iront-ils ??

Pied de page des forums

Propulsé par PunBB
© Copyright 2002–2005 R. Andersson