#2 10-05-2006 22:50:01

Siddartha
Administrateur
Lieu: Paris et #66valley ☼
Date d'inscription: 20-06-2005
Messages: 2988
Site web

Re: Nouvel OR ?

J'ai essayé les sites en démo, c'est super lent leur bordel.

Le principe de p2p était pourtant alléchant smile

Hors ligne

 

Deprecated: preg_replace(): The /e modifier is deprecated, use preg_replace_callback instead in /home/tgarchive/forum/include/parser.php on line 313

Deprecated: preg_replace(): The /e modifier is deprecated, use preg_replace_callback instead in /home/tgarchive/forum/include/parser.php on line 414

#3 10-05-2006 23:08:15

jmleray
Tagglers
Lieu: Rome
Date d'inscription: 27-01-2006
Messages: 1000
Site web

Re: Nouvel OR ?

J'ai posté le même message dans la liste motrech, de Jérôme Charron, voici ce qu'il a répondu (je le cite parce que je trouve son explication très pertinente, même si je ne comprends pas tout au plan technique) :

Globalement, ce que je pense de l'approche p2p pour un moteur de recherche:

http://motrech.blogspot.com/2006/01/le- … -pire.html

Sinon rapidement:

1. J'aime beaucoup l'approche proxy pour récupérer le contenu à indexer
plutôt que de faire du crawling:

"... we collect information by simply using the information that passes the
proxy."

Je pense depuis longtemps que les proxy sont réellement sous-utilisés.
Les providers ne se rendent certainement pas bien compte de l'or qui leur
passe entre les tuyaux:
Ils disposent en temps réel des URLs consultées par les internautes:

1.1 ça leur permettrait de découvrir de nouveaux URLs très facilement (même
si ce sont des documents qui ne sont reliés à aucun autre, ou faiblement
connecté).
1.2 ça leur permettrait de récupérer directement le contenu qui passe chez
eux et de le valoriser en le stockant et l'indexant, sans avoir besoin de
crawler le web (économie et valorisation de la bande passante).
1.3 ça leur permettrait de faire une sorte de UsageRank : Ils connaissent
dans leur réseau quelle sont les URLs les plus demandées => permettrait de
scorer en fonction de ce critère

Bref, je me demande depuis pas mal de temps pourquoi des gens comme Free qui
font preuve de beaucoup d'innovations ne valorisent pas plus le moteur
Dir.com d'Iliad en le couplant à leurs proxys... c'est un mystère pour moi.
Ils pourraient faire un truc terrible chez Free / Dir.com en terme de moteur
de recherche!

2. Les temps de réponse d'une archi p2p ne sont pas bons:
"Because we need some redundancy to compensate for missing peers, we ask
several peers simultanously. To collect their response, we wait a little
time of at most 6 seconds. If this is not enough, the user may start a
re-search to catch up 'late' responses from other peers."
Cette réponse ne me semble pas acceptable... non?

Hors ligne

 

#4 10-05-2006 23:16:14

Siddartha
Administrateur
Lieu: Paris et #66valley ☼
Date d'inscription: 20-06-2005
Messages: 2988
Site web

Re: Nouvel OR ?

Inadmissible pour un moteur de recherche digne de ce nom d'afficher des résultats en plus de 6 secondes ..

L'exemple Google est flagrant, c'est souvent en moins de 0.05sec que le moteur renvoie des milliers de résultats smile

Hors ligne

 

Deprecated: preg_replace(): The /e modifier is deprecated, use preg_replace_callback instead in /home/tgarchive/forum/include/parser.php on line 313

Deprecated: preg_replace(): The /e modifier is deprecated, use preg_replace_callback instead in /home/tgarchive/forum/include/parser.php on line 414

#5 11-05-2006 10:40:20

salemioche
Survivors
Lieu: blue sky
Date d'inscription: 06-07-2005
Messages: 4128
Site web

Re: Nouvel OR ?

1.1 ça leur permettrait de découvrir de nouveaux URLs très facilement (même
si ce sont des documents qui ne sont reliés à aucun autre, ou faiblement
connecté).

sympa pour voir les pages apres authentification...

Hors ligne

 

#6 11-05-2006 12:28:53

Siddartha
Administrateur
Lieu: Paris et #66valley ☼
Date d'inscription: 20-06-2005
Messages: 2988
Site web

Re: Nouvel OR ?

Ou hacker un proxy pour que toutes les URLS A.com mènent vers B.com smile

Hors ligne

 

#7 11-05-2006 18:34:18

Phobos
'tetine'
Lieu: Marseille
Date d'inscription: 16-07-2005
Messages: 867
Site web

Re: Nouvel OR ?

Google utilise déjà l'approche proxy pour le crawl avec ses bots smile


Forum - Taggle Boost - Novetys
dispo par mail, me cherchez pas trop sur msn, irc ou Gtalk wink

Hors ligne

 

#8 11-05-2006 23:08:12

Siddartha
Administrateur
Lieu: Paris et #66valley ☼
Date d'inscription: 20-06-2005
Messages: 2988
Site web

Re: Nouvel OR ?

Oui mais les siens smile pas ceux disponibles partout sur le net :p

Hors ligne

 

Pied de page des forums

Propulsé par PunBB
© Copyright 2002–2005 R. Andersson