Forum dédié au moteur de recherche et aux techniques d'optimisation par #taggle
Vous n'�tes pas identifi�.
Salut à tous,
Quelqu'un sait il de quel script il s'agit ?
-http://www.va-y.com/
Ce script me parait interressant au vue de ceci :
http://www.google.fr/search?hl=fr&c … &meta=
et de :
http://www.va-y.com/keyword.php?start=2000
Je serais donc assez curieux de le tester
A vous la parole ....
Hors ligne
Tiens je connai le webmaster un éminent membre wri
Hors ligne
Tiens, c'est marrant, ca !!
Résultats 1 - 10 sur un total d'environ 28 500 provenant de va-y.com
Il s'avère que j'ai un certain nombre de moteurs (tousenvacances.com, pingoin.com,..) qui ont le même problème.
Un programme comme celui ci est capable de délivrer un bon million de pages différentes très facilement. Pourtant, les moteurs 'normaux' s'arrètent avant d'avoir fait le tour de la base. J'en ai fait l'expérience plusieurs fois..
Donc :
Il semblerait qu'il y ait un blocage, à 11 000 résultats environs. Jusque là, il est facile d'indexer les pages. Puis, il y a un passage à vide, à 11000, où le moteur semble ne plus prendre d'urls supplémentaires. Ensuite, ca repart. Ca vascille entre 27000 et 28500. Un bon PR3 suffit. Après, au dessus, c'est plus difficile. On arrive alors à un 3e palier, qui se situerait à 41 000 environ.
Pour le moteur 'pingoin.com', j'en suis entre les 11 000 et les 41000. Autrement dit, pour l'instant il est redescendu à 11 000, mais il était récemment à 28000. Par contre, en début de semaine, il repartait à la hausse, avec de nouvelles urls. Bref, il semblait repartir pour les 41 000.
Pour tousenvacances.com, il semble bloqué depuis un moment à 41000.
A noter que les chiffres paraissent vraiment tirés du chapeau, et qu'ils ne sont pas issus de la même source. Pour preuve, les différentes commandes google, qui donnent des chiffres assez fantaisistes (du style 27500 'inurl, puis 41300 'site:') M'enfin.. Ce qui est étrange, c'est la 'constance', dans ces chiffres.
!!!! Pour info, si tu veux la méthode pour dédoubler les pages, c'est assez facile
Hors ligne
pfff....
(valà.. j'me tape un super discours démonstratif, et y casse tout... )
D'un autre coté, je te parle de la barrière des 11000, des 21000, des 41000, et tu me sors celle des 71 000, ca ressemble un peu à du X-files, non ?
Hors ligne
Ben en fait, c'est surtout que curieusement (j'en suis le premier étonné) je n'ai eu aucune barriere si ce n'est celle que tu évoques vers les 21 000 ou ca a un peu stagné pendant un mois.
Sinon ca ajoute en permanence, ceci dit la home change minimum 3 fois par jour aussi et ce depuis 5 mois ... ceci explique peut etre cela ..
Hors ligne
Hum... moi, ca serait plutot le contraire, ca change tous les 3 mois..
Par contre, quand ca change, c'est toutes les pages (comme tous les moteurs ).
Hors ligne
juste un mot pour vous demander de donner des topic un peu plus explicite que "Connaissez vous ce script ?", cela aiderait à la navigation du forum.
merci
Hors ligne
Oups autant pour moi, il est vrai que j'ai été evasif j'avais pas d'autres idées
Tiens je connai le webmaster un éminent membre wri
Je dois pas connaitre son pseudo sur PR Descendant et comme je n'y vais plus (grace à vous)
Ce qui m'etonne le plus, c'est pas tant les pages avec les keywords car cela est possible avec une banale requete SQL mais surtout le nombre de réponse :
-http://www.va-y.com/Chant_154
Il semblerait qu'il se serve d'une base exterieure mais laquelle puisque je ne reconnais pas le DMOZ ?
Mon feeling me dit qu'il y a un truc à faire avec un engin comme celui ci ....
Hors ligne
Un bon moteur de recherche fait un truc comme ca.
Tu récupères les cat. dans dmoz, par exemple, et après tu lances un moteur récupérer les sites qui répondent à la requète sur gg, et tu les crawle avec mnogosearch, et le tour est joué.
Si tu as une centaine de catégories avec une centaine de sites chacune, ca fait un bon paquet de sites.
A coté de ca, tu ne crawle pas tout le site, juste la page d'accueil. Ca te fait un bon "jeu" de sites, et avec la manip. des urls et des redirections, tu essaies de récupérer les sites/pr/trafic de tout ca, sur ton site.
Ton feeling ? En fait, quantité de personnes lancent ce genre de moteurs.
Quand tu en as marre de valider des sites dans un annuaire, et de remplir des champs 'description', tu te lances dans le "moteur"
Hors ligne
Pour être franc, je dois avoir 12000 sites que je ne validerais plus jamais par manque de temps
Alors effectivement un joujou comme cela automatique et qui se ref bien m'amuserait je pense
Hors ligne
Ce qu'il te faudrait, dans ce cas, c'est un script qui permet à l'internaute qui te soumet un site, de voir l'évolution de ton bot sur ses pages.
Ca rajoute à l'interactivité, et d'un autre coté, ca te débarrasse de ce coté 'validation'.
Enfin, quitte à laisse un annuaire 'à l'abandon' (si l'on peut dire.. ), autant le laisser 'évoluer'. Qui sait, peut être se fera t il une place tout seul (!?)
Hors ligne