#1 30-08-2006 16:16:05

franck
Member
Lieu: Vannes
Date d'inscription: 12-10-2005
Messages: 109

Parser ou quelque chose dans le genre

Bonjour à tous, et bonne rentrée si vous avez pris des vacances.

Vous en avez peut-être déjà parlé, mais j'ai pas trouvé.

Je voudrais voir comment récupérer le nombre de résultats de Google (par exemple) sur une liste de mots-clef.
Les API sont limitées à 1000 requêtes / jour, et j'ai cru lire que parser ne fonctionnait pas.

Vous savez comment faire ça, ou vou avez une piste ?

Hors ligne

 

#2 30-08-2006 17:03:40

Siddartha
Administrateur
Lieu: Paris et #66valley ☼
Date d'inscription: 20-06-2005
Messages: 2988
Site web

Re: Parser ou quelque chose dans le genre

Deux solutions :
1- disposer de plusieurs clés API selon le volume que tu souhaites (10 000 req/jour = 10 clés)
2- disposer de proxy pour pouvoir faire le volume que tu veux sans clé API.

Via la solution 2, tu devras tester le parsing pour savoir à partir de combien tu te fais bannir. Certains ici doivent avoir l'info, mais je ne sais pas s'ils peuvent la donner autrement que sous le manteau ... smile

Sinon, je sais pas quelle est l'utilité finale de ton script, donc ce qui suit est à prendre avec des pincettes :

Quelle est l'utilité de récupérer le nb de résultats sur une liste de mot clés au vu des données fantaisistes que renvoie Google pour ce type d'informations et sachant que cette meme information sera différente selon le DC dans lequel tu vas tapé au moment de la requête ?

Hors ligne

 

#3 30-08-2006 17:48:46

ChauffeurDeBuzz
Member
Date d'inscription: 07-08-2006
Messages: 1094

Re: Parser ou quelque chose dans le genre

une autre solution et de mettre en cache le résultat.

Hors ligne

 

#4 30-08-2006 18:35:19

Tiger
Survivors
Lieu: 78
Date d'inscription: 08-06-2006
Messages: 640
Site web

Re: Parser ou quelque chose dans le genre

Salut,

Je ne sais pas si ça peut t'aider mais voici un code qui renvoie le nombre de résultats pour un mot-clé :

Code:

<?php
$count = 0;
    $searchkey = "ambatchdotcom seocontest" ;
    $searchkey = str_replace(" ","+",$searchkey);    


if(!empty($searchkey))
{
      

    $filename = "http://www.google.com/search?sourceid=navclient&ie=UTF-8&q=$searchkey";
    $file = fopen($filename, "r");
    if (!$file) 
    {
        echo "<p>Unable to open remote file $filename.\n";
    }
    else
    {
        while (!feof($file))
        {
            $var = fgets($file, 1024);
            if(eregi("of about <b>(.*)</b> for",$var,$out))
            { 
                $out[1] = strtolower(strip_tags($out[1]));
                $count = $out[1];
                echo $count ;
                
                break;
            }
            
        }
        fclose($file);    
    }

 
}
?>

J'ai modifié un script qui permet d'avoir le nombre de pages indexées par google pour un site donné. Ici il suffit de remplacer ambatchdotcom seocontest :

Code:

$searchkey = "ambatchdotcom seocontest" ;

par le keyword que tu veux tester.

A toi de l'améliorer et de l'adapter pour chercher sur plusieurs mots-clés (si tu le fais, un retour ici serait cool).

Par contre, je ne sais pas si dans ce cas, ya des risque de ban...

Paul

Hors ligne

 

#5 30-08-2006 18:37:45

Tiger
Survivors
Lieu: 78
Date d'inscription: 08-06-2006
Messages: 640
Site web

Re: Parser ou quelque chose dans le genre

Au fait, un mot-clé = une requete, tu vas tester plus de 1000 mots par jour ?

Paul

Hors ligne

 

#6 31-08-2006 10:41:19

franck
Member
Lieu: Vannes
Date d'inscription: 12-10-2005
Messages: 109

Re: Parser ou quelque chose dans le genre

Merci pour vos réponses.

> Quelle est l'utilité de récupérer le nb de résultats sur une liste de mot clés au vu des données fantaisistes que renvoie Google pour ce type d'informations et sachant que cette meme information sera différente selon le DC dans lequel tu vas tapé au moment de la requête ?

Oui, c'est fantaisiste, mais l'idée est justement de faire un état de tout cela, et d'essayer de retirer des éléments sur l'évolution, parce que fantaisiste ou pas, cela doit bien avoir un impact sur la faisabilité du positionnemenet sur la fluctuation des classements.
Vous utilisez d'autres indicateurs ?

> une autre solution et de mettre en cache le résultat
Et tu parses le document enregistré ? Mais alors, en ressources nécessaires sur un gros paquet d'expressions ...

Merci Tiger pour le script, je vais essayer ça. Je croyais qu'on ne pouvais pas passer de Get File (lu sur un forum ... ça m'apprendra à croire tout ce que je lis smile)

> tu vas tester plus de 1000 mots par jour ?
Pourquoi pas ? Tant qu'à faire. Par jour, je ne sais pas, mais ça pourrait arriver, oui.

Maintenant, est-ce que ça présente un intérêt réel, à voir. C'est hallucinant, la quantité de réponses parfois sur certaines requêtes, et les fluctuations d'un DC ou d'une minute à l'autre, mais les proportions et les rapports pourraient-ils donner quelque chose d'intéressant ?
Vous avez déjà fait des tests dans ce sens là ?

Hors ligne

 

Pied de page des forums

Propulsé par PunBB
© Copyright 2002–2005 R. Andersson