Forum dédié au moteur de recherche et aux techniques d'optimisation par #taggle
Vous n'�tes pas identifi�.
Un programme assez genial, qui determine notamment les fréquence des mots-clés isolés, mais aussi les fréquence de clusters de mots (taille et frequence parametrables), et qui support les expressions régulières :
http://www.antlab.sci.waseda.ac.jp/software.html
En crawlant puis en analysant les échanges des communauté d'utilisateurs, ça permet ainsi de trouver les expressions clés qu'ils utilisent vraiment. Par ex si vous vendez des produits de beauté faites une analyse des forums d'aufeminin.com
Hors ligne
ça a l'air sympa Seb, mais comment procèdes tu ? tu prends des pages HTMLs du forum cible, tu sauvegardes dans un fichier texte et tu lances l'analyse ? Je vais esssayer ça ce soi, ça a l'air sympathique tel que tu le décris
Hors ligne
Il accepte de prendre de multiples pages html locales, sauvegardées par exemple avec HTTtrack. Le problème est que pour le html, il considère comme mots ce qu'il y a dans les balises, attributs etc... ce que je cherche à faire sans succès pour l'instant, c'est récupere des versions texte (.txt) des pages html, avec seulement le contenu utile, et non les balises, liens etc.
Hors ligne
Pour ca ya qu'à demander
Je fais ça en vitesse et j'édite pour filer l'url...
edit : http://evere.st/html2txt.php
(source en bas de page, pas de gestion des problemes d'encoding...)
edit 2 : j'ai ajouté qqs lignes pour gérer basiquement l'encoding (utf8 ou iso8859 devraient passer sans probleme)
Derni�re modification par fbparis (08-02-2007 15:21:56)
Hors ligne
Yes ! sinon j'ai aussi trouvé ce petit programme excellent et gratuit : http://www.nirsoft.net/utils/htmlastext.html
Il permet même de virer ou non la balise title.
Hors ligne
Bon voila le résultat de mes recherches :
http://s.billard.free.fr/referencement/ … -mots-cles
Je précise bien qu'il s'agit d'un complément aux outils des moteurs, il ne s'agit pas de trouver les termes les plus recherchés, mais les plus utilisés par de "vrais" gens. Vos avis sont bienvenus. En particulier, n'étant pas statisticien ni linguiste, je me demande quelle taille de corpus est nécessaire pour des résultats raisonnablement fiables.
Hors ligne
Ca a l'air tres interessant tout ça, et peut-etre complémentaire au service Yahoo Term Extraction que je suis en train de tester ces temps ci
Hors ligne