#1 08-02-2007 11:25:12

Sebastien
Un référenceur accessible
Lieu: Lille et Paris
Date d'inscription: 29-07-2005
Messages: 691
Site web

Antconc, outils d'analyse linguistique

Un programme assez genial, qui determine notamment les fréquence des mots-clés isolés, mais aussi les fréquence de clusters de mots (taille et frequence parametrables), et qui support les expressions régulières :
http://www.antlab.sci.waseda.ac.jp/software.html

En crawlant puis en analysant les échanges des communauté d'utilisateurs, ça permet ainsi de trouver les expressions clés qu'ils utilisent vraiment. Par ex si vous vendez des produits de beauté faites une analyse des forums d'aufeminin.com wink

Hors ligne

 

#2 08-02-2007 12:15:03

Toucouleur
Survivors
Lieu: Perpignan
Date d'inscription: 30-09-2005
Messages: 790
Site web

Re: Antconc, outils d'analyse linguistique

ça a l'air sympa Seb, mais comment procèdes tu ? tu prends des pages HTMLs du forum cible, tu sauvegardes dans un fichier texte et tu lances l'analyse ? Je vais esssayer ça ce soi, ça  a l'air sympathique tel que tu le décris smile


"Le luxe est naturellement associé à la richesse qui permet des investissements qui visent le pur agrément et non le profit."

Hors ligne

 

#3 08-02-2007 12:19:19

Sebastien
Un référenceur accessible
Lieu: Lille et Paris
Date d'inscription: 29-07-2005
Messages: 691
Site web

Re: Antconc, outils d'analyse linguistique

Il accepte de prendre de multiples pages html locales, sauvegardées par exemple avec HTTtrack. Le problème est que pour le html, il considère comme mots ce qu'il y a dans les balises, attributs etc... ce que je cherche à faire sans succès pour l'instant, c'est récupere des versions texte (.txt) des pages html, avec seulement le contenu utile, et non les balises, liens etc.

Hors ligne

 

#4 08-02-2007 12:26:00

fbparis
Survivors
Lieu: Paris
Date d'inscription: 14-07-2006
Messages: 1896
Site web

Re: Antconc, outils d'analyse linguistique

Pour ca ya qu'à demander smile
Je fais ça en vitesse et j'édite pour filer l'url...

edit : http://evere.st/html2txt.php

(source en bas de page, pas de gestion des problemes d'encoding...)

edit 2 : j'ai ajouté qqs lignes pour gérer basiquement l'encoding (utf8 ou iso8859 devraient passer sans probleme)

Derni�re modification par fbparis (08-02-2007 15:21:56)

Hors ligne

 

#5 08-02-2007 12:33:08

Sebastien
Un référenceur accessible
Lieu: Lille et Paris
Date d'inscription: 29-07-2005
Messages: 691
Site web

Re: Antconc, outils d'analyse linguistique

Yes ! sinon j'ai aussi trouvé ce petit programme excellent et gratuit : http://www.nirsoft.net/utils/htmlastext.html
Il permet même de virer ou non la balise title.

Hors ligne

 

#6 15-02-2007 23:02:24

Sebastien
Un référenceur accessible
Lieu: Lille et Paris
Date d'inscription: 29-07-2005
Messages: 691
Site web

Re: Antconc, outils d'analyse linguistique

Bon voila le résultat de mes recherches :
http://s.billard.free.fr/referencement/ … -mots-cles
Je précise bien qu'il s'agit d'un complément aux outils des moteurs, il ne s'agit pas de trouver les termes les plus recherchés, mais les plus utilisés par de "vrais" gens. Vos avis sont bienvenus. En particulier, n'étant pas statisticien ni linguiste, je me demande quelle taille de corpus est nécessaire pour des résultats raisonnablement fiables.

Hors ligne

 

Deprecated: preg_replace(): The /e modifier is deprecated, use preg_replace_callback instead in /home/tgarchive/forum/include/parser.php on line 414

#7 16-02-2007 11:11:42

ZN
Tagglers+
Lieu: Entre ici et là ...
Date d'inscription: 26-10-2005
Messages: 547

Re: Antconc, outils d'analyse linguistique

Ca a l'air tres interessant tout ça, et peut-etre complémentaire au service Yahoo Term Extraction que je suis en train de tester ces temps ci smile

Hors ligne

 

Pied de page des forums

Propulsé par PunBB
© Copyright 2002–2005 R. Andersson