Forum dédié au moteur de recherche et aux techniques d'optimisation par #taggle
Vous n'�tes pas identifi�.
Bonjour,
J'envisage de mettre un document pdf en téléchargement sur un site.
Je souhaite que ce pdf soit indexable par les moteurs de recherche, mais je veux aussi interdire le téléchargement direct de ce pdf si le visiteur ne vient pas d'une page précise du site.
En particulier si le visiteur clicke sur le lien vers le pdf à partir d'une page de résultats de Google, il doit être redirigé vers la page du site qui propose le lien de téléchargement du pdf.
Quelle est la meilleure façon de procéder?
Merci.
Hors ligne
c'est exactement ce que je fais pour le site de la boite (clique sur le premier de http://www.google.fr/search?hl=fr&q … &meta= )
les liens sont en dur, mais cachés... qqpart dans le site
il y a une gestion d'inscription par IMP Download sur Wordpress (il faut etre enregistré et loggé pour télécharger)
les visiteurs venant de google se heurtent à :
# redirection des pdf venant de google vers les pages correspondantes Rewritecond %{HTTP_REFERER} ^http://(www\.)?google\.(com|fr) [NC] RewriteRule (.*)\.pdf?$ /pdf_redir.php?url=$1 [NC,L]
(que je vais transformer en "ne vient pas du site digimind.fr" => redir)
et dans le pdf_redir.php, j'ai un tableau avec les pages html de redirection en fonction du pdf
Hors ligne
Merci Malaic. C'est effectivement une bonne façon de rediriger les visiteurs en provenance de Google.
Ceci dit, en copiant l'url du pdf dans la barre d'adresse (donc sans referer), on peut accéder au pdf.
Pour l'empêcher, et aussi rediriger les visiteurs en provenance de yahoo ou autre, j'imagine que je pourrais modifier ton rewrite pour rediriger si le referer n'est pas la page de mon site. Mais dans ce cas... je bloquerais aussi les bots.
Ou alors:
- je cloake pour laisser passer les bots
- je redirige tous les visiteurs (non bots) qui arrivent avec un referer différent de la page de mon site.
Un peu compliqué mais ça doit marcher non?
Hors ligne
N'oublis pas d'empêcher les bots d'archiver la page
Hors ligne
Ils archivent les pdf?
Hors ligne
Ben ils les mettent en version HTML... mais je ne sais pas si tu peux dire au bots de ne pas archiver un pdf...
Hors ligne
Ils n'ont pas tous le lien Version HTML :
http://www.google.fr/search?q=grr+filet … 0&sa=N
Ou là : http://www.google.fr/search?q=filetype% … fr___FR228
Faudrait examiner ça de plus près, ya sans doute un moyen de contrôler ça..
Edit : rien trouvé de concluant dans l'encoding ou dans les headers / reponses du serveur.. Peut-être ya t'il des options dans le pdf lui même à la création du document..
Derni�re modification par fbparis (20-07-2007 12:59:12)
Hors ligne
C'est pour faire quoi exactement ? vendre un ebook ?
Hors ligne
Ah oui, très juste, il va falloir que je comprenne comment faire en sorte pour que Google ne propose pas de version HTML.
MagicYoyo, l'idée est plus de le donner, un genre de linbkbait en fait. Mais en contrepartie il faut que ça drive du trafic sur le site, d'où ma question.
Hors ligne
Sinon tu sers du html aux bots avec la balise noarchive (donc faut htmliser les pdf) puis tu rediriges les users qui n'ont pas le bon referer vers la page de paiement..
Hors ligne
Jan a �crit:
Merci Malaic. C'est effectivement une bonne façon de rediriger les visiteurs en provenance de Google.
Ceci dit, en copiant l'url du pdf dans la barre d'adresse (donc sans referer), on peut accéder au pdf.
Ou alors:
- je cloake pour laisser passer les bots
- je redirige tous les visiteurs (non bots) qui arrivent avec un referer différent de la page de mon site.
Un peu compliqué mais ça doit marcher non?
C'est ce que je comtpe faire
Hors ligne
Jan a �crit:
Ah oui, très juste, il va falloir que je comprenne comment faire en sorte pour que Google ne propose pas de version HTML.
Il faudrait un un tag NOPREVIEW mais ça n'est pas encore prêvu au programme :
http://sebastianx.blogspot.com/2007/08/ … s-tag.html
Hors ligne
Je me suis renseigné à ce sujet, il y a une option dans adobe à partir de certaines versions, et sinon le truc classique qui marche tout le temps (aussi utilisé par les spameurs pour rendre inefficaces les antivirus) est de sauver ton pdf avec un password vide (ou une astuce dans le genre). Les bots ne peuvent plus les lire et pour les users c transparent...
Hors ligne
Bien vu FB
Hors ligne