Forum dédié au moteur de recherche et aux techniques d'optimisation par #taggle
Vous n'�tes pas identifi�.
On entend souvent qu'il faut optimiser sa page d'erreur 404 pour le référencement. Du coup je viens de faire un petit test.
Apparemment, Google ne tient pas compte de ces pages : dès que le code réponse envoyé par le document est "404", le crawler ne se donne même pas la peine d'indexer la page.
Je n'ai vu aucune page d'erreur ayant le code 404 dans son entête indexée par Google : http://www.google.fr/search?q=%22Not+fo … t+Found%22
Bref, tout ca pour dire que si on veut que les liens présents dans la page 404 soient suivis et servent au netlinking interne, il faut paradoxalement que la page d'erreur 404 renvoit un code 200...
En fait, le shéma idéal est que dès qu'une URL ne résoud sur aucun document web, le serveur redirige en 301 vers une URL de type /error-404/ qui répond en 200. Comme ca, cette URL d'erreur est la même pour tout le monde, et elle peut même ranker dans les résultats et avoir un PR
Hors ligne
seg, pourquoi ne pas faire une page 404.asp avec à l'intérieur une simple redirection vers la home page du site ?
Hors ligne
il faut paradoxalement que la page d'erreur 404 renvoit un code 200...
Grosse erreur à mon avis, qui dit 404 dit duplicat car il n'y en a pas qu'une normalement,
Je pense à l'inverse qu'il ne faut pas fatiguer Googlebot, si la page n'existe pas,
elle n'existe pas et doit être supprimée
Le 404 marche très bien pour tout les moteurs, c'est intéressant lorsque tu cloak par exemple,
si tu n'as pas réussi à identifier ton client, c'est à dire que tu n'as pas résolu son IP par exemple,
tu envois un entête 404 comme ca le bot croit que le site est en panne, mais tu donne quand même la page au cas où c'est un vrai visiteur
Au pire faire une R=301 vers la home, mais c'est pas logique, une page qui a un thème autre que la home ne peut pas être déplacée "remplacée" par la home
Non rien de mieux qu'une bonne 404 pour avoir un site au fonctionnement "logique"
Je te dis ca car je chasse justement les pages orpholines sur mon spip rewrité et mon phpbb
et que j'applique des 404 au maximum quand je peux
NB : j'ai vu GGbot passer près de 6mois après une suppression sur une page à entete 404
alors ggbot aime se fatiguer à crawler pour rien je crois
Hors ligne
seg, pourquoi ne pas faire une page 404.asp avec à l'intérieur une simple redirection vers la home page du site ?
l'internaute ne comprendrait pas s'il ne trouve pas la page qu'il cherche. La 404 personnalisée permet de montrer le fameux message disant que la page a bougé ou disparu.
Au pire faire une R=301 vers la home, mais c'est pas logique, une page qui a un thème autre que la home ne peut pas être déplacée "remplacée" par la home
Ok avec toi Pagetronic, c'est pouquoi je suggère qu'en cas de 404 potentielle, le serveur redirige en 301 vers le fichier /error-404/ par exemple. Ca évitera les problèmes de duplicate. Cette page pourra présenter le message d'erreur à l'internaute suivi du plan du site.
j'ai vu GGbot passer près de 6mois après une suppression sur une page à entete 404
Normal s'il existe des liens pointant vers cette URL morte depuis des pages qui sont toujours crawlées. Mais je persiste qu'il faut renvoyer du 200, car sinon le robot ne prend pas en compte les liens présents dans la 404 car il n'indexe pas les 404 (il les crawl, certes, pour connaître les headers, mais il ne va pas plus loin a mon avis s'il trouve le code 404 alors qu'il chopera tout le contenu si c'est un code 200).
Du coup, si tu renvois du 404 au robots qui arrive d'un lien externe, tu perds le poid du backlink... C'est ça le problème.
Hors ligne
Tout dépends du cas.. mais je persiste
la page n'éxiste plus : 404,
la page a été déplacée : 301,
tu as perdu la page 302
à part en interne je vois pas comment avoir des BLs vers une page 404
Hors ligne
Oui, je suis d'accord : dans l'idéal le site ne devrait présenter aucune 404. Mais il arrive qu'on oublie de rediriger une page, ou qu'un webmaster se trompe en écrivant un lien vers notre site. Dans ces cas, la 404 est inévitable, c'est pouqoi il faut tout de même en prévoir une. Et si on veut que les liens qui pointent vers ces URL (qu'ils soient internes ou externes) bénéficient au référencement du site, il faut que le contenu de la page puisse être suivi par les moteurs ==> donc code reponse = 200
(m'en fous, je suis plus tétu que toi )
Hors ligne
Je n'ai jamais testé la 410, mais elle existe !
header(‘HTTP/1.0 410 Gone’);
En gros : la page est détruite, n'est pas remplacée et n'est pas redirigée !
Parait-il que ça va plus vite que les 404 pour sortir des pages de l'index (si on ne veut pas switcher sur une autre URL...)
Hors ligne