Forum dédié au moteur de recherche et aux techniques d'optimisation par #taggle
Vous n'�tes pas identifi�.
Bonjour, encore moi
J'ai pu vérifier que google indexe bien les pages https, en tous cas il en a dans son index.
Or sur mon site, aucune page https n'est indexée et je ne comprends vraiment pas pourquoi (pas de fichier robots.txt en https qui interdirait les robots, rien non plus dans les balises meta) car google a indexe des centaines de pages du site depuis des années et les liens vers les pages https sont bien présents depuis toutes les pages du site ou presque.
Comment expliquer cela ?
On pourrait avoir un lien ?
Hors ligne
J'ai peur que non
Enfin je crois avoir compris, c'est une histoire de duplicate content encore, google considere les deux sites comme identiques et desindexe le https... du coup mes pages https sortent de l'index et les pages equivalentes en http ne risquent pas d'etre indexees puisque aucun lien ne pointe vers elles..
Au final il faudra pourtant bien que les pages https soient reindexees, vous avez une idée de la façon de faire sachant que pour l'instant toute histoire de Rewriting est exclue ?
Question : quel est l'intérêt de référencer les pages en https si elles sont similaires à celles en http ?
Hors ligne
Le fait que le site entier soit accessible en http ou https est une erreur que je vais corriger, par contre il y a des pages avec des formulaires qui resteront en https, et elles regorgent de contenu donc il serait vraiment dommage qu'elle ne soient pas indexees...
Je comprends mieux.
Question de noob en sécurité : le protocole HTTPS suppose-t-il un certificat de sécurité ?
L'acceptation des certificats est elle "passée" par les bots ?
Hors ligne
Tu as, sur certaines pages en https (par exemple lorsque tu te connectes au https de ton serveur ovh, si t'en as un..) une alerte de IE, qui t'informe que le certificat n'est pas valable.
Dans ce cas :
Le certificat est bien valable, mais pas reconnu par microsoft (autrement dit, ovh n'a pas payé microsoft).
Le protocole https ne nécessite pas de certificat en soit, et tous les serveurs ovh ont la possibilité de faire du https (d'après ce que j'ai compris..). Mais pour afficher une alerte du style 'ce site a un certificat valable', alors il faut s'adresser à un organisme de validation.
Mais je ne suis pas sûr que les certificats valables pour l'un (IE) soient systématiquement valables pour les autres (FF, etc..).
Hors ligne
Salut FB, lorsque tu dis : "J'ai pu vérifier que google indexe bien les pages https, en tous cas il en a dans son index." tu veux dire qu'il les indexe et il le fait bien ? ou alors tu parts du principe qu'on peut constater que GG a des pages https dans son index donc il est possible d'entrer ces pages dans l'index de GG ?
Les pages https demandent un certificat d'authentification et les moteurs ne ( "peuvent pas" / "devraient pas " ) valider ce certificat, ils ne devraient donc pas indexer ces pages.
Il est vrai que l'on trouve des pages https dans l'index de GG, mais je ne saurais te répondre sur comment et pourquoi il a indexé ces pages.
Personnellement je ne vois pas l'intérêt de sécuriser des pages par un certificat et de rendre leur contenu accessible sans vérification.
Il me parait donc normal qu'un site en https ne soit pas indexé.
Mais avec un exemple de site on pourrait être plus objectif
Pourrais tu nous donner alors l'intérêt de mettre tout un site en https ?
Jeff,
Derni�re modification par Jeff (30-06-2006 13:44:13)
Hors ligne
FB a �crit:
J'ai peur que non
Enfin je crois avoir compris, c'est une histoire de duplicate content encore, google considere les deux sites comme identiques et desindexe le https... du coup mes pages https sortent de l'index et les pages equivalentes en http ne risquent pas d'etre indexees puisque aucun lien ne pointe vers elles..
Au final il faudra pourtant bien que les pages https soient reindexees, vous avez une idée de la façon de faire sachant que pour l'instant toute histoire de Rewriting est exclue ?
Tu as forcément des liens qui pointent vers le site en http, puisque sinon Google ne pourrait pas les voir, et tu n'aurais pas de problèmes de duplicate content.
Par contre, il se peut que tu ais plus de liens vers du https que vers du http.
Par contre : Rien de plus pénible que d'avoir un site qui a d'un coté du http, et d'un autre du https. Par ce que là, l'internaute passe son temps à valider les certificats sur son navigateur préféré.
D'un autre coté, les personnes qui te feront un lien 'spontané' ne le feront pas forcément sur du https.
Bref, la solution ? Je sais pas
Hors ligne
FB a �crit:
J'ai peur que non
Enfin je crois avoir compris, c'est une histoire de duplicate content encore, google considere les deux sites comme identiques et desindexe le https... du coup mes pages https sortent de l'index et les pages equivalentes en http ne risquent pas d'etre indexees puisque aucun lien ne pointe vers elles..
Au final il faudra pourtant bien que les pages https soient reindexees, vous avez une idée de la façon de faire sachant que pour l'instant toute histoire de Rewriting est exclue ?
pages securisees, pour les utilisateurs enregistres seulement et tu resous le probleme...
Hors ligne
Jeff a �crit:
Pourrais tu nous donner alors l'intérêt de mettre tout un site en https ?
Consulter un site librement en étant assuré que la communication entre toi et le serveur sont complètement chiffrés et donc ne passe pas en clair sur le réseau.
Une sécurité de plus en somme pour ta vie privée
Hors ligne
Siddartha a �crit:
Jeff a �crit:
Pourrais tu nous donner alors l'intérêt de mettre tout un site en https ?
Consulter un site librement en étant assuré que la communication entre toi et le serveur sont complètement chiffrés et donc ne passe pas en clair sur le réseau.
Une sécurité de plus en somme pour ta vie privée
Exact Sid
Mais je voulais connaître l'intérêt que FB lui portait sachant qu'il souhaite que son site soit indexé
Jeff,
Hors ligne
Anonymus a �crit:
Dans ce cas :
Le certificat est bien valable, mais pas reconnu par microsoft (autrement dit, ovh n'a pas payé microsoft).
Faux. ce n'est pas comme ca que ca marche, ca n'a rien a voir avec MS.
Pour qu'un certificat soit valable, il faut qu'un organisme l'ait signé (ou certifié), sinon n'importe qui peut créer un certificat mais comment etre sur que ce qu'il y a dedans est vrai. Genre, sur mon certificat je dis que je suis JPchaseMorgan, mais en fait je suis un petit hacker asiatique (ou autre) et lorsque l'on se loggue sur mon site on pourrait croire a une connexion securisé et valide alors qu'il n'en est rien. Donc pour qu'un certificat soit valide il doit etre certifié par un organisme (avec une date d'expiration). Ces organisme sont entre autre verisign, thawte... Quand on installe un navigateur il est livré avec un certain nombre de certificat pas defaut dont ceux precedemment cités. Donc si un site balance son cerrtificat et qu'il est signé par thawte, le browser verifie (il a le certificat de thawte en reserve) et l'accepte sans broncher (c'est donc valable pour IE mais aussi pour FF, et la JVM java a aussi sa petite valise a certificat). Par contre si le certificat a été signé par un organisme bidon (snake oil est ce qui est utilisé par defaut sous Linux), alors le browser alerte en disant, attention, la connexion est securisé mais le charlot en face peut se faire passer pour quelqu'un qu'il n'est pas.
PS: le certificat a une date de validité et est lié à l'adresse IP
Hors ligne