Search

Googlebot commence l'exploration avec le protocole HTTP / 2


Google a mis à jour sa page d’assistance aux développeurs Googlebot pour indiquer que Google peut désormais essayer de télécharger des pages via le dernier protocole HTTP / 2. Cette opération est effective en novembre 2020. La page des développeurs Googlebot a été mise à jour le 12 novembre 2020 pour refléter ce changement.

Ce changement avait déjà été annoncé en septembre. Le changement est maintenant officiellement en vigueur.

Selon Google:

« Généralement, Googlebot explore via HTTP / 1.1. Cependant, à partir de novembre 2020, Googlebot pourra explorer les sites susceptibles d’en bénéficier via HTTP / 2 s’il est pris en charge par le site. »

Pourquoi le protocole réseau HTTP / 2

HTTP / 2 est actuellement le dernier protocole réseau. Il permet un transfert de données plus rapide et plus efficace entre un serveur et un navigateur (ou Googlebot).

Ce que fait HTTP / 2 est de réduire le temps nécessaire pour qu’une page Web soit envoyée d’un navigateur à un serveur. HTTP / 2 réduit également la surcharge en compressant les champs d’en-tête HTTP.

Publicité

Continuer la lecture ci-dessous

Sous l’ancien protocole réseau (HTTP / 1), plusieurs flux devaient être téléchargés en parallèle car une seule requête à la fois était activée sous l’ancienne version HTTP / 1.

Avec HTTP / 2, Googlebot et les navigateurs peuvent profiter du nouveau « multiplexé”Qualité. Cela signifie que plusieurs ressources peuvent être téléchargées dans un même flux à partir d’une connexion au lieu d’avoir à demander plusieurs flux à plusieurs connexions pour télécharger la même page Web.

Selon une page FAQ officielle de l’IETF sur Github:

«HTTP / 1.x a un problème appelé« blocage de tête de ligne », où effectivement une seule demande peut être en suspens sur une connexion à la fois.

… Le multiplexage résout ces problèmes en permettant à plusieurs messages de demande et de réponse d’être en vol en même temps; il est même possible de mélanger des parties d’un message avec un autre sur le fil.

Ceci, à son tour, permet à un client d’utiliser une seule connexion par origine pour charger une page. »

Publicité

Continuer la lecture ci-dessous

Les capacités de HTTP / 2 signifient moins de congestion du serveur et économisent les ressources du serveur.

Minimiser la pression sur les ressources du serveur est bon pour les sites Web. Parfois, non seulement Googlebot, mais de nombreux autres robots arrivent sur un site en même temps.

Le résultat est que le site commence à répondre de manière lente car de nombreuses ressources du serveur sont utilisées. C’est mauvais pour les utilisateurs qui essaient d’afficher des pages Web et mauvais pour l’éditeur si Googlebot ne peut pas explorer un site Web parce que le serveur est étiré à la limite par des robots malveillants tels que des grattoirs et des pirates.

Selon Google:

« … À partir de novembre 2020, Googlebot pourra explorer les sites susceptibles d’en bénéficier via HTTP / 2 s’il est pris en charge par le site.

Cela peut économiser des ressources informatiques (par exemple, CPU, RAM) pour le site et Googlebot, mais dans le cas contraire, cela n’affecte pas l’indexation ou le classement de votre site. « 

Les éditeurs peuvent désactiver l’exploration HTTP / 2

Il est possible de désactiver l’exploration HTTP / 2. Le serveur doit être configuré pour envoyer un code de réponse de serveur 421.

Le code d’état 421 est décrit par l’Internet Engineering Task Force (IETF.org) comme une demande mal dirigée. Cela signifie qu’une requête HTTP / 2 est mal dirigée si elle n’est pas disponible.

Selon l’IETF:

«Le code d’état 421 (demande mal dirigée) indique que la demande a été dirigée vers un serveur qui n’est pas en mesure de produire une réponse.
Cela peut être envoyé par un serveur qui n’est pas configuré pour produire des réponses pour la combinaison du schéma et de l’autorité qui sont inclus dans l’URI de la demande. »

La page des développeurs de Google recommande:

« Pour désactiver l’exploration via HTTP / 2, demandez au serveur qui héberge votre site de répondre avec un code d’état HTTP 421 lorsque Googlebot tente d’explorer votre site via HTTP / 2. Si ce n’est pas possible, vous – pouvez envoyer un message à l’équipe Googlebot – (cette solution est toutefois temporaire). »

Publicité

Continuer la lecture ci-dessous

Citation

Page des développeurs Googlebot
https://www.google.com/webmasters/tools/googlebot-report



Auteur/autrice

Partager:

Articles Similaires