Il existe un rapport dans la Google Search Console qui est à la fois incroyablement utile et assez difficile à trouver, surtout si vous ne faites que commencer votre voyage de référencement.
C’est l’un des outils les plus puissants pour tous les professionnels du référencement, même si vous ne pouvez même pas y accéder depuis l’interface principale de Google Search Console.
Je parle du rapport sur les statistiques de l’exploration.
Dans cet article, vous apprendrez pourquoi ce rapport est si important, comment y accéder et comment l’utiliser pour un avantage SEO.
Comment votre site Web est-il exploré?
Le budget d’exploration (le nombre de pages que Googlebot peut et veut explorer) est essentiel pour le référencement, en particulier pour les grands sites Web.
Si vous rencontrez des problèmes avec le budget d’exploration de votre site Web, Google peut ne pas indexer certaines de vos pages importantes.
Publicité
Continuer la lecture ci-dessous
Et comme le dit le proverbe, si Google n’a pas indexé quelque chose, cela n’existe pas.
Google Search Console peut vous montrer combien de pages de votre site sont visitées par Googlebot chaque jour.
Armé de ces connaissances, vous pouvez trouver des anomalies qui peuvent être à l’origine de vos problèmes de référencement.
Plonger dans vos statistiques d’exploration: 5 informations clés
Pour accéder à votre rapport sur les statistiques d’exploration, connectez-vous à votre compte Google Search Console et accédez à Paramètres> Statistiques d’exploration.
Voici toutes les dimensions de données que vous pouvez inspecter dans le rapport sur les statistiques d’exploration:
1. Hôte
Imaginez que vous ayez une boutique en ligne sur shop.website.com et un blog sur blog.website.com.
À l’aide du rapport sur les statistiques d’exploration, vous pouvez facilement consulter les statistiques d’exploration liées à chaque sous-domaine de votre site Web.
Malheureusement, cette méthode ne fonctionne pas actuellement avec les sous-dossiers.
2. État HTTP
Un autre cas d’utilisation du rapport sur les statistiques d’exploration concerne les codes d’état des URL explorées.
C’est parce que vous ne voulez pas que Googlebot consacre des ressources à l’exploration de pages qui ne sont pas HTTP 200 OK. C’est un gaspillage de votre budget d’exploration.
Publicité
Continuer la lecture ci-dessous
Pour voir la répartition des URL explorées par code d’état, accédez à Paramètres> Statistiques d’exploration> Répartition des demandes d’exploration.
Dans ce cas particulier, 16% de toutes les demandes concernaient des pages redirigées.
Si vous voyez des statistiques comme celles-ci, je vous recommande d’enquêter plus avant et de rechercher des sauts de redirection et d’autres problèmes potentiels.
À mon avis, l’un des pires cas que vous puissiez voir ici est une grande quantité d’erreurs 5xx.
Pour citer la documentation de Google: « Si le site ralentit ou répond par des erreurs de serveur, la limite diminue et Googlebot explore moins. »
Si ce sujet vous intéresse, Roger Montti a écrit un article détaillé sur les erreurs 5xx dans Google Search Console.
3. Objet
Le rapport sur les statistiques de l’exploration divise l’objectif de l’exploration en deux catégories:
- URL explorées à des fins d’actualisation (une nouvelle exploration de pages déjà connues, par exemple, Googlebot visite votre page d’accueil pour découvrir de nouveaux liens et contenus).
- URL explorées à des fins de découverte (URL explorées pour la première fois).
Cette ventilation est incroyablement utile, et voici un exemple:
J’ai récemment rencontré un site Web contenant environ 1 million de pages classées comme « Découvertes – actuellement non indexées ».
Ce problème a été signalé pour 90% de toutes les pages de ce site.
(Si vous ne le connaissez pas, « Découvert mais pas indexé » signifie que Google a découvert une page donnée mais ne l’a pas visitée. Si vous avez découvert un nouveau restaurant dans votre ville mais que vous ne l’avez pas essayé, par exemple .)
Publicité
Continuer la lecture ci-dessous
L’une des options était d’attendre, en espérant que Google indexe ces pages progressivement.
Une autre option consistait à examiner les données et à diagnostiquer le problème.
Je me suis donc connecté à Google Search Console et j’ai accédé à Paramètres> Statistiques d’exploration> Demandes d’exploration: HTML.
Il s’est avéré qu’en moyenne, Google ne visitait que 7460 pages sur ce site Web par jour.
Mais voici quelque chose d’encore plus important.
Publicité
Continuer la lecture ci-dessous
Grâce au rapport sur les statistiques d’exploration, j’ai découvert que seulement 35% de ces 7460 URL avaient été explorées pour des raisons de découverte.
Cela ne représente que 2611 nouvelles pages découvertes par Google par jour.
2611 sur plus d’un million.
Il faudrait 382 jours à Google pour indexer complètement l’ensemble du site Web à ce rythme.
Découvrir cela a changé la donne. Toutes les autres optimisations de recherche ont été reportées car nous nous sommes entièrement concentrés sur l’optimisation du budget d’exploration.
Publicité
Continuer la lecture ci-dessous
4. Type de fichier
Les statistiques de l’exploration GSC peuvent être utiles pour les sites Web JavaScript. Vous pouvez facilement vérifier la fréquence à laquelle Googlebot explore les fichiers JS nécessaires à un rendu correct.
Si votre site regorge d’images et que la recherche d’images est cruciale pour votre stratégie de référencement, ce rapport vous aidera également beaucoup – vous pouvez voir à quel point Googlebot peut explorer vos images.
5. Type de Googlebot
Enfin, le rapport sur les statistiques d’exploration vous donne une ventilation détaillée du type de Googlebot utilisé pour explorer votre site.
Vous pouvez connaître le pourcentage de demandes effectuées par les robots Googlebot pour mobile ou de bureau et d’image, vidéo et annonces.
Autres informations utiles
Il convient de noter que le rapport sur les statistiques d’exploration contient des informations précieuses que vous ne trouverez pas dans les journaux de votre serveur:
- Erreurs DNS.
- Délais d’expiration de la page.
- Problèmes d’hôte tels que des problèmes de récupération du fichier robots.txt.
Utilisation des statistiques d’exploration dans l’outil d’inspection d’URL
Vous pouvez également accéder à certaines données d’analyse granulaires en dehors du rapport sur les statistiques d’exploration, dans l’outil d’inspection d’URL.
Publicité
Continuer la lecture ci-dessous
J’ai récemment travaillé avec un grand site Web de commerce électronique et, après quelques analyses initiales, j’ai remarqué deux problèmes urgents:
- De nombreuses pages de produits n’étaient pas indexées dans Google.
- Il n’y avait pas de lien interne entre les produits. Le seul moyen pour Google de découvrir de nouveaux contenus était via des plans de site et des pages de catégories paginées.
Une prochaine étape naturelle consistait à accéder aux journaux du serveur et à vérifier si Google avait exploré les pages de catégories paginées.
Mais accéder aux journaux du serveur est souvent très difficile, en particulier lorsque vous travaillez avec une grande organisation.
Le rapport sur les statistiques d’exploration de Google Search Console est venu à la rescousse.
Laissez-moi vous guider à travers le processus que j’ai utilisé et que vous pouvez utiliser si vous êtes aux prises avec un problème similaire:
1. Commencez par rechercher une URL dans l’outil d’inspection d’URL. J’ai choisi l’une des pages paginées dans l’une des principales catégories du site.
2. Ensuite, accédez au Couverture> Rapport d’exploration.
Dans ce cas, l’URL a été explorée pour la dernière fois il y a trois mois.
Publicité
Continuer la lecture ci-dessous
Gardez à l’esprit que c’était l’une des principales pages de catégorie du site Web qui n’avait pas été explorée depuis plus de trois mois!
Je suis allé plus loin et j’ai vérifié un échantillon d’autres pages de catégories.
Il s’est avéré que Googlebot n’a jamais visité de nombreuses pages de catégories principales. Beaucoup d’entre eux sont encore inconnus de Google.
Je ne pense pas avoir besoin d’expliquer à quel point il est crucial d’avoir ces informations lorsque vous travaillez à améliorer la visibilité d’un site Web.
Le rapport sur les statistiques d’exploration vous permet de visualiser des choses comme celle-ci en quelques minutes.
Emballer
Comme vous pouvez le voir, le rapport sur les statistiques d’exploration est un puissant outil de référencement, même si vous pouvez utiliser Google Search Console pendant des années sans jamais le trouver.
Il vous aidera à diagnostiquer les problèmes d’indexation et à optimiser votre budget d’exploration afin que Google puisse trouver et indexer rapidement votre précieux contenu, ce qui est particulièrement important pour les grands sites.
Je vous ai donné quelques cas d’utilisation auxquels réfléchir, mais maintenant la balle est dans votre camp.
Publicité
Continuer la lecture ci-dessous
Comment allez-vous utiliser ces données pour améliorer la visibilité de votre site?
Plus de ressources:
Crédits d’image
Toutes les captures d’écran prises par l’auteur, avril 2021