Comment optimiser les sitemaps XML: 13 meilleures pratiques SEO


La création et la mise à jour de votre plan de site XML est une pratique SEO essentielle mais négligée.

Les sitemaps sont importants pour vos sites et vos moteurs de recherche.

Pour les moteurs de recherche, les plans de site sont un moyen simple et direct d’obtenir des informations sur la structure et les pages de votre site Web.

Les sitemaps XML fournissent également des métadonnées cruciales, telles que:

  • À quelle fréquence chaque page est mise à jour.
  • Quand ils ont été modifiés pour la dernière fois.
  • L’importance des pages les unes par rapport aux autres.

Cependant, il existe certaines bonnes pratiques pour utiliser un plan de site à votre avantage maximum.

Prêt à apprendre comment optimiser les sitemaps XML?

Voici les 13 meilleures pratiques pour obtenir le meilleur rapport qualité-prix en matière de référencement.

1. Utilisez les outils et plugins pour générer automatiquement votre plan de site

La création d’un plan de site est facile lorsque vous disposez des bons outils, tels qu’un logiciel d’audit avec un générateur de plan de site XML intégré ou des plugins populaires tels que Google XML Sitemaps.

En fait, les sites Web WordPress qui utilisent déjà Yoast SEO peuvent activer les Sitemaps XML directement dans le plugin.

Publicité

Continuer la lecture ci-dessous

Vous pouvez également créer manuellement un plan de site en suivant la structure du code de plan de site XML.

Techniquement, votre plan de site n’a même pas besoin d’être au format XML – un fichier texte avec une nouvelle ligne séparant chaque URL suffira.

Cependant, vous devrez générer un plan de site XML complet si vous souhaitez implémenter l’attribut hreflang, il est donc beaucoup plus facile de laisser un outil faire le travail à votre place.

Consultez les pages officielles Google et Bing pour plus d’informations sur la configuration manuelle de votre plan de site.

2. Envoyez votre sitemap à Google

Vous pouvez soumettre votre plan de site à Google à partir de votre Google Search Console.

Depuis votre tableau de bord, cliquez sur Explorer> Sitemaps> Ajouter un sitemap de test.

Testez votre plan de site et affichez les résultats avant de cliquer Soumettre le plan du site pour rechercher les erreurs susceptibles d’empêcher l’indexation des principales pages de destination.

Idéalement, vous souhaitez que le nombre de pages indexées soit le même que le nombre de pages soumises.

Notez que l’envoi de votre plan de site indique à Google les pages que vous considérez comme étant de haute qualité et dignes d’être indexées, mais ne fait pas garantie qu’ils seront indexés.

Publicité

Continuer la lecture ci-dessous

Au lieu de cela, l’avantage de soumettre votre plan de site est de:

  • Aidez Google à comprendre la présentation de votre site Web.
  • Découvrez les erreurs que vous pouvez corriger pour vous assurer que vos pages sont correctement indexées.

3. Donner la priorité aux pages de haute qualité dans votre plan de site

En ce qui concerne le classement, la qualité globale du site est un facteur clé.

Si votre plan de site redirige les robots vers des milliers de pages de mauvaise qualité, les moteurs de recherche interprètent ces pages comme un signe que votre site Web n’est probablement pas celui que les gens voudront visiter – même si les pages sont nécessaires pour votre site, telles que les pages de connexion.

Essayez plutôt de diriger les robots vers les pages les plus importantes de votre site.

Idéalement, ces pages sont:

  • Hautement optimisé.
  • Incluez des images et des vidéos.
  • Avoir beaucoup de contenu unique.
  • Engagement rapide des utilisateurs grâce à des commentaires et des critiques.

4. Isoler les problèmes d’indexation

Google Search Console peut être un peu frustrant s’il n’indexe pas toutes vos pages, car il ne vous dit pas quelles pages sont problématiques.

Par exemple, si vous soumettez 20 000 pages et que seulement 15 000 de celles-ci sont indexées, vous ne saurez pas quelles sont les 5 000 «pages problématiques».

Cela est particulièrement vrai pour les grands sites Web de commerce électronique qui ont plusieurs pages pour des produits très similaires.

Le consultant SEO Michael Cottam a rédigé un guide utile pour isoler les pages problématiques.

Il recommande de diviser les pages de produits en différents sitemaps XML et de tester chacun d’eux.

Créez des sitemaps qui confirmeront des hypothèses, telles que « les pages sans image de produit ne sont pas indexées » ou « les pages sans copie unique ne sont pas indexées ».

Une fois que vous avez identifié les principaux problèmes, vous pouvez soit travailler pour résoudre les problèmes, soit définir ces pages sur « noindex », afin qu’elles ne diminuent pas la qualité globale de votre site.

En 2018, Google Search Console a été mis à jour en termes de couverture d’index.

Publicité

Continuer la lecture ci-dessous

En particulier, les pages problématiques sont désormais répertoriées et les raisons pour lesquelles Google n’indexe pas certaines URL sont fournies.

5. N’incluez que les versions canoniques des URL dans votre plan de site

Lorsque vous avez plusieurs pages très similaires, telles que des pages de produits pour différentes couleurs du même produit, vous devez utiliser la balise « link rel = canonical » pour indiquer à Google quelle page est la page « principale » à explorer et indexer.

Les robots ont plus de facilité à découvrir les pages clés si vous n’incluez pas de pages avec des URL canoniques pointant vers d’autres pages.

6. Utilisez la balise Meta Robots sur Robots.txt chaque fois que possible

Lorsque vous ne souhaitez pas qu’une page soit indexée, vous souhaitez généralement utiliser la balise meta robots « noindex, follow ».

Cela empêche Google d’indexer la page, mais cela préserve la valeur de vos liens, et c’est particulièrement utile pour les pages utilitaires qui sont importantes pour votre site mais qui ne devraient pas apparaître dans les résultats de recherche.

Le seul moment où vous souhaitez utiliser le fichier robots.txt pour bloquer des pages, c’est lorsque vous consommez votre budget d’exploration.

Publicité

Continuer la lecture ci-dessous

Si vous remarquez que Google est en train de réexplorer et d’indexer des pages relativement peu importantes (par exemple, des pages de produits individuelles) au détriment des pages principales, vous pouvez utiliser le fichier robots.txt.

7. Créer des sitemaps XML dynamiques pour les grands sites

Il est presque impossible de suivre tous vos méta-robots sur d’énormes sites Web.

Au lieu de cela, vous devez définir des règles pour déterminer à quel moment une page sera incluse dans votre sitemap XML et / ou remplacée par « index, suivez ».

Vous pouvez trouver des instructions détaillées sur la manière exacte de créer un plan de site XML dynamique, mais, encore une fois, cette étape est beaucoup plus facile à l’aide d’un outil qui génère des plans de site dynamiques pour vous.

8. Utilisez des sitemaps XML et des flux RSS / Atom

Les flux RSS / Atom informent les moteurs de recherche lorsque vous mettez à jour une page ou ajoutez du nouveau contenu à votre site Web.

Google recommande d’utiliser les deux sitemaps et Flux RSS / Atom pour aider les moteurs de recherche à comprendre quelles pages doivent être indexées et mises à jour.

En n’incluant que du contenu récemment mis à jour dans vos flux RSS / Atom, vous faciliterez la recherche de nouveaux contenus pour les moteurs de recherche et les visiteurs.

Publicité

Continuer la lecture ci-dessous

9. Mettre à jour les heures de modification uniquement lorsque vous apportez des modifications substantielles

N’essayez pas de tromper les moteurs de recherche pour qu’ils réindexent les pages en mettant à jour votre heure de modification sans apporter de modifications substantielles à votre page.

Dans le passé, j’ai longuement parlé des dangers potentiels d’un référencement risqué.

Je ne répéterai pas tous mes points ici, mais il suffit de dire que Google peut commencer à supprimer vos horodatages s’ils sont constamment mis à jour sans fournir de nouvelle valeur.

10. N’incluez pas les URL « noindex » dans votre sitemap.

En parlant de budget d’exploration gaspillé, si les robots des moteurs de recherche ne sont pas autorisés à indexer certaines pages, ils n’ont aucune entreprise dans votre plan de site.

Lorsque vous soumettez un plan du site qui comprend des pages bloquées et « noindex », vous dites simultanément à Google « il est vraiment important que vous indexiez cette page » et « vous n’êtes pas autorisé à indexer cette page ».

Le manque de cohérence est une erreur courante.

11. Ne vous inquiétez pas trop des paramètres de priorité

Certains plans Sitemap comportent une colonne «Priorité» qui indique ostensiblement aux moteurs de recherche quelles pages sont les plus importantes.

Publicité

Continuer la lecture ci-dessous

Cependant, si cette fonctionnalité fonctionne réellement, a longtemps été débattue.

En 2017, Gary Illyes de Google tweeté que Googlebot ignore les paramètres de priorité lors de l’exploration.

Comment optimiser les sitemaps XML: 13 meilleures pratiques SEO

12. Ne laissez pas votre sitemap devenir trop volumineux

Plus votre plan de site est petit, moins vous mettez de pression sur votre serveur.

Google et Bing ont tous deux augmenté la taille des fichiers de plan de site acceptés de 10 Mo à 50 Mo et 50 000 URL par plan de site.

Bien que cela soit plus que suffisant pour la plupart des sites, certains webmasters devront diviser leurs pages en deux plans de site ou plus.

Publicité

Continuer la lecture ci-dessous

Par exemple, si vous exploitez une boutique en ligne de 200 000 pages, vous devrez créer cinq plans de site distincts pour gérer tout cela.

Voici les conseils de John Mueller de Google sur la façon d’ajouter des plans de site pour plus de 50 000 URL. TLDR: créez un fichier de plan de site pour les plans de site.

13. Ne créez pas de plan de site si vous n’êtes pas obligé

N’oubliez pas que tous les sites Web n’ont pas besoin d’un plan du site.

Google peut trouver et indexer vos pages assez précisément.

Selon Mueller, le plan du site lui-même n’apporte pas la même valeur SEO à tout le monde.

Fondamentalement, si votre site Web est un portfolio / une page, ou s’il s’agit d’un site Web d’organisation que vous mettez rarement à jour, le plan du site n’est pas vraiment nécessaire.

Cependant, si vous publiez beaucoup de nouveau contenu et que vous souhaitez qu’il soit indexé dès que possible, ou si vous avez des centaines de milliers de pages (exécutant un site Web de commerce électronique, par exemple), un plan de site est toujours un excellent moyen de donner des informations directement. à Google.

Plus de ressources:

Publicité

Continuer la lecture ci-dessous


Crédits d’image

Toutes les captures d’écran prises par l’auteur, octobre 2020



Partager:

Partager sur facebook
Partager sur twitter
Partager sur telegram
Partager sur reddit
Partager sur linkedin
Partager sur pinterest

Articles Similaires