Search

Comment éviter l'erreur de corrélation pour la causalité dans le référencement


De temps en temps, la communauté SEO éclatera dans un tollé lors de la publication d’une nouvelle étude des facteurs de classement.

Le cri habituel – «la corrélation n’est pas la même chose que la causalité!»

Vous connaissez peut-être les termes.

La corrélation est la «relation mutuelle de deux choses ou plus» et la causalité est «l’action de causer ou de produire».

Essentiellement, est-ce que quelque chose est vraiment la cause d’un résultat, ou est-ce que cela change simplement en fonction du résultat?

Pour le dire clairement, voici un exemple inhabituel de corrélation.

Tyler Vigen - Mozzarella consommation graphique des doctorats en génie civil

Selon les données recueillies par Tylervigen.com auprès du département américain de l’Agriculture et de la National Science Foundation, il existe une corrélation directe entre le nombre de doctorats en génie civil décernés aux États-Unis et la consommation par personne de fromage mozzarella.

Publicité

Continuer la lecture ci-dessous

C’est vrai.

Vous voulez plus d’ingénieurs civils pour obtenir leur diplôme aux États-Unis?

Vous feriez mieux de commencer à manger plus de fromage.

Nous pouvons tous identifier rapidement qu’il s’agit probablement d’une coïncidence plutôt que d’un lien de causalité.

C’est un bon exemple de corrélation qui n’est pas la même chose que la causalité.

Pourquoi la corrélation et la causalité sont-elles un problème dans le référencement?

Une grande partie de l’activité de référencement est basée sur des essais et des erreurs, l’expérience et les déclarations des représentants des moteurs de recherche.

Pour cette raison, il y a souvent des affirmations telles que « l’activité SEO X a un effet positif sur le classement de votre page Web. »

Par exemple: « les liens provenant de sites Web faisant autorité amélioreront le classement SERP de votre site Web. »

Parfois, ceux-ci seront exacts – l’activité déclarée sera ce qui a provoqué l’augmentation du classement.

D’autres fois, c’est purement fortuit.

Le problème avec cela est qu’il peut y avoir beaucoup de temps et d’argent investis dans la réalisation d’activités de référencement qui ne seront jamais rentables.

Par exemple, que se passerait-il s’il y avait une étude SEO suggérant que le nombre de JPEG sur une page était un facteur de classement.

Publicité

Continuer la lecture ci-dessous

Cette étude hypothétique suggère que plus il y a de JPEG, plus vous êtes susceptible de vous classer dans Google.

Cela pourrait amener les professionnels du référencement à commencer à ajouter des images à leurs pages, qu’ils en bénéficient ou non à l’utilisateur final.

Et payer pour des photographies ou un service d’image haut de gamme pourrait être coûteux.

Non, mentionner le temps nécessaire pour télécharger les images sur chaque page peut également être coûteux.

Comment éviter l’erreur de corrélation pour la causalité

Comment alors décidez-vous si Y est affecté par X, ou si les changements sont de simples coïncidences?

Considérez la réclamation

Tout d’abord, considérez ce qui est revendiqué.

Parfois, une vérification de bon sens de ce qui est discuté suffit pour déterminer si la corrélation est une coïncidence.

Les deux questions suivantes peuvent contribuer grandement à résoudre ce problème:

  • Comment les moteurs de recherche pourraient-ils mesurer cela?
  • En quoi cela profiterait-il à l’utilisateur final et donc aux moteurs de recherche?

Ce n’est pas une liste exhaustive.

Les cyniques pourraient se demander: « cela bénéficierait-il financièrement au moteur de recherche? »

Ou vous vous demandez peut-être, « serait-ce le cas pour mon secteur? »

Il se peut qu’un facteur de classement supposé n’ait pas de sens pour l’industrie dans laquelle vous vous trouvez.

Par exemple, les pages «votre argent ou votre vie» (YMYL), les sites de commerce électronique ou de divertissement peuvent avoir été soumis à des pondérations différentes pour différents facteurs de classement.

Que dit votre expérience?

Avez-vous expérimenté des résultats de référencement d’une manière qui sonne juste avec la déclaration de causalité faite?

Votre expérience est aussi valable que celle des autres.

Si vous avez constaté le contraire – par exemple, la suppression des fichiers JPEG inutiles d’une page a entraîné une augmentation du classement de votre page – alors c’est une raison suffisante pour approfondir la demande.

Identifier d’autres facteurs

Avec l’exemple donné ci-dessus, il peut y avoir d’autres raisons pour lesquelles l’ajout de JPEG à une page est en corrélation avec une augmentation du classement SERP pour une page.

Publicité

Continuer la lecture ci-dessous

Par exemple, peut-être que les images incluaient des attributs alt et c’était en fait ce qui faisait la différence dans le classement.

Les images faisaient peut-être partie de la refonte d’une page et d’autres éléments comme une copie unique ont également été introduits en même temps.

Il est également difficile avec les études menées par des tiers de connaître la véritable méthodologie.

Peut-être y avait-il d’autres variables en jeu que les chercheurs n’ont pas prises en compte.

Cela seul pourrait remettre en question la validité de l’expérience.

Quelle est la taille de l’échantillon?

Lors de l’exécution d’expériences statistiques, un chercheur recherchera des résultats qui ont atteint une signification statistique.

Autrement dit, une assurance que la relation entre X et Y ne s’est pas produite par hasard.

Afin d’atteindre un niveau fiable de signification statistique, la taille de votre échantillon doit être suffisamment grande.

Si la taille de votre échantillon n’est pas assez grande, votre expérience peut être sujette à une erreur d’échantillonnage.

Une corrélation peut émerger qui ne serait tout simplement pas là dans un échantillon de plus grande taille.

Publicité

Continuer la lecture ci-dessous

Dans notre exemple, que se passerait-il si seuls trois sites Web étaient utilisés dans le cadre de l’étude sur la façon dont les JPEG affectent les classements.

Si deux d’entre eux avaient vu leur classement augmenter lors de l’ajout de JPEG à une page et que l’un d’eux ne l’avait pas fait, vous pourriez en conclure que les JPEG ont un effet positif sur le classement.

Cependant, que se passerait-il si vous ajoutiez sept autres sites Web à votre étude et que chacun de ceux-ci n’indiquait pas d’augmentation du classement lorsque des fichiers JPEG étaient ajoutés à la page.

Cela porterait le résultat à deux qui montraient des augmentations de rang et à huit qui ne le faisaient pas.

Qu’arriverait-il aux résultats avec 10 autres sites Web?

Trois est tout simplement une taille d’échantillon trop petite pour faire des déclarations sur tous les sites Web de l’index des moteurs de recherche.

Dans quelle mesure l’échantillon est-il varié?

De même, si votre échantillon n’est pas une représentation suffisamment diversifiée de l’ensemble de données, vous risquez des erreurs d’échantillonnage.

Par exemple, que se passerait-il si les sites Web choisis pour notre étude hypothétique étaient tous des sites de commerce électronique.

Publicité

Continuer la lecture ci-dessous

Serait-ce une expérience suffisamment fiable pour appliquer ces résultats à des sites d’information uniquement?

Pourraient-ils être appliqués aux sites YMYL?

Et si les sites Web échantillonnés étaient tous construits sur WordPress?

Serait-ce une conclusion juste de supposer que les sites Web fonctionnant sur Magento se classeraient de la même manière?

Une mise en garde sur les études menées par des tiers

Il est très facile de voir des études partagées autour de Twitter et LinkedIn et de supposer que l’étude est approfondie.

De même, écouter un orateur partager son étude de cas lors d’une conférence peut inspirer l’assurance que ses conclusions sont valables.

Vous ne pouvez cependant pas en être sûr.

Une étude tierce peut avoir des failles expérimentales.

Une étude de cas est un échantillon trop petit.

Conclusion

Chaque fois que vous entendez une réclamation sur ce qui est ou non important dans le référencement et que des données sont utilisées pour le sauvegarder, assurez-vous de vous ramener aux expériences scientifiques de votre école.

Un échantillon suffisamment grand a-t-il été utilisé?

Publicité

Continuer la lecture ci-dessous

Toutes les variables ont-elles été prises en compte et contrôlées?

Obtiendriez-vous une note «A» pour cette étude?

En cas de doute, assurez-vous de ne pas considérer les conclusions comme des faits.

Au lieu de cela, continuez à expérimenter par vous-même.

Surveillez l’effet de toutes les modifications que vous apportez à vos sites pour voir si elles produisent le résultat escompté.

Plus de ressources:


Crédits d’image

Capture d’écran prise par l’auteur, octobre 2020



Auteur/autrice

Partager:

Articles Similaires