Suivi des mises à jour et de la volatilité de l’algorithme Google Knowledge Graph


À l’instar de l’algorithme de base, le Knowledge Graph de Google est régulièrement mis à jour.

Mais on sait peu de choses sur comment, quand et ce que cela signifie – jusqu’à présent.

Je pense que ces mises à jour se composent de trois choses:

  1. Ajustements d’algorithme.
  2. Une injection de données de formation organisées.
  3. Une actualisation de l’ensemble de données de Knowledge Graph.

Mon entreprise, Kalicube, suit le Knowledge Graph de Google à la fois via l’API et via des panneaux de connaissances depuis plusieurs années.

Quand j’ai écrit à propos de The Budapest Update ‘en 2019, par exemple, j’avais constaté une augmentation massive des scores de confiance. Rien d’aussi sismique sur les partitions ne s’est produit depuis.

Publicité

Continuer la lecture ci-dessous

Cependant, les scores des entités individuelles fluctuent beaucoup et généralement plus de 75% changeront au cours d’un mois donné.

Les exceptions sont décembre 2019 et au cours des quatre derniers mois (j’y reviendrai plus tard).

De juillet 2019 à juin 2020, nous effectuions un suivi mensuel (d’où les chiffres mensuels).

Volatilité du Knowledge Graph de Google par mois

Depuis juillet 2020, nous effectuons un suivi quotidien pour voir si nous pouvons repérer des modèles plus granulaires. Je n’en avais pas vu jusqu’à ce qu’une conversation avec Andrea Volpini de Wordlift m’envoie dans un terrier de lapin…

Publicité

Continuer la lecture ci-dessous

Et là, j’ai découvert des idées vraiment étonnantes.

Noter: Cet article concerne spécifiquement les résultats renvoyés par l’API et les informations qu’ils nous donnent lorsque Google met à jour son Knowledge Graph – y compris la taille, la nature et le jour de la mise à jour – ce qui change la donne si vous me le demandez.

Mises à jour majeures du Knowledge Graph au cours des 8 derniers mois

  • Dimanche 12 juillet 2020.
  • Lundi 13 juillet 2020.
  • Mercredi 12 août 2020.
  • Samedi 22 août 2020.
  • Mercredi 9 septembre 2020.
  • Samedi 19 septembre 2020.
  • Dimanche 11 octobre 2020.
  • Jeudi 11 février 2021.
  • Jeudi 25 février 2021.

Mises à jour du Knowledge Graph

Vous pouvez consulter les mises à jour sur le Knowledge Graph Sensor de Kalicube ici (mis à jour quotidiennement).

Pour tous ceux qui suivent les mises à jour de l’algorithme du lien bleu principal, vous remarquerez peut-être que les deux ne sont pas synchronisés, jusqu’aux mises à jour de février 2021.

Les exceptions que j’ai trouvées sont (avec ma théorie sauvage en italique):

  1. Le 11 octobre mise à jour qui est inconfortablement proche du bug d’indexation du 12 octobre 2020, rapporté par Moz.
    Se pourrait-il que l’interruption de 3 mois dans les mises à jour de Knowledge Graph soit simplement que, au cours de ces mois, Google a fusionné les deux ensembles de données et que Knowledge Graph ait pris une pause de 3 mois pendant qu’ils travaillaient sur les problèmes de ce mouvement massif?
  2. Le 11 février mise à jour qui s’est produite juste un jour après le passage à l’indexation de passage (10 février 2021).
    L’indexation basée sur les passages pourrait-elle signifier une indexation basée sur les entités? L’indexation basée sur les passages consiste à segmenter les pages pour mieux extraire les entités.
  3. Le 25 février La mise à jour coïncide avec la volatilité des SERP Google largement rapportée les 25 et 26 février 2021.
    Cela pourrait-il être un signe que l’algorithme de base et le graphe de connaissances sont désormais synchronisés et que les résultats basés sur les entités sont désormais une réalité?

Portée, portée et échelle de ces mises à jour

Nous pouvons utilement considérer trois aspects d’une mise à jour:

  1. Le ordre de grandeur (portée / largeur), qui est le pourcentage d’entités affectées (jusqu’à présent, entre 60 et 80%).
  2. Le amplitude (portée / hauteur), ou le changement (à la hausse ou à la baisse) des scores de confiance au niveau micro, par niveau d’entité (l’amplitude moyenne pour la cinquantaine médiane a été d’environ 10 à 15%).
  3. Le décalage (échelle / profondeur), qui est la variation des scores de confiance au niveau macro (mise à part la mise à jour de Budapest, c’est moins de 0,1%).

Ce que nous avons trouvé en suivant quotidiennement le Knowledge Graph

Le Knowledge Graph a des mises à jour très régulières.

Publicité

Continuer la lecture ci-dessous

Ces mises à jour se produisent toutes les 2 à 3 semaines, mais parfois avec de longues pauses, comme vous pouvez le voir ci-dessus.

Les mises à jour sont violentes et soudaines.

Nous constatons que 60 à 80% des entités sont affectées, et les changements sont probablement immédiats sur l’ensemble de l’ensemble de données.

Les mises à jour des entités individuelles se poursuivent entre les deux.

Toute entité individuelle peut voir son score de confiance augmenter ou diminuer n’importe quel jour, qu’il y ait une mise à jour ou non. Il peut disparaître (dans une bouffée de fumée virtuelle) et les informations sur cette entité peuvent changer à tout moment entre ces mises à jour majeures de l’algorithme Knowledge Graph et des données.

Il y a des cas extrêmes extrêmes.

Les entités individuelles réagissent très différemment. Dans chaque mise à jour (et même entre les deux), certains changements sont extrêmes. Un score de confiance peut multiplier par plusieurs en une journée. Il peut tomber plusieurs fois. Et une entité peut disparaître complètement (lorsqu’elle réapparaît, elle a un nouvel identifiant).

Il y a un plafond.

Le score de confiance moyen pour l’ensemble de données change rarement de plus d’un dixième de un pour cent par jour (le quart de travail), même les jours où une mise à jour majeure se produit.

Publicité

Continuer la lecture ci-dessous

Il semble qu’il puisse y avoir un plafond aux scores que le système peut attribuer, probablement pour empêcher les entités les plus dominantes d’évincer complètement le reste (merci Jono Alderson pour cette suggestion).

Suite à l’augmentation massive de ce plafond lors de la mise à jour de Budapest, le plafond semble n’avoir pas bougé de manière significative depuis.

Chaque mise à jour depuis Budapest affecte à la fois la portée et la portée. Aucun depuis Budapest n’a déclenché un changement d’échelle majeur.

Le plafond ne changera peut-être plus jamais. Mais alors c’est possible. Et si c’est le cas, ce sera gros. Alors restez à l’écoute (et idéalement, soyez prêt).

Après de nombreuses expérimentations, nous avons isolé et exclu ces valeurs extrêmes.

Nous les suivons et continuons à essayer de voir tout schéma évident. Mais c’est une histoire pour un autre jour.

Comment nous mesurons

Nous avons isolé chacun des trois aspects des changements et les mesurons quotidiennement sur un ensemble de données de 3000 entités. Nous mesurons:

Publicité

Continuer la lecture ci-dessous

  1. Combien d’entités ont vu une augmentation ou une diminution (portée / largeur / ampleur).
  2. Quelle était l’importance de ce changement au niveau micro (portée / hauteur / amplitude).
  3. Quelle est l’importance du changement par rapport au score global (échelle / profondeur / décalage).

Qu’est-ce qui se passe?

Une chose est claire: ces mises à jour ont été violentes, de grande envergure et soudaines.

Quelqu’un chez Google avait (et a peut-être encore) «un gros bouton rouge».

Bill Slawski m’a mentionné un brevet Bing qui mentionne exactement ce processus.

Les deux dernières mises à jour le jeudi reflètent le mantra des développeurs « ne changez rien le vendredi si vous ne voulez pas travailler le week-end. »

Une danse Google Knowledge Graph

Slawski m’a suggéré un concept qui, à mon avis, en dit long. Google a joué des «chaises musicales» avec les données – les algorithmes de base et l’algorithme Knowledge Graph ont des besoins très différents.

  1. Les algorithmes de base reposent fondamentalement sur la popularité (la probabilité que les liens entrants mènent à votre site), alors que le Knowledge Graph doit nécessairement mettre cette popularité / probabilité de côté et examiner la fiabilité / la véracité probable / l’autorité – en d’autres termes, la confiance.
  2. Les algorithmes de base se concentrent sur des chaînes de caractères / mots, alors que le Knowledge Graph repose sur la compréhension des entités que ces mêmes mots représentent.

Publicité

Continuer la lecture ci-dessous

Il est possible que les mises à jour des algorithmes de base et de Knowledge Graph soient nécessairement désynchronisées, puisque Google devait «réorganiser» les données pour chaque approche à chaque fois qu’ils voulaient mettre à jour l’un ou l’autre, puis revenir en arrière.

Vous vous souvenez de la Google Dance à l’époque?

À l’époque, il s’agissait simplement d’un téléchargement par lots de données de lien fraîches. Cela aurait pu être quelque chose de similaire.

En février 2021, la danse est-elle terminée?

Il reste à voir si c’est maintenant un «problème résolu».

J’imagine que nous verrons encore quelques danses désynchronisées et quelques bugs plus étranges en raison de mises à jour de chacune qui se contredisent.

Mais que d’ici la fin de 2021, les deux seront fusionnés à toutes fins utiles et la recherche basée sur les entités sera une réalité que nous, en tant que spécialistes du marketing, pouvons exploiter de manière productive et mesurable.

Quelle que soit la manière dont les algorithmes évoluent et progressent, le changement sous-jacent est sismique.

Classer le corpus de données que Google possède en entités et organiser ces informations en fonction de la confiance dans sa compréhension de ces entités est un énorme changer d’organiser ces mêmes données par pure pertinence (comme cela a été le cas jusqu’à présent).

Publicité

Continuer la lecture ci-dessous

La convergence des algorithmes?

Opinion: Les choses suivantes me font penser que l’hiver 2020/2021 a été le moment où Google a vraiment mis en œuvre le passage «de la chaîne aux choses» (après cinq ans de relations publiques):

  • La pause de trois mois d’octobre à février lorsque l’algorithme de base était relativement actif, mais que les mises à jour de Knowledge Graph étaient très clairement suspendues.
  • L’annonce de l’activation de la couche thématique en novembre.
  • L’introduction de l’indexation basée sur les passages dans l’algorithme de base en février qui semble se concentrer sur l’extraction d’entités.
  • L’apparente convergence des mises à jour (c’est frais; nous n’avons que deux mises à jour à juger, et notre suivi pourrait me prouver plus tard que j’ai tort sur celle-ci, bien sûr).

Le graphe des connaissances est une chose vivante

Le Knowledge Graph semble être basé sur une approche data-lake plutôt que sur l’approche data-river de l’algorithme de base actuel (réaction retardée versus effet immédiat).

Cependant, le fait que les entités changent et se déplacent entre ces mises à jour majeures et le fait que les mises à jour semblent converger suggère que nous ne sommes pas loin d’un algorithme Knowledge Graph qui non seulement fonctionne sur des rivières de données fraîches, mais est également intégré dans le cadre et parcelle de l’algorithme de base.

Voici un exemple spécifique qui mappe les mises à jour aux changements du score de confiance pour mon nom (une de mes expériences).

Publicité

Continuer la lecture ci-dessous

Cette baisse vertigineuse ne correspond pas à une mise à jour.

C’était une erreur de ma part et cela montre que les mises à jour des entités individuelles sont en cours et peuvent être extrêmes!

Lisez à propos de cette catastrophe particulière ici dans ma contribution à un article de SE Ranking.

Score de l'API Knowledge Graph

L’avenir

Mon avis: le «gros bouton rouge» sera progressivement retiré et les mises à jour violentes et soudaines seront remplacées par des changements et des décalages plus fluides et moins visibles.

Publicité

Continuer la lecture ci-dessous

L’intégration d’entités dans les algorithmes de liens bleus de base sera de plus en plus incrémentale et impossible à suivre (alors profitons-en autant que possible).

Il est clair que Google évolue rapidement vers une compréhension quasi humaine du monde et tous ses algorithmes s’appuieront de plus en plus sur sa compréhension des entités et sa confiance dans sa compréhension.

Le monde du référencement devra vraiment embrasser les entités et se concentrer de plus en plus sur l’éducation de Google via son Knowledge Graph.

Conclusion

Dans cet article, je me suis volontairement attaché à des choses dont je suis assez convaincu qu’elles se révéleront vraies.

J’ai des centaines d’idées, de théories et de plans, et mon entreprise continue de suivre plus de 70 000 entités sur une base mensuelle – plus de 3 000 par jour.

Je dirige également plus de 500 expériences actives sur le Knowledge Graph et les panneaux de connaissances (y compris sur moi-même, le chien bleu et le koala jaune), alors attendez-vous à plus de nouvelles bientôt.

En attendant, j’espère juste que Google ne me coupera pas l’accès à l’API Knowledge Graph!

Publicité

Continuer la lecture ci-dessous

Plus de ressources:


Crédits d’image

Toutes les captures d’écran prises par l’auteur, mars 2021

Partager:

Partager sur facebook
Partager sur twitter
Partager sur telegram
Partager sur reddit
Partager sur linkedin
Partager sur pinterest

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Articles Similaires

Investir dans Air Liquide

Air Liquide est un groupe français spécialisé dans la production du gaz. La fourniture de technologies est également une de ses principales activités. A travers