Search

Google Knowledge Graph et son fonctionnement


Les Knowledge Graphs peuvent aider les moteurs de recherche comme Google à exploiter des données structurées sur des sujets.

Les données sémantiques et le balisage, à leur tour, aident à connecter les concepts et les idées, ce qui facilite leur transformation en données structurées pour alimenter le Knowledge Graph de Google.

Les professionnels du référencement doivent comprendre comment influencer les sujets du graphique s’ils veulent modifier de manière significative la compréhension de Google de leur contenu.

Qu’est-ce que le Knowledge Graph de Google?

J’aime penser à un graphe de connaissances comme un croisement entre une encyclopédie et une base de données. Chaque article est appelé une «entité» par les développeurs ou un «sujet» dans les articles destinés aux clients de Google.

Un sujet peut concerner n’importe quoi. Comme la plupart des bases de données, il possède un identifiant unique, que vous pouvez parfois voir dans les URL de Google. Quelque chose comme: [kgmid=/g/11f0vfyswk&hl], bien que le nom du paramètre «kgmid» puisse changer en fonction du type de sujet.

Publicité

Continuer la lecture ci-dessous

Il y a généralement plusieurs déclarations sur le sujet:

  • Un nom ou une étiquette (comme «Elvis Presley»).
  • Un type ou des types (comme «Personne»).
  • Une description (dites «chanteur»).
  • Une liste d’URL d’image (généralement avec les droits d’utilisation associés).
  • Une description détaillée (généralement du texte avec une URL de la source).

Cependant, Google indique également que si les informations de la liste ci-dessus peuvent être disponibles directement dans leur API de recherche, elles augmentent considérablement ces données en interne.

Ainsi, le sujet, dans ce cas, pourrait également inclure la date de naissance et de mort d’Elvis.

On pourrait dire qu’il était marié à Priscilla Presley.

Ses œuvres d’art pourraient inclure «Hound Dog».

La liste pourrait s’allonger encore.

Vous pouvez voir comment ce n’est vraiment pas très différent d’un article d’encyclopédie, mais comme tous les faits se trouvent dans des domaines tels que «Marié à», il devient beaucoup plus facile pour une machine de relier les points entre les sujets.

Il aide également la machine à récupérer les bonnes informations au bon moment lorsqu’une personne le demande (par exemple). «Qui était marié à Elvis Presley?»

Boîte de réponse Google Knowledge GraphUn exemple de Google exploitant son Knowledge Graph

Une note importante sur la désambiguïsation

Il existe de nombreux graphiques de connaissances dans le monde. Le graphe de connaissances Google n’en est qu’un. D’autres incluent dbpedia.com, Wikidata.org et Inlinks.net (divulgation complète: mon entreprise).

Publicité

Continuer la lecture ci-dessous

En effet, toute donnée semi-structurée pourrait être décrite comme un graphe de connaissances, comprenant des encyclopédies ou des bases de données comme IMDB.

Google est connu pour avoir construit son graphique de connaissances initialement à partir d’autres ensembles de données, notamment Wikipedia et le CIA Factbook.

Il existe également une idée fausse répandue selon laquelle le Knowledge Panel de Google est le Knowledge Graph de Google. Ce n’est pas le cas, bien que le panneau Connaissances puisse représenter un sous-ensemble de données dans le graphique.

Le panneau de connaissances est une visualisation d’éléments de données connectés via le Knowledge Graph de Google, mais le graphique de connaissances de Google est un enregistrement moins visuel sur les sujets.

Une dernière clarification se trouve dans la terminologie. Un Knowledge Graph est généralement décrit comme étant composé «d’entités», mais Google a tendance à désigner les entités comme des «sujets» dans sa documentation publique.

Il s’agit d’un mot plus «convivial» à utiliser, mais il peut être plus difficile de savoir quand Google fait spécifiquement référence à des entités. Cet article utilisera les phrases de manière interchangeable.

Types de sujets d’entité

Toute entité reçoit généralement un type de sujet. Ce peut être une personne; Organisation; Événement; Lieu ou pays.

S’il ne s’agit d’aucune de celles-ci, il est généralement simplement étiqueté comme une «chose», bien que les types d’entités puissent continuer à être développés par Google.

L’API de traitement du langage naturel de Google donne des indices suggérant que de nombreux types d’entités sont utilisés, tels que « Oeuvre d’art » et « Biens de consommation ».

Beaucoup d’autres sont répertoriés sur leur page de développement de l’API Knowledge Graph Search, mais Google semble actuellement assez faible pour catégoriser correctement de nombreuses entités.

En outre, les principales recherches menées chaque semaine par mon entreprise indiquent que moins de 20% des entités sont des entités reconnues dans l’algorithme de traitement du langage naturel de Google que celles renvoyées dans leur offre publique.

Types de sujetsÉtiquettes de sujet dans la sortie PNL de Google

Quelques avantages du Knowledge Graph (pour Google)

En organisant les informations mondiales par sujet, plutôt qu’en explorant et en indexant simplement les pages Web et les sites Web, un moteur de recherche peut tirer parti de plusieurs avantages. Il s’agit notamment de l’échelle, de la diversité, de l’intégrité de l’information et de la vitesse.

Publicité

Continuer la lecture ci-dessous

Avantage de mise à l’échelle

Le nombre de pages Web est un sujet très controversé et bien que beaucoup affirment qu’elles sont innombrables, elles se chiffrent certainement à des milliers de milliards et se développent à un rythme énorme chaque jour.

En revanche, le nombre de sujets compris par l’humanité est beaucoup plus petit (peut-être de l’ordre de centaines de milliards) et augmente à un rythme bien moindre.

Cela signifie qu’il y a une duplication excessive de des idées dans le contenu sur le Web.

En stockant les informations sur un sujet de manière semi-structurée, les informations du monde prennent beaucoup moins d’espace et ont beaucoup moins de duplication.

Bénéfice de la diversité des sources de données

Le stockage d’informations sur un sujet permet à Google de citer plusieurs sources de données, plutôt que de toujours renvoyer l’utilisateur vers une seule page Web.

Cela signifie que Google peut rassembler des faits saillants sur un sujet et les afficher à l’écran ou via d’autres supports d’une manière plus appropriée pour l’utilisateur ou la requête de l’utilisateur.

Publicité

Continuer la lecture ci-dessous

En outre, les informations sur un sujet peuvent en théorie provenir d’autres sources au-delà d’Internet.

Avantage d’intégrité de l’information

Alors que le Knowledge Graph de Google peut encore contenir des inexactitudes et des erreurs factuelles et peut être ouvert à la manipulation par des professionnels du référencement ou de mauvais acteurs, l’approche a l’avantage de fournir à Google un «point de vérité unique» – au moins pour les sujets non controversés.

Un nouveau fait sur un sujet peut devoir passer un certain seuil de qualité avant d’être ajouté au Knowledge Graph, mais il est peu probable que ces seuils soient discutés ouvertement par Google.

Du côté négatif, un point de vérité unique peut réduire la diversité des informations et peut être sujet à des biais si les sources de données sous-jacentes sont elles-mêmes biaisées.

Avantages de la recherche d’informations (vitesse)

En organisant les informations par sujet, il devient beaucoup plus rapide de récupérer des informations – à la fois par Google et par l’utilisateur à la recherche d’une aiguille dans une botte de foin.

Comment ça marche: où vous voyez le graphique des connaissances de Google utilisé

Après avoir expliqué en quoi le Knowledge Panel n’est pas le même que le Knowledge Graph lui-même, il reste l’utilisation la plus manifeste du Knowledge Graph pour la plupart des professionnels du référencement.

Publicité

Continuer la lecture ci-dessous

Cependant, pour de nombreux utilisateurs de smartphones Android, l’utilisation la plus répandue du graphique de connaissances est en fait dans la fonction «Découvrir» sur leur écran d’accueil chaque jour.

Google peut utiliser des informations sur votre comportement pour comprendre les sujets importants pour vous et peut faire apparaître des sujets liés en fonction de l’historique des utilisateurs.

Les sujets peuvent également être consultés dans Google Trends.

À partir de là, Google donne également une indication des sujets qui pourraient être étroitement liés les uns aux autres, bien qu’il semble que ces données soient actuellement glanées en tirant d’autres recherches par les mêmes utilisateurs, ce qui peut parfois conduire à des listes de sujets connexes plutôt inattendues.

Rubriques connexesLes sujets associés dans Google Trends ne sont pas basés sur la sémantique

Google fournit également une API Knowledge Graph Search, comme indiqué ci-dessus, et fait apparaître les entités dans la sortie de son API NLP.

Publicité

Continuer la lecture ci-dessous

Recherche Google: En plus du panneau de connaissances, lorsque vous tapez une question dans la recherche Google à laquelle il peut répondre à l’aide du graphique de connaissances, vous obtenez également un affichage riche dans le SERPS. Cela se fait souvent au détriment des résultats de recherche de base, en poussant les liens vers des sites Web bien en dessous du pli.

Ces réponses sont également alors dans un format que Google peut utiliser dans la recherche vocale. La capture d’écran Priscilla en est un exemple:

Thèmes d'imageImages regroupées par une rubrique Knowledge Graph

Les entités sont également très visibles dans la recherche d’images, regroupant souvent des images autour d’une personne ou d’un lieu en particulier.

Publicité

Continuer la lecture ci-dessous

C’est un excellent exemple de la façon dont le Knowledge Graph peut être utilisé pour servir de référentiel pour d’autres sources de données que les pages Web.

Davantage de ressources:


Crédits d’image

Toutes les captures d’écran prises par l’auteur, mars 2021

Auteur/autrice

Partager:

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Articles Similaires