Search

Pourquoi les fautes d’orthographe dans les recherches Google sont en fait une bonne chose


Vous êtes-vous déjà demandé comment Google sait par magie ce que vous recherchez, même lorsque votre requête de recherche contient des fautes de frappe?

Avec une requête de recherche sur dix mal orthographiée et de nouveaux mots constamment signalés, Google dispose d’un algorithme complet dédié à la navigation dans les fautes d’orthographe.

Comment Google catégorise les erreurs d’orthographe

La première chose que fait l’IA de Google lorsqu’elle rencontre ce qu’elle croit être un mot mal orthographié est de le catégoriser:

Erreur de glissement de doigt – Google voit plus de 10 000 variantes d’erreurs de glissement de doigt pour des requêtes telles que «Youtube». Les utilisateurs savent comment l’épeler, mais peut-être qu’une lettre est incorrecte. Par exemple, au lieu d’appuyer sur le «t» dans «Youtube», vous appuyez sur la lettre à côté.

Erreur conceptuelle – Également connu sous le nom d’orthographe au mieux, c’est quand un utilisateur ne sait pas comment épeler un mot et tape dans sa meilleure estimation.

L’approche précédente de Google pour les requêtes de recherche mal orthographiées

Historiquement, Google s’appuyait sur la conception du clavier pour déchiffrer le mot qu’un utilisateur voulait saisir:

« Si vous avez essayé de taper » u « mais que vous avez fait une erreur, nos systèmes ont appris que vous étiez plus susceptible d’avoir tapé » y « que » z « car » y « est adjacent à » u « sur un clavier anglais standard. »

Google commencerait par la lettre la plus proche de celle que vous avez tapée et se frayait un chemin, en utilisant la lettre adjacente, puis celle qui suivait jusqu’à ce qu’il trouve une lettre qui lui convienne.

Fait intéressant, cette approche a non seulement résolu les erreurs de glissement de doigt, mais a également aidé à résoudre les erreurs conceptuelles.

Publicité

Continuer la lecture ci-dessous

Comment le Deep Learning a changé l’approche de Google vis-à-vis des mots mal orthographiés

Le 15 octobre 2020, Google a introduit un nouvel algorithme qu’il appelle:

«Une plus grande amélioration de l’orthographe que toutes nos améliorations au cours des cinq dernières années.»

Le résultat?

À l’époque, les résultats recherchés par un utilisateur faisaient surface en moins de trois millisecondes.

Aujourd’hui?

L’algorithme exécute des modèles avec plus de 680 millions de paramètres en moins de deux millisecondes.

Plutôt que d’utiliser l’approche clavier précédente, le nouvel algorithme utilise le contexte pour déterminer ce qu’un utilisateur voulait taper.

Cette nouvelle approche fonctionne par:

  1. Évaluer l’ensemble de la requête, pas seulement le mot incorrect.
  2. Vous recherchez des mots de remplacement qui correspondent à la requête globale.
  3. Fournir les résultats de la recherche en fonction du «meilleur ajustement».

Publicité

Continuer la lecture ci-dessous

Lorsque Google affiche les résultats sur ce qu’il pense que vous voulez dire, une note sera signalée sous la barre de recherche pour vous le faire savoir, ainsi que pour vous donner la possibilité de voir les résultats de la recherche pour la requête d’origine:

Erreur d'orthographe dans le journal des moteurs de recherche

Avez-vous remarqué que parfois lorsque vous effectuez une recherche, une petite note apparaît sous la barre de recherche vous demandant si vous vouliez dire un terme particulier:

Erreur d'orthographe SEO

Google fait cela quand il a une assez bonne idée de ce que vous vouliez dire mais n’est pas sûr à 100%.

Publicité

Continuer la lecture ci-dessous

La façon dont vous répondez à ces notes a un impact direct sur l’algorithme, car Google utilise ces signaux pour continuer à entraîner l’IA.

Ainsi, la prochaine fois que vous faites une faute d’orthographe lors d’une recherche sur Google, rappelez-vous que l’erreur sert un objectif plus important que d’être simplement ennuyeux.

Auteur/autrice

Partager:

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Articles Similaires