Vous êtes-vous déjà demandé comment Google sait par magie ce que vous recherchez, même lorsque votre requête de recherche contient des fautes de frappe? Avec une requête de recherche sur dix mal orthographiée et de nouveaux mots constamment signalés, Google dispose d’un algorithme complet dédié à la navigation dans les fautes d’orthographe.
Comment Google catégorise les erreurs d’orthographe
La première chose que fait l’IA de Google lorsqu’elle rencontre ce qu’elle croit être un mot mal orthographié est de le catégoriser :Erreur de glissement de doigt – Google voit plus de 10 000 variantes d’erreurs de glissement de doigt pour des requêtes telles que « Youtube ». Les utilisateurs savent comment l’épeler, mais peut-être qu’une lettre est incorrecte. Par exemple, au lieu d’appuyer sur le «t» dans «Youtube», vous appuyez sur la lettre à côté.Erreur conceptuelle – Également appelée «orthographe au mieux», c’est lorsqu’un utilisateur ne sait pas comment épeler un mot et le saisit au mieux.
L’approche précédente de Google pour les requêtes de recherche mal orthographiées
Historiquement, Google s’appuyait sur la conception du clavier pour déchiffrer le mot qu’un utilisateur voulait saisir : « Si vous essayez de taper » u « mais que vous faites une erreur, nos systèmes ont appris que vous étiez plus susceptible d’avoir tapé » y « que » z « parce que » y « est adjacent à » u « sur un clavier de langue anglaise standard. » Google commencerait par la lettre la plus proche de celle que vous avez tapée et se frayait un chemin, en utilisant la lettre adjacente, puis celle qui suit jusqu’à ce qu’il trouve une lettre qui Il est intéressant de noter que cette approche a non seulement résolu les erreurs de glissement de doigt, mais a également aidé à résoudre les erreurs conceptuelles.
Comment le Deep Learning a changé l’approche de Google concernant les mots mal orthographiés
Le 15 octobre 2020, Google a introduit un nouvel algorithme qu’il qualifie de : « Une plus grande amélioration de l’orthographe que toutes nos améliorations au cours des cinq dernières années. » Le résultat? À l’époque, il faisait apparaître les résultats qu’un utilisateur recherchait en moins de trois millisecondes.Aujourd’hui, l’algorithme exécute des modèles avec plus de 680 millions de paramètres en moins de deux millisecondes.Plutôt que d’utiliser l’approche clavier précédente, le nouvel algorithme utilise le contexte pour déterminer ce qu’un utilisateur voulait taper.Cette nouvelle approche fonctionne. par :
- Évaluer l’ensemble de la requête, pas seulement le mot incorrect
- Vous recherchez des mots de remplacement qui correspondent à la requête globale
- Fournir les résultats de recherche en fonction du « meilleur ajustement »
Lorsque Google affiche les résultats sur ce qu’il pense que vous voulez dire, une note sera signalée sous la barre de recherche pour vous le faire savoir, ainsi que pour vous donner la possibilité de voir les résultats de la recherche pour la requête d’origine : avez-vous remarqué que parfois lorsque vous effectuez une recherche, une petite note apparaît sous la barre de recherche pour vous demander si vous vouliez dire un terme particulier : Google le fait quand il a une assez bonne idée de ce que vous vouliez dire mais n’est pas sûr à 100%. l’algorithme, car Google utilise ces signaux pour continuer à entraîner l’IA.Ainsi, la prochaine fois que vous faites une faute d’orthographe lors d’une recherche Google, rappelez-vous que l’erreur sert un objectif plus important que d’être simplement ennuyeux.