Comment Google classe les pages avec des abréviations

John Mueller de Google a répondu à une question sur la façon dont l’algorithme de Google gère les abréviations. John a répondu à la question en profondeur, expliquant qu’il s’agit essentiellement de synonymes et que Google ne fait rien de particulièrement spécial avec les abréviations.

Comment Google gère-t-il les abréviations ?

La personne qui posait une question voulait savoir comment Google gérait les abréviations telles que « par exemple » qui signifie ergo. Ils ont raconté qu’ils avaient beaucoup de ce genre d’abréviations sur leur site.

John Mueller de Google a répondu  :

« Et la réponse courte est que nous ne faisons rien de spécial avec ce genre de choses. Nous les traitons essentiellement comme des jetons sur une page. Et un jeton est essentiellement un peu comme un mot ou une phrase sur une page. Et nous reconnaîtrions probablement qu’il existe des synonymes connus pour certains d’entre eux et comprendrions cela un peu. Mais nous ne ferions rien de spécifique ici dans la mesure où nous aimerions avoir un glossaire de ce que signifie cette abréviation et gérer cela d’une manière spécifique. C’est donc quelque chose où, surtout en ce qui concerne les synonymes, nos systèmes les apprennent au fil du temps. Et pour la plupart, nous les traitons lorsque les gens effectuent des recherches et non lorsque nous effectuons l’indexation. » John Mueller recommande ensuite de regarder une vidéo de l’ingénieur de recherche Google Paul Haahr s’exprimant lors d’une conférence sur la recherche publiée par Google Search central dans laquelle il explique le fonctionnement de la recherche, dans laquelle Paul discute de l’utilisation de synonymes pour l’expansion des requêtes.

Muller dit :

« Et dans cette vidéo, il passe en revue certains des défis synonymes que nous avons rencontrés dans le passé. Et j’ai trouvé cela super intéressant à regarder et cela vous donne probablement aussi des idées sur la façon dont nous pourrions gérer certains de ces types d’expansions en ce qui concerne les abréviations. Mueller a déclaré que la vidéo datait de décembre 2019 ou 2020 et était publiée sur la chaîne YouTube de Google Search Central. Et il y a bien une vidéo de 2019 qui a été publiée en 2020 dans laquelle Paul Haahr parle de synonymes et d’expansion des requêtes.

Paul aborde le sujet de l’expansion des requêtes et des synonymes à la minute 1 :30  :

Vidéo Google de Paul Haahr discutant des synonymes et de l’extension des requêtes

« Donc, je vais d’abord parler de quelque chose dans l’un de nos systèmes de compréhension des langues, qui est le système des synonymes. »

L’écran derrière Paul affiche le texte suivant  :

    • « Vocabulaire utilisateur ≠ Vocabulaire document

    • Le système essaie de combler l’écart en ajoutant automatiquement des mots alternatifs

    • Similaire à l’utilisation du OU, mais généralement moins important que les termes d’origine

    • L’un des composants les plus importants de la recherche Google »

Paul Haahr explique le but d’utiliser des synonymes :

« Alors, quel est notre système de synonymes ? C’est quelque chose qui est là pour combler le fossé entre le vocabulaire de l’utilisateur et le vocabulaire de la requête – ou le vocabulaire de l’utilisateur et le vocabulaire du document. Autrement dit, lorsque nous voyons une requête, elle est souvent rédigée dans une langue différente de celle des documents utilisés. Et nous essayons de faire correspondre ces choses. La façon dont cela fonctionne réellement est qu’il semble que nous ajoutions un tas de termes avec OR. Qui ici dans le public a utilisé l’opérateur OU ? Et la façon dont notre système de synonymes fonctionne efficacement, nous prenons une requête d’utilisateur et nous y ajoutons beaucoup de termes OR. Et c’est en fait l’un des éléments de classement les plus importants de Google… c’est en quelque sorte… c’est quelque chose que nous avons lancé il y a environ 15 ans et plus, qui s’est beaucoup amélioré au fil des ans.

Plus de vidéos de Paul Haahr discutant des synonymes et de l’extension des requêtes

Il y a une autre vidéo de Paul Haahr parlant à SMX West en 2016 où il parle également de l’expansion des requêtes et cela éclaire également le sujet.

Paul discute de l’extension des requêtes à la minute 6 :35 de la présentation  :

Regardez l’ingénieur Google Paul Haahr discuter des synonymes

Ce n’est pas la vidéo à laquelle John Mueller faisait référence, mais elle contient également des informations intéressantes.

Paul Haahr explique :

«Nous faisons une partie de compréhension de la requête où nous essayons de comprendre ce que signifie la requête, nous effectuons une récupération et une notation… puis nous faisons quelques… ajustements. Donc Query Understanding, la première question est, connaissons-nous des entités nommées dans la requête ? Le San Jose Convention Center, nous savons ce que c’est. Matt Cutts, nous savons ce que c’est. Et donc nous les étiquetons. Et puis, y a-t-il des synonymes utiles ? Est-ce que General Motors dans ce contexte… est-ce que GM veut dire General Motors ? Est-ce que GM veut dire génétiquement modifié ? Et ce que je veux dire, c’est que le contexte compte. Nous examinons l’ensemble de la requête pour le contexte. »

Google et les abréviations

Ce que Mueller semble dire dans sa réponse, c’est que Google considère les abréviations comme des synonymes. Ainsi, lorsque vous réfléchissez à la façon dont Google pourrait comprendre une page de contenu, une abréviation peut être condensée en une signification de base qui pourrait être considérée comme un synonyme.

Citation

Comment Google gère les abréviations

Regardez John Mueller répondre à la question à la minute 48 :43

Tags: