Google discute des principaux systèmes d'actualité

La dernière recherche of the record de Google a partagé une multitude d’informations sur le fonctionnement réel de la recherche Google. John Mueller et Lizzi Sassman de Google se sont entretenus avec Elizabeth Tucker, directrice de la gestion des produits chez Google, qui a partagé ses idées sur les nombreux systèmes qui fonctionnent ensemble pour classer les pages Web, y compris une mention d’un système d’actualité.

Google et l’actualité

Le mot « actualité » signifie à quel point quelque chose est pertinent dans le moment présent.

Mais lorsqu’il est utilisé dans la recherche, le mot « actualité » consiste à faire correspondre le sujet d’une requête de recherche avec le contenu d’une page Web. Les modèles d’apprentissage automatique jouent un rôle important en aidant Google à comprendre ce que veulent dire les utilisateurs. Un exemple mentionné par Elizabeth Tucker est BERT (Bidirectionnel Encoder Representations from Transformers) qui est un modèle de langage qui aide Google à comprendre un mot dans le contexte des mots qui le précèdent et le suivent (c’est plus, c’est une explication miniature).

Elizabeth explique l’importance de faire correspondre un contenu pertinent à une requête de recherche dans le contexte de la satisfaction des utilisateurs. La Googleuse Lizzi Sassman a posé des questions sur la satisfaction des utilisateurs et Tucker a mentionné qu’il existe de nombreuses dimensions dans la recherche, avec de nombreux systèmes, en utilisant comme exemple l’importance du concept de pertinence thématique. Lizzi a demandé (vers 4 min 20 s) : « En ce qui concerne la satisfaction que vous avez mentionnée, y a-t-il des moyens plus précis que nous envisageons ? Qu’est-ce que cela signifie d’être satisfait lorsque l’on sort d’une recherche ? Elizabeth a répondu : « Absolument, Lizzi.

Dans le cadre de la qualité de la recherche, nous réfléchissons à de nombreuses dimensions importantes de la recherche. Nous avons tellement de systèmes. Nous souhaitons évidemment afficher du contenu pertinent par rapport à votre recherche.

Au début de la recherche Google, cela représentait parfois un défi. Nos systèmes se sont beaucoup améliorés, mais c’est encore parfois, pour des recherches particulièrement difficiles, un problème avec lequel nous pouvons avoir du mal. Les gens effectuent des recherches de nombreuses manières : depuis, bien sûr, la saisie de mots-clés jusqu’à la conversation avec Google et l’utilisation d’un langage de tous les jours.

J’ai vu des recherches étonnantes. « Hey Google, qui est cette personne qui, il y a des années, a fait cette chose, et je ne me souviens plus comment elle s’appelait. » Vous savez, ces longues requêtes très vagues.

Et c’est incroyable maintenant que nous disposons de systèmes capables de répondre à certaines de ces questions. À retenir : Un point important à retenir de cet échange est qu’il existe de nombreux systèmes qui travaillent ensemble, l’actualité n’étant que l’un d’entre eux. De nombreux membres de la communauté du marketing de recherche ont tendance à se concentrer sur l’importance d’une chose comme l’autorité ou l’utilité, mais en réalité, la recherche comporte de nombreuses « dimensions » et il est contre-productif de réduire les facteurs entrant dans la recherche à un, deux ou trois concepts.

Biais dans la recherche

John Mueller de Google a demandé à Elizabeth s’il y avait des biais dans la recherche et si c’était quelque chose à quoi Google pensait. Elle a répondu qu’il y avait de nombreux types de biais que Google surveille et essaie de détecter. Tucker explique les différents types de résultats de recherche qui peuvent être pertinents sur le plan thématique (tels que les résultats persistants et les résultats récents) et explique ensuite comment Google s’efforce d’obtenir correctement un équilibre.

John a demandé (à la minute 05:24) : « Lorsque vous regardez les données, je suppose que des biais apparaissent. Est-ce un sujet auquel nous réfléchissons également ? » Elizabeth a répondu : « Absolument. Il y a toutes sortes de biais qui nous préoccupent lorsque vous recherchez des informations.

Montrons-nous de manière disproportionnée certains types de sites, montrons-nous plus, je ne sais pas, d’encyclopédies et de résultats persistants ou montrons-nous plus de résultats récents avec des informations à jour, montrons-nous les résultats de grands sites institutionnels, montrons-nous les résultats de petits blogs, montrons-nous les résultats de plateformes de médias sociaux où nous avons des voix quotidiennes ? Nous voulons nous assurer que nous disposons d’un mélange approprié qui nous permette de faire ressortir le meilleur du Web sous n’importe quelle forme ou taille, avec des objectifs modestes.

Systèmes d’actualité de base (et bien d’autres)

Elizabeth a ensuite répété qu’elle travaille avec de nombreux types de systèmes de recherche. C’est quelque chose à garder à l’esprit car la communauté de recherche ne connaît que quelques systèmes alors qu’en fait il en existe beaucoup, beaucoup plus.

Cela signifie qu’il est important de ne pas se concentrer sur un, deux ou trois systèmes seulement lorsque l’on essaie de déboguer un problème de classement, mais plutôt de garder l’esprit ouvert quant au fait qu’il pourrait s’agir d’autre chose, pas seulement de l’utilité ou de l’EEAT ou d’autres raisons. John Mueller a demandé si Google Search répond en rétrogradant un site lorsque les utilisateurs se plaignent de certains résultats de recherche. Elle parle de plusieurs choses, notamment du fait que la plupart des systèmes sur lesquels elle travaille n’ont rien à voir avec la rétrogradation de sites.

Je tiens à souligner qu’elle mentionne qu’elle travaille avec de nombreux systèmes et de nombreux signaux (pas seulement la poignée de signaux sur lesquels la communauté du marketing de recherche a tendance à se concentrer). L’un de ces systèmes qu’elle mentionne est le système de topicité de base. Qu’est-ce que cela signifie ? Elle explique qu’il s’agit de faire correspondre le sujet de la requête de recherche.

Elle dit « systèmes de topicité de base », donc cela signifie probablement plusieurs systèmes et algorithmes. John a demandé (à 11:20 minutes) : « Lorsque les gens parlent fort, la première étape consiste-t-elle à procéder à une sorte de rétrogradation en disant : « Eh bien, c’était clairement un mauvais site que nous avons montré, nous devrions donc en montrer moins » ? Ou comment équilibrer le côté positif des choses que nous devrions peut-être montrer davantage par rapport au contenu que nous devrions montrer moins ? » Elizabeth a répondu : « Oui, c’est une excellente question. Je travaille donc sur de nombreux systèmes différents.

C’est une partie amusante de mon travail dans la qualité de la recherche. Nous avons de nombreux signaux, de nombreux systèmes, qui doivent tous fonctionner ensemble pour produire une excellente page de résultats de recherche. Certains systèmes sont par nature démotivants, et le spam Web en est un bon exemple.

Si nous avons un problème avec, par exemple, des sites de téléchargement malveillants, c’est quelque chose que nous voudrions probablement résoudre en essayant de découvrir quels sites se comportent mal et en essayant de nous assurer que les utilisateurs ne rencontrent pas ces sites. Cependant, la plupart des systèmes avec lesquels je travaille essaient en fait de trouver le bon. Un exemple : j’ai travaillé avec certains de nos principaux systèmes de topologie, c’est-à-dire des systèmes qui tentent de faire correspondre le sujet de la requête.

Ce n’est pas si difficile si vous avez une requête par mot-clé, mais le langage est globalement difficile. Nous avons réalisé de formidables avancées dans la compréhension du langage naturel ces dernières années grâce au ML modèles, et nous voulons donc exploiter une grande partie de cette technologie pour vraiment nous assurer que nous comprenons les recherches des gens afin que nous puissions trouver le contenu qui correspond à cela. C’est un problème étonnamment difficile.

Et l’une des choses intéressantes sur lesquelles nous avons découvert en travaillant, ce que nous pourrions appeler l’actualité, un mot un peu ringard, c’est que mieux nous sommes capables de le faire, plus les recherches que les gens feront seront intéressantes et difficiles.

Comment Google se concentre sur les sujets de recherche

Elizabeth revient sur la question de l’actualité, en l’appelant cette fois « l’espace d’actualité » et les efforts déployés par Google pour y parvenir. Elle souligne en particulier le fait que Google était autrefois très concentré sur les mots-clés, ce qui implique clairement qu’ils ne s’y concentrent plus autant, expliquant l’importance de l’actualité.

Elle en parle à la minute 13:16 : « Google était autrefois très axé sur les mots-clés. Si vous associez simplement des mots avec des prépositions, nous risquions de nous tromper. Les prépositions sont très difficiles ou l’étaient pour nos systèmes.

Je veux dire, en y repensant, c’est risible, n’est-ce pas ? Mais, autrefois, les gens tapaient un, deux, trois mots-clés. Lorsque j’ai commencé chez Google, si une recherche comportait plus de quatre mots, nous la considérions comme longue. Je veux dire, de nos jours, je vois régulièrement des recherches longues qui peuvent comporter 10 à 20 mots ou plus.

Lorsque nous avons ces recherches plus longues, comprendre quels mots sont importants devient un défi. Par exemple, cela s’est passé il y a des années, peut-être près de dix ans, mais nous étions confrontés à des recherches qui étaient des questions. Un exemple classique est « Quelle est la taille de Barack Obama ? » Parce que nous voulions des pages qui fourniraient la réponse, pas seulement des mots-clés correspondant à quelle taille, n’est-ce pas ? Et, en fait, lorsque nos extraits en vedette sont apparus pour la première fois, ils ont été motivés par ce genre de problème.

Comment pouvons-nous faire correspondre la réponse, pas seulement des mots-clés correspondant aux mots de la question ? Au fil des ans, nous avons beaucoup travaillé dans ce que nous pourrions appeler l’espace de l’actualité. C’est un espace dans lequel nous continuons à travailler encore aujourd’hui.

L’importance des sujets et de l’actualité

Il y a beaucoup de choses à comprendre dans la réponse de Tucker, notamment le fait qu’il peut être utile, lorsque l’on réfléchit aux algorithmes de classement de recherche de Google, de prendre également en compte les systèmes d’actualité de base qui aident Google à comprendre les sujets des requêtes de recherche et à les faire correspondre au contenu des pages Web, car ils soulignent l’importance de penser en termes de sujets au lieu de se concentrer sur le classement des mots-clés.

Une erreur courante que je vois est que les personnes qui ont des difficultés avec le classement sont fortement concentrées sur les mots-clés. J’encourage depuis de nombreuses années une approche alternative qui met l’accent sur l’importance de penser en termes de sujets. C’est une façon multidimensionnelle de penser le référencement.

L’optimisation des mots-clés est unidimensionnelle. L’optimisation pour un sujet est multidimensionnelle et correspond à la manière dont la recherche Google classe les pages Web, dans la mesure où l’actualité constitue une partie importante du classement. Écoutez le podcast Search Off The Record à partir de 4 minutes 20 environ, puis avancez rapidement jusqu’à 11 minutes 20 minutes : Image en vedette par Shutterstock/dekazigzag

Tags: