Serait-ce le brevet Navboost ?

Il y a eu beaucoup de spéculations sur ce qu'est Navboost, mais à ma connaissance, personne n'a identifié un brevet adéquat qui pourrait être le brevet original de Navboost. Ce brevet de 2004 s'aligne étroitement sur Navboost. J'ai donc pris les quelques indices dont nous disposons à son sujet et identifié quelques brevets probables. Les indices avec lesquels je travaillais sont que l'ingénieur logiciel de Google, Amit Singhal, a été impliqué dans Navboost et a contribué à son invention. Un autre indice est que Navboost date de 2005. Enfin, les documents judiciaires indiquent que Navboost a été mis à jour plus tard, il peut donc y avoir d'autres brevets à ce sujet, que nous aborderons à un moment donné, mais pas dans cet article. J’en ai donc déduit que si Amit Singhal était l’inventeur, alors il y aurait un brevet portant son nom et il existe effectivement, datant de 2004.

Parmi tous les brevets que j’ai vus, les deux plus intéressants étaient les suivants :

  • Systèmes et procédés pour corréler l'actualité et la popularité des documents 2004
  • Résultats de recherche entrelacés 2007

Cet article traitera du premier, Systèmes et méthodes de corrélation de l'actualité et de la popularité des documents datant de 2004, qui s'aligne sur la chronologie connue de Navboost datant de 2005.

Le brevet ne mentionne pas les clics

Une qualité intéressante de ce brevet est qu'il ne mentionne pas les clics et je soupçonne que les personnes recherchant le brevet Navboost l'ont peut-être ignoré car il ne mentionne pas les clics. Mais le brevet aborde des concepts liés aux interactions des utilisateurs et aux modèles de navigation qui font référence aux clics.

Cas où les clics des utilisateurs sont implicites dans le brevet

Sélection et récupération de documents  :

Le brevet décrit un processus par lequel un utilisateur sélectionne des documents (ce qui peut être déduit qu'il clique dessus) à partir des résultats de recherche. Ces sélections sont utilisées pour déterminer la popularité des documents.

Mappage de documents à des sujets  :

Une fois les documents sélectionnés par les utilisateurs (par le biais de clics), ils sont mappés à un ou plusieurs sujets. Cette cartographie est un élément clé du processus, car elle associe les documents à des domaines d'intérêt ou à des sujets spécifiques.

Modèles de navigation des utilisateurs  :

Le brevet fait fréquemment référence aux modèles de navigation des utilisateurs, qui incluent la manière dont les utilisateurs interagissent avec les documents, tels que les documents sur lesquels ils choisissent de cliquer. Ces modèles sont utilisés pour calculer les scores de popularité des documents. Il est clair que les clics des utilisateurs constituent un élément fondamental de la manière dont le brevet propose d'évaluer la popularité des documents. En analysant les documents avec lesquels les utilisateurs choisissent d'interagir, le système peut attribuer des scores de popularité à ces documents. Ces scores, combinés à la pertinence thématique des documents, sont ensuite utilisés pour améliorer l'exactitude et la pertinence des résultats des moteurs de recherche.

Brevet  : les interactions des utilisateurs sont une mesure de popularité

Le brevet US8595225 fait implicitement référence aux « clics des utilisateurs » dans le contexte de la détermination de la popularité des documents. Bon sang, la popularité est si importante pour le brevet qu'elle figure dans le nom du brevet  : systèmes et méthodes pour corréler l'actualité et la popularité des documents. Les clics des utilisateurs, dans ce contexte, font référence aux interactions des utilisateurs avec divers documents, tels que des pages Web. Ces interactions constituent un élément essentiel dans l’établissement des scores de popularité de ces documents. Le brevet décrit une méthode dans laquelle la popularité d'un document est déduite des modèles de navigation des utilisateurs, qui ne peuvent être que des clics. J'aimerais m'arrêter ici et mentionner que Matt Cutts a expliqué dans une vidéo que la popularité et le PageRank sont deux choses différentes. La popularité dépend de ce que les utilisateurs ont tendance à préférer et le PageRank est une question d'autorité, comme en témoignent les liens.

Matt a défini la popularité  :

« Et donc, dans un certain sens, la popularité est une mesure de la destination des gens, alors que le PageRank est bien plus une mesure de la réputation. » Cette définition datant d'environ 2014 correspond à ce dont parle ce brevet en termes de popularité, à savoir où vont les gens. Voir Matt Cutts explique comment Google sépare la popularité de la véritable autorité

Regardez la vidéo YouTube  : Comment Google sépare-t-il la popularité de l'autorité ?

Comment le brevet utilise les scores de popularité

Le brevet décrit plusieurs façons d’utiliser les scores de popularité.

Attribution de scores de popularité  :

Le brevet discute de l'attribution de scores de popularité aux documents en fonction des interactions des utilisateurs telles que la fréquence des visites ou les modèles de navigation (ligne 1).

Popularité par sujet  :

Il parle de dériver des informations sur la popularité par sujet en corrélant les données de popularité associées à chaque document à des sujets spécifiques (ligne 5).

Scores de popularité dans le classement  :

Le document décrit l'utilisation des scores de popularité pour classer les documents parmi un ou plusieurs sujets associés à chaque document (ligne 13).

Popularité dans la recherche de documents  :

Dans le contexte de la recherche de documents, le brevet décrit l'utilisation des scores de popularité pour classer les documents (ligne 27).

Détermination de la popularité en fonction de la navigation de l'utilisateur  :

Le processus de détermination du score de popularité de chaque document, qui peut impliquer l'utilisation de modèles de navigation des utilisateurs, est également mentionné (ligne 37). Ces exemples démontrent l'accent mis par le brevet sur l'intégration de la popularité des documents, telle que déterminée par l'interaction de l'utilisateur (clics), dans le processus de classement et de corrélation avec des sujets spécifiques. L'approche décrite dans le brevet suggère une méthode plus dynamique et plus adaptée à l'utilisateur pour déterminer la pertinence et l'importance des documents dans les résultats des moteurs de recherche.

Navboost attribue des scores aux documents

Je vais m'arrêter ici pour mentionner également que ce brevet mentionne l'attribution de scores aux documents, c'est ainsi que Eric Lehman, directeur de Google, a décrit dans l'essai le fonctionnement de Navboost  :

Parlant de la situation où il n'y avait pas beaucoup de données de clics, Lehman a témoigné  :

« Et donc je pense que Navboost fait un peu la chose naturelle, c'est-à-dire que, face à ce genre d'incertitude, vous prenez des mesures plus douces. Vous pouvez donc modifier la partition d’un document, mais de manière plus légère que si vous disposiez de plus de données. C'est un autre lien avec Navboost dans la mesure où la description de l'essai et le brevet décrivent l'utilisation de l'interaction utilisateur pour évaluer les pages Web. Plus ce brevet est analysé, plus il ressemble à ce que les documents d'essai décrivaient comme Navboost.

Lisez le brevet ici :

Systèmes et méthodes permettant de corréler l'actualité et la popularité d'un document. Image sélectionnée par Shutterstock/Sabelskaya