Will Douglas Heaven travaille au MIT Technology Review; MIT Technology Review est une société de médias; etc. Chacun de ces factoids se joint à des milliards d’autres dans un vaste réseau de faits interconnectés. C’est ce qu’on appelle un graphe de connaissances. Les graphiques de connaissances ne sont pas nouveaux. Ils existent depuis des décennies et étaient un concept fondamental dans les premières recherches sur l’IA. Mais la construction et la maintenance des graphiques de connaissances ont généralement été faites à la main, ce qui est difficile. Cela a également empêché Tim Berners-Lee de réaliser ce qu’il a appelé le Web sémantique, qui aurait inclus des informations pour les machines ainsi que pour les humains, afin que les robots puissent réserver nos vols, faire nos achats ou donner des réponses plus intelligentes aux questions que les moteurs de recherche. Il y a quelques années, Google a également commencé à utiliser des graphiques de connaissances. Recherchez «Katy Perry» et vous obtiendrez une boîte à côté des principaux résultats de recherche vous indiquant que Katy Perry est un auteur-compositeur-interprète américain avec de la musique disponible sur YouTube, Spotify et Deezer. Vous pouvez voir en un coup d’œil qu’elle est mariée à Orlando Bloom, elle a 35 ans et vaut 125 millions de dollars, et ainsi de suite. Au lieu de vous donner une liste de liens vers des pages sur Katy Perry, Google vous donne un ensemble de faits sur elle tirés de son graphique de connaissances. Mais Google ne le fait que pour ses termes de recherche les plus populaires. Diffbot veut le faire pour tout. En automatisant entièrement le processus de construction, Diffbot a pu créer ce qui pourrait être le plus grand graphe de connaissances jamais réalisé. Aux côtés de Google et Microsoft, c’est l’une des trois seules entreprises américaines à explorer l’ensemble du Web public. «Il est tout à fait logique d’explorer le Web», déclare Victoria Lin, chercheuse scientifique chez Salesforce qui travaille sur le traitement du langage naturel et la représentation des connaissances. «Autrement, beaucoup d’efforts humains peuvent servir à constituer une vaste base de connaissances.» Heiko Paulheim de l’Université de Mannheim en Allemagne est d’accord : «L’automatisation est le seul moyen de créer des graphiques de connaissances à grande échelle.»
Super surfeur
Pour recueillir ses informations, l’IA de Diffbot lit le Web comme le ferait un humain, mais beaucoup plus rapidement. À l’aide d’une version ultra-chargée du navigateur Chrome, l’IA affiche les pixels bruts d’une page Web et utilise des algorithmes de reconnaissance d’image pour classer la page dans l’un des 20 types différents, y compris la vidéo, l’image, l’article, l’événement et le fil de discussion.. Il identifie ensuite les éléments clés de la page, tels que le titre, l’auteur, la description du produit ou le prix, et utilise la PNL pour extraire des faits de n’importe quel texte. Chaque factoïde en trois parties est ajouté au graphe de connaissances. Diffbot extrait des faits de pages écrites dans n’importe quelle langue, ce qui signifie qu’il peut répondre aux questions sur Katy Perry, par exemple, en utilisant des faits tirés d’articles en chinois ou en arabe, même s’ils ne contiennent pas le terme «Katy Perry». Naviguer sur le Web comme un humain permet à l’IA de voir les mêmes faits que nous. Cela signifie également qu’il a dû apprendre à naviguer sur le Web comme nous. L’IA doit faire défiler vers le bas, basculer entre les onglets et cliquer sur les fenêtres contextuelles. «L’IA doit jouer sur le Web comme un jeu vidéo pour découvrir les pages», explique Tung. Diffbot explore le Web en continu et reconstruit son graphique de connaissances tous les quatre à cinq jours. Selon Tung, l’IA ajoute de 100 à 150 millions d’entités chaque mois à mesure que de nouvelles personnes apparaissent en ligne, des entreprises sont créées et des produits sont lancés. Il utilise davantage d’algorithmes d’apprentissage automatique pour fusionner les nouveaux faits avec les anciens, créer de nouvelles connexions ou écraser les anciennes. Diffbot doit ajouter un nouveau matériel à son centre de données au fur et à mesure que le graphique de connaissances se développe. Les chercheurs peuvent accéder gratuitement au graphique des connaissances de Diffbot. Mais Diffbot compte également environ 400 clients payants. Le moteur de recherche DuckDuckGo l’utilise pour générer ses propres boîtes de type Google. Snapchat l’utilise pour extraire les faits saillants des pages d’actualités. L’application populaire de planification de mariage Zola l’utilise pour aider les gens à faire des listes de mariage, en tirant des images et des prix. Le NASDAQ, qui fournit des informations sur le marché boursier, l’utilise pour la recherche financière.
Faux chaussures
Adidas et Nike l’utilisent même pour rechercher sur le Web des chaussures contrefaites. Un moteur de recherche renverra une longue liste de sites mentionnant les baskets Nike. Mais Diffbot permet à ces entreprises de rechercher des sites qui vendent réellement leurs chaussures, plutôt que d’en parler. Pour l’instant, ces entreprises doivent interagir avec Diffbot à l’aide de code. Mais Tung prévoit d’ajouter une interface en langage naturel. En fin de compte, il veut construire ce qu’il appelle un «système de réponse aux questions factoïdes universel» : une IA qui pourrait répondre à presque tout ce que vous lui avez demandé, avec des sources pour étayer sa réponse. Tung et Lin conviennent que ce type d’IA ne peut pas être construit uniquement avec des modèles de langage. Mais mieux encore serait de combiner les technologies, en utilisant un modèle de langage comme GPT-3 pour créer un front-end de type humain pour un bot qui sait tout. Pourtant, même une IA qui a les faits justes n’est pas nécessairement intelligente. « Nous n’essayons pas de définir ce qu’est l’intelligence, ou quoi que ce soit de ce genre », dit Tung. « Nous essayons simplement de créer quelque chose d’utile. »