ChatGPT 4.0 arrive

GPT-4, est considéré par certains comme étant « de niveau supérieur » et perturbateur, mais quelle sera la réalité ? Le PDG Sam Altman répond aux questions sur le GPT-4 et l’avenir de l’IA.

Des indices que GPT-4 sera une IA multimodale ?

Dans une interview en podcast (IA for the Next Era) du 13 septembre 2022, le PDG d’OpenAI, Sam Altman, a évoqué l’avenir proche de la technologie de l’IA. Ce qui est particulièrement intéressant, c’est qu’il a dit qu’un modèle multimodal était dans un avenir proche. Multimodal signifie la capacité de fonctionner dans plusieurs modes, tels que le texte, les images et les sons. OpenAI interagit avec les humains via des entrées de texte. Qu’il s’agisse de Dall-E ou de ChatGPT, il s’agit strictement d’une interaction textuelle. Une IA dotée de capacités multimodales peut interagir par la parole. Il peut écouter des commandes et fournir des informations ou effectuer une tâche. Altman a offert ces détails alléchants sur ce à quoi s’attendre bientôt : « Je pense que nous aurons des modèles multimodaux dans peu de temps, et cela ouvrira de nouvelles choses. Je pense que les gens font un travail incroyable avec des agents qui peuvent utiliser des ordinateurs pour faire des choses pour vous, utiliser des programmes et cette idée d’une interface linguistique où vous dites un langage naturel – ce que vous voulez dans ce genre de dialogue dans les deux sens. Vous pouvez l’itérer et l’affiner, et l’ordinateur le fait pour vous. Vous voyez une partie de cela avec DALL-E et CoPilot de manière très précoce. Altman n’a pas spécifiquement dit que GPT-4 sera multimodal. Mais il a laissé entendre que cela arriverait dans un court laps de temps. Il est particulièrement intéressant de noter qu’il envisage l’IA multimodale comme une plate-forme pour créer de nouveaux modèles commerciaux qui ne sont pas possibles aujourd’hui. Il a comparé l’IA multimodale à la plate-forme mobile et comment cela a ouvert des opportunités pour des milliers de nouvelles entreprises et emplois. Altman a déclaré : « . Je pense que cela va être une tendance massive, et de très grandes entreprises seront construites avec cela comme interface, et plus généralement [I think] que ces modèles très puissants seront l’une des véritables nouvelles plates-formes technologiques, ce que nous n’avons pas vraiment eu depuis le mobile. Et il y a toujours une explosion de nouvelles entreprises juste après, donc ça va être cool. Lorsqu’on lui a demandé quelle était la prochaine étape de l’évolution de l’IA, il a répondu par ce qu’il a dit être des caractéristiques qui étaient une certitude. « Je pense que nous allons faire fonctionner de vrais modèles multimodaux. Et donc pas seulement du texte et des images, mais chaque modalité que vous avez dans un modèle est capable de se déplacer facilement et de manière fluide entre les choses.

Des modèles d’IA qui s’auto-améliorent ?

il est bloqué dans le temps où il a été formé ça ne s’améliore pas et tout ça. Je pense que nous allons changer cela. Je suis donc très excité à propos de tout cela. On ne sait pas si Altman parlait d’Intelligence Générale Artificielle (AGI), mais cela ressemble un peu à ça. Altman a récemment démystifié l’idée qu’OpenAI a un AGI, qui est cité plus loin dans cet article. Altman a été invité par l’intervieweur à expliquer comment toutes les idées dont il parlait étaient des cibles réelles et des scénarios plausibles et pas seulement des opinions sur ce qu’il aimerait que OpenAI fasse. L’intervieweur a demandé : « Donc, une chose que je pense serait utile de partager – parce que les gens ne réalisent pas que vous faites en fait ces prédictions fortes d’un point de vue assez critique, pas seulement » Nous pouvons prendre cette colline « … » Altman a expliqué que toutes ces choses dont il parle sont des prédictions basées sur des recherches qui leur permettent de tracer une voie viable pour choisir le prochain grand projet en toute confiance. Il a partagé : « Nous aimons faire des prédictions là où nous pouvons être à la frontière, comprendre de manière prévisible à quoi ressemblent les lois de mise à l’échelle (ou avoir déjà fait la recherche) où nous pouvons dire : » D’accord, cette nouvelle chose va fonctionner et faire des prédictions de cette façon. Et c’est ainsi que nous essayons de faire fonctionner OpenAI, qui consiste à faire la prochaine chose devant nous lorsque nous avons une grande confiance et à prendre 10% de l’entreprise pour tout simplement partir et explorer, ce qui a conduit à d’énormes gains.

OpenAI peut-il atteindre de nouveaux jalons avec GPT-4 ?

L’une des choses nécessaires pour piloter OpenAI est l’argent et des quantités massives de ressources informatiques. Microsoft a déjà versé trois milliards de dollars dans OpenAI, et selon le New York Times, il est en pourparlers pour investir 10 milliards de dollars supplémentaires. Le New York Times a rapporté que le GPT-4 devrait être publié au premier trimestre de 2023. Il a été laissé entendre que le GPT-4 pourrait avoir des capacités multimodales, citant un capital-risqueur Matt McIlwain qui connaît le GPT-4. Le Times a rapporté : « OpenAI travaille sur un système encore plus puissant appelé GPT-4, qui pourrait être publié dès ce trimestre, selon M. McIlwain et quatre autres personnes connaissant l’effort. …Construit à l’aide de l’immense réseau de Microsoft pour les centres de données informatiques, le nouveau chatbot pourrait être un système similaire à ChatGPT qui génère uniquement du texte. Ou il pourrait jongler entre les images et le texte. Certains investisseurs en capital-risque et employés de Microsoft ont déjà vu le service en action. Mais OpenAI n’a pas encore déterminé si le nouveau système sera publié avec des capacités impliquant des images.

L’argent suit OpenAI

Bien qu’OpenAI n’ait pas partagé de détails avec le public, il a partagé des détails avec la communauté du financement par capital-risque. Il est actuellement en pourparlers qui valoriseraient l’entreprise à 29 milliards de dollars. Il s’agit d’une réalisation remarquable car OpenAI ne génère actuellement pas de revenus importants et le climat économique actuel a forcé les valorisations de nombreuses entreprises technologiques à baisser. The Observer a rapporté : « Les sociétés de capital-risque Thrive Capital et Founders Fund font partie des investisseurs intéressés par l’achat d’un total de 300 millions de dollars d’actions OpenAI, a rapporté le Journal. L’opération est structurée comme une offre publique d’achat, les investisseurs achetant des actions aux actionnaires existants, y compris les employés. La valorisation élevée d’OpenAI peut être considérée comme une validation pour l’avenir de la technologie, et cet avenir est actuellement GPT-4.

Sam Altman répond aux questions sur GPT-4

Le moulin à rumeurs GPT est comme une chose ridicule. … Les gens supplient d’être déçus et ils le seront. … Nous n’avons pas de véritable AGI et je pense que c’est en quelque sorte ce qu’on attend de nous et vous savez, ouais… nous allons décevoir ces gens.  »

Beaucoup de rumeurs, peu de faits

GPT-4 est meilleur que ce à quoi tout le monde s’attend Sam Altman a mis en garde de ne pas fixer d’attentes trop élevées.

Davantage de ressources:

Image en vedette : salarko/Shutterstock