OpenAI-et-intelligence-artificielle-réalité-ou-mirage

Vous avez probablement entendu parler de la société OpenAI, ou tout au moins de l’un de ses produits, DALL-E qui génère des dessins, et ChatGPT pour ses « conversations » et qui a fait la une de la presse ces dernières semaines.

Je vous propose un rapide tour d’horizon de ces deux applications, quelques informations à propos d’OpenAI, la société éditrice, et en annexe un exemple de dialogue.

Les images : DALL-E

DALL-E est une IA qui peut créer des images réalistes et artistiques à partir d’une description en langage naturel. Demandez-lui « un couple en train de s’occuper de son jardin, façon Turner », et voici le résultat proposé en quelques secondes :

un-couple-en-train-de-s-occuper-de-son-jardin-façon-Turner

Il ne faut surtout pas se tromper, ces images sont originales : elles ont été construites pixel par pixel à une vitesse stupéfiante par l’IA. Elles ne sont pas extraites d’un catalogue existant. Si l’on précise « sous un orage », voici un extrait du résultat :

un-couple-en-train-de-s-occuper-de-son-jardin-façon-Turner-sous-un-orage

DALL-E peut décliner à l’infini des variations de cette image. Voici les scènes proposées pour « un couple en train de s’occuper de son jardin, façon Turner sous un orage » :

un-couple-en-train-de-s-occuper-de-son-jardin-façon-Turner-sous-un-orage

On peut changer de style, en demandant par exemple « façon Dali », ou tout autre peintre ou dessinateur connu, ou encore selon vos spécifications, comme par exemple « au crayon » :

un-couple-en-train-de-s-occuper-de-son-jardin-façon-Turner-sous-un-orage-au-crayon

DALL-E est un outil qui comprend le langage naturel (dans plusieurs langues), et infère à partir de cette description selon ses connaissances (acquises au travers d’un long apprentissage) des propositions. Dans les exemples donnés, il lui fallait par exemple comprendre « orage » et « jardin », et savoir agencer ces notions dans l’image créée.

L’utilisation de DALL-E est gratuite jusqu’à un seuil à partir duquel il faut acheter des crédits.

Le dialogue et des connaissances : ChatGPT

ChatGPT est également une IA qui comprend le langage naturel en 18 langues et repose sur une base de connaissances très étendue (disons, encyclopédique) acquises jusqu’en 2021. En outre, cette IA a la capacité de comprendre une « conversation » en suivant le « fil conducteur » des échanges, pour inférer à partir de ses connaissances et ainsi répondre aux questions posées.

ChatGPT est plutôt bluffant ! Dès lors que l’on ne s’adresse pas à l’actualité (inutile de demander la météo de demain), ChatGPT ne fait pas que répondre aux questions, mais « infère », c’est-à-dire produit une réponse construite, jusqu’à produire des exemples contextuels (= qui tiennent compte du fil de discussion). ChatGPT ne sait que produire du texte (ni image, ni dessin), mais cela ouvre un champ incroyable.

Besoin d’un algorithme informatique : formuler une question précise pour obtenir un premier exemple, puis de préciser un langage, et adapter avec quelques compléments. Besoin de résoudre une équation : la décrire est suffisant. Retrouver une équation à partir de points : décrire la suite de points, par exemple sous la forme (x0,y0) … (xn,yn). En annexe, j’ai recopié un dialogue réel sur un sujet inhabituel : la nature de l’énergie cinétique.

Bien entendu, les réponses de ChatGPT seront à l’avenant de la précision des questions, et si vous lui demandez d’architecturer une application logicielle ou un bâtiment, il vous expliquera de manière pertinente en quoi cela ne peut relever d’une conversation.

ChatGPT est le fruit d’un double entrainement : l’acquisition des connaissances d’une part, puis l’aspect conversationnel au cours duquel des formateurs humains en IA ont fourni des conversations dans lesquelles ils jouaient les deux rôles – l’utilisateur et un assistant IA. Ces phases d’apprentissage, de même que les phases d’exploitation requièrent de très grosses puissances de calcul, en l’occurrence fournies par le cloud Azure de Microsoft.

Mais attention, ChatGPT n’est pas parfait.

Il repose sur un corpus de connaissances établit à partir de supports dont OpenAI dit qu’ils sont « de qualité » : livres, papiers scientifiques, code informatique (dont GitHub, ce qui alimente des polémiques de la part des développeurs dont les codes ont été utilisés), etc.

Mais même s’il est réputé qualitatif, ce corpus contient des imperfections, et de plus, ChatGPT n’en tire peut-être pas toujours la quintessence. Voici par exemple ce qu’un article de France-Info décrit sur ses connaissances à propos des Outre-mer : « Il est souvent pertinent mais commet aussi de grosses erreurs ». Je vous invite à lire l’article pour apprécier ces erreurs.

On peut donc voir en ChatGPT un assistant qui dispose de connaissances encyclopédiques et sur lequel on doit toujours garder un recul critique.

Qui est OpenAI ?

OpenAI est une société de recherche et de déploiement de l’IA localisée à San Francisco et fondée en 2015, qui définit sa mission comme étant de « faire en sorte que l’intelligence artificielle générale profite à l’ensemble de l’humanité ». Des sociétés telles que Microsoft participent à son financement.

OpenAI travaille sur DALL-E et ChatGPT, mais aussi d’autres projets de recherche qui ont pour dénominateur commun de s’appuyer sur des IA et l’exploration des langages (écriture, images, audio) et ce qu’ils permettent d’inférer (corpus des connaissances), par exemple : Connexions entre texte et images (CLIP), Relations entre images (ImageGPT), Générateur de musique (JukeBox).

Des sociétés comme Google ont des programmes concurrents, OpenAI n’est pas seul à travailler dans ces domaines, et quelques recherche web vous conduiront très vite vers de nombreux projets similaires.

Le futur ?

Les réseaux neuronaux sur lesquelles les IA sont construites et entrainées sont en train de modifier notre quotidien. Au-delà de notre quotidien, les IA produisent des résultats qui font avancer la science en général, dont l’informatique elle-même.

Pour l’instant, il me semble que ChatGPT peut être défini comme un « super assistant » apte à partager et décrire un corpus de connaissances vraiment très large d’une manière pratique et accessible en 18 langues. C’est déjà beaucoup ! Dans l’urgence, Microsoft vient d’intégrer ChatGPT dans sa suite bureautique et devrait l’intégrer à son moteur de recherche Bing.

Depuis son exposition au public (des millions d’utilisateurs), et si j’ai bien compris, ChatGPT n’évolue pas sur ses connaissances, mais évolue sur sa capacité à conduire une discussion.

Chez J2S, nous évaluons en permanence ces technologies, et plusieurs membres de l’équipe sont des spécialistes en IA (par formation et pour avoir conduit des travaux de recherche).

Dans le viseur : rendre l’automatisation tout à la fois plus simple et plus automatique, faire des propositions de mise en page, détecter des incohérences dans les données, etc.

Prenez contact avec nous : nous serons ravis d’échanger. David Lantier, Business developer