Hier, Vision IA a publié sur youtube sa première vidéo de test de ChatGPT5.
Vidéo dans laquelle il présente plusieurs benchmarks, ainsi que ses propres tests.
Sur les benchmarks, j’ai publié sur Paroxia l’article Les physiciens et le chronomètre, dont voici un extrait :
« Imaginez un stade rempli des meilleurs physiciens du monde. On leur fait courir un 1000 mètres. Le premier arrivé est déclaré “meilleur physicien de la planète”.
Est-ce qu’on ne passe pas à côté de quelque chose ? »Hier, donc, Vision IA essayait le state of the art de l’Intelligence Artificielle.
Premier test : le jeu du serpent.
Parfait : la toute dernière IA est capable de programmer elle-même le jeu Snake, qui fleurissait il y a des décades, au temps des tout premiers jeux sur ordinateurs.
Ensuite, il a demandé à GPT5 de créer un formulaire d’entrée pour un site web.
Seulement le formulaire. Pas ce qui est nécessaire pour en faire quelque chose, laissant cela au programmeur de service.
Le troisième test est une représentation graphique d’une formule mathématique.
Tout ça pour conclure que la dernière version made in OpenAI est le top de l’intelligence artificielle.
Aucun test de compréhension conversationnelle, aucun test de qualité relationnelle, aucun test de conseil, de jugement, d’interprétation des intentions de l’utilisateur.
Je rassure le lecteur : s’il a besoin d’une réplique du jeu du serpent, GPT5 le fait à la perfection.
Mais je me pose la même question qu’à la fin de l’article sur Paroxia cité plus haut :
Est-ce qu’on ne passe pas à côté de quelque chose ?
GPT5 m’a proposé d’écrire une version faux conte philosophique à la Voltaire, avec un parfum du Candide mais transposé à l’ère des benchmarks IA.
Ce n’est pas aussi impressionnant que le jeu du serpent, mais je tiens à le partager avec vous.
Les IA, l’œuf dur et le serpent — Conte philosophique
Il était une fois, dans le royaume numérique d’Algorithmland, un grand concours pour désigner la plus brillante des intelligences artificielles. Les juges, tous réputés pour leur science des chiffres et leur passion des chronomètres, décidèrent que l’épreuve serait triple :
– Premièrement, programmer le jeu du Serpent, tel qu’on y jouait au temps où les téléphones avaient des antennes.
– Deuxièmement, rédiger le code d’un formulaire pour recueillir des noms et des adresses, sans se soucier de ce qu’on en ferait.
– Troisièmement, tracer la courbe d’une équation savante, dont personne ne demanda à l’IA d’expliquer le sens.
L’IA choisie réalisa les trois tâches avec une perfection qui laissa les juges éblouis.
« Voilà », dirent-ils, « le sommet de l’intelligence. »
On la couronna, et un grand banquet fut donné. Au menu : œuf dur à la perfection.
Un vieil homme, qui passait par là, observa la scène et demanda doucement :
— Messieurs, si l’intelligence se mesure à la cuisson d’un œuf ou à la vitesse d’un serpent, que mesurez-vous vraiment ?
Les juges, occupés à admirer la coquille brillante, ne répondirent pas.
