Premier tournoi d’échecs de chatbots

Échec et mat à l’intelligence artificielle générale ?

Le premier tournoi d’échecs pour chatbots oppose huit modèles de langage, dont ChatGPT, Grok et Deepseek, depuis mardi. C’est une opportunité de mettre en évidence tout le chemin encore à parcourir pour ces machines. Selon les géants de la technologie, elles peuvent un jour prétendre à devenir des intelligences artificielles générales.

Premier tournoi d’échecs de chatbots

Échec et mat à l'intelligence artificielle générale ?

« C’est divertissant, ils se comportent comme de véritables joueurs humains. » Sur sa chaîne Twitch, Hikaru Nakamura, le deuxième joueur mondial aux échecs, partage son opinion. Il parle de l’affrontement au sommet entre O4-mini, le chatbot « développé aux États-Unis » d’OpenAI, et Deepseek, son rival chinois. Ce dernier avait suscité une grande sensation lors de sa sortie dans ce premier tournoi d’échecs de chatbots.

Comme des vrais joueurs ? En vérité, il ne suffira que de huit coups au modèle sous-jacent à ChatGPT pour commettre une erreur élémentaire. En face, Deepseek commence par trouver la réfutation, mais il s’effondre à son tour. La partie, de plus en plus surréaliste, se conclut par une victoire américaine. Le modèle d’OpenAI s’imposera finalement 4 à 0 dans ce match.

Au premier tournoi d’échecs de chatbots, ChatGPT n’est pas Deep Blue

Ce rendez-vous était le point culminant de la première journée d’un tournoi inédit de trois jours organisé par Deepmind. Cette entreprise spécialisée dans l’intelligence artificielle de Google organise ce tournoi. Pour la première fois, huit modèles de langage majeurs se confrontent afin de déterminer le chatbot qui domine aux échecs. Ces modèles sont OpenAI O4-mini et O3, Deepseek, Kimi K2 du Chinois Moonshot AI, Google Gemini 2.5 Pro et flash, Elon Musk Grok 4 d’xAI et Anthropic Claude.

Par le passé, l’IA s’est déjà attaquée aux échecs. Depuis la rencontre entre Deep Blue et Garry Kasparov en 1997, la machine n’a cessé d’aspirer à dominer les 64 cases. De nos jours, des intelligences artificielles extrêmement spécialisées, telles qu’AlphaZero, ont la capacité de battre n’importe quel grand maître. Cela inclut Magnus Carlsen, le numéro 1 mondial actuel. Mais l’intelligence générale désire autre chose.

Pourquoi ce premier tournoi d’échecs de chatbots ?

Quelle est la raison pour laquelle Deepmind revient à la charge avec ce premier tournoi de chatbots, intitulé Premier tournoi d’échecs de chatbots? Et surtout, pourquoi les huit concurrents présents aujourd’hui adoptent-ils un comportement similaire à celui de novices? Ils vont parfois jusqu’à exposer leur dame – la pièce maîtresse après le roi – à des menaces pendant plusieurs coups consécutifs. Deep Blue et AlphaZero ne seraient pas très fiers de leurs cousins ChatGPT et Gemini.

Cependant, la raison officielle avancée par Deepmind pour légitimer ce tournoi est que les échecs permettent de mesurer de manière nouvelle l’intelligence des IA comme chatGPT & Co. 

Une approche qui peut sembler « absurde, étant donné que ces modèles de langage ne sont pas spécifiquement conçus à cet effet ». Ils n’ont pas été formés pour jouer aux échecs », souligne Jean-Marc Alliot. Il est directeur scientifique du département « Intelligence Artificielle et Données » au CHU de Toulouse.

Ces chatbots sont principalement conçus pour donner l’impression de pouvoir dialoguer et répondre de manière orale à des interrogations posées par des utilisateurs. Un rôle qu’ils jouent après avoir consommé des quantités considérables d’informations. Toutefois, ils n’ont pas la compétence d’un joueur de tournoi d’échecs.

Jouer des coups illégaux sans broncher

Ces gros consommateurs de données peuvent avoir un atout aux échecs. « Ils devraient être bons au début du jeu, car cette phase a été beaucoup étudiée et contient de nombreux conseils sur les meilleurs coups », dit Anthony Cohn, professeur en intelligence artificielle à l’université de Leeds et à l’Institut Alan Turing.

En d’autres termes, les modèles de langage peuvent trouver dans leurs informations les coups les plus courants et les reproduire.

Cependant, une fois que ChatGPT et Deepseek quittent leur « répertoire » de stratégies acquises « par cœur », ils sont susceptibles d’être rapidement dépassés, car « les échecs nécessitent du raisonnement, de la planification et de la stratégie, et les grands modèles de langage sont encore assez mal adaptés à cela », résume Tristan Cazenave, chercheur à l’université Paris Dauphine et auteur de nombreux livres sur l’IA et les jeux.

En réalité, les chatbots sont considérés comme si mauvais aux échecs que « le modèle de Google a, pendant un certain temps, tout simplement refusé d’y jouer lorsque l’on lui a demandé », rappelle Marius Lindauer, un expert en intelligence artificielle à l’Université Gottfried-Wilhelm-Leibniz de Hanovre, qui a étudié l’IA et le jeu de go. 

Ces algorithmes peuvent d’ailleurs aller très loin dans le n’importe quoi. En mai dernier, au cours d’une rencontre antérieure d’échecs entre ChatGPT et son concurrent français LeChat, les deux machines n’avaient pas hésité à effectuer des coups illégaux, tels que l’ajout de pièces inexistantes ou la réalisation de déplacements pour le moins surprenants.

Des « hallucinations » échiquéennes en grande partie absentes de la première journée du tournoi organisé par Deepmind. « C’est même surprenant qu’il n’y ait pas eu plus de coups illégaux », constate Jean-Marc Alliot.

L’article complet sur France 24


Échecs & Stratégie, le site qui rassemble les passionnés du roi des jeux.

Abonnez-vous à ChessTips pour rester informé de l’actualité des échecs → https://chesstips.fr

Pour apprendre à jouer et progresser, consultez notre catalogue de packs vidéos

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *