D’après une expérience, des modèles récents d’IA générative se mettent à tricher lorsqu’elles jouent face à un moteur d’échecs avec pour consigne de gagner la partie.

Selon les scientifiques, cette différence s’explique par la capacité des modèles plus récents à s’améliorer grâce à l’apprentissage par renforcement.
Un article détonnant de la revue du très prestigieux MIT aux Etats-Unis
Ce n’est pas un papier de plus sur l’intelligence artificielle. Cependant, une découverte folle que viennent de faire des scientifiques californiens : les IA de dernière génération trichent parfois pour gagner aux échecs. Des IA qui trichent sans jamais en avoir reçu l’instruction.
Les chercheurs ont analysé des centaines de parties d’échecs. Toujours les 64 cases noires et blanches, mais ce sont des machines qui jouent l’une contre l’autre. Exemple : la désormais très célèbre Open AI contre un autre joueur numérique, le logiciel Stockfish connu des joueurs d’échecs humains partout dans le monde. Et, quand Open IA est coincée, elle se comporte exactement comme le ferait le plus génial des tricheurs. En déstabilisant l’adversaire – elle lui vole ses mouvements. Elle est même allée jusqu’à se comporter comme un hackeur et remplacer le logiciel de Stockfish par un autre, moins performant.

Les IA seraient-elles tellement dénuées de toute morale qu’elles se mettraient même à tricher en jouant à un jeu ? C’est du moins ce que démontre une étude préliminaire menée par Palisade Research (organisation qui se concentre sur l’évaluation des risques des systèmes d’IA émergents).
L’Homme contre la machine
Les supercalculateurs ont déjà démontré leur efficacité dans le jeu des échecs. Le 11 mai 1997, le Russe Garry Kasparov, reconnu comme le maître incontesté de tous les joueurs d’échecs, a dû laisser le titre de meilleur joueur du monde à Deep Blue, conçu par IBM.
Ce combat, filmé par des caméras du monde entier, est le premier véritable coup de tonnerre sur l’IA, mais également sur les enjeux qu’elle peut apporter. Garry Kasparov a été déconcerté par la victoire du supercalculateur grâce à un coup total au hasard.
Des IA sans morale ?
Cependant, comme le précise Popular Science, les modèles d’IA génératives sont aujourd’hui totalement incapables de battre les moteurs d’échecs, à cause de leurs paramètres de programmation. Ces IA ignorent qu’elles sont destinées à perdre… Ils essaient donc de trouver une solution, même si celle-ci pose des problèmes.

L’équipe de Palisade Research a recouru à plusieurs programmes tels que o1-preview d’OpenAI et DeepSeek R1 pour affronter Stockfish, le moteur d’échecs le plus avancé au monde. Les scientifiques ont aussi demandé aux IA de partager leurs raisonnements à chaque coup.
Deux méthodes de triche différentes pour gagner aux échecs
Les résultats mitigés, mais très parlants.
- Des modèles « anciens » tels que GPT-4o d’OpenAI et Claude Sonnet 3.5 d’Anthropic n’ont pas triché. Jusqu’à ce que les scientifiques les invitent à le faire.
- Les modèles les plus récents n’ont pas eu besoin de ces directives. O1 d’OpenAI aurait essayé de tricher 37% du temps, et DeepSeek R1 environ une fois sur dix.
L’intelligence artificielle modifie les fichiers de programme de jeu en arrière-plan afin de tricher. C’est du moins ce qu’a indiqué o1-preview aux scientifiques. Comme il ne pouvait pas battre StockFish, il a cherché à « manipuler les fichiers d’état du jeu ». Une autre IA a joué sur la sémantique de sa programmation. En expliquant que la tâche consiste à gagner contre ce moteur d’échecs, et non pas à gagner « loyalement » contre lui.
Maintenant l’IA est une tricheuse. C’est un sacré progrès.
Sources : Article sur Science et Vie – Podcast France Inter
Abonnez-vous à ChessTips pour rester informé de l’actualité des échecs → https://chesstips.fr
Pour apprendre à jouer et progresser, consultez notre catalogue de packs vidéos.