Le tournoi d'échecs LLM s'est terminé : OpenAI o3 a remporté le titre, xAI Grok 4 n'a pas gagné une seule partie et a été complètement éliminé.

Le tournoi international d'échecs Kaggle AI s'est terminé, l'o3 non entraîné remportant une victoire écrasante 4-0 contre Grok 4, démontrant une capacité de raisonnement extrêmement forte. (Résumé : Musk menace de poursuivre Apple : le classement de l'App Store présente un comportement monopolistique, réprimant délibérément Grok) (Contexte : Grok 4 est maintenant disponible gratuitement, Musk xAI se confronte à GPT-5) Récemment, Kaggle, une filiale de Google, a annoncé les résultats de son "spectacle d'échecs d'intelligence artificielle" le 14 août, où le modèle de langage général d'OpenAI, o3, a balayé Grok 4 de xAI avec un score de 4:0, remportant le championnat et devenant le premier LLM à réussir un blanchissage sans entraînement spécifique. Le tournoi a vu la participation de 8 groupes d'IA sur une durée de trois jours, avec des éliminatoires pour déterminer le vainqueur. Points forts du concours de modèles linguistiques Selon OpenTools.ai, o3 a réussi à enregistrer trois victoires consécutives de 4:0 tout au long de son parcours, éliminant même sa propre version légère, o4 mini, en demi-finale. En revanche, Grok 4 a souvent pris de l'avance en début de partie, mais a perdu à plusieurs reprises en fin de match (sacrifiant la pièce la plus dynamique, la Reine). Le grand maître d'échecs Hikaru Nakamura a évalué o3 comme ayant "très peu d'erreurs", notant que Grok 4 avait souvent des tactiques d'auto-sabotage. L'ancien champion du monde Magnus Carlsen a décrit le style de jeu de Grok comme : regarder des enfants jouer aux échecs. Il estime que le Elo de Grok est d'environ 800, tandis que celui de o3 est d'environ 1200, bien en dessous des meilleurs joueurs humains ou des IA spécialisées dans les échecs. Elo : un système de notation professionnelle (anglais : Elo rating system) est une méthode d'évaluation créée par le physicien américain d'origine hongroise Arpad Elo, qui mesure le niveau des diverses activités de jeu, reconnue comme la norme d'évaluation des niveaux de jeu dans le monde d'aujourd'hui, largement utilisée dans des sports comme les échecs, le go, le football et le basket-ball. Le score Elo le plus élevé en échecs a été établi par Magnus Carlsen avec 2882 points. Confrontation entre IA générale et IA spécialisée Les systèmes spécialisés comme Stockfish s'appuient sur une recherche approfondie et des évaluations de domaine, maintenant un score Elo d'environ 3644 depuis longtemps. Les LLM généralistes apprennent à travers des corpus massifs interdomaines, le jeu d'échecs n'étant qu'une extension de leur capacité de raisonnement. Bien que o3 ait pu battre Grok 4, il a cependant été vaincu par Stockfish plus tôt cette année, montrant que le modèle généraliste a encore des lacunes en termes de stabilité et de calcul approfondi dans le raisonnement de jeux d'échecs. Rapports connexes Parier sur OpenAI, Masayoshi Son a encore "retourné la situation" Un développeur Ethereum a été victime d'un "plugin AI malveillant", son portefeuille cryptographique a été vidé en trois jours, même dix ans d'expérience en cybersécurité n'ont pas suffi. Les dernières perspectives d'a16z : le commerce électronique traditionnel est-il mort ? Les plateformes d'IA natives redéfinissent ce qu'est le "shopping". Cet article intitulé "Le tournoi d'échecs LLM s'est terminé : OpenAI o3 remporte le championnat, xAI Grok 4 n'a pas gagné une seule partie et a été complètement pulvérisé" a été publié pour la première fois dans BlockTempo, le média d'information blockchain le plus influent.

XAI-10.59%
GROK-11.49%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)