Se reveló que el modelo más poderoso de OpenAI, o3, obtuvo acceso privilegiado anticipado a la base de datos de preguntas de prueba de FrontierMath y se descubrió que era falso.

robot
Generación de resúmenes en curso

Según informa Jinse Financial, un contratista de Epoch AI llamado 'Meemi' reveló en el foro LessWrong que OpenAI no solo brindó apoyo financiero para las pruebas de FrontierMath Indicador de referencia, sino que también obtuvo acceso privilegiado a la base de datos de pruebas. Quizás esta sea una de las razones importantes por las cuales el rendimiento de o3 ha mejorado enormemente en un corto período de tiempo. Esto indica que o3 tiene un gran conocimiento en razonamiento matemático avanzado, la doctora en matemáticas de la Universidad de Stanford, Carina Hong, afirmó que, bajo el acuerdo de Epoch AI, OpenAI tiene privilegios de acceso especial a FrontierMath. A pesar de los avances académicos, la reputación se vio afectada después de las revelaciones de un contratista. Ante la controversia, Tamay Besiroglu, vicepresidente y uno de los co-fundadores de Epoch AI, rápidamente reconoció el asunto en la plataforma X. Según se informa, FrontierMath es una evaluación de la capacidad de razonamiento matemático de alto nivel que es extremadamente importante Indicador de referencia. Fue creado en colaboración con Epoch AI y más de 60 destacados matemáticos, incluidos varios ganadores del Premio Fields y experimentados creadores de problemas de la Olimpiada Internacional de Matemáticas.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)