Se reveló que el modelo más poderoso de OpenAI, o3, obtuvo acceso privilegiado anticipado a la base de datos de preguntas de prueba de FrontierMath y se descubrió que era falso.

2025-01-21 07:01:17

Generación de resúmenes en curso

Según informa Jinse Financial, un contratista de Epoch AI llamado 'Meemi' reveló en el foro LessWrong que OpenAI no solo brindó apoyo financiero para las pruebas de FrontierMath Indicador de referencia, sino que también obtuvo acceso privilegiado a la base de datos de pruebas. Quizás esta sea una de las razones importantes por las cuales el rendimiento de o3 ha mejorado enormemente en un corto período de tiempo. Esto indica que o3 tiene un gran conocimiento en razonamiento matemático avanzado, la doctora en matemáticas de la Universidad de Stanford, Carina Hong, afirmó que, bajo el acuerdo de Epoch AI, OpenAI tiene privilegios de acceso especial a FrontierMath. A pesar de los avances académicos, la reputación se vio afectada después de las revelaciones de un contratista. Ante la controversia, Tamay Besiroglu, vicepresidente y uno de los co-fundadores de Epoch AI, rápidamente reconoció el asunto en la plataforma X. Según se informa, FrontierMath es una evaluación de la capacidad de razonamiento matemático de alto nivel que es extremadamente importante Indicador de referencia. Fue creado en colaboración con Epoch AI y más de 60 destacados matemáticos, incluidos varios ganadores del Premio Fields y experimentados creadores de problemas de la Olimpiada Internacional de Matemáticas.

X2.35%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

2 me gusta

Recompensa
2
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
#Gate ETH Staking APY 5%
46k Popularidad
#Show My Alpha Points
56k Popularidad
#Crypto IPO Surge
21k Popularidad
#SOL Futures Reach New High
26k Popularidad
#ETH ETF Sees 12 Weeks of Inflows
7k Popularidad

Anclado