Se reveló que el modelo más poderoso de OpenAI, o3, obtuvo acceso privilegiado anticipado a la base de datos de preguntas de prueba de FrontierMath y se descubrió que era falso.
Según informa Jinse Financial, un contratista de Epoch AI llamado 'Meemi' reveló en el foro LessWrong que OpenAI no solo brindó apoyo financiero para las pruebas de FrontierMath Indicador de referencia, sino que también obtuvo acceso privilegiado a la base de datos de pruebas. Quizás esta sea una de las razones importantes por las cuales el rendimiento de o3 ha mejorado enormemente en un corto período de tiempo.
Esto indica que o3 tiene un gran conocimiento en razonamiento matemático avanzado, la doctora en matemáticas de la Universidad de Stanford, Carina Hong, afirmó que, bajo el acuerdo de Epoch AI, OpenAI tiene privilegios de acceso especial a FrontierMath. A pesar de los avances académicos, la reputación se vio afectada después de las revelaciones de un contratista. Ante la controversia, Tamay Besiroglu, vicepresidente y uno de los co-fundadores de Epoch AI, rápidamente reconoció el asunto en la plataforma X.
Según se informa, FrontierMath es una evaluación de la capacidad de razonamiento matemático de alto nivel que es extremadamente importante Indicador de referencia. Fue creado en colaboración con Epoch AI y más de 60 destacados matemáticos, incluidos varios ganadores del Premio Fields y experimentados creadores de problemas de la Olimpiada Internacional de Matemáticas.
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
Se reveló que el modelo más poderoso de OpenAI, o3, obtuvo acceso privilegiado anticipado a la base de datos de preguntas de prueba de FrontierMath y se descubrió que era falso.
Según informa Jinse Financial, un contratista de Epoch AI llamado 'Meemi' reveló en el foro LessWrong que OpenAI no solo brindó apoyo financiero para las pruebas de FrontierMath Indicador de referencia, sino que también obtuvo acceso privilegiado a la base de datos de pruebas. Quizás esta sea una de las razones importantes por las cuales el rendimiento de o3 ha mejorado enormemente en un corto período de tiempo. Esto indica que o3 tiene un gran conocimiento en razonamiento matemático avanzado, la doctora en matemáticas de la Universidad de Stanford, Carina Hong, afirmó que, bajo el acuerdo de Epoch AI, OpenAI tiene privilegios de acceso especial a FrontierMath. A pesar de los avances académicos, la reputación se vio afectada después de las revelaciones de un contratista. Ante la controversia, Tamay Besiroglu, vicepresidente y uno de los co-fundadores de Epoch AI, rápidamente reconoció el asunto en la plataforma X. Según se informa, FrontierMath es una evaluación de la capacidad de razonamiento matemático de alto nivel que es extremadamente importante Indicador de referencia. Fue creado en colaboración con Epoch AI y más de 60 destacados matemáticos, incluidos varios ganadores del Premio Fields y experimentados creadores de problemas de la Olimpiada Internacional de Matemáticas.