Модель OpenAI 最强o3 была обвинена в подлоге, получив привилегированный доступ к тестовой базе данных FrontierMath заранее

robot
Генерация тезисов в процессе

Согласно информации, опубликованной на форуме LessWrong, подрядчик Epoch AI по имени Meemi сообщил, что OpenAI не только предоставляет финансовую поддержку для тестирования FrontierMath Бенчмарк, но также получает привилегированный доступ к библиотеке тестовых примеров. Возможно, это одна из основных причин значительного повышения результатов o3 в кратчайшие сроки. Это подтверждает, что у o3 есть значительные навыки в продвинутом математическом рассуждении, и доктор математических наук Карина Хонг из Стэнфордского университета заявила, что OpenAI имеет привилегированный доступ к FrontierMath по договоренности с Epoch AI. Однако после обнародования информации подрядчиком, репутация компании резко изменилась. Стоя перед спорным вопросом, заместитель главного исполнительного директора Epoch AI и один из сооснователей Тамай Бесировглу быстро признал это на платформе X. По сообщениям, FrontierMath - это Бенчмарк высокого уровня математического рассуждения с тяжелым весом. Он был создан совместными усилиями Epoch AI и более 60 ведущих математиков, включая нескольких лауреатов премии Филдса и опытных авторов задач Международной математической олимпиады.

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить