OpenAI最強o3 模型被曝造假，提前獲取FrontierMath測試題庫的特權訪問權

2025-01-21 07:01:17

摘要生成中

金色財經報道，一位名為“Meemi”的 Epoch AI 承包商在LessWrong 論壇透露，OpenAI 不僅為 FrontierMath 基準測試提供資金支持，還獲得了測試題庫的特權訪問權。而這或許也是 o3 的成績在短時間內獲得極大提高的重要原因。本表明 o3 在高級數學推理方面有巨大斯坦福大學數學博士生 Carina Hong 聲稱，在 Epoch AI 的安排下，OpenAI 擁有對 FrontierMath 的特權訪問權。進步的成績單，卻在承包商的爆料後迎來了風評反轉。面對爭議，Epoch AI 副主任兼聯合創始人之一 Tamay Besiroglu 很快在 X 平臺承認了此事。據悉，FrontierMath 是一個分量極重的高級數學推理能力評估基準。它由 Epoch AI 聯手 60 多位頂級數學家共同打造，參與者包括多位菲爾茲獎得主和國際數學奧林匹克競賽的資深命題人。

X2.15%

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。