OpenAI最強o3 模型被曝造假,提前獲取FrontierMath測試題庫的特權訪問權

robot
摘要生成中

金色財經報道,一位名為“Meemi”的 Epoch AI 承包商在LessWrong 論壇透露,OpenAI 不僅為 FrontierMath 基準測試提供資金支持,還獲得了測試題庫的特權訪問權。而這或許也是 o3 的成績在短時間內獲得極大提高的重要原因。 本表明 o3 在高級數學推理方面有巨大斯坦福大學數學博士生 Carina Hong 聲稱,在 Epoch AI 的安排下,OpenAI 擁有對 FrontierMath 的特權訪問權。進步的成績單,卻在承包商的爆料後迎來了風評反轉。面對爭議,Epoch AI 副主任兼聯合創始人之一 Tamay Besiroglu 很快在 X 平臺承認了此事。 據悉,FrontierMath 是一個分量極重的高級數學推理能力評估基準。它由 Epoch AI 聯手 60 多位頂級數學家共同打造,參與者包括多位菲爾茲獎得主和國際數學奧林匹克競賽的資深命題人。

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)