「Meemi」という名前のエポックAI請負業者は、OpenAIがFrontierMathベンチマークに資金を提供しただけでなく、テスト問題バンクへの特権アクセスも得たことをLessWrongフォーラムで明らかにしました。 これが、O3の性能が短期間で飛躍的に向上した大きな理由でしょう。 この表明書は、o3が数学の高度な推論において、Stanford大学の数学博士であるCarina Hong氏によって主張されていることを示しています。Epoch AIの手配により、OpenAIはFrontierMathへの特権的なアクセス権を持っています。進歩した成績表は、請負業者の告発後に風評が一変しました。論争に直面して、Epoch AIの副主任兼共同創設者のTamay Besiroglu氏は迅速にこの問題を認めました。FrontierMathは、重要な数学的推論能力の評価ベンチマークであると報じられています。それは、Epoch AIと60人以上のトップ数学者によって共同開発されました。参加者には、フィールズ賞受賞者や国際数学オリンピックの経験豊富な問題作成者も含まれています。
OpenAI最強o3モデルが偽造され、FrontierMathテスト問題の特権アクセス権を事前に入手していたことが暴露されました
「Meemi」という名前のエポックAI請負業者は、OpenAIがFrontierMathベンチマークに資金を提供しただけでなく、テスト問題バンクへの特権アクセスも得たことをLessWrongフォーラムで明らかにしました。 これが、O3の性能が短期間で飛躍的に向上した大きな理由でしょう。 この表明書は、o3が数学の高度な推論において、Stanford大学の数学博士であるCarina Hong氏によって主張されていることを示しています。Epoch AIの手配により、OpenAIはFrontierMathへの特権的なアクセス権を持っています。進歩した成績表は、請負業者の告発後に風評が一変しました。論争に直面して、Epoch AIの副主任兼共同創設者のTamay Besiroglu氏は迅速にこの問題を認めました。 FrontierMathは、重要な数学的推論能力の評価ベンチマークであると報じられています。それは、Epoch AIと60人以上のトップ数学者によって共同開発されました。参加者には、フィールズ賞受賞者や国際数学オリンピックの経験豊富な問題作成者も含まれています。