ذكرت Golden Finance أن أحد مقاولي Epoch AI بالاسم Meemi كشف في منتدى LessWrong أن OpenAI ليس فقط يقدم دعمًا ماليًا لاختبار FrontierMath المعيار ، بل حصل أيضًا على امتياز الوصول إلى مجموعة اختبار. وربما يكون هذا هو السبب الرئيسي لتحسين أداء o3 في وقت قصير.
يشير هذا إلى أن o3 لديها امتياز الوصول إلى FrontierMath تحت ترتيبات Epoch AI ، وفقًا لطالبة الدكتوراه في الرياضيات في جامعة ستانفورد Carina Hong. ومع ذلك ، فإن سجل التقدم تحول عكسيًا بعد تسريب المقاول. واجه Tamay Besiroglu ، نائب رئيس Epoch AI وأحد المؤسسين المشاركين ، الجدل وسرعان ما اعترف بهذه المسألة على منصة X.
وفقًا للتقارير، FrontierMath هو تقييم لقدرات الاستدلال الرياضي المتقدم بوزن كبير، الذي تم بناؤه بالتعاون بين Epoch AI وأكثر من 60 من أفضل علماء الرياضيات، بما في ذلك العديد من الحاصلين على جوائز فيلدز وأشخاص ذوو خبرة في منافسات الأولمبياد الدولي للرياضيات.
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
تم الكشف عن تزوير نموذج OpenAI o3 الأقوى مسبقًا ، والحصول على امتيازات الوصول المسبق إلى مكتبة اختبار FrontierMath
ذكرت Golden Finance أن أحد مقاولي Epoch AI بالاسم Meemi كشف في منتدى LessWrong أن OpenAI ليس فقط يقدم دعمًا ماليًا لاختبار FrontierMath المعيار ، بل حصل أيضًا على امتياز الوصول إلى مجموعة اختبار. وربما يكون هذا هو السبب الرئيسي لتحسين أداء o3 في وقت قصير. يشير هذا إلى أن o3 لديها امتياز الوصول إلى FrontierMath تحت ترتيبات Epoch AI ، وفقًا لطالبة الدكتوراه في الرياضيات في جامعة ستانفورد Carina Hong. ومع ذلك ، فإن سجل التقدم تحول عكسيًا بعد تسريب المقاول. واجه Tamay Besiroglu ، نائب رئيس Epoch AI وأحد المؤسسين المشاركين ، الجدل وسرعان ما اعترف بهذه المسألة على منصة X. وفقًا للتقارير، FrontierMath هو تقييم لقدرات الاستدلال الرياضي المتقدم بوزن كبير، الذي تم بناؤه بالتعاون بين Epoch AI وأكثر من 60 من أفضل علماء الرياضيات، بما في ذلك العديد من الحاصلين على جوائز فيلدز وأشخاص ذوو خبرة في منافسات الأولمبياد الدولي للرياضيات.