أخبار Gate bot: أشار الباحثون في شركة آبل في ورقة بحثية نُشرت في يونيو بعنوان "وهم التفكير" إلى أن النماذج الرائدة للذكاء الاصطناعي (AGI) لا تزال تواجه صعوبات في الاستدلال، لذلك لا يزال السباق نحو تطوير الذكاء الاصطناعي العام (AGI) بعيد المنال.
تشير المقالة إلى أن التحديثات الأخيرة لنماذج اللغة الكبيرة للذكاء الاصطناعي السائدة (LLM) (مثل ChatGPT من OpenAI وClaude من Anthropic) قد تضمنت نماذج استدلال كبيرة (LRM)، ولكن وظائفها الأساسية وميزاتها الموسعة وقيودها "لا تزال غير مفهومة بشكل كامل".
تتعلق التقييمات الحالية بشكل رئيسي بالمعايير الرياضية والترميزية المحددة، "مع التأكيد على دقة الإجابة النهائية". ومع ذلك، يشير الباحثون إلى أن هذا التقييم لم يتناول بعمق قدرات الاستدلال لنماذج الذكاء الاصطناعي، مما يشكل تباينًا حادًا مع التوقعات التي تشير إلى أن الذكاء الاصطناعي العام يمكن تحقيقه في غضون بضع سنوات.
صمم الباحثون ألعاب ألغاز مختلفة لتجاوز المعايير الرياضية القياسية لاختبار "تفكير" و"غير تفكير" كل من كلود سونيت (Claude Sonnet) وo3-mini وo1 من OpenAI وDeepSeek-R1 وV3 من روبوتات الدردشة.
اكتشفوا أن "نماذج الاستدلال المنطقي المتقدمة (LRM) تواجه انهيارًا تامًا في الدقة عندما تتجاوز مستوى معين من التعقيد"، ولا يمكنها تعميم الاستدلال بشكل فعال، كما أن ميزاتها تتلاشى مع زيادة التعقيد، وهذا يتعارض مع توقعات الناس لقدرات الذكاء الاصطناعي العام (AGI).
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
باحثو آبل: نماذج الذكاء الاصطناعي السائدة لا تزال غير قادرة على تحقيق مستوى الاستدلال المتوقع لـ AGI
أخبار Gate bot: أشار الباحثون في شركة آبل في ورقة بحثية نُشرت في يونيو بعنوان "وهم التفكير" إلى أن النماذج الرائدة للذكاء الاصطناعي (AGI) لا تزال تواجه صعوبات في الاستدلال، لذلك لا يزال السباق نحو تطوير الذكاء الاصطناعي العام (AGI) بعيد المنال.
تشير المقالة إلى أن التحديثات الأخيرة لنماذج اللغة الكبيرة للذكاء الاصطناعي السائدة (LLM) (مثل ChatGPT من OpenAI وClaude من Anthropic) قد تضمنت نماذج استدلال كبيرة (LRM)، ولكن وظائفها الأساسية وميزاتها الموسعة وقيودها "لا تزال غير مفهومة بشكل كامل".
تتعلق التقييمات الحالية بشكل رئيسي بالمعايير الرياضية والترميزية المحددة، "مع التأكيد على دقة الإجابة النهائية". ومع ذلك، يشير الباحثون إلى أن هذا التقييم لم يتناول بعمق قدرات الاستدلال لنماذج الذكاء الاصطناعي، مما يشكل تباينًا حادًا مع التوقعات التي تشير إلى أن الذكاء الاصطناعي العام يمكن تحقيقه في غضون بضع سنوات.
صمم الباحثون ألعاب ألغاز مختلفة لتجاوز المعايير الرياضية القياسية لاختبار "تفكير" و"غير تفكير" كل من كلود سونيت (Claude Sonnet) وo3-mini وo1 من OpenAI وDeepSeek-R1 وV3 من روبوتات الدردشة.
اكتشفوا أن "نماذج الاستدلال المنطقي المتقدمة (LRM) تواجه انهيارًا تامًا في الدقة عندما تتجاوز مستوى معين من التعقيد"، ولا يمكنها تعميم الاستدلال بشكل فعال، كما أن ميزاتها تتلاشى مع زيادة التعقيد، وهذا يتعارض مع توقعات الناس لقدرات الذكاء الاصطناعي العام (AGI).
مصدر الخبر: كوينتيليغراف