Сообщение Gate News bot: исследователи Apple в статье, опубликованной в июне под названием «Иллюзия мышления», отметили, что ведущие модели искусственного интеллекта (AGI) все еще испытывают трудности с рассуждениями, поэтому гонка по разработке общего искусственного интеллекта (AGI) все еще далека от завершения.
Статья указывает на то, что последние обновления основных крупных языковых моделей искусственного интеллекта (LLM) (например, ChatGPT от OpenAI и Claude от Anthropic) теперь содержат крупные модели вывода (LRM), однако их основные функции, расширенные возможности и ограничения «по-прежнему не полностью поняты».
Текущая оценка в основном сосредоточена на установленных математических и кодировочных эталонах, «подчеркивающих точность окончательного ответа». Однако исследователи заявляют, что эта оценка не углубляется в способности к рассуждению моделей искусственного интеллекта, что резко контрастирует с ожиданиями, что общий искусственный интеллект может быть достигнут всего за несколько лет.
Исследователи разработали различные головоломки, чтобы превзойти стандартные математические показатели и протестировать "мыслительные" и "немыслищие" варианты Клода Сонне (Claude Sonnet), o3-mini и o1 от OpenAI, а также чат-ботов DeepSeek-R1 и V3.
Они обнаружили, что "передовые модели логического вывода (LRM) сталкиваются с полным крахом точности при превышении определенной сложности", не способны эффективно обобщать выводы, и их преимущества исчезают с увеличением сложности, что противоречит ожиданиям людей относительно возможностей общего искусственного интеллекта (AGI).
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
Исследователи Apple: основные модели ИИ все еще не могут достичь ожидаемого уровня вывода AGI
Сообщение Gate News bot: исследователи Apple в статье, опубликованной в июне под названием «Иллюзия мышления», отметили, что ведущие модели искусственного интеллекта (AGI) все еще испытывают трудности с рассуждениями, поэтому гонка по разработке общего искусственного интеллекта (AGI) все еще далека от завершения.
Статья указывает на то, что последние обновления основных крупных языковых моделей искусственного интеллекта (LLM) (например, ChatGPT от OpenAI и Claude от Anthropic) теперь содержат крупные модели вывода (LRM), однако их основные функции, расширенные возможности и ограничения «по-прежнему не полностью поняты».
Текущая оценка в основном сосредоточена на установленных математических и кодировочных эталонах, «подчеркивающих точность окончательного ответа». Однако исследователи заявляют, что эта оценка не углубляется в способности к рассуждению моделей искусственного интеллекта, что резко контрастирует с ожиданиями, что общий искусственный интеллект может быть достигнут всего за несколько лет.
Исследователи разработали различные головоломки, чтобы превзойти стандартные математические показатели и протестировать "мыслительные" и "немыслищие" варианты Клода Сонне (Claude Sonnet), o3-mini и o1 от OpenAI, а также чат-ботов DeepSeek-R1 и V3.
Они обнаружили, что "передовые модели логического вывода (LRM) сталкиваются с полным крахом точности при превышении определенной сложности", не способны эффективно обобщать выводы, и их преимущества исчезают с увеличением сложности, что противоречит ожиданиям людей относительно возможностей общего искусственного интеллекта (AGI).
Источник: Cointelegraph