Nhà nghiên cứu Apple: Mô hình AI chính thống vẫn không thể đạt được mức độ suy luận mong đợi của AGI.

2025-06-09 04:37:02

Tin tức Gate bot, các nhà nghiên cứu của Apple đã chỉ ra trong một bài báo mang tên "Huyễn tưởng của suy nghĩ" được công bố vào tháng 6 rằng, các mô hình AI tiên tiến (AGI) vẫn gặp khó khăn trong việc suy luận, do đó, cuộc đua phát triển trí tuệ nhân tạo tổng quát (AGI) vẫn còn nhiều thách thức.

Bài viết chỉ ra rằng các mô hình ngôn ngữ lớn của trí tuệ nhân tạo chính thống (LLM) (chẳng hạn như ChatGPT của OpenAI và Claude của Anthropic) đã có các bản cập nhật mới nhất bao gồm các mô hình suy luận lớn (LRM), nhưng các chức năng cơ bản, các tính năng mở rộng và những hạn chế của chúng "vẫn chưa được hiểu đầy đủ".

Đánh giá hiện tại chủ yếu tập trung vào các tiêu chuẩn toán học và mã hóa đã được thiết lập, "nhấn mạnh độ chính xác của câu trả lời cuối cùng". Tuy nhiên, các nhà nghiên cứu cho biết, đánh giá này không đi sâu vào khả năng suy luận của các mô hình trí tuệ nhân tạo, điều này tạo ra sự tương phản rõ rệt với kỳ vọng rằng trí tuệ nhân tạo tổng quát chỉ cần vài năm để đạt được.

Các nhà nghiên cứu đã thiết kế những trò chơi trí tuệ khác nhau để vượt qua các tiêu chuẩn toán học cơ bản nhằm kiểm tra các biến thể "suy nghĩ" và "không suy nghĩ" của Claude Sonnet, o3-mini và o1 của OpenAI cũng như DeepSeek-R1 và V3.

Họ phát hiện ra rằng "các mô hình suy luận logic tiên tiến (LRM) sẽ đối mặt với sự sụp đổ hoàn toàn về độ chính xác khi đạt đến một mức độ phức tạp nhất định", không thể tổng quát hóa suy luận một cách hiệu quả, và lợi thế của chúng sẽ biến mất khi độ phức tạp tăng lên, điều này trái ngược với kỳ vọng của con người về khả năng của trí tuệ nhân tạo tổng quát (AGI).

Nguồn tin: Cointelegraph

AGI4.77%

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Chia sẻ

Bình luận

0/400

Không có bình luận

Chủ đề
1/3
1CandyDrop Airdrop Event 6.0
86565 Phổ biến
2White House Crypto Report
75662 Phổ biến
3Join Alpha RION Airdrop to Earn $40
61281 Phổ biến
4Fed Holds Rates Decision
9834 Phổ biến
5July Spark Program TOP 10 Creators Announced
3617 Phổ biến

Ghim

sơ đồ trang web