Tin tức Gate bot, các nhà nghiên cứu của Apple đã chỉ ra trong một bài báo mang tên "Huyễn tưởng của suy nghĩ" được công bố vào tháng 6 rằng, các mô hình AI tiên tiến (AGI) vẫn gặp khó khăn trong việc suy luận, do đó, cuộc đua phát triển trí tuệ nhân tạo tổng quát (AGI) vẫn còn nhiều thách thức.
Bài viết chỉ ra rằng các mô hình ngôn ngữ lớn của trí tuệ nhân tạo chính thống (LLM) (chẳng hạn như ChatGPT của OpenAI và Claude của Anthropic) đã có các bản cập nhật mới nhất bao gồm các mô hình suy luận lớn (LRM), nhưng các chức năng cơ bản, các tính năng mở rộng và những hạn chế của chúng "vẫn chưa được hiểu đầy đủ".
Đánh giá hiện tại chủ yếu tập trung vào các tiêu chuẩn toán học và mã hóa đã được thiết lập, "nhấn mạnh độ chính xác của câu trả lời cuối cùng". Tuy nhiên, các nhà nghiên cứu cho biết, đánh giá này không đi sâu vào khả năng suy luận của các mô hình trí tuệ nhân tạo, điều này tạo ra sự tương phản rõ rệt với kỳ vọng rằng trí tuệ nhân tạo tổng quát chỉ cần vài năm để đạt được.
Các nhà nghiên cứu đã thiết kế những trò chơi trí tuệ khác nhau để vượt qua các tiêu chuẩn toán học cơ bản nhằm kiểm tra các biến thể "suy nghĩ" và "không suy nghĩ" của Claude Sonnet, o3-mini và o1 của OpenAI cũng như DeepSeek-R1 và V3.
Họ phát hiện ra rằng "các mô hình suy luận logic tiên tiến (LRM) sẽ đối mặt với sự sụp đổ hoàn toàn về độ chính xác khi đạt đến một mức độ phức tạp nhất định", không thể tổng quát hóa suy luận một cách hiệu quả, và lợi thế của chúng sẽ biến mất khi độ phức tạp tăng lên, điều này trái ngược với kỳ vọng của con người về khả năng của trí tuệ nhân tạo tổng quát (AGI).
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Nhà nghiên cứu Apple: Mô hình AI chính thống vẫn không thể đạt được mức độ suy luận mong đợi của AGI.
Tin tức Gate bot, các nhà nghiên cứu của Apple đã chỉ ra trong một bài báo mang tên "Huyễn tưởng của suy nghĩ" được công bố vào tháng 6 rằng, các mô hình AI tiên tiến (AGI) vẫn gặp khó khăn trong việc suy luận, do đó, cuộc đua phát triển trí tuệ nhân tạo tổng quát (AGI) vẫn còn nhiều thách thức.
Bài viết chỉ ra rằng các mô hình ngôn ngữ lớn của trí tuệ nhân tạo chính thống (LLM) (chẳng hạn như ChatGPT của OpenAI và Claude của Anthropic) đã có các bản cập nhật mới nhất bao gồm các mô hình suy luận lớn (LRM), nhưng các chức năng cơ bản, các tính năng mở rộng và những hạn chế của chúng "vẫn chưa được hiểu đầy đủ".
Đánh giá hiện tại chủ yếu tập trung vào các tiêu chuẩn toán học và mã hóa đã được thiết lập, "nhấn mạnh độ chính xác của câu trả lời cuối cùng". Tuy nhiên, các nhà nghiên cứu cho biết, đánh giá này không đi sâu vào khả năng suy luận của các mô hình trí tuệ nhân tạo, điều này tạo ra sự tương phản rõ rệt với kỳ vọng rằng trí tuệ nhân tạo tổng quát chỉ cần vài năm để đạt được.
Các nhà nghiên cứu đã thiết kế những trò chơi trí tuệ khác nhau để vượt qua các tiêu chuẩn toán học cơ bản nhằm kiểm tra các biến thể "suy nghĩ" và "không suy nghĩ" của Claude Sonnet, o3-mini và o1 của OpenAI cũng như DeepSeek-R1 và V3.
Họ phát hiện ra rằng "các mô hình suy luận logic tiên tiến (LRM) sẽ đối mặt với sự sụp đổ hoàn toàn về độ chính xác khi đạt đến một mức độ phức tạp nhất định", không thể tổng quát hóa suy luận một cách hiệu quả, và lợi thế của chúng sẽ biến mất khi độ phức tạp tăng lên, điều này trái ngược với kỳ vọng của con người về khả năng của trí tuệ nhân tạo tổng quát (AGI).
Nguồn tin: Cointelegraph