Gate News bot haberi, Apple araştırmacılarının Haziran ayında yayımladığı "Düşünmenin İllüzyonu" başlıklı çalışmada, önde gelen yapay zeka (AGI) modellerinin akıl yürütme konusunda hâlâ zorluklar yaşadığına dikkat çekilmiştir. Bu nedenle, genel yapay zeka (AGI) geliştirme yarışında hala kat edilmesi gereken uzun bir yol vardır.
Makale, ana akım yapay zeka büyük dil modelleri (LLM) (örneğin OpenAI'nin ChatGPT'si ve Anthropic'in Claude'u) için en son güncellemelerin büyük akıl yürütme modelleri (LRM) içerdiğini belirtmekte, ancak temel işlevlerinin, genişletilmiş özelliklerinin ve sınırlamalarının "hala tam olarak anlaşılamadığını" vurgulamaktadır.
Mevcut değerlendirme, öncelikle "nihai cevabın doğruluğunu vurgulayan" yerleşik matematik ve kodlama kriterlerine odaklanmaktadır. Bununla birlikte, araştırmacılar, değerlendirmenin, yapay genel zekanın sadece birkaç yıl içinde elde edileceği beklentisinin aksine, AI modellerinin akıl yürütme yetenekleri hakkında fikir vermediğini söyledi.
Araştırmacılar, Claude Sonnet, OpenAI'nin o3-mini ve o1 ile DeepSeek-R1 ve V3 sohbet robotlarının "düşünme" ve "düşünmeme" varyantlarını test etmek için standart matematik ölçütlerini aşan farklı bulmaca oyunları tasarladılar.
Onlar, "öncü mantıksal çıkarım modellerinin (LRM) belirli bir karmaşıklık seviyesini aştığında kesinlik oranının tamamen çökmekle karşılaşacağını", çıkarımı etkili bir şekilde genelleştiremeyeceğini ve avantajlarının karmaşıklık arttıkça kaybolacağını keşfettiler; bu da genel yapay zekaya (AGI) dair insanların beklentileriyle çelişiyor.
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
Apple araştırmacıları: Ana akım AI modelleri hala AGI beklentisi olan akıl yürütme seviyesine ulaşamıyor.
Gate News bot haberi, Apple araştırmacılarının Haziran ayında yayımladığı "Düşünmenin İllüzyonu" başlıklı çalışmada, önde gelen yapay zeka (AGI) modellerinin akıl yürütme konusunda hâlâ zorluklar yaşadığına dikkat çekilmiştir. Bu nedenle, genel yapay zeka (AGI) geliştirme yarışında hala kat edilmesi gereken uzun bir yol vardır.
Makale, ana akım yapay zeka büyük dil modelleri (LLM) (örneğin OpenAI'nin ChatGPT'si ve Anthropic'in Claude'u) için en son güncellemelerin büyük akıl yürütme modelleri (LRM) içerdiğini belirtmekte, ancak temel işlevlerinin, genişletilmiş özelliklerinin ve sınırlamalarının "hala tam olarak anlaşılamadığını" vurgulamaktadır.
Mevcut değerlendirme, öncelikle "nihai cevabın doğruluğunu vurgulayan" yerleşik matematik ve kodlama kriterlerine odaklanmaktadır. Bununla birlikte, araştırmacılar, değerlendirmenin, yapay genel zekanın sadece birkaç yıl içinde elde edileceği beklentisinin aksine, AI modellerinin akıl yürütme yetenekleri hakkında fikir vermediğini söyledi.
Araştırmacılar, Claude Sonnet, OpenAI'nin o3-mini ve o1 ile DeepSeek-R1 ve V3 sohbet robotlarının "düşünme" ve "düşünmeme" varyantlarını test etmek için standart matematik ölçütlerini aşan farklı bulmaca oyunları tasarladılar.
Onlar, "öncü mantıksal çıkarım modellerinin (LRM) belirli bir karmaşıklık seviyesini aştığında kesinlik oranının tamamen çökmekle karşılaşacağını", çıkarımı etkili bir şekilde genelleştiremeyeceğini ve avantajlarının karmaşıklık arttıkça kaybolacağını keşfettiler; bu da genel yapay zekaya (AGI) dair insanların beklentileriyle çelişiyor.
Kaynak: Cointelegraph