Dünya, en iyi temel modelleri inşa etme yarışında. Hesaplama gücü ve model mimarisi önemli olsa da, gerçek koruma duvarı eğitim verisidir. Bu ay AI dünyasında en büyük haber, Meta'nın gücünü göstermesi oldu; Zuckerberg, Çinli araştırmacılardan oluşan lüks bir AI ekibi kurmak için geniş çaplı personel alımı yaptı. Ekibin lideri 28 yaşındaki Alexander Wang; kurduğu Scale AI'nın değeri şu anda 29 milyar dolar ve ABD ordusu, OpenAI, Anthropic, Meta gibi rekabet eden birçok AI devine veri hizmeti sağlıyor. Scale AI'nın temel işi, büyük miktarda doğru etiketli veri sağlamaktır.
Scale AI'nın Başarı Yolu
Scale AI'nin birçok unicorn arasında öne çıkmasının nedeni, verinin AI endüstrisindeki önemini erken bir dönemde fark etmesidir.
Hesaplama gücü, model ve veri, AI modelinin üç ana direğidir. Büyük modeli bir insana benzetirsek, model bedeni, hesaplama gücü yiyeceği ve veri ise bilgiyi/bilgiyi temsil eder.
LLM'nin hızlı gelişimi sürecinde, sektördeki odak noktası modelden hesaplama gücüne kaydı. Şu anda çoğu model, çerçeve olarak transformer'ı oluşturdu ve arada MoE veya MoRe gibi yenilikler görülebiliyor; büyük oyuncular ya kendi süper hesaplama kümelerini kuruyor ya da bulut hizmet sağlayıcılarıyla uzun vadeli sözleşmeler imzalayarak hesaplama gücü sorununu çözmeye çalışıyor. Hesaplama gücünün temel ihtiyaçları çözüldükten sonra, verinin önemi giderek belirginleşiyor.
Scale AI, AI modelleri için sağlam bir veri temeli oluşturmayı amaçlamaktadır. İşleri yalnızca mevcut verilerin madenciliği ile sınırlı kalmayıp, aynı zamanda uzun vadeli veri üretim işine de odaklanmaktadır. Şirket, farklı alanlardan insan uzmanlardan oluşan AI eğitim ekipleri aracılığıyla AI modellerinin eğitimi için daha kaliteli veriler sunmaktadır.
Model eğitiminin iki aşaması
Model eğitimi, ön eğitimi ve ince ayar olmak üzere iki bölüme ayrılır.
Ön eğitim, insan bebeklerinin konuşmayı öğrenme sürecine benzer şekilde, AI modeline internette taranan metinler, kodlar ve diğer bilgilerin büyük bir miktarını girmeyi gerektirir. Bu sayede model, kendi kendine öğrenerek temel iletişim yeteneklerini kazanır.
İnce ayar, genellikle belirli doğru ve yanlışların, cevapların ve yönlerin olduğu bir okula gitmeye benzer. Farklı "okullar", farklı özelliklere sahip "yetenekler" geliştirecektir. Modelin istediğimiz yeteneklere sahip olmasını sağlamak için, bazı özenle hazırlanmış, hedefli veri setleri kullanıyoruz.
Bu nedenle, iki tür veriye ihtiyacımız var:
Çok fazla işleme gerektirmeyen devasa veriler, esas olarak büyük UGC platformlarından alınan web tarayıcı verileri, kamuya açık literatür veritabanları, şirket özel veritabanları vb. kaynaklardan gelmektedir.
Özenle tasarlanmış ve seçilmiş profesyonel veri setlerinin veri temizliği, seçimi, etiketleme, insan geri bildirimi gibi işlemlerden geçirilmesi gerekmektedir.
Bu iki veri seti, AI Data pisti için ana unsurları oluşturuyor. Şu anda genel olarak, hesaplama gücündeki avantajın yavaş yavaş kaybolmasıyla birlikte, verilerin büyük model üreticilerinin rekabet gücünü korumasında anahtar haline geleceği kabul ediliyor.
Model yeteneklerinin daha da artmasıyla, daha ince ve profesyonel eğitim verileri model yeteneklerini belirleyen anahtar faktör haline gelecektir. Model eğitimini bir dövüş sanatları ustası yetiştirmeye benzetirsek, kaliteli veri setleri en üst düzey dövüş sanatları kitaplarıdır.
Uzun vadede, AI Data, kümülatif etkisi olan uzun vadeli bir alan. Ön çalışmaların birikimi ile veri varlıkları bileşik faiz yeteneğine sahip olacak ve değeri zamanla artacaktır.
Web3 DataFi: AI Verisi için İdeal Toprak
Geleneksel veri şirketlerine kıyasla, Web3'ün AI veri alanında doğal bir avantajı vardır ve bu nedenle DataFi kavramı doğmuştur.
İdeal olarak, Web3 DataFi'nin avantajları şunlardır:
Akıllı sözleşmeler veri egemenliğini, güvenliğini ve gizliliğini sağlar.
Dağıtık mimari en uygun küresel iş gücünü çeker
Blok zinciri net teşvik ve uzlaşma avantajları sunar.
Verimli, açık bir tek duraklı veri pazarı oluşturmaya yardımcı olur.
Sıradan kullanıcılar için DataFi, katılımı en kolay merkeziyetsiz AI projesidir. Kullanıcılar yalnızca cüzdanlarına basit bir şekilde giriş yaparak, veri sağlama, modelleri değerlendirme, AI araçlarıyla basit yaratımlar yapma, veri ticaretine katılma gibi çeşitli görevleri tamamlayarak projeye katılabilirler.
Web3 DataFi'nin Potansiyel Projeleri
Şu anda birçok DataFi projesi büyük finansmanlar elde etti, aşağıda bazı temsilci projeler yer almaktadır:
Sahara AI: Merkeziyetsiz AI altyapısı ve ticaret pazarı oluşturmayı hedefliyor.
Yupp: AI model geri bildirim platformu, kullanıcıların model çıktıları hakkında değerlendirmelerini toplar.
Vana: Kullanıcı kişisel verilerini paraya dönüştürülebilir dijital varlıklara dönüştürme
Chainbase: Zincir üstü verilere odaklanır, 200'den fazla blok zincirini kapsar.
Sapien: İnsan bilgisini yüksek kaliteli AI eğitim verilerine dönüştürmek
Prisma X: Robotların açık koordinasyon katmanını inşa etmeye adanmıştır.
Masa: Bittensor ekosisteminin alt ağ projesi, gerçek zamanlı veri erişimi sağlar.
Irys: Programlanabilir veri depolama ve hesaplamaya odaklanıyor
ORO: Sıradan insanların AI katkısına katılmalarını sağlamak
Gata: Merkeziyetsiz veri katmanı, çeşitli veri katılım yolları sunar.
Bu projelerin şu anda genel olarak düşük engelleri var, ancak kullanıcılar ve ekosistem bağlılığı arttıkça, platform avantajı hızla oluşacaktır. Erken aşama projeleri, teşvikler ve kullanıcı deneyimi üzerinde yoğunlaşarak yeterli kullanıcıyı çekmelidir.
Aynı zamanda, bu platformların iş gücünü nasıl yöneteceklerine, veri kalitesini nasıl koruyacaklarına dikkat etmeleri gerekiyor. "Kötü para iyi parayı kovar" durumunun ortaya çıkmasını önlemek için. Sahara ve Sapien gibi bazı projeler, veri kalitesine vurgu yapmaya başladı ve platform kullanıcılarıyla uzun vadeli sağlıklı iş ilişkileri kurmaya çalışıyor.
Ayrıca, şeffaflığın artırılması da günümüzdeki blok zinciri projelerinin karşılaştığı bir zorluktur. Birçok projenin, Web3 DataFi'nin uzun vadeli sağlıklı gelişimini teşvik etmek için açık ve şeffaf olma yolunda hızlanması gerekmektedir.
DataFi'nin büyük ölçekli benimsenmesi iki açıdan ilerletilmelidir: birincisi, veri toplama/üretimine katılacak yeterli sayıda bireysel kullanıcının çekilmesi, AI ekonomisinin tüketici grubunu oluşturması; ikincisi, ana akım işletmelerin onayını almak, çünkü kısa vadede bunlar veri büyük siparişlerinin ana kaynağıdır.
Sonuç
Bir açıdan bakıldığında, DataFi, insan zekasını uzun vadede makine zekasını geliştirmek için kullanırken, akıllı sözleşmeler aracılığıyla insan zekasının emeğinin karşılığını güvence altına alır ve nihayetinde makine zekasının geri dönüşümünden faydalanır.
AI çağında belirsizlik içinde olanlar veya blockchain alanında hala idealleri olanlar için, sermaye devlerinin izinden giderek DataFi'ye katılmak, bir fırsatı değerlendirmek için iyi bir seçim olabilir.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
16 Likes
Reward
16
4
Share
Comment
0/400
SneakyFlashloan
· 23h ago
Aman Tanrım, 28 yaşında 290 milyar, ben de biraz çaba göstermeliyim.
View OriginalReply0
MetaMuskRat
· 23h ago
Yine Zack bir şeyler yapıyor, gülmekten ölüyorum.
View OriginalReply0
NftDataDetective
· 23h ago
zuck sonunda anlıyor gibi görünüyor... veri yeni petrol fr fr
View OriginalReply0
AirdropChaser
· 23h ago
Dönerken gerçekten zengin bir proje var, artık konum almak zamanı.
DataFi: Web3, AI veri varlıklaştırma yeni trendini yönlendiriyor
Veri Varlık: DataFi Yeni Mavi Okyanusu Açıyor
Dünya, en iyi temel modelleri inşa etme yarışında. Hesaplama gücü ve model mimarisi önemli olsa da, gerçek koruma duvarı eğitim verisidir. Bu ay AI dünyasında en büyük haber, Meta'nın gücünü göstermesi oldu; Zuckerberg, Çinli araştırmacılardan oluşan lüks bir AI ekibi kurmak için geniş çaplı personel alımı yaptı. Ekibin lideri 28 yaşındaki Alexander Wang; kurduğu Scale AI'nın değeri şu anda 29 milyar dolar ve ABD ordusu, OpenAI, Anthropic, Meta gibi rekabet eden birçok AI devine veri hizmeti sağlıyor. Scale AI'nın temel işi, büyük miktarda doğru etiketli veri sağlamaktır.
Scale AI'nın Başarı Yolu
Scale AI'nin birçok unicorn arasında öne çıkmasının nedeni, verinin AI endüstrisindeki önemini erken bir dönemde fark etmesidir.
Hesaplama gücü, model ve veri, AI modelinin üç ana direğidir. Büyük modeli bir insana benzetirsek, model bedeni, hesaplama gücü yiyeceği ve veri ise bilgiyi/bilgiyi temsil eder.
LLM'nin hızlı gelişimi sürecinde, sektördeki odak noktası modelden hesaplama gücüne kaydı. Şu anda çoğu model, çerçeve olarak transformer'ı oluşturdu ve arada MoE veya MoRe gibi yenilikler görülebiliyor; büyük oyuncular ya kendi süper hesaplama kümelerini kuruyor ya da bulut hizmet sağlayıcılarıyla uzun vadeli sözleşmeler imzalayarak hesaplama gücü sorununu çözmeye çalışıyor. Hesaplama gücünün temel ihtiyaçları çözüldükten sonra, verinin önemi giderek belirginleşiyor.
Scale AI, AI modelleri için sağlam bir veri temeli oluşturmayı amaçlamaktadır. İşleri yalnızca mevcut verilerin madenciliği ile sınırlı kalmayıp, aynı zamanda uzun vadeli veri üretim işine de odaklanmaktadır. Şirket, farklı alanlardan insan uzmanlardan oluşan AI eğitim ekipleri aracılığıyla AI modellerinin eğitimi için daha kaliteli veriler sunmaktadır.
Model eğitiminin iki aşaması
Model eğitimi, ön eğitimi ve ince ayar olmak üzere iki bölüme ayrılır.
Ön eğitim, insan bebeklerinin konuşmayı öğrenme sürecine benzer şekilde, AI modeline internette taranan metinler, kodlar ve diğer bilgilerin büyük bir miktarını girmeyi gerektirir. Bu sayede model, kendi kendine öğrenerek temel iletişim yeteneklerini kazanır.
İnce ayar, genellikle belirli doğru ve yanlışların, cevapların ve yönlerin olduğu bir okula gitmeye benzer. Farklı "okullar", farklı özelliklere sahip "yetenekler" geliştirecektir. Modelin istediğimiz yeteneklere sahip olmasını sağlamak için, bazı özenle hazırlanmış, hedefli veri setleri kullanıyoruz.
Bu nedenle, iki tür veriye ihtiyacımız var:
Çok fazla işleme gerektirmeyen devasa veriler, esas olarak büyük UGC platformlarından alınan web tarayıcı verileri, kamuya açık literatür veritabanları, şirket özel veritabanları vb. kaynaklardan gelmektedir.
Özenle tasarlanmış ve seçilmiş profesyonel veri setlerinin veri temizliği, seçimi, etiketleme, insan geri bildirimi gibi işlemlerden geçirilmesi gerekmektedir.
Bu iki veri seti, AI Data pisti için ana unsurları oluşturuyor. Şu anda genel olarak, hesaplama gücündeki avantajın yavaş yavaş kaybolmasıyla birlikte, verilerin büyük model üreticilerinin rekabet gücünü korumasında anahtar haline geleceği kabul ediliyor.
Model yeteneklerinin daha da artmasıyla, daha ince ve profesyonel eğitim verileri model yeteneklerini belirleyen anahtar faktör haline gelecektir. Model eğitimini bir dövüş sanatları ustası yetiştirmeye benzetirsek, kaliteli veri setleri en üst düzey dövüş sanatları kitaplarıdır.
Uzun vadede, AI Data, kümülatif etkisi olan uzun vadeli bir alan. Ön çalışmaların birikimi ile veri varlıkları bileşik faiz yeteneğine sahip olacak ve değeri zamanla artacaktır.
Web3 DataFi: AI Verisi için İdeal Toprak
Geleneksel veri şirketlerine kıyasla, Web3'ün AI veri alanında doğal bir avantajı vardır ve bu nedenle DataFi kavramı doğmuştur.
İdeal olarak, Web3 DataFi'nin avantajları şunlardır:
Sıradan kullanıcılar için DataFi, katılımı en kolay merkeziyetsiz AI projesidir. Kullanıcılar yalnızca cüzdanlarına basit bir şekilde giriş yaparak, veri sağlama, modelleri değerlendirme, AI araçlarıyla basit yaratımlar yapma, veri ticaretine katılma gibi çeşitli görevleri tamamlayarak projeye katılabilirler.
Web3 DataFi'nin Potansiyel Projeleri
Şu anda birçok DataFi projesi büyük finansmanlar elde etti, aşağıda bazı temsilci projeler yer almaktadır:
Bu projelerin şu anda genel olarak düşük engelleri var, ancak kullanıcılar ve ekosistem bağlılığı arttıkça, platform avantajı hızla oluşacaktır. Erken aşama projeleri, teşvikler ve kullanıcı deneyimi üzerinde yoğunlaşarak yeterli kullanıcıyı çekmelidir.
Aynı zamanda, bu platformların iş gücünü nasıl yöneteceklerine, veri kalitesini nasıl koruyacaklarına dikkat etmeleri gerekiyor. "Kötü para iyi parayı kovar" durumunun ortaya çıkmasını önlemek için. Sahara ve Sapien gibi bazı projeler, veri kalitesine vurgu yapmaya başladı ve platform kullanıcılarıyla uzun vadeli sağlıklı iş ilişkileri kurmaya çalışıyor.
Ayrıca, şeffaflığın artırılması da günümüzdeki blok zinciri projelerinin karşılaştığı bir zorluktur. Birçok projenin, Web3 DataFi'nin uzun vadeli sağlıklı gelişimini teşvik etmek için açık ve şeffaf olma yolunda hızlanması gerekmektedir.
DataFi'nin büyük ölçekli benimsenmesi iki açıdan ilerletilmelidir: birincisi, veri toplama/üretimine katılacak yeterli sayıda bireysel kullanıcının çekilmesi, AI ekonomisinin tüketici grubunu oluşturması; ikincisi, ana akım işletmelerin onayını almak, çünkü kısa vadede bunlar veri büyük siparişlerinin ana kaynağıdır.
Sonuç
Bir açıdan bakıldığında, DataFi, insan zekasını uzun vadede makine zekasını geliştirmek için kullanırken, akıllı sözleşmeler aracılığıyla insan zekasının emeğinin karşılığını güvence altına alır ve nihayetinde makine zekasının geri dönüşümünden faydalanır.
AI çağında belirsizlik içinde olanlar veya blockchain alanında hala idealleri olanlar için, sermaye devlerinin izinden giderek DataFi'ye katılmak, bir fırsatı değerlendirmek için iyi bir seçim olabilir.