"Wen Xin Yi Yan" yayınlandıktan sonraki 24. saatte, Shen Dou verilere bakmak için arka plana gitti ve Wen Xin Yi Yan'ın kullanıcılardan gelen "33,42 milyon" soruyu beklentilerini aşan bir şekilde yanıtladığını gördü.
İki gün sonra Shen Dou, ben de dahil olmak üzere birçok medya profesyoneliyle görüştü ve şunları söyledi: "Biz de eğlenceyi izleyenlerin sayısının azaldığını düşünüyorduk ancak kullanıcıların coşkusunun aynı kalmasını beklemiyorduk."
Eylül ayında, Çin'in büyük model çılgınlığı yarım yıl boyunca devam ederken, sıradan insanlar nihayet başlama şansı buldu.
31 Ağustos'tan itibaren "Wen Xin Yi Yan" da dahil olmak üzere bir dizi büyük model başvuruyu geçti ve resmi olarak halka açıldı. Bu haber, kullanıcıları denemek için heyecanlandırmakla kalmadı, aynı zamanda şirketlerin de coşkulu tepkilerine yol açtı. **Shen Dou, Wenxin Yiyan'ın açıldığı gün Baidu Akıllı Bulut Qianfan büyük ölçekli model platformundaki günlük aktif şirket sayısının %40'tan fazla arttığını söyledi. ——İkincisi, Baidu'nun işletmeler için başlattığı büyük ölçekli bir model geliştirme ve yönetim platformudur. **
Büyük modeller çağında Baidu, büyük modellerin bireyler ve işletmeler tarafından aynı zaman çizelgesinde kullanılmasını teşvik etmeyi umuyor. Makro açıdan bakıldığında bu, büyük modellerin en son teknolojisinin yaygınlaşmasına yardımcı oluyor. Şirket açısından bakıldığında bu, Baidu'nun kendi işini yapmasına yardımcı oluyor. C tarafı kullanıcılarının ticari değeri hemen belli olmasa da, B tarafı müşterilerinin ticari değeri doğrudan model API planlama ücretlerine ve bulut bilişim gelirine yansır.
Uzun yıllardır Baidu Mobil Ekosistemi'nden (MEG) sorumlu olan Shen Dou, geçen yılın mayıs ayında Baidu Akıllı Bulut Grubu'nun (ACG) başkanlığına atandı. Grubun ondan beklentisi, AIGC döneminin fırsatlarını yakalamak ve akıllı bulutu Baidu'nun ikinci büyüme eğrisine yerleştirmektir.
Ancak Shen Ji'nin karşılaştığı durum çok zordu. Baidu, Çin'deki en büyük bulut bilişim tedarikçisi olmasa da yapay zeka ile ilgili hizmetler konusunda genel bulutta yalnızca önde yer alıyor. O zamanlar Shen Dou, tüm bulut hizmetinin büyümesini sağlamak için yapay zekayı kullanmayı umuyordu.Ne yazık ki o dönemde yapay zeka yetenekleri çok "parçalanmış"tı ve mevcut yüksek hizmet maliyetleri durumundan kurtulamıyordu. ölçek büyütmede zorluk ve yetersiz kar.
Ancak birkaç ay sonra büyük modellerin çağı geldi. Rekabet açısından bakıldığında, eskiden IaaS (Hizmet Olarak Altyapı) ve PaaS'nin (Hizmet Olarak Platform) hakim olduğu temel bulut hizmetleri, yerini yapay zekanın hakim olduğu MaaS (Hizmet Olarak Model) gibi bulut hizmetlerine bırakıyor . Shen Dou, bunun Baidu Akıllı Bulut'un "bir virajı geçme" fırsatı olduğuna inanıyor.
Gelir açısından bakıldığında, büyük modellerin evrensel yetenekleri, bulut hizmetlerinin daha standart hale getirilmesine olanak tanıyarak farklı senaryolarda büyük ölçekli yeniden kullanıma olanak tanır, hizmet maliyetlerini azaltır ve karı artırır. Bu nedenle Baidu yönetimi, yatırımcılara 2023'ün ikinci çeyreğindeki kazançların, yapay zeka ve büyük modellerin Baidu Akıllı Bulut'un daha yüksek kar marjları elde etmesine olanak sağlayacağını söylediğini söyledi.
**Geek Park'ın düzenlediği Shen Dou ile söyleşimizin tam metni aşağıdadır. **
Resim kaynağı: Sınırsız Yapay Zeka tarafından oluşturulmuştur
01 C tarafında Wenxin Yiyan ve B tarafında Qianfan platformu, iki tarafıyla başarılı bir platform
**S: Eğlenceyi izledikten sonra artık pratik bir şeyler yapmanın zamanı geldi. İki gün önce Baidu, Wen Xinyiyan'ı C tarafında açtı. Bu kullanıcı kullanım verileri hakkında ne düşünüyorsunuz? Beklenen mi, beklenmeyen mi? Arka uç işletim ve bakım yetenekleri nelerdir? **
Shen Dou: Verileri o gece saat 12:30'da gruba gönderdim ve meslektaşlarım verileri ertesi gün yayınladılar. Veriler tarafımdan sistemden alınarak dış dünyaya bozulmadan sunulmuştur, kesinlikle doğrudur.
Başlangıçta "heyecanı izleyen" insan sayısının daha az olduğunu düşünmüştük, dolayısıyla beklentilerimiz o kadar da yüksek değildi. Beklenmedik bir şekilde o gün 33,42 milyon yanıt geldi, bu da kullanıcıların Wen Xinyiyan'a dair beklentilerinin yüksek olduğunu gösteriyor. Herkes bir iki soru sorup ardından ayrılmadı, ancak birçok diyalog turundan geçti. Bu açıdan bakıldığında kullanıcıların heyecanı hala devam ediyor.
Wen Xinyiyan, 16 Mart'tan bu yana beş veya altı aydır dahili testlerde bulunuyor ve bu bize hem etki iyileştirme hem de maliyet azaltma açısından yeterli hazırlık süresi sağladı. Örneğin, Wenxin büyük modelinin çıkarım hızı, orijinaliyle karşılaştırıldığında 30 kattan fazla artırıldı, bu da çıkarım maliyetini büyük ölçüde azalttı ve bu kadar çok sayıda kullanıcıyla başa çıkmamıza olanak sağladı.
**S: Yani Baidu'nun büyük modelinin bu dönemdeki teknik ilerlemesi aynı zamanda maliyet ilerlemesini de içeriyor mu? **
**Shen Dou:**Evet, büyük modelin kendisi kaynak yoğun bir teknik paradigmadır.
Trafiğin bu kadar büyük olacağını ilk başta beklemiyorduk.Makine (bilgi işlem gücü) kaynağının kendisi çok değerli.Çok fazla makine koymanın israf olacağını düşündük, bu yüzden çok fazla ekstra makine koymadık. O günkü kullanıcı sayısındaki artıştan sonra, çok şükür, muhakeme performansımız arttığı için, kullanıcılara hala istikrarlı hizmetler sunuyoruz.
Ayrıca elimizde iyi bir bilgi işlem gücü rezervi var ve gelecekte de eğitim ve muhakeme maliyetlerini düşürmeye devam edeceğiz, böylece kullanıcı ihtiyaçlarının karşılanmasında herhangi bir sorun yaşanmaz. O dönemde kendi iç grubumuzda trafiğe karşı direnilip direnilemeyeceğini tartıştık. Trafiği şiddetlendirmenin mutluluk belası olduğunu söyledim.
**S: Wenxin Yiyan'ın C tarafında serbest bırakılmasının Baidu'ya faydaları nelerdir? **
Shen Ji: C tarafına açılmanın ticari değer getirip getiremeyeceği, sürdürülebilir bir konu olup olmadığı konusunda endişeleniyor olabilirsiniz.
Aslında kullanıcılar için gerçekten değer yaratıldığı sürece ticarileşme sadece zaman meselesidir. Teknolojik gelişme tarihinde değerli ancak gerçekleştirilmesi zor olan çok az örnek vardır. Wen Xinyiyan gerçekten de C-son kullanıcılarına gerçek değer kattı.Dün, Wenxinyiyan olmasaydı ofis verimliliğinin düşeceğini söyleyen bazı yorumlar gördüm. Dolayısıyla değerli olduğu sürece Wenxinyiyan'ın gelecekte ticarileşmesi doğal olarak gelecektir.
**S: Çin Büyük Modelinin C-end ürün formu ChatGPT ile tutarlı olacak mı? Abonelik ücreti mi? **
Shen Dou: Büyük modellerin ürün formundan bahsetmek için henüz çok erken ve tanımı da henüz bu kadar net değil.
Mobil İnternet ortaya çıkmaya başladığında, bunu açıkça tanımlamak için SoLoMo (Sosyal, Yerel, Mobil, daha iyi bir kullanıcı deneyimi sağlamak için sosyal medyayı, coğrafi konum hizmetlerini ve mobil terminal cihazlarını kullanma) gibi birkaç anahtar kelime kullanabilirdik. Ancak şu anda büyük model birkaç net kelimeyle tanımlanamaz. Yetenekleri daha güçlü ama sınırları da daha geniş ve ürün biçimi üzerinde birleşmenin zamanı henüz çok uzak.
OpenAI teknoloji odaklı bir şirkettir ve kullanıcı deneyimi aslında onun güçlü noktası değildir. Bugün tasarladığı ürün formu henüz başlangıç aşamasında, sonrasında ürünün iterasyon hızı çok hızlı olacak ve form büyük ölçüde değişecek.
**S: ChatGPT'nin C-son kullanıcılarından abonelik ücreti alma iş modeli Çin'de uygulanabilir mi? **
Shen Dou: Reklamcılık, e-ticaret ve oyunlardan oluşan üç yaygın para kazanma yöntemi gibi yeni para kazanma yöntemleri geliştirebiliriz.
Bir asistanı işe almak için ayda 2.000 yuan harcamaya hazırsanız, o zaman yapay zeka bir asistanın yapabileceğinin 1/10'unu yapabiliyorsa (seyahat planları yapmanıza, uçak bileti ve otel rezervasyonu yapmanıza ve hatta taksi çağırmayı harekete geçirmenize yardımcı olmak gibi) ve yemek dağıtım uygulamaları, tamam mı? İki yüz yuan harcamaya hazır mısınız? Ancak bunun gerçekleşme yolu mutlaka üyelik ücreti olmak zorunda değildir, işlem komisyonları veya başka yöntemler olabilir.
Başka bir örnek olarak, oyundaki bir grup NPC karakteri üretken yapay zeka tarafından yönlendiriliyor ve e-ticaret alanındaki "dijital insanların" canlı yayını da üretken yapay zeka tarafından destekleniyor ve bu da farklı para kazanma yöntemlerine yol açabilir. Sonuçta C ucunun ürün formu onun gerçekleştirilme yöntemini belirler.
**S: Eğer C-end ürünü sonuçta bir üretkenlik aracı ise, şirketin bireye değil bireye ödeme yapması mümkün müdür? **
Shen Dou: Bu mümkün. Örneğin Baidu Netdisk aynı zamanda bir verimlilik aracı olarak da değerlendirilebilir ve birçok şirket, çalışanlarının kullanması için Netdisk hesapları satın alacaktır. Ayrıca şirketlerle temasa geçtik ve her çalışana program yazması için bir Copilot hesabı atadık. Bunların hepsi şirketlerin bireyler adına fatura ödediği durumlardır.
"Wen Xin Yi Yan" arayüzü
**S: Bir içerik şirketi olarak makale üretmek için özellikle büyük modeller kullanmak istiyoruz. To B'nin büyük model hizmet platformu "Qianfan"ı yeni başlattınız. "Qianfan"ı başlatmanın arka planı nedir? Sıfır programcıya sahip şirketlerin büyük modelleri devreye almasına nasıl yardımcı olabiliriz? **
Shen Ji: Bu çok güzel bir soru. Aslında Qianfan Platformunu da bu yüzden yapıyoruz.
Büyük modelin bu kez B tarafına inmesinin özelliği, büyük şirketlerin ilk sırada yer alması ve müşterilerin çoğunun finans kurumları, enerji kurumları, eğitim kurumları vb. olmasıdır. Özel olarak dağıtılmaları gerektiği gibi bariz bir özellikleri var, ancak eşik çok yüksek ve modeli yinelemek için bir grup teknisyeni eğitmek zorundalar, bu da büyük modelin yürürlüğe girme süresini yavaşlatabilir.
Aksine, birçok küçük ve orta ölçekli şirket gibi, büyük olasılıkla (platform tabanlı) bir SaaS ürününü veya genel bulutları hariç tutmayacaksınız. Qianfan platformu böyle bir üründür. Kuruluşlar doğrudan API'leri arayabilir veya neredeyse hiç kod kullanmadan kendi modellerini oluşturmak için eğitim örneklerinde ince ayar yapabilir. **Qianfan'ın amacı, büyük modellerin dağıtım eşiğini düşürmek ve büyük modellerin yaygın uygulamasını teşvik etmektir. **
**S: Görünüşe göre siz ve OpenAI'nin yolları farklı. OpenAI önce C-end ürünü ChatGPT'yi piyasaya sürdü ve ardından yavaş yavaş B-end ürününü piyasaya sürerken Baidu hem C-end'i hem de B-end'i yan yana ilerletiyor. Bu fark neden var? **
**Shen Dou: **Teknolojinin kabul edilme sorunları var ve daha fazla kullanıcının onu gerçekten kullanması ve değerini bulması gerekiyor. Herkes büyük modellerden bahsediyor ama kaç kişi gerçekten büyük modelleri kullandı? B tarafı kurumsal müşteriler, büyük modellerin tüm üretim paradigmaları üzerindeki potansiyel etkisinin daha fazla farkındalar ve bunları daha fazla kullanmaları gerekiyor.
Ancak genel bulut API'lerini kullanmıyorlarsa veya deneyimlemek ve denemek için kendi ortamlarını kurmuyorlarsa, o zaman oradaki tamamen hayal ürünüdür. Bu yüzden Qianfan'ı yapıp önce büyük modeli kullanmalarına izin vermeliyiz. Hatta büyük modelin çepeçevre açılması konusunda C tarafı uzun süredir bekliyordu, B tarafı da uzun süredir bekliyordu. Sadece B tarafı ticarileşmeye daha yakın.
**S: Wenxin'in serbest bırakılmasının ardından Qianfan platformunun B tarafı talebi ne kadar arttı? **
Shen Ji: Wenxin Yiyan'ın açıldığı gün, Baidu Akıllı Bulut Qianfan büyük ölçekli model platformundaki günlük aktif girişimlerin sayısı %40'tan fazla arttı, biraz daha iyi.
Gevşeme yalnızca C tarafındaki verileri artırmakla kalmayacak, aynı zamanda B tarafındaki verileri de artıracaktır. Çünkü bu, B tarafı şirketlerinin maliyetleri azaltmasına ve yinelemeleri hızlandırmasına yardımcı olacaktır (not: yerli modelleri kullanmak daha ucuz ve daha uygundur).
Ancak veri büyümesi açısından B tarafı şimdilik C tarafı kadar iyi değil. Bugün, birinin B tarafında "Wen Xin Yi Yan"ı kullanmak istediğini varsayalım. API'yi çağırmak yerine, ilk önce onu deneyimlemek için C tarafına gidebilir. Deneyimin iyi olduğunu düşündüğünde bunu Qianfan üzerinde kullanacak. B tarafının kullanılmasını sağlamak bir uygulama sürecini gerektirir.
**S: C tarafı ile B tarafı el ele giderse önceliği nasıl belirlersiniz? Odaklanma esas olarak C tarafında mı yoksa B tarafında mı? **
Shen Shake: Önceliğin yalnızca kaynak çakışması olduğunda ayarlanması gerekir. Büyük modelin özelliği, alt kısmında evrensel olan çok kalın bir katmana sahip olmasıdır; bu nedenle, ister B'ye ister C'ye olsun, üzerinde uygulamalar bulmak, Baidu'nun el ele yapmak istediği şeydir. Kaynak çatışması yok.
C tarafında Baidu, büyük modelleri uygulayabilecek ürün formlarını ve iş modellerini aktif olarak araştırıyor. Baidu'nun C-end ürünlerini büyük modellere göre yeniden yapılandırması gerekiyor.Örneğin, Baidu'nun kendi ürün verilerinden Baidu Netdisk, Baidu Kütüphanesi ve diğer ürünlere bakılırsa, büyük modellere göre yeniden yapılanma sonrasında kullanıcı yapışkanlığı ve üyelik ödeme oranları çok yüksek. İyileştirme; yeni oluşturulan Wenxin Yiyan APP ve yeniden yapılandırılan Baidu Arama da büyük model uygulamalara yeni girişler haline geldi. B tarafında, Baidu Smart Cloud, en iyi büyük ölçekli model platformunu oluşturarak To B pazarına iyi bir şekilde hizmet ediyor.
**S: Aslında en evrensel temel bulut bilişiminizdir. İster iç müşterilere, ister dış müşterilere hizmet veriyor olun, bu sizin başarınızdır. **
Shen Dou: Evet, eğer iç müşterilere iyi hizmet verirseniz, dış müşterilere de iyi hizmet verirsiniz. Eğer dış müşterilere iyi hizmet verirseniz, iç müşterilere de iyi hizmet verirsiniz. MaaS'ın güzelliği de budur. Aksi takdirde, dış ve iç teknoloji yığınlarının tamamen iki set olduğunu varsayarsak, maliyet çok yüksek olacaktır.
İki ayak üzerinde yürüyoruz. Baidu kesinlikle gişe rekorları kıran bir To C ürünü yapmayı umuyor, ancak aynı zamanda temeldeki büyük model ve bilgi işlem gücü aracılığıyla daha fazla şirket ve geliştiricinin iyi To C uygulamaları oluşturmasını desteklemeye de çok istekliyiz. Aslında yukarıda kim başarılı olursa olsun, bu, altta yatan büyük modelin başarısıdır.
02 Büyük modeller acımasız bir eleme rekabeti başlatıyor ve açık kaynaklı modellerin geleceği endişe verici
**S: Wen Xinyiyan'a ek olarak Qianfan platformu başka modelleri de piyasaya sürdü. Qianfan ile Hugging Face gibi model toplama platformları arasındaki fark nedir? **
Shen Dou: Şu anda veya uzun bir süredir, ister modelin sahneye uyarlanabilirliği, ister müşterilerin psikolojik ihtiyaçları nedeniyle olsun, şirketler farklı modeller denemeyi umuyor. Bu açıdan bakıldığında üçüncü parti modelleri de sağlamamız gerekiyor.
Ancak her model denemeye değer değildir, bu da büyük bir kaynak israfı anlamına gelir. Bu nedenle Qianfan'ın kendi tarama ilkeleri vardır ve ortaya koyduğumuz modeller nispeten mükemmel ve kullanımı kolaydır.
**S: Yani Hugging Face bir topluluk olarak mı konumlandırılıyor, Qianfan da bir platform olarak mı? **
Shen Dou: Doğru. Qianfan yalnızca model seçme sorununuzu çözmekle kalmıyor, aynı zamanda modeli fiilen kullanma sorununuzu da çözüyor. Bunu kullanmak aynı zamanda veri, eğitim, ayarlama, mühendislik ve uygulama oluşturma gibi bir dizi konuyu da içerir ve maliyet ve verimliliği tamamen dikkate alır. Qianfan, Qianfan ve Hugging Face arasındaki fark olan tek elden hizmet sağlıyor.
Hugging face modeli yeterli genişliğe sahip ve bulut satıcılarının doğal avantajlarına dayanan Qianfan, operasyon için yeterli alana sahip ve ayrıca uçtan uca eğitim ve çıkarım performansı optimizasyonu da gerçekleştirebiliyor. Örneğin, eğitim sürecinin hızlandırılması, hataların hızlı algılanması, konumlandırılması ve kurtarılması; Baidu'nun devasa heterojen bilgi işlem kümesinin ölçeklenebilirliğine dayanan muhakeme sürecinde, çok iyi bir kaynak esnekliğine sahiptir ve ayrıca sunucusuz hizmetler sunarak müşterilere olanak sağlar. düşük maliyetli Altyapı maliyetleri, işletme ve bakım gerektirmemesi ve yüksek ölçeklenebilirlik avantajları elde etmek. Qianfan'ın Hugging Face'ten daha derine indiği yer burasıdır.
Baidu Akıllı Bulut Qianfan büyük ölçekli model platformu | Görüntü kaynağı: Baidu Akıllı Bulut resmi web sitesi
**S: Açık kaynak modeli konusunda pek iyimser görünmüyorsunuz ancak açık kaynak, büyük modellerin işletmelere dağıtılmasının maliyetini azaltıyor, dolayısıyla bunun anlamsız olduğu söylenemez. Açık kaynak modeli hakkında tam olarak ne düşünüyorsunuz? **
**Shen Dou:**LLaMA'nın maliyetini kimin karşılayacağını düşünüyorsunuz (Not: Facebook'un açık kaynaklı büyük modeli)? Bu Facebook. Facebook'un maliyetini kim paylaşacak? **Eğer bu sorunun son noktasını anlayamıyorsanız o zaman (açık kaynak) kaynağı olmayan su, kökü olmayan ağaçtır ve bir gün mutlaka sorunlar çıkacaktır. **
Çünkü bu, geleneksel açık kaynaklı yazılımlardan farklıdır.Geçmişte, kişinin açık kaynağa yaptığı yatırım, kendi zaman maliyetiydi. Ancak günümüzde bir kişi açık kaynaklı büyük modeller açmak isterse makinelerin ve verilerin maliyeti çok yüksektir.
**S: Sevgiyi elektrik üretmek için kullanabilirsiniz ama sevgiyi hesaplamak için kullanamazsınız. **
Shen Dou: Evet, bir eğitim turu için on milyonları buna harcamanız gerekiyor.
Günümüzün geleneksel açık kaynak oynanışına biraz benzeyen şey, hepsinin kullanıcıların dikkatini çekmek için açık kaynak kullanması ve sonuçta diğer (kapalı kaynak) büyük modelleri seçmeyi ummasıdır.
**S: Red Hat ve IBM'e benzer bir ilişkiye sahip olmak mümkün mü (Not: 2018'de IBM, dünyanın en büyük açık kaynak şirketi olan Red Hat'i satın aldığını duyurdu)? Peki ya IBM gibi varlıklı işletme sahipleri açık kaynağı desteklemeye istekliyse? Bu sayede açık kaynak finansal ve veri desteğine sahip olacaktır. **
Shen Dou: Açık kaynak kesinlikle uzun bir süre var olacak. Büyük modeller giderek daha fazla ilgi gördükçe, hükümetler ve işletmeler bu alandaki araştırmaları desteklemek ve tüm pazarda eğitimi teşvik etmek için bağışta bulunabilirler. Ama sonuçta ne kadar değer üretebilir? Ana akım haline gelmemesi veya tam bir kapalı döngü iş modeli oluşturmama ihtimalinin yüksek olduğunu düşünüyorum.
Geleneksel yazılım geliştirme kapalı bir döngü oluşturabilir. Örneğin, bir kod parçası yazarsanız veya bir işlevi yükseltirseniz, hızlı bir şekilde kontrol edebilirsiniz ve tüm açık kaynak yazılımın yetenekleri anında geliştirilir. Ancak LLaMA bugün piyasaya sürüldükten sonra kaç kişi kullanıyor olursa olsun kontrol edilemiyor. Veriler, bilgi işlem gücü ve yetenekler geri alınamıyor ve kapalı bir döngü oluşturulamıyor.
**S: Birçok açık kaynak okulu, açık kaynak modelinin trilyonlarca parametre okuduğuna inanıyor. Kapalı kaynak modeli kadar iyi olmasa da yine de oldukça kullanışlı. Tıpkı modelin kendisinde 985 ve 211 dereceleri olmadığı gibi en azından daha dikey ince ayar için kullanılabilecek profesyonel düzeyde. **
Shen Dou: Temel Modeli gelişmeli mi? Bugünkü Vakıf Modeli zaten çok iyiyse ve değiştirilmesine de gerek yoksa sorun yok. Ama bugünkü durum, Temel Model'in sadece 60 puanı var ve bizim 90 ya da 95 puan almaya çalışmamız gerekiyor.
**S: Neden ilerleme? Pek çok şirketin asıl düşüncesi GPT3.0'ın sorunu zaten çözebileceği yönünde, peki ilerlemenin anlamı nedir? **
Shen Dou: Bu çok güzel bir soru ve bunu şirket içinde de tartıştık. Bugün Temel Modeli 60 puana ulaştığında sorunun büyük bir kısmını çözebiliyor ama yine de mükemmel çözümle arasında büyük bir uçurum var. Ve insan doğasının talebi şudur ki, eğer bunu bir defada çözmeme izin verirseniz, bunu asla iki defada yapmayacağım.
Bugün Temel Modelde sadece 60 puana dayanarak 85 puan antrenmanı yaptınız. Bundan sonra Vakıf Modeli 85 puana ulaştı, 95 puan alabilir misin? Bu konuda insanoğlunun arayışının sınırı yoktur.
Bu limit mutlaka yukarıya doğru itilmeye devam edecektir. Örnek olarak aramayı ele alalım. 20 yıldan daha önce yapılan aramalar kullanılabilir. Peki Google son 20 yılda neler yapıyor? İşiniz bitmiş gibi görünüyor, ama değilsiniz.
**S: Büyük modelin gelecekteki rekabet modelini nasıl görüyorsunuz? **
Shen Ji: Bugün piyasada çok fazla model var ama çoğunun hızla yok olacağını düşünüyorum.
Halen birçok modelin mevcut olmasının nedeni, birçok insanın bunların iyi mi yoksa kötü mü olduğunu bilmemesidir. Zaten kimse deneyemez, kimse kullanamaz ve ilk testteki sıralaması oldukça yüksektir. Ancak modelin piyasaya sürülmesiyle artıları ve eksileri yargılamak daha kolay. Bugün büyük modeller yapanlara, girmeleri ve denemeleri için 30 milyon soru verirseniz, yarıdan fazlasının aşağı inmek zorunda kalacağı tahmin ediliyor.
Bu, trafiğin kademeli olarak yoğunlaşmasına yol açacak ve kafa modelinin ölçek etkisi oluşturması daha kolay olacak, böylece model geliştirme maliyeti daha fazla paylaşılacaktır. Aradaki fark daha da açılacaktır.
**S: Eleme turları ne zaman başlayacak? **
Shen Ji: Bunu söylemek zor, sonuçta herkesin para toplaması biraz zaman alabilir. Büyük işletmeler için yakma hala ekonomiktir ancak bu aynı zamanda yakmanın değerine de bağlıdır. Bazı firmalar zaten kendi uygulama senaryolarını hedefliyorlar, şu anda onlardan başkalarının büyük model API'lerini ayarlamalarını istemek kesinlikle iyi değil, bu yüzden mutlaka kendi modellerini yapacaklar. Daha da iyisi, neredeyse (önemli değil), en azından dış dünyaya güvenmenize gerek yok. Büyük firmalar bir süre daha model yapmaya devam edecek.
03 Büyük modeller, bulut bilişim hizmetlerinin "standartlaştırmaya" doğru ilerlemesine olanak tanır ve Baidu Bulut sonunda para kazanır
**S: Büyük modeller gelecekte tüm uygulamaların temelini oluşturacak mı? Bu tamamen farklı bir geliştirme ve uygulama ekosistemi yaratacak mı? **
Shen Dou: Büyük modellerin işletim sistemlerinde yeni bir çağ oluşturacağına ve birçok uygulamanın temelini oluşturacağına hiç şüphe yok.
Uzun zamandır insanlar, insanlarla ve makinelerle uğraşırken dili talimat olarak kullandılar. Ancak geçmişte makineler doğal dili anlamıyordu, biz de onların anlayabileceği bir dizi programlama dili yazdık. Artık büyük modeller doğal dili anladığı için uygulama geliştirme paradigmasının tamamı temelden değişti. Geliştirme, kodlama yeteneğinden ziyade yaratıcılığa dayalı hale gelir.
Ayrıca büyük modeller sistemleri birbirine bağlama özelliğine de sahiptir. Eklentilerin, yani bağımsız olarak belirli bir yeteneği tamamlayan ve çağrılmayı bekleyen bileşenlerin ortaya çıkması gibi, büyük model de belirli bir görevi tamamlamak için eklentileri birleştirebilir. Bu, kalkınma paradigmasını daha da değiştirecek.
**S: Büyük model sorunları tüm eklentiler aracılığıyla çözebiliyorsa bu ara bağlantı gizli mi? **
**Shen Dou:**Aslında hâlâ değil. Aslında bu APP'ler artık aynı cep telefonunda ve aynı uygulama programında da mevcut ve hala ara bağlantıyı gerçekleştirmiyor. Gelecekte Meituan ve Didi büyük model temelinde bağlantı kuracaklar ancak hâlâ birbirleriyle iletişim kurmuyorlar.
**S: Temel sorun çözülmedi. **
Shen Ji: Evet, ara bağlantı veri bağlantısını ifade etmelidir. Ben sizin verilerinize erişebilirim ve siz de benim verilerime erişebilirsiniz. Ancak geniş model tabanı altında, yalnızca bu merkezle konuşmaya hazırız ancak eklentilerimiz birbirleriyle konuşmuyor.
**S: Bu ara bağlantı eksikliği, geliştiricilerin kaynaklar arası planlamayı sorunsuz bir şekilde uygulamasını engelleyecek mi? Bu, Çin'in geniş model geliştirme ekosisteminde bir kusur mu olacak? **
Shen Dou: Bence asıl sebep liberalleşmemiş ve trafik ölçeğinin artmamış olması. Örneğin Wenxin Yiyan'ın aynı anda 30 milyondan fazla trafiği var ve geliştirici %1'in kendisine ait olabileceğini hesaplarsa 300.000 ziyaret var ve bunu yapmaya karar verecek.
**S: Büyük modeller çağında Baidu Cloud ekosistemdeki konumunu nasıl tanımlıyor? Fayda mekanizması nasıl dağıtılır? **
Shen Dou: Baidu'nun tek başına bunu yapması kesinlikle imkansız. Bunu yapamayacağımdan korktuğum için değil, kesinlikle yapamayacağım için endişeleniyorum.
Öncelikle eklentinin çok verimli bir ekolojiye sahip olması ve büyük modeli tamamlaması gerekiyor. Eklentilerin büyük modellerden trafik alması gerekiyor, büyük modeller ise eklenti yeteneklerinin desteklenmesini gerektiriyor.Tıpkı bugün olduğu gibi cep telefonunda WeChat veya Douyin olmadığını varsayarsak kullanıcılar bunu kullanamayabilir.
İkincisi, son müşteri odaklı uygulamalar açısından, ister özel bir bulut konuşlandırması ister Qianfan gibi platform düzeyinde bir çözüm olsun, sonuçta Kingdee, UFIDA ve gibi ekolojik ortakların son aşama teslimatını tamamlamasını gerektirecektir. iSoftStone. Özellikle tanıdık müşterileri ve iş süreçleri var ve nihai gereksinimler de buna entegre edilecek.
Özetlemek gerekirse, birincisi ekosistemi geliştirmeye yönelik yeteneklerin bir araya getirilmesi, ikincisi büyük modellerin sunulmasına yardımcı olan ortaklar ve üçüncüsü ise kendi hizmetlerini güçlendirmek için büyük modelleri kullanan müşterilerdir. Bunların hepsi ekosistemdir.
**S: Büyük modellerin teknoloji paradigması bulut bilişime ne gibi değişiklikler getirdi? **
**Shen Dou:**Teknolojik gelişme trendi giderek daha da ileri gidiyor. Yani alt katmandan giderek uzaklaşıyoruz, ayrıntılara dikkat etme ihtiyacı giderek azalıyor, ambalajlar giderek daha iyi hale geliyor ve perde arkasında bu işleri yapan çok sayıda insan var. . Bu aynı zamanda bulutun sağladığı değerin ta kendisidir.
İlk CPU bulutunun sağladığı değer, müşterilerin kartları tek tek bağlamak için makine satın almasına gerek kalmamasıdır. Giderek daha iyi paketlenir ve doğrudan üzerinde kullanılabilir. Büyük modeller çağının gelişiyle birlikte, "AI hızlandırma çipi" GPU yavaş yavaş bilgi işlem gücünün merkezi haline geldi ve bilgi işlem gücü büyüme oranı CPU'nunkini çok aşıyor. Bu, CPU bulutundan GPU bulutuna geçişimizi hızlandıracaktır.
GPU bulutu çağında, alt katmanın açığa çıkmasını önlemek, daha gelişmiş bir etkileşimli form oluşturmak ve büyük modelin API'sine doğrudan bağlanmak için bulutun yeteneklerini eninde sonunda daha da kapsamlı hale getireceğiz. Günümüzün bulutu hala mühendisler için geliştirilmiş ve etkileşim formu yeterince kapsamlı değil ama gelecekte en alttaki mühendisler daha az olacak ve üst seviyelere daha fazla insan geçecek. Bu çok ciddi bir değişiklik.
Baidu Akıllı Bulut | Görüntü kaynağı: Visual China
**S: Büyük modeller bulut bilişim pazarının manzarasını yeniden şekillendirecek mi? Eğer öyleyse, sinyali ne zaman göreceğiz? **
Shen Dou: Bu soruyu beğendim. Büyük modeller olmasaydı Baidu'nun bulutunun çalıştırılması çok zor olurdu. Geçmişte, "Derinlemesine endüstri, senaryolara odaklanma, bulut ve zekanın entegrasyonu ve kapsayıcı yapay zeka" diye bağırıyorduk. Baidu Smart Cloud'un yapmak istediği şey, yapay zekayı tüm To B hizmetine yerleştirmek ve bunu bir büyüme noktası.
**Fakat geçmişte geleneksel yapay zeka çok parçalıydı. Bir soruna yönelik bir yetenek üretmesi ve ardından sorunu çözmesi gerekiyor, dolayısıyla çok yönlülüğü nispeten zayıf. Bu durum ölçeklenmesi zor ve brüt karı düşük bir proje sistemi olmasına neden olmaktadır. **
Üretken yapay zeka ortaya çıktıktan sonra, çok iyi bir çok yönlülüğe sahip olduğunu ve birçok sorunu aynı anda çözebildiğini gördük. Temel olarak uygulama katmanından aşağıya doğru birleştirilmiştir. İnce ayar ve eklentiler gerekli olsa bile bunların hepsi standartlaştırılmış eylemlerdir. . Bu, önceki çok parçalı yapay zeka uygulamalarından tamamen farklıdır. Bu, bulut işinde başlı başına büyük bir değişikliktir; IaaS, MaaS'e dönüşmüştür.
**S: Geçmişte Çinli yapay zeka şirketleri proje almak zorundaydı ve bu çok zordu. Sorunlar şimdiki gibi standart ürünlerle çözülemez. **
Shen Ji: Robin ile bulut stratejisini tartıştık (Not: Baidu'nun kurucusu, başkanı ve CEO'su Robin Li) ve o da bizden standartlaştırmamızı ve ölçeklendirmemizi istedi, aksi takdirde Baidu'yu bir teknoloji şirketi olarak yansıtamazdık. değer.
**S: Yani uzun vadeli gelecek standardizasyon ve ölçeklendirmeyle mi ilgili olacak? **
**Shen Dou:**Büyük modellerde ilk günlerde büyük belirsizlikler vardı. Bugün pek çok müşteri, büyük modellerin kapasite sınırları, sınırları, maliyetleri, teslimatı ve talep yöntemleri konusunda henüz ortak bir anlayışa sahip değil. Kısa sürede tüm müşterilerin genel buluta geleceğini garanti edemeyiz ve bunu öncelikle proje sistemi üzerinden yapmamız gerekiyor.
Ancak böyle bir proje sistemi bile önceki proje sisteminden farklıdır. Mesela size özel bir dağıtım modeli verirsem, daha çok Windows ya da Office gibi olur, önce sürüm 95, sonra sürüm 97, sonra sürüm 2000. Görünüşe göre sana evde kurman için bir CD verdim ama aslında abone olmaya devam etmelisin. Bu aynı zamanda orijinalinden farklıdır.
**S: Ancak mali durumunuz iyileşti. Bu yılın ilk çeyreğinde Baidu Akıllı Bulut ilk kez üç aylık kârlılığa ulaştı, bunun nedeninin bulut hizmetlerinin standartlaştırılmasının büyük ölçekli yeniden kullanıma olanak sağlaması ve maliyetleri düşürmesi olduğunu belirtmiştiniz. **
Shen Ji: Evet. Saf proje sistemi veya nispeten yüksek oranda proje sistemi olması durumunda, teslim sonrası brüt kar çok düşüktür.
04 Bir yıldan fazla bir süre Baidu Cloud'un sorumluluğunu üstlendikten sonra en iyi fırsata sahibiz
**S: Baidu'nun en yüksek karar alma kademesinin bir üyesi olarak en çok ne hakkında endişeleniyor ve endişeleniyorsunuz? Ekibinizle sıklıkla hangi konuları tartışıyorsunuz? **
**Shen Dou: Ürün formu açısından Robin'in tüm ürünlerin yapay zeka yerel düşüncesi kullanılarak yeniden yapılandırılması zorunluluğu var. Bu yeniden yapılanmadır, entegrasyon değil. **
Teknik olarak günümüzün üretken yapay zekasının yeteneklerinin ne kadar ileri gidebileceğini düşünüyoruz. Wen Xinyiyan'ın mevcut değerlendirme sonuçları fena değil ancak insan dilinin üst sınırından veya mükemmel insan dili anlayışından uzak. Bu yeteneği hızla geliştirmeye nasıl devam edebiliriz, kesinlikle düşündüğümüz ilk sorudur.
Daha sonra endüstri uygulaması var, model gerçekten nasıl kullanılabilir, hangi senaryolarda kullanılabilir, eşiğin ne kadar yüksek olduğu, sınırın ne kadar geniş olduğu, verimliliğinin nasıl artırılabileceği, herkese daha iyi kullanımlar düşünmesi için nasıl ilham verileceği var. ... Bunlar düşünmeye devam etmemiz gereken şeyler.
**S: Bunlar nispeten yumuşak katmanlardır. Peki ya daha sert katmanlar? **
Shen Dou: Bugünlerde bilgi işlem güç kümeleri 1.000 karttan 10.000 karta çıktı. Baidu, Çin'de 10.000 kart düzeyinde tek bir görevi gerçek anlamda yürütebilen tek şirket.
Wanka kümesinde organizasyon, verimlilik ve garanti, herkesin göremediği gerçek alt düzey görevlerdir ancak bunlar son derece önemlidir. Örneğin, temeldeki donanımın eğitim ve muhakeme verimliliğini ve yazılım ile donanımın entegrasyonunu geliştirmek istiyoruz. Bunların hepsi oldukça önemli şeyler.
**S: Baidu'da uzun yıllardır arama ve reklamcılık işlerinden sorumlusunuz. Geçen yıla kadar akıllı bulutun sorumluluğunu üstlenmediniz. Büyük modellerin tarihi fırsatıyla hemen karşılaştınız. Şanslı hissediyor musun? Nasıl hissediyorsun? **
Shen Dou: O kadar da abartılı değil ama böyle bir şey yapacağım için gerçekten heyecanlı ve şanslıyım.
Geçen yıl görevi devraldığımda, ölçeklendirme ve standartlaştırma (bulut hizmetleri) fikri aklıma geldi. Ancak yapay zeka yetenekleri çok parçalı olduğundan bunu yapmak çok zordur. **O zamanlar çok düşündüm, hem yapay zeka yetenekleri hem de yapay zeka hesaplama gücü gerektiren ve aynı anda birçok kişi tarafından kullanılabilen bir şey var mı? Uzun zamandır bulamıyorum. **
Daha sonra büyük model ortaya çıktı. Bir anda doğru geldi.
Shen Dou, Baidu Group'un başkan yardımcısı ve Baidu Akıllı Bulut Grubu (ACG) başkanı | Görüntü kaynağı: Baidu
**S: Yapay zeka üzerinde çalışıyorsunuz. Büyük model size daha uygun mu? **
Shen Dou: Bu benim yüksek lisans öğrencisiyken yaptıklarıma çok benziyor. Her ne kadar her zaman bilgisayar bilimi okumuş olsam da daha çok yazılım üzerine çalışıyorum ve yapay zeka üzerine çalışıyorum.
Buluta (düşük seviyeli donanım) bağlandıktan sonra aslında işletim sistemleri ve bilgisayar kompozisyonu ilkeleri hakkındaki kitabı tekrar okudum. CPU çağında gerçekten IaaS, ağ bileşenleri ve depolama bilişimi söz konusuysa, bunun hala biraz zor olduğunu düşünüyorum.
Ancak büyük model ortaya çıktıktan sonra, bunların aşağıda özetlendiğini fark ettim. Şimdi esas olarak büyük model üzerinde çalışıyorum, örneğin makale okumak, Qianfan'da API'yi çağırmak için Python kullanmak vb. Kendimi çok daha rahat hissediyorum.
**S: Peki Baidu Akıllı Bulut'un gelişim ve büyüme hızına ilişkin beklentileriniz neler? **
**Shen Ji:**Baidu Akıllı Bulut'un şu anda yaklaşık 20 milyar plakası var ve bu nispeten küçük bir rakam. Büyük modelin bereketiyle müşteri talebimiz çok güçlü hale geldi ve artık çok meşgulüz. Ancak kullanıcıların onu gerçekten kullanabilmesi ve iyi bir şekilde sunabilmesi için hala bir sürece ihtiyacı var.
**S: Dördüncü çeyrekte küçük bir salgın olacak mı? **
**Shen Ji:**Bazıları dördüncü çeyrekte bir salgın çıkacağını tahmin ediyor. Talep gerçekten de artmaya başladı ancak patlamasının gelecek yıla kadar sürebileceğini düşünüyorum.
**S: Şansınızı nasıl değerlendiriyorsunuz? **
Shen Dou: Bunun Baidu'nun şansı olduğunu düşünüyorum. Baidu uzun yıllardır yapay zeka yapıyor ve bunun için çok çaba harcıyor.Eğer büyük modeller mevcut değilse, bulutun ticarileşme yolu gerçekten de daha zor ve meşakkatli olacaktır. Bu sadece Vizyon sahibi şirketlerin sonuçta kötü şansa sahip olmayacağını gösteriyor.
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
Baidu Akıllı Bulut Başkanı Shen Dou ile Diyalog: Bugün piyasada pek çok büyük model var, ancak çoğu hızla ortadan kaybolacak.
"Wen Xin Yi Yan" yayınlandıktan sonraki 24. saatte, Shen Dou verilere bakmak için arka plana gitti ve Wen Xin Yi Yan'ın kullanıcılardan gelen "33,42 milyon" soruyu beklentilerini aşan bir şekilde yanıtladığını gördü.
İki gün sonra Shen Dou, ben de dahil olmak üzere birçok medya profesyoneliyle görüştü ve şunları söyledi: "Biz de eğlenceyi izleyenlerin sayısının azaldığını düşünüyorduk ancak kullanıcıların coşkusunun aynı kalmasını beklemiyorduk."
Eylül ayında, Çin'in büyük model çılgınlığı yarım yıl boyunca devam ederken, sıradan insanlar nihayet başlama şansı buldu.
31 Ağustos'tan itibaren "Wen Xin Yi Yan" da dahil olmak üzere bir dizi büyük model başvuruyu geçti ve resmi olarak halka açıldı. Bu haber, kullanıcıları denemek için heyecanlandırmakla kalmadı, aynı zamanda şirketlerin de coşkulu tepkilerine yol açtı. **Shen Dou, Wenxin Yiyan'ın açıldığı gün Baidu Akıllı Bulut Qianfan büyük ölçekli model platformundaki günlük aktif şirket sayısının %40'tan fazla arttığını söyledi. ——İkincisi, Baidu'nun işletmeler için başlattığı büyük ölçekli bir model geliştirme ve yönetim platformudur. **
Büyük modeller çağında Baidu, büyük modellerin bireyler ve işletmeler tarafından aynı zaman çizelgesinde kullanılmasını teşvik etmeyi umuyor. Makro açıdan bakıldığında bu, büyük modellerin en son teknolojisinin yaygınlaşmasına yardımcı oluyor. Şirket açısından bakıldığında bu, Baidu'nun kendi işini yapmasına yardımcı oluyor. C tarafı kullanıcılarının ticari değeri hemen belli olmasa da, B tarafı müşterilerinin ticari değeri doğrudan model API planlama ücretlerine ve bulut bilişim gelirine yansır.
Uzun yıllardır Baidu Mobil Ekosistemi'nden (MEG) sorumlu olan Shen Dou, geçen yılın mayıs ayında Baidu Akıllı Bulut Grubu'nun (ACG) başkanlığına atandı. Grubun ondan beklentisi, AIGC döneminin fırsatlarını yakalamak ve akıllı bulutu Baidu'nun ikinci büyüme eğrisine yerleştirmektir.
Ancak Shen Ji'nin karşılaştığı durum çok zordu. Baidu, Çin'deki en büyük bulut bilişim tedarikçisi olmasa da yapay zeka ile ilgili hizmetler konusunda genel bulutta yalnızca önde yer alıyor. O zamanlar Shen Dou, tüm bulut hizmetinin büyümesini sağlamak için yapay zekayı kullanmayı umuyordu.Ne yazık ki o dönemde yapay zeka yetenekleri çok "parçalanmış"tı ve mevcut yüksek hizmet maliyetleri durumundan kurtulamıyordu. ölçek büyütmede zorluk ve yetersiz kar.
Ancak birkaç ay sonra büyük modellerin çağı geldi. Rekabet açısından bakıldığında, eskiden IaaS (Hizmet Olarak Altyapı) ve PaaS'nin (Hizmet Olarak Platform) hakim olduğu temel bulut hizmetleri, yerini yapay zekanın hakim olduğu MaaS (Hizmet Olarak Model) gibi bulut hizmetlerine bırakıyor . Shen Dou, bunun Baidu Akıllı Bulut'un "bir virajı geçme" fırsatı olduğuna inanıyor.
Gelir açısından bakıldığında, büyük modellerin evrensel yetenekleri, bulut hizmetlerinin daha standart hale getirilmesine olanak tanıyarak farklı senaryolarda büyük ölçekli yeniden kullanıma olanak tanır, hizmet maliyetlerini azaltır ve karı artırır. Bu nedenle Baidu yönetimi, yatırımcılara 2023'ün ikinci çeyreğindeki kazançların, yapay zeka ve büyük modellerin Baidu Akıllı Bulut'un daha yüksek kar marjları elde etmesine olanak sağlayacağını söylediğini söyledi.
**Geek Park'ın düzenlediği Shen Dou ile söyleşimizin tam metni aşağıdadır. **
01 C tarafında Wenxin Yiyan ve B tarafında Qianfan platformu, iki tarafıyla başarılı bir platform
**S: Eğlenceyi izledikten sonra artık pratik bir şeyler yapmanın zamanı geldi. İki gün önce Baidu, Wen Xinyiyan'ı C tarafında açtı. Bu kullanıcı kullanım verileri hakkında ne düşünüyorsunuz? Beklenen mi, beklenmeyen mi? Arka uç işletim ve bakım yetenekleri nelerdir? **
Shen Dou: Verileri o gece saat 12:30'da gruba gönderdim ve meslektaşlarım verileri ertesi gün yayınladılar. Veriler tarafımdan sistemden alınarak dış dünyaya bozulmadan sunulmuştur, kesinlikle doğrudur.
Başlangıçta "heyecanı izleyen" insan sayısının daha az olduğunu düşünmüştük, dolayısıyla beklentilerimiz o kadar da yüksek değildi. Beklenmedik bir şekilde o gün 33,42 milyon yanıt geldi, bu da kullanıcıların Wen Xinyiyan'a dair beklentilerinin yüksek olduğunu gösteriyor. Herkes bir iki soru sorup ardından ayrılmadı, ancak birçok diyalog turundan geçti. Bu açıdan bakıldığında kullanıcıların heyecanı hala devam ediyor.
Wen Xinyiyan, 16 Mart'tan bu yana beş veya altı aydır dahili testlerde bulunuyor ve bu bize hem etki iyileştirme hem de maliyet azaltma açısından yeterli hazırlık süresi sağladı. Örneğin, Wenxin büyük modelinin çıkarım hızı, orijinaliyle karşılaştırıldığında 30 kattan fazla artırıldı, bu da çıkarım maliyetini büyük ölçüde azalttı ve bu kadar çok sayıda kullanıcıyla başa çıkmamıza olanak sağladı.
**S: Yani Baidu'nun büyük modelinin bu dönemdeki teknik ilerlemesi aynı zamanda maliyet ilerlemesini de içeriyor mu? **
**Shen Dou:**Evet, büyük modelin kendisi kaynak yoğun bir teknik paradigmadır.
Trafiğin bu kadar büyük olacağını ilk başta beklemiyorduk.Makine (bilgi işlem gücü) kaynağının kendisi çok değerli.Çok fazla makine koymanın israf olacağını düşündük, bu yüzden çok fazla ekstra makine koymadık. O günkü kullanıcı sayısındaki artıştan sonra, çok şükür, muhakeme performansımız arttığı için, kullanıcılara hala istikrarlı hizmetler sunuyoruz.
Ayrıca elimizde iyi bir bilgi işlem gücü rezervi var ve gelecekte de eğitim ve muhakeme maliyetlerini düşürmeye devam edeceğiz, böylece kullanıcı ihtiyaçlarının karşılanmasında herhangi bir sorun yaşanmaz. O dönemde kendi iç grubumuzda trafiğe karşı direnilip direnilemeyeceğini tartıştık. Trafiği şiddetlendirmenin mutluluk belası olduğunu söyledim.
**S: Wenxin Yiyan'ın C tarafında serbest bırakılmasının Baidu'ya faydaları nelerdir? **
Shen Ji: C tarafına açılmanın ticari değer getirip getiremeyeceği, sürdürülebilir bir konu olup olmadığı konusunda endişeleniyor olabilirsiniz.
Aslında kullanıcılar için gerçekten değer yaratıldığı sürece ticarileşme sadece zaman meselesidir. Teknolojik gelişme tarihinde değerli ancak gerçekleştirilmesi zor olan çok az örnek vardır. Wen Xinyiyan gerçekten de C-son kullanıcılarına gerçek değer kattı.Dün, Wenxinyiyan olmasaydı ofis verimliliğinin düşeceğini söyleyen bazı yorumlar gördüm. Dolayısıyla değerli olduğu sürece Wenxinyiyan'ın gelecekte ticarileşmesi doğal olarak gelecektir.
**S: Çin Büyük Modelinin C-end ürün formu ChatGPT ile tutarlı olacak mı? Abonelik ücreti mi? **
Shen Dou: Büyük modellerin ürün formundan bahsetmek için henüz çok erken ve tanımı da henüz bu kadar net değil.
Mobil İnternet ortaya çıkmaya başladığında, bunu açıkça tanımlamak için SoLoMo (Sosyal, Yerel, Mobil, daha iyi bir kullanıcı deneyimi sağlamak için sosyal medyayı, coğrafi konum hizmetlerini ve mobil terminal cihazlarını kullanma) gibi birkaç anahtar kelime kullanabilirdik. Ancak şu anda büyük model birkaç net kelimeyle tanımlanamaz. Yetenekleri daha güçlü ama sınırları da daha geniş ve ürün biçimi üzerinde birleşmenin zamanı henüz çok uzak.
OpenAI teknoloji odaklı bir şirkettir ve kullanıcı deneyimi aslında onun güçlü noktası değildir. Bugün tasarladığı ürün formu henüz başlangıç aşamasında, sonrasında ürünün iterasyon hızı çok hızlı olacak ve form büyük ölçüde değişecek.
**S: ChatGPT'nin C-son kullanıcılarından abonelik ücreti alma iş modeli Çin'de uygulanabilir mi? **
Shen Dou: Reklamcılık, e-ticaret ve oyunlardan oluşan üç yaygın para kazanma yöntemi gibi yeni para kazanma yöntemleri geliştirebiliriz.
Bir asistanı işe almak için ayda 2.000 yuan harcamaya hazırsanız, o zaman yapay zeka bir asistanın yapabileceğinin 1/10'unu yapabiliyorsa (seyahat planları yapmanıza, uçak bileti ve otel rezervasyonu yapmanıza ve hatta taksi çağırmayı harekete geçirmenize yardımcı olmak gibi) ve yemek dağıtım uygulamaları, tamam mı? İki yüz yuan harcamaya hazır mısınız? Ancak bunun gerçekleşme yolu mutlaka üyelik ücreti olmak zorunda değildir, işlem komisyonları veya başka yöntemler olabilir.
Başka bir örnek olarak, oyundaki bir grup NPC karakteri üretken yapay zeka tarafından yönlendiriliyor ve e-ticaret alanındaki "dijital insanların" canlı yayını da üretken yapay zeka tarafından destekleniyor ve bu da farklı para kazanma yöntemlerine yol açabilir. Sonuçta C ucunun ürün formu onun gerçekleştirilme yöntemini belirler.
**S: Eğer C-end ürünü sonuçta bir üretkenlik aracı ise, şirketin bireye değil bireye ödeme yapması mümkün müdür? **
Shen Dou: Bu mümkün. Örneğin Baidu Netdisk aynı zamanda bir verimlilik aracı olarak da değerlendirilebilir ve birçok şirket, çalışanlarının kullanması için Netdisk hesapları satın alacaktır. Ayrıca şirketlerle temasa geçtik ve her çalışana program yazması için bir Copilot hesabı atadık. Bunların hepsi şirketlerin bireyler adına fatura ödediği durumlardır.
**S: Bir içerik şirketi olarak makale üretmek için özellikle büyük modeller kullanmak istiyoruz. To B'nin büyük model hizmet platformu "Qianfan"ı yeni başlattınız. "Qianfan"ı başlatmanın arka planı nedir? Sıfır programcıya sahip şirketlerin büyük modelleri devreye almasına nasıl yardımcı olabiliriz? **
Shen Ji: Bu çok güzel bir soru. Aslında Qianfan Platformunu da bu yüzden yapıyoruz.
Büyük modelin bu kez B tarafına inmesinin özelliği, büyük şirketlerin ilk sırada yer alması ve müşterilerin çoğunun finans kurumları, enerji kurumları, eğitim kurumları vb. olmasıdır. Özel olarak dağıtılmaları gerektiği gibi bariz bir özellikleri var, ancak eşik çok yüksek ve modeli yinelemek için bir grup teknisyeni eğitmek zorundalar, bu da büyük modelin yürürlüğe girme süresini yavaşlatabilir.
Aksine, birçok küçük ve orta ölçekli şirket gibi, büyük olasılıkla (platform tabanlı) bir SaaS ürününü veya genel bulutları hariç tutmayacaksınız. Qianfan platformu böyle bir üründür. Kuruluşlar doğrudan API'leri arayabilir veya neredeyse hiç kod kullanmadan kendi modellerini oluşturmak için eğitim örneklerinde ince ayar yapabilir. **Qianfan'ın amacı, büyük modellerin dağıtım eşiğini düşürmek ve büyük modellerin yaygın uygulamasını teşvik etmektir. **
**S: Görünüşe göre siz ve OpenAI'nin yolları farklı. OpenAI önce C-end ürünü ChatGPT'yi piyasaya sürdü ve ardından yavaş yavaş B-end ürününü piyasaya sürerken Baidu hem C-end'i hem de B-end'i yan yana ilerletiyor. Bu fark neden var? **
**Shen Dou: **Teknolojinin kabul edilme sorunları var ve daha fazla kullanıcının onu gerçekten kullanması ve değerini bulması gerekiyor. Herkes büyük modellerden bahsediyor ama kaç kişi gerçekten büyük modelleri kullandı? B tarafı kurumsal müşteriler, büyük modellerin tüm üretim paradigmaları üzerindeki potansiyel etkisinin daha fazla farkındalar ve bunları daha fazla kullanmaları gerekiyor.
Ancak genel bulut API'lerini kullanmıyorlarsa veya deneyimlemek ve denemek için kendi ortamlarını kurmuyorlarsa, o zaman oradaki tamamen hayal ürünüdür. Bu yüzden Qianfan'ı yapıp önce büyük modeli kullanmalarına izin vermeliyiz. Hatta büyük modelin çepeçevre açılması konusunda C tarafı uzun süredir bekliyordu, B tarafı da uzun süredir bekliyordu. Sadece B tarafı ticarileşmeye daha yakın.
**S: Wenxin'in serbest bırakılmasının ardından Qianfan platformunun B tarafı talebi ne kadar arttı? **
Shen Ji: Wenxin Yiyan'ın açıldığı gün, Baidu Akıllı Bulut Qianfan büyük ölçekli model platformundaki günlük aktif girişimlerin sayısı %40'tan fazla arttı, biraz daha iyi.
Gevşeme yalnızca C tarafındaki verileri artırmakla kalmayacak, aynı zamanda B tarafındaki verileri de artıracaktır. Çünkü bu, B tarafı şirketlerinin maliyetleri azaltmasına ve yinelemeleri hızlandırmasına yardımcı olacaktır (not: yerli modelleri kullanmak daha ucuz ve daha uygundur).
Ancak veri büyümesi açısından B tarafı şimdilik C tarafı kadar iyi değil. Bugün, birinin B tarafında "Wen Xin Yi Yan"ı kullanmak istediğini varsayalım. API'yi çağırmak yerine, ilk önce onu deneyimlemek için C tarafına gidebilir. Deneyimin iyi olduğunu düşündüğünde bunu Qianfan üzerinde kullanacak. B tarafının kullanılmasını sağlamak bir uygulama sürecini gerektirir.
**S: C tarafı ile B tarafı el ele giderse önceliği nasıl belirlersiniz? Odaklanma esas olarak C tarafında mı yoksa B tarafında mı? **
Shen Shake: Önceliğin yalnızca kaynak çakışması olduğunda ayarlanması gerekir. Büyük modelin özelliği, alt kısmında evrensel olan çok kalın bir katmana sahip olmasıdır; bu nedenle, ister B'ye ister C'ye olsun, üzerinde uygulamalar bulmak, Baidu'nun el ele yapmak istediği şeydir. Kaynak çatışması yok.
C tarafında Baidu, büyük modelleri uygulayabilecek ürün formlarını ve iş modellerini aktif olarak araştırıyor. Baidu'nun C-end ürünlerini büyük modellere göre yeniden yapılandırması gerekiyor.Örneğin, Baidu'nun kendi ürün verilerinden Baidu Netdisk, Baidu Kütüphanesi ve diğer ürünlere bakılırsa, büyük modellere göre yeniden yapılanma sonrasında kullanıcı yapışkanlığı ve üyelik ödeme oranları çok yüksek. İyileştirme; yeni oluşturulan Wenxin Yiyan APP ve yeniden yapılandırılan Baidu Arama da büyük model uygulamalara yeni girişler haline geldi. B tarafında, Baidu Smart Cloud, en iyi büyük ölçekli model platformunu oluşturarak To B pazarına iyi bir şekilde hizmet ediyor.
**S: Aslında en evrensel temel bulut bilişiminizdir. İster iç müşterilere, ister dış müşterilere hizmet veriyor olun, bu sizin başarınızdır. **
Shen Dou: Evet, eğer iç müşterilere iyi hizmet verirseniz, dış müşterilere de iyi hizmet verirsiniz. Eğer dış müşterilere iyi hizmet verirseniz, iç müşterilere de iyi hizmet verirsiniz. MaaS'ın güzelliği de budur. Aksi takdirde, dış ve iç teknoloji yığınlarının tamamen iki set olduğunu varsayarsak, maliyet çok yüksek olacaktır.
İki ayak üzerinde yürüyoruz. Baidu kesinlikle gişe rekorları kıran bir To C ürünü yapmayı umuyor, ancak aynı zamanda temeldeki büyük model ve bilgi işlem gücü aracılığıyla daha fazla şirket ve geliştiricinin iyi To C uygulamaları oluşturmasını desteklemeye de çok istekliyiz. Aslında yukarıda kim başarılı olursa olsun, bu, altta yatan büyük modelin başarısıdır.
02 Büyük modeller acımasız bir eleme rekabeti başlatıyor ve açık kaynaklı modellerin geleceği endişe verici
**S: Wen Xinyiyan'a ek olarak Qianfan platformu başka modelleri de piyasaya sürdü. Qianfan ile Hugging Face gibi model toplama platformları arasındaki fark nedir? **
Shen Dou: Şu anda veya uzun bir süredir, ister modelin sahneye uyarlanabilirliği, ister müşterilerin psikolojik ihtiyaçları nedeniyle olsun, şirketler farklı modeller denemeyi umuyor. Bu açıdan bakıldığında üçüncü parti modelleri de sağlamamız gerekiyor.
Ancak her model denemeye değer değildir, bu da büyük bir kaynak israfı anlamına gelir. Bu nedenle Qianfan'ın kendi tarama ilkeleri vardır ve ortaya koyduğumuz modeller nispeten mükemmel ve kullanımı kolaydır.
**S: Yani Hugging Face bir topluluk olarak mı konumlandırılıyor, Qianfan da bir platform olarak mı? **
Shen Dou: Doğru. Qianfan yalnızca model seçme sorununuzu çözmekle kalmıyor, aynı zamanda modeli fiilen kullanma sorununuzu da çözüyor. Bunu kullanmak aynı zamanda veri, eğitim, ayarlama, mühendislik ve uygulama oluşturma gibi bir dizi konuyu da içerir ve maliyet ve verimliliği tamamen dikkate alır. Qianfan, Qianfan ve Hugging Face arasındaki fark olan tek elden hizmet sağlıyor.
Hugging face modeli yeterli genişliğe sahip ve bulut satıcılarının doğal avantajlarına dayanan Qianfan, operasyon için yeterli alana sahip ve ayrıca uçtan uca eğitim ve çıkarım performansı optimizasyonu da gerçekleştirebiliyor. Örneğin, eğitim sürecinin hızlandırılması, hataların hızlı algılanması, konumlandırılması ve kurtarılması; Baidu'nun devasa heterojen bilgi işlem kümesinin ölçeklenebilirliğine dayanan muhakeme sürecinde, çok iyi bir kaynak esnekliğine sahiptir ve ayrıca sunucusuz hizmetler sunarak müşterilere olanak sağlar. düşük maliyetli Altyapı maliyetleri, işletme ve bakım gerektirmemesi ve yüksek ölçeklenebilirlik avantajları elde etmek. Qianfan'ın Hugging Face'ten daha derine indiği yer burasıdır.
**S: Açık kaynak modeli konusunda pek iyimser görünmüyorsunuz ancak açık kaynak, büyük modellerin işletmelere dağıtılmasının maliyetini azaltıyor, dolayısıyla bunun anlamsız olduğu söylenemez. Açık kaynak modeli hakkında tam olarak ne düşünüyorsunuz? **
**Shen Dou:**LLaMA'nın maliyetini kimin karşılayacağını düşünüyorsunuz (Not: Facebook'un açık kaynaklı büyük modeli)? Bu Facebook. Facebook'un maliyetini kim paylaşacak? **Eğer bu sorunun son noktasını anlayamıyorsanız o zaman (açık kaynak) kaynağı olmayan su, kökü olmayan ağaçtır ve bir gün mutlaka sorunlar çıkacaktır. **
Çünkü bu, geleneksel açık kaynaklı yazılımlardan farklıdır.Geçmişte, kişinin açık kaynağa yaptığı yatırım, kendi zaman maliyetiydi. Ancak günümüzde bir kişi açık kaynaklı büyük modeller açmak isterse makinelerin ve verilerin maliyeti çok yüksektir.
**S: Sevgiyi elektrik üretmek için kullanabilirsiniz ama sevgiyi hesaplamak için kullanamazsınız. **
Shen Dou: Evet, bir eğitim turu için on milyonları buna harcamanız gerekiyor.
Günümüzün geleneksel açık kaynak oynanışına biraz benzeyen şey, hepsinin kullanıcıların dikkatini çekmek için açık kaynak kullanması ve sonuçta diğer (kapalı kaynak) büyük modelleri seçmeyi ummasıdır.
**S: Red Hat ve IBM'e benzer bir ilişkiye sahip olmak mümkün mü (Not: 2018'de IBM, dünyanın en büyük açık kaynak şirketi olan Red Hat'i satın aldığını duyurdu)? Peki ya IBM gibi varlıklı işletme sahipleri açık kaynağı desteklemeye istekliyse? Bu sayede açık kaynak finansal ve veri desteğine sahip olacaktır. **
Shen Dou: Açık kaynak kesinlikle uzun bir süre var olacak. Büyük modeller giderek daha fazla ilgi gördükçe, hükümetler ve işletmeler bu alandaki araştırmaları desteklemek ve tüm pazarda eğitimi teşvik etmek için bağışta bulunabilirler. Ama sonuçta ne kadar değer üretebilir? Ana akım haline gelmemesi veya tam bir kapalı döngü iş modeli oluşturmama ihtimalinin yüksek olduğunu düşünüyorum.
Geleneksel yazılım geliştirme kapalı bir döngü oluşturabilir. Örneğin, bir kod parçası yazarsanız veya bir işlevi yükseltirseniz, hızlı bir şekilde kontrol edebilirsiniz ve tüm açık kaynak yazılımın yetenekleri anında geliştirilir. Ancak LLaMA bugün piyasaya sürüldükten sonra kaç kişi kullanıyor olursa olsun kontrol edilemiyor. Veriler, bilgi işlem gücü ve yetenekler geri alınamıyor ve kapalı bir döngü oluşturulamıyor.
**S: Birçok açık kaynak okulu, açık kaynak modelinin trilyonlarca parametre okuduğuna inanıyor. Kapalı kaynak modeli kadar iyi olmasa da yine de oldukça kullanışlı. Tıpkı modelin kendisinde 985 ve 211 dereceleri olmadığı gibi en azından daha dikey ince ayar için kullanılabilecek profesyonel düzeyde. **
Shen Dou: Temel Modeli gelişmeli mi? Bugünkü Vakıf Modeli zaten çok iyiyse ve değiştirilmesine de gerek yoksa sorun yok. Ama bugünkü durum, Temel Model'in sadece 60 puanı var ve bizim 90 ya da 95 puan almaya çalışmamız gerekiyor.
**S: Neden ilerleme? Pek çok şirketin asıl düşüncesi GPT3.0'ın sorunu zaten çözebileceği yönünde, peki ilerlemenin anlamı nedir? **
Shen Dou: Bu çok güzel bir soru ve bunu şirket içinde de tartıştık. Bugün Temel Modeli 60 puana ulaştığında sorunun büyük bir kısmını çözebiliyor ama yine de mükemmel çözümle arasında büyük bir uçurum var. Ve insan doğasının talebi şudur ki, eğer bunu bir defada çözmeme izin verirseniz, bunu asla iki defada yapmayacağım.
Bugün Temel Modelde sadece 60 puana dayanarak 85 puan antrenmanı yaptınız. Bundan sonra Vakıf Modeli 85 puana ulaştı, 95 puan alabilir misin? Bu konuda insanoğlunun arayışının sınırı yoktur.
Bu limit mutlaka yukarıya doğru itilmeye devam edecektir. Örnek olarak aramayı ele alalım. 20 yıldan daha önce yapılan aramalar kullanılabilir. Peki Google son 20 yılda neler yapıyor? İşiniz bitmiş gibi görünüyor, ama değilsiniz.
**S: Büyük modelin gelecekteki rekabet modelini nasıl görüyorsunuz? **
Shen Ji: Bugün piyasada çok fazla model var ama çoğunun hızla yok olacağını düşünüyorum.
Halen birçok modelin mevcut olmasının nedeni, birçok insanın bunların iyi mi yoksa kötü mü olduğunu bilmemesidir. Zaten kimse deneyemez, kimse kullanamaz ve ilk testteki sıralaması oldukça yüksektir. Ancak modelin piyasaya sürülmesiyle artıları ve eksileri yargılamak daha kolay. Bugün büyük modeller yapanlara, girmeleri ve denemeleri için 30 milyon soru verirseniz, yarıdan fazlasının aşağı inmek zorunda kalacağı tahmin ediliyor.
Bu, trafiğin kademeli olarak yoğunlaşmasına yol açacak ve kafa modelinin ölçek etkisi oluşturması daha kolay olacak, böylece model geliştirme maliyeti daha fazla paylaşılacaktır. Aradaki fark daha da açılacaktır.
**S: Eleme turları ne zaman başlayacak? **
Shen Ji: Bunu söylemek zor, sonuçta herkesin para toplaması biraz zaman alabilir. Büyük işletmeler için yakma hala ekonomiktir ancak bu aynı zamanda yakmanın değerine de bağlıdır. Bazı firmalar zaten kendi uygulama senaryolarını hedefliyorlar, şu anda onlardan başkalarının büyük model API'lerini ayarlamalarını istemek kesinlikle iyi değil, bu yüzden mutlaka kendi modellerini yapacaklar. Daha da iyisi, neredeyse (önemli değil), en azından dış dünyaya güvenmenize gerek yok. Büyük firmalar bir süre daha model yapmaya devam edecek.
03 Büyük modeller, bulut bilişim hizmetlerinin "standartlaştırmaya" doğru ilerlemesine olanak tanır ve Baidu Bulut sonunda para kazanır
**S: Büyük modeller gelecekte tüm uygulamaların temelini oluşturacak mı? Bu tamamen farklı bir geliştirme ve uygulama ekosistemi yaratacak mı? **
Shen Dou: Büyük modellerin işletim sistemlerinde yeni bir çağ oluşturacağına ve birçok uygulamanın temelini oluşturacağına hiç şüphe yok.
Uzun zamandır insanlar, insanlarla ve makinelerle uğraşırken dili talimat olarak kullandılar. Ancak geçmişte makineler doğal dili anlamıyordu, biz de onların anlayabileceği bir dizi programlama dili yazdık. Artık büyük modeller doğal dili anladığı için uygulama geliştirme paradigmasının tamamı temelden değişti. Geliştirme, kodlama yeteneğinden ziyade yaratıcılığa dayalı hale gelir.
Ayrıca büyük modeller sistemleri birbirine bağlama özelliğine de sahiptir. Eklentilerin, yani bağımsız olarak belirli bir yeteneği tamamlayan ve çağrılmayı bekleyen bileşenlerin ortaya çıkması gibi, büyük model de belirli bir görevi tamamlamak için eklentileri birleştirebilir. Bu, kalkınma paradigmasını daha da değiştirecek.
**S: Büyük model sorunları tüm eklentiler aracılığıyla çözebiliyorsa bu ara bağlantı gizli mi? **
**Shen Dou:**Aslında hâlâ değil. Aslında bu APP'ler artık aynı cep telefonunda ve aynı uygulama programında da mevcut ve hala ara bağlantıyı gerçekleştirmiyor. Gelecekte Meituan ve Didi büyük model temelinde bağlantı kuracaklar ancak hâlâ birbirleriyle iletişim kurmuyorlar.
**S: Temel sorun çözülmedi. **
Shen Ji: Evet, ara bağlantı veri bağlantısını ifade etmelidir. Ben sizin verilerinize erişebilirim ve siz de benim verilerime erişebilirsiniz. Ancak geniş model tabanı altında, yalnızca bu merkezle konuşmaya hazırız ancak eklentilerimiz birbirleriyle konuşmuyor.
**S: Bu ara bağlantı eksikliği, geliştiricilerin kaynaklar arası planlamayı sorunsuz bir şekilde uygulamasını engelleyecek mi? Bu, Çin'in geniş model geliştirme ekosisteminde bir kusur mu olacak? **
Shen Dou: Bence asıl sebep liberalleşmemiş ve trafik ölçeğinin artmamış olması. Örneğin Wenxin Yiyan'ın aynı anda 30 milyondan fazla trafiği var ve geliştirici %1'in kendisine ait olabileceğini hesaplarsa 300.000 ziyaret var ve bunu yapmaya karar verecek.
**S: Büyük modeller çağında Baidu Cloud ekosistemdeki konumunu nasıl tanımlıyor? Fayda mekanizması nasıl dağıtılır? **
Shen Dou: Baidu'nun tek başına bunu yapması kesinlikle imkansız. Bunu yapamayacağımdan korktuğum için değil, kesinlikle yapamayacağım için endişeleniyorum.
Öncelikle eklentinin çok verimli bir ekolojiye sahip olması ve büyük modeli tamamlaması gerekiyor. Eklentilerin büyük modellerden trafik alması gerekiyor, büyük modeller ise eklenti yeteneklerinin desteklenmesini gerektiriyor.Tıpkı bugün olduğu gibi cep telefonunda WeChat veya Douyin olmadığını varsayarsak kullanıcılar bunu kullanamayabilir.
İkincisi, son müşteri odaklı uygulamalar açısından, ister özel bir bulut konuşlandırması ister Qianfan gibi platform düzeyinde bir çözüm olsun, sonuçta Kingdee, UFIDA ve gibi ekolojik ortakların son aşama teslimatını tamamlamasını gerektirecektir. iSoftStone. Özellikle tanıdık müşterileri ve iş süreçleri var ve nihai gereksinimler de buna entegre edilecek.
Özetlemek gerekirse, birincisi ekosistemi geliştirmeye yönelik yeteneklerin bir araya getirilmesi, ikincisi büyük modellerin sunulmasına yardımcı olan ortaklar ve üçüncüsü ise kendi hizmetlerini güçlendirmek için büyük modelleri kullanan müşterilerdir. Bunların hepsi ekosistemdir.
**S: Büyük modellerin teknoloji paradigması bulut bilişime ne gibi değişiklikler getirdi? **
**Shen Dou:**Teknolojik gelişme trendi giderek daha da ileri gidiyor. Yani alt katmandan giderek uzaklaşıyoruz, ayrıntılara dikkat etme ihtiyacı giderek azalıyor, ambalajlar giderek daha iyi hale geliyor ve perde arkasında bu işleri yapan çok sayıda insan var. . Bu aynı zamanda bulutun sağladığı değerin ta kendisidir.
İlk CPU bulutunun sağladığı değer, müşterilerin kartları tek tek bağlamak için makine satın almasına gerek kalmamasıdır. Giderek daha iyi paketlenir ve doğrudan üzerinde kullanılabilir. Büyük modeller çağının gelişiyle birlikte, "AI hızlandırma çipi" GPU yavaş yavaş bilgi işlem gücünün merkezi haline geldi ve bilgi işlem gücü büyüme oranı CPU'nunkini çok aşıyor. Bu, CPU bulutundan GPU bulutuna geçişimizi hızlandıracaktır.
GPU bulutu çağında, alt katmanın açığa çıkmasını önlemek, daha gelişmiş bir etkileşimli form oluşturmak ve büyük modelin API'sine doğrudan bağlanmak için bulutun yeteneklerini eninde sonunda daha da kapsamlı hale getireceğiz. Günümüzün bulutu hala mühendisler için geliştirilmiş ve etkileşim formu yeterince kapsamlı değil ama gelecekte en alttaki mühendisler daha az olacak ve üst seviyelere daha fazla insan geçecek. Bu çok ciddi bir değişiklik.
Baidu Akıllı Bulut | Görüntü kaynağı: Visual China
**S: Büyük modeller bulut bilişim pazarının manzarasını yeniden şekillendirecek mi? Eğer öyleyse, sinyali ne zaman göreceğiz? **
Shen Dou: Bu soruyu beğendim. Büyük modeller olmasaydı Baidu'nun bulutunun çalıştırılması çok zor olurdu. Geçmişte, "Derinlemesine endüstri, senaryolara odaklanma, bulut ve zekanın entegrasyonu ve kapsayıcı yapay zeka" diye bağırıyorduk. Baidu Smart Cloud'un yapmak istediği şey, yapay zekayı tüm To B hizmetine yerleştirmek ve bunu bir büyüme noktası.
**Fakat geçmişte geleneksel yapay zeka çok parçalıydı. Bir soruna yönelik bir yetenek üretmesi ve ardından sorunu çözmesi gerekiyor, dolayısıyla çok yönlülüğü nispeten zayıf. Bu durum ölçeklenmesi zor ve brüt karı düşük bir proje sistemi olmasına neden olmaktadır. **
Üretken yapay zeka ortaya çıktıktan sonra, çok iyi bir çok yönlülüğe sahip olduğunu ve birçok sorunu aynı anda çözebildiğini gördük. Temel olarak uygulama katmanından aşağıya doğru birleştirilmiştir. İnce ayar ve eklentiler gerekli olsa bile bunların hepsi standartlaştırılmış eylemlerdir. . Bu, önceki çok parçalı yapay zeka uygulamalarından tamamen farklıdır. Bu, bulut işinde başlı başına büyük bir değişikliktir; IaaS, MaaS'e dönüşmüştür.
**S: Geçmişte Çinli yapay zeka şirketleri proje almak zorundaydı ve bu çok zordu. Sorunlar şimdiki gibi standart ürünlerle çözülemez. **
Shen Ji: Robin ile bulut stratejisini tartıştık (Not: Baidu'nun kurucusu, başkanı ve CEO'su Robin Li) ve o da bizden standartlaştırmamızı ve ölçeklendirmemizi istedi, aksi takdirde Baidu'yu bir teknoloji şirketi olarak yansıtamazdık. değer.
**S: Yani uzun vadeli gelecek standardizasyon ve ölçeklendirmeyle mi ilgili olacak? **
**Shen Dou:**Büyük modellerde ilk günlerde büyük belirsizlikler vardı. Bugün pek çok müşteri, büyük modellerin kapasite sınırları, sınırları, maliyetleri, teslimatı ve talep yöntemleri konusunda henüz ortak bir anlayışa sahip değil. Kısa sürede tüm müşterilerin genel buluta geleceğini garanti edemeyiz ve bunu öncelikle proje sistemi üzerinden yapmamız gerekiyor.
Ancak böyle bir proje sistemi bile önceki proje sisteminden farklıdır. Mesela size özel bir dağıtım modeli verirsem, daha çok Windows ya da Office gibi olur, önce sürüm 95, sonra sürüm 97, sonra sürüm 2000. Görünüşe göre sana evde kurman için bir CD verdim ama aslında abone olmaya devam etmelisin. Bu aynı zamanda orijinalinden farklıdır.
**S: Ancak mali durumunuz iyileşti. Bu yılın ilk çeyreğinde Baidu Akıllı Bulut ilk kez üç aylık kârlılığa ulaştı, bunun nedeninin bulut hizmetlerinin standartlaştırılmasının büyük ölçekli yeniden kullanıma olanak sağlaması ve maliyetleri düşürmesi olduğunu belirtmiştiniz. **
Shen Ji: Evet. Saf proje sistemi veya nispeten yüksek oranda proje sistemi olması durumunda, teslim sonrası brüt kar çok düşüktür.
04 Bir yıldan fazla bir süre Baidu Cloud'un sorumluluğunu üstlendikten sonra en iyi fırsata sahibiz
**S: Baidu'nun en yüksek karar alma kademesinin bir üyesi olarak en çok ne hakkında endişeleniyor ve endişeleniyorsunuz? Ekibinizle sıklıkla hangi konuları tartışıyorsunuz? **
**Shen Dou: Ürün formu açısından Robin'in tüm ürünlerin yapay zeka yerel düşüncesi kullanılarak yeniden yapılandırılması zorunluluğu var. Bu yeniden yapılanmadır, entegrasyon değil. **
Teknik olarak günümüzün üretken yapay zekasının yeteneklerinin ne kadar ileri gidebileceğini düşünüyoruz. Wen Xinyiyan'ın mevcut değerlendirme sonuçları fena değil ancak insan dilinin üst sınırından veya mükemmel insan dili anlayışından uzak. Bu yeteneği hızla geliştirmeye nasıl devam edebiliriz, kesinlikle düşündüğümüz ilk sorudur.
Daha sonra endüstri uygulaması var, model gerçekten nasıl kullanılabilir, hangi senaryolarda kullanılabilir, eşiğin ne kadar yüksek olduğu, sınırın ne kadar geniş olduğu, verimliliğinin nasıl artırılabileceği, herkese daha iyi kullanımlar düşünmesi için nasıl ilham verileceği var. ... Bunlar düşünmeye devam etmemiz gereken şeyler.
**S: Bunlar nispeten yumuşak katmanlardır. Peki ya daha sert katmanlar? **
Shen Dou: Bugünlerde bilgi işlem güç kümeleri 1.000 karttan 10.000 karta çıktı. Baidu, Çin'de 10.000 kart düzeyinde tek bir görevi gerçek anlamda yürütebilen tek şirket.
Wanka kümesinde organizasyon, verimlilik ve garanti, herkesin göremediği gerçek alt düzey görevlerdir ancak bunlar son derece önemlidir. Örneğin, temeldeki donanımın eğitim ve muhakeme verimliliğini ve yazılım ile donanımın entegrasyonunu geliştirmek istiyoruz. Bunların hepsi oldukça önemli şeyler.
**S: Baidu'da uzun yıllardır arama ve reklamcılık işlerinden sorumlusunuz. Geçen yıla kadar akıllı bulutun sorumluluğunu üstlenmediniz. Büyük modellerin tarihi fırsatıyla hemen karşılaştınız. Şanslı hissediyor musun? Nasıl hissediyorsun? **
Shen Dou: O kadar da abartılı değil ama böyle bir şey yapacağım için gerçekten heyecanlı ve şanslıyım.
Geçen yıl görevi devraldığımda, ölçeklendirme ve standartlaştırma (bulut hizmetleri) fikri aklıma geldi. Ancak yapay zeka yetenekleri çok parçalı olduğundan bunu yapmak çok zordur. **O zamanlar çok düşündüm, hem yapay zeka yetenekleri hem de yapay zeka hesaplama gücü gerektiren ve aynı anda birçok kişi tarafından kullanılabilen bir şey var mı? Uzun zamandır bulamıyorum. **
Daha sonra büyük model ortaya çıktı. Bir anda doğru geldi.
Shen Dou, Baidu Group'un başkan yardımcısı ve Baidu Akıllı Bulut Grubu (ACG) başkanı | Görüntü kaynağı: Baidu
**S: Yapay zeka üzerinde çalışıyorsunuz. Büyük model size daha uygun mu? **
Shen Dou: Bu benim yüksek lisans öğrencisiyken yaptıklarıma çok benziyor. Her ne kadar her zaman bilgisayar bilimi okumuş olsam da daha çok yazılım üzerine çalışıyorum ve yapay zeka üzerine çalışıyorum.
Buluta (düşük seviyeli donanım) bağlandıktan sonra aslında işletim sistemleri ve bilgisayar kompozisyonu ilkeleri hakkındaki kitabı tekrar okudum. CPU çağında gerçekten IaaS, ağ bileşenleri ve depolama bilişimi söz konusuysa, bunun hala biraz zor olduğunu düşünüyorum.
Ancak büyük model ortaya çıktıktan sonra, bunların aşağıda özetlendiğini fark ettim. Şimdi esas olarak büyük model üzerinde çalışıyorum, örneğin makale okumak, Qianfan'da API'yi çağırmak için Python kullanmak vb. Kendimi çok daha rahat hissediyorum.
**S: Peki Baidu Akıllı Bulut'un gelişim ve büyüme hızına ilişkin beklentileriniz neler? **
**Shen Ji:**Baidu Akıllı Bulut'un şu anda yaklaşık 20 milyar plakası var ve bu nispeten küçük bir rakam. Büyük modelin bereketiyle müşteri talebimiz çok güçlü hale geldi ve artık çok meşgulüz. Ancak kullanıcıların onu gerçekten kullanabilmesi ve iyi bir şekilde sunabilmesi için hala bir sürece ihtiyacı var.
**S: Dördüncü çeyrekte küçük bir salgın olacak mı? **
**Shen Ji:**Bazıları dördüncü çeyrekte bir salgın çıkacağını tahmin ediyor. Talep gerçekten de artmaya başladı ancak patlamasının gelecek yıla kadar sürebileceğini düşünüyorum.
**S: Şansınızı nasıl değerlendiriyorsunuz? **
Shen Dou: Bunun Baidu'nun şansı olduğunu düşünüyorum. Baidu uzun yıllardır yapay zeka yapıyor ve bunun için çok çaba harcıyor.Eğer büyük modeller mevcut değilse, bulutun ticarileşme yolu gerçekten de daha zor ve meşakkatli olacaktır. Bu sadece Vizyon sahibi şirketlerin sonuçta kötü şansa sahip olmayacağını gösteriyor.