GPU devrimi: Sıfır bilgi kanıtları ile Ethereum'u 1000 kat nasıl hızlandırırız

Bu makale, yüksek performanslı GPU ile zk-SNARKs'in birleşimi sayesinde bir anahtar teknolojik atılımı analiz edecektir. Ethereum'un çalışma verimliliğini yüzlerce hatta binlerce kat artırmayı hedefliyoruz. Bu, sadece Blok zincirinin uzun süredir var olan performans darboğazını çözmekle kalmıyor, aynı zamanda gelecekteki Web3 altyapısı için uygulanabilir bir teknik yol sağlıyor.

Eğer hiç merak ettiysen: Neden Ethereum yavaş çalışıyor ve işlem maliyetleri yüksek? Ya da bir sonraki nesil blok zinciri teknolojisinin ana itici güçlerine mi odaklanıyorsun? O zaman, bu makale sana net cevaplar sunacak.

Sorunun Özelliği: Blok Zinciri Neden Trafik Tıkanıklığı Gibi?

Ethereum'u bir otoyol olarak düşünebilirsiniz. Günümüzde, tüm kullanıcılar ve uygulamalar sınırlı şerit kaynakları için yarışıyor, bu da ağın tıkanmasına, işlem işleme hızının yavaşlamasına ve Gas ücretlerinin yüksek olmasına neden oluyor.

Geleneksel çözüm iki yoldan başka bir şey değildir:

  • Daha fazla şerit onarın - yani Layer 2 ağları (örneğin Rollups) inşa edin
  • Araçları daha küçük hale getirin - yani işlem verilerini sıkıştırın.

Ama eğer araçları "anında" taşımak için bir yol varsa, neden şeritlerde sıkışmaya devam edelim? İşte bu, zk-SNARKs'ın getirdiği paradigma yeniliğidir. Temel düşüncesi şudur: Tüm işlem verilerini iletmek zorunda kalmadan, yalnızca bir matematiksel kanıt oluşturarak işlemin doğruluğunu doğrulayabilirsiniz. Diğer bir deyişle, her bir aracın otoyoldan geçmesini sağlamak yerine, "bu araçların gerçekten varış noktasına ulaştığını" doğrudan doğrulayabiliriz. Bu, veri iletim yükünü azaltmakla kalmaz, aynı zamanda "yüksek verim + güçlü güvenlik + güvensiz doğrulama" üçlüsünün uyumlu olmasını sağlar.

The Verge: Ethereum'un Bir Sonraki Gelişimi

Ethereum şu anda büyük bir teknik plana doğru ilerliyor - The Verge, bunu Ethereum'un "zayıflama planı" olarak düşünebilirsiniz. Hedef: Ethereum düğümünü çalıştırmanın eşiğini büyük ölçüde düşürmek, tıpkı bir uygulamayı bir akıllı telefonda çalıştırmak kadar basit. Gelecekte herkes, yüksek performanslı bir oyun bilgisayarına bağımlı olmadan Ethereum ağına kolayca katılabilecek.

Ancak bu planın arkasında bir anahtar teknik zorluk var: milyonlarca karmaşık matematiksel işlemi çok kısa bir süre içinde tamamlamak gerekiyor.

Bu, Polyhedra ekibinin odaklandığı yenilikçi yönlerden biri - nasıl GPU'ları kullanarak büyük ölçekli ZK hesaplamalarını hızlandıracakları, doğrulama güvenliğini sağlarken icra verimliliğini büyük ölçüde artıracakları.

Teknik Zorluklar: Bu veri seti algınızı alt üst edecek

Anlamakta olduğumuz karmaşıklığı anlamak için, aşağıda Ethereum'un mevcut zincir üzerindeki işlemlerinin gerçek ölçeği bulunmaktadır:

  • Konsens Doğrulama (Consensus Verification): Her blok yaklaşık 90.000.000 SHA 2-256 hash hesaplaması ve 2.048 BLS dijital imza doğrulaması içerir.
  • Durum Geçiş Kanıtları (State Transition Proofs): Her blok yaklaşık 500.000 kez Keccak hash işlemi gerçekleştirmektedir.
  • Mevcut darboğaz:
    CPU tabanlı sıfır bilgi kanıtlayıcısı (Prover) şu anda saniyede yalnızca yaklaşık 2 milyon Poseidon hash hesaplaması yapabiliyor.

Gerçek zorluk, yukarıda belirtilen tüm hesaplamaları tamamlamak için zk-SNARKs teknolojisini kullanmamız gerektiğidir, bu kesinlikle hesaplama karmaşıklığını önemli ölçüde artırmaktadır.

Kırılma Noktası: GPU'nun Hesaplama Gücü Devrimi

Herkesin bildiği gibi, GPU'lar oyun oyuncuları ve AI mühendisleri için vazgeçilmezdir. Ancak gerçekte, bu grafik işleme birimleri, sıfır bilgi kanıtlarının gerektirdiği büyük ölçekli paralel matematiksel hesaplamaları gerçekleştirirken, CPU'lara kıyasla çok daha üstün bir yetenek sergilemektedir.

Polyhedra'da, ZK kanıtlama sistemini GPU yerel optimizasyonu ile geliştirdik ve etkileyici bir performans göstergesi elde ettik:

Performans sıçraması, beklenenden çok daha fazla

  • Temel matematik işlemleri (Mersenne 31 alanı) 362 kat hızlandı
  • Karmaşık kriptografik hesaplamalar (BN 254 eliptik eğrisi) %2826 hız artışı
  • Önceden 21 dakika süren bir sıfır bilgi hesaplaması artık sadece 450 milisaniyeye sıkıştırılmıştır.

Başka bir deyişle, bu, sabah yoğun saatlerdeki işe gidiş sürenizin 20 dakikadan yarım saniyeye düşmesi gibidir. Bu, kademeli bir optimizasyon değil, bir paradigma düzeyinde bir hesaplama sıçramasıdır.

Bu devrim neden sizinle yakından ilgili?

  1. Daha düşük işlem maliyeti: Kanıt oluşturma hızı daha hızlıdır, bu da genel hesaplama maliyetinin belirgin bir şekilde düşmesi anlamına gelir ve dolayısıyla daha düşük Gas ücretleri getirir. Kullanıcılar ve ağ kazan-kazan durumunda.
  2. Daha güçlü güvenlik garantisi: Ethereum'un yıllık 40 milyon doların üzerinde bir güvenlik bütçesi olduğundan bahsettiğimizi hatırlıyor musunuz? Teknolojimiz sayesinde, hafif düğümler de Ethereum konsensüs zincirini kolayca doğrulayabilir, büyük kaynak harcaması olmadan ana ağ düzeyinde güvenlik garantisinden faydalanabilir.
  3. Daha yaygın düğüm çalıştırma, telefonlar da Ethereum çalıştırabilir: Performans ve verimlilikteki sürekli optimizasyonlarımız, sıradan cihazlarda Ethereum düğümü çalıştırmayı mümkün kılıyor. Gelecekte, blok zinciri verilerini doğrulamak için belki de sadece bir telefona ihtiyaç duyulacak.

Teknik Çekirdek: Bunu Nasıl Başardık

1. GPU Yerel Tasarım: CUDA ile Optimize Edilmiş Sumcheck Protokolü

CUDA tabanlı Sumcheck uygulamamız, GPU'nun paralel hesaplama avantajını en iyi şekilde değerlendirmiştir:

  • Sayı alanı işlemleri (toplama, çarpma, üstel işlem) için özelleştirilmiş CUDA çekirdekleri tasarlandı
  • Birleşik bellek erişim moduyla GPU bant genişliği kullanımını en üst düzeye çıkarın (RTX 4090'da 1008 GB/sn'ye kadar ölçülen bant genişliği)
  • Warp seviyesinde ilkelere dayanarak, etkin bir azaltma (Reduction) işlemi gerçekleştirin.

Bu seviye derin özelleştirme, Sumcheck protokolünün CPU'nun seri darboğazıyla sınırlı kalmamasını sağlıyor.

  1. Bellek Kraldır: Bant Genişliği Darboğazı Optimizasyonu Geleneksel görüş, ZK Prover'ın hesaplama darboğazının hesaplama gücünde olduğunu belirtirken, bizim ampirik verilerimiz – Sumcheck'in tipik bir bellek bant genişliği darboğazı sorunu olduğunu göstermektedir:
  • Bellek bant genişliği analizi: Bant genişliği kullanım oranı teorik sınırın %95'ine ulaştı +
  • Veri yapısı optimizasyonu: Geleneksel Yapı Dizileri (AoS) yerine Dizilerin Yapısı (SoA) kullanımı
  • SM birimi kullanım oranının artırılması: İş parçacığı bloğu yapılandırmasını optimize ederek en iyi donanım kullanım oranını sağlama.

Bellek bant genişliği sorununu çözerek, ZK hesaplamayı gerçek bir verimli akış görevi haline getirdik.

3. Farklı sayı alanları için özelleştirilmiş optimizasyon stratejileri

Farklı kriptografi alanları farklı işlem özelliklerine sahiptir, her ana akım alan için optimize edilmiş yollar geliştirdik:

  • Mersenne 31 (M 31): 31 basamaklı tam sayı optimizasyonu, etkili modülasyon yapısı
  • M 31 ext 3 : Genişletilmiş alan desteği, çok terimli genişleme ve düşük maliyet dengesi.
  • BN 254 : Montgomery algoritmasına dayalı özel çarpan, 254-bit büyük tam sayılar alanı için tasarlanmıştır.

Bu yüksek derecede hedeflenmiş alt seviye optimizasyon, ZK Prover'ımızı hem evrensel hem de son derece verimli hale getiriyor.

Performans Verileri Analizi: Optimize Edilen Yerler

Sadece "çok daha hızlı" yapmadık, aynı zamanda ZK performansını eşi benzeri görülmemiş bir seviyeye taşıdık. Aşağıda gerçek test performans verileri bulunmaktadır:

GPU Devrimi: Zero Knowledge Proof ile Ethereum'u 1000 Kat Hızlandırma

Teknoloji Mimarisi İfşası: Motor Kapağının Altındaki Gerçekler

GKR Protokol Yığını: Hızlandırılmış Çekirdek

Hızlandırma optimizasyonumuz GKR (Goldwasser-Kalai-Rothblum) protokolüne odaklanmaktadır, özellikle şunları içermektedir:

  • Doğrusal GKR katmanı: Toplama ve çarpma kapılarını işlemek için kullanılır.
  • Sumcheck protokolü: Performans darboğazı, CPU toplam hesaplama zamanının neredeyse %50'sini kaplıyor.
  • Polinom Değerlendirme Aşaması: GPU'da hesaplama süresini 8.4 saniyeden 9.5 milisaniyeye düşürdü.

GPU çekirdek tasarımı ayrıntılı açıklaması

Birinci Aşama: Polinom Değerlendirmesi

  • 2 ^n noktasında paralel hesaplama
  • Paylaşılan bellek önbellek katsayısını kullanarak erişim hızını artırın
  • Warp shuffle kullanarak verimli azaltma işlemi gerçekleştirme
  • İkinci Aşama: Meydan Okuma Oluşturma
  • CPU-GPU sık geçişlerini önlemek için Fiat-Shamir hash işlemlerini GPU içinde gerçekleştirin.
  • CPU ve GPU arasındaki iletişim gecikmesini azaltmak

Bellek iletim optimizasyonu: Verilerin akışındaki "son kilometreyi" aşmak

CPU-GPU etkileşimi konusunda da sistematik optimizasyonlar yaptık, böylece bant genişliği bir dar boğaz haline gelmemiştir:

  • PCIe veri iletim optimizasyonu: 2 ^{ 27 } elemanı işlemek yalnızca 737 milisaniye sürüyor
  • Sabit Bellek: "Sıfır Kopya" veri aktarımını destekler, kopyalama maliyetlerini azaltır.
  • Asenkron işlem zamanlaması: Hesaplama ve iletişim paralel olarak gerçekleşir, kaynak kullanımını maksimuma çıkarır.

Dürüst olmak gerekirse: Zorluklar hala var.

Her zaman şeffaflığa bağlı kalıyoruz - GPU hızlandırma her şeyin çözümü değildir, uygulama sürecinde birçok teknik engelle karşılaştık:

  1. Bellek bant genişliği zirveye ulaştı
  • H100'ün 3.35 TB/s'ye kadar bant genişliğine sahip olmasına rağmen, yüksek yük altında performans darboğazı haline gelecektir.
  • Karşılaştırıldığında: Daha büyük eliptik eğri alanları (örneğin BN 254) küçük alanlara (örneğin M 31) göre daha hızlı ulaşır.
  1. GPU bellek kapasitesi sınırlıdır
  • RTX 4090, 2 ^{ 29 } öğeyi işlerken bellek tükeniyor
  • Gerçek dağıtımda, taşma riskini önlemek için hassas bir bellek yönetim stratejisi gereklidir.
  1. Alan boyutu ile performans arasındaki denge

GPU Devrimi: Nasıl zk-SNARKs ile Ethereum'u 1000 kat hızlandırıyoruz

  1. "GPU Avantaj Noktaları" karşılaştırması: Ne zaman CPU'yu geçmeye başladı?

GPU devrimi: Eter'i nasıl 1000 kat hızlandırmak için zk-SNARKs kullanıyoruz

Çapraz platform performans testi

Tüketici ve veri merkezi düzeyindeki donanımı kapsayan farklı seviyelerdeki GPU'larda kıyaslama testleri yaptık:

Tüketici seviyesi GPU

  • RTX 3090 : Bellek bant genişliği 936 GB/s, performans artışı en fazla 951 kat olabilir
  • RTX 4090 : Bellek bant genişliği 1008 GB/s, performans artışı maksimum 1565 kat.
  • Veri Merkezi GPU
  • NVIDIA H100: Bant genişliği 3.35 TB/s kadar, performans artışı en fazla 2826 kat

Sonuç net ve açıktır: Bellek bant genişliği, zk-SNARKs hızlandırmasında ana değişkendir.

Geleceğe Bakış: Yol Haritamız

Henüz durmadık, önümüzdeki hedeflerimize ulaşmaya devam edeceğiz:

  • Daha aşırı hızlandırma: Belirli işlemler için hedef, 10, 000 kat hız artışı sağlamaktır.
  • Daha geniş donanım uyumluluğu: Yüksek performanslı oyun grafik kartlarından veri merkezi düzeyindeki hızlandırma kartlarına kadar tam kapsam
  • Yerel Ethereum entegrasyonu: GPU ZK kanıt yığınımızı doğrudan L1 katmanına entegre etmek için Ethereum istemci geliştirme ekibi ile birlikte çalışıyoruz.

Bu devrim dalgasına katıl!

Bu sadece hızın artırılması değil, aynı zamanda blok zincirinin erişilebilirliğinin tamamen yeniden şekillendirilmesidir. Kim olursanız olun, katılmanın bir yolunu bulabilirsiniz:

  • Geliştirici: Geleceği birlikte inşa etmek için Expander ve CUDA deposuna hoş geldiniz.
  • Öğrenciler: Araştırma seminerlerimize ve teknik derin dalışlarımıza dikkat edin, sürekli güncellemeleri kaçırmayın.
  • Herkes: Bu teknolojiyi yay! Anlayan kişi sayısı arttıkça, Web3'ün geleceği o kadar yakınlaşıyor.

Temel Görüşlerin Gözden Geçirilmesi

Heyecan verici bir teknolojik dönüm noktasındayız. zk-SNARKs ve GPU hızlandırmasının birleşimi, sadece performansın marjinal bir artışı değil, aynı zamanda bir paradigma değişikliğidir.

Ethereum'un hız, maliyet ve kullanılabilirlik sınırlarını yeniden tanımlıyoruz.

Anahtar teknik başarılar listesi:

  • Üretim ortamına yönelik ZK kanıtı uygulaması 1000 kat hızlandırma sağlıyor
  • GPU bellek bant genişliği kullanımı %95'i aştı
  • Açık kaynak uygulaması, her an entegre edilebilir

Web3'ün geleceği sadece merkeziyetsiz değil, aynı zamanda hızlı erişilebilir ve düşündüğünüzden daha hızlı.

Bu gelişmelerle en çok ilgilendiğiniz nokta nedir? Yorumlar kısmında bırakabilir veya Twitter'da benimle etkileşime geçebilirsiniz, bu teknik detayları derinlemesine tartışmaktan çok memnuniyet duyarız!

Gelecek hıza aittir, aynı zamanda sana da. Bir sonraki görüşmede, inşa etmeye devam et, sadece hızlı olmakla kalma!

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)