Artikel ini akan menganalisis terobosan teknologi kunci: melalui kombinasi GPU berkinerja tinggi dan zk-SNARKs, kami sedang meningkatkan efisiensi operasional Ethereum hingga ratusan bahkan ribuan kali lipat. Ini tidak hanya menyelesaikan kendala kinerja yang telah lama ada di Blockchain, tetapi juga menyediakan jalur teknologi yang layak untuk infrastruktur Web3 di masa depan.
Jika Anda pernah bertanya-tanya: mengapa Ethereum berjalan lambat dan biaya transaksi tetap tinggi? Atau apakah Anda sedang memperhatikan faktor pendorong utama dari teknologi blockchain generasi berikutnya? Maka, artikel ini akan memberikan jawaban yang jelas untuk Anda.
Esensi Masalah: Mengapa Blockchain Seperti Jalan Tol yang Macet?
Pikirkan Ethereum sebagai jalan raya. Saat ini, semua pengguna dan aplikasi bersaing untuk sumber daya jalur yang terbatas, mengakibatkan kemacetan jaringan, pemrosesan transaksi yang lambat, dan biaya gas yang tinggi.
Dua pendekatan tradisional yang tersedia adalah:
Memperbaiki lebih banyak jalur —— yaitu membangun jaringan Layer 2 (seperti Rollups)
Membuat kendaraan lebih kecil —— yaitu mengompresi data transaksi
Tapi bagaimana jika ada cara untuk "teleportasi" kendaraan alih-alih terus berlari di jalur? Ini adalah revolusi paradigma yang dibawa oleh Zero-Knowledge Proofs (ZKPs). Ide intinya adalah bahwa keaslian suatu transaksi dapat diverifikasi dengan menghasilkan bukti matematis tanpa perlu mengirimkan semua data transaksi itu sendiri. Dengan kata lain, alih-alih setiap mobil melaju melalui jalan raya, kita dapat langsung memverifikasi bahwa "mobil-mobil ini memang telah mencapai akhir". Ini tidak hanya mengurangi beban transmisi data, tetapi juga membuat "throughput tinggi + keamanan kuat + verifikasi tanpa kepercayaan" kompatibel.
The Verge: Evolusi Selanjutnya dari Ethereum
Ethereum saat ini bergerak maju dengan cetak biru teknis besar - The Verge, yang dapat Anda pahami sebagai "rencana pelangsingan" Ethereum. Tujuannya: untuk membuat menjalankan node Ethereum semudah menjalankan aplikasi di ponsel Anda. Di masa depan, semua orang akan dapat dengan mudah bergabung dengan jaringan Ethereum tanpa harus bergantung pada PC gaming berperforma tinggi.
Namun, di balik rencana ini ada tantangan teknis kunci: ini memerlukan penyelesaian jutaan operasi matematika kompleks dalam waktu yang sangat singkat.
Inilah arah terobosan yang difokuskan oleh tim Polyhedra —— bagaimana memanfaatkan GPU untuk mempercepat komputasi ZK skala besar, sambil menjamin keamanan verifikasi dan secara signifikan meningkatkan efisiensi eksekusi.
Tantangan Teknologi: Kumpulan data ini akan mengguncang pemahaman Anda
Untuk memahami kompleksitas yang kami hadapi, berikut adalah skala nyata dari operasi on-chain Ethereum saat ini:
Verifikasi Konsensus (Consensus Verification):
Setiap blok berisi sekitar 9,000,000 SHA 2-256 perhitungan hash dan 2,048 verifikasi tanda tangan digital BLS.
Bukti Transisi Status (State Transition Proofs):
Setiap blok membutuhkan sekitar 500.000 kali operasi hash Keccak.
Kendala saat ini:
Prover berbasis CPU saat ini hanya dapat memproses sekitar 2 juta perhitungan hash Poseidon per detik.
Tantangan sebenarnya adalah—kita perlu menggunakan teknologi zk-SNARKs untuk menyelesaikan semua perhitungan di atas, yang tentunya secara signifikan meningkatkan kompleksitas komputasi.
Titik Terobosan: Revolusi Kekuatan Komputasi GPU
Seperti yang kita ketahui, GPU adalah favorit para gamer dan insinyur AI. Namun, pada kenyataannya, unit pemrosesan grafis ini menunjukkan kemampuan yang jauh lebih baik daripada CPU dalam melakukan perhitungan matematis paralel skala besar yang diperlukan untuk zk-SNARKs.
Di Polyhedra, kami telah mengoptimalkan sistem ZK menggunakan GPU secara asli dan mencapai indikator kinerja yang mengejutkan.
Lompatan kinerja, jauh melebihi ekspektasi
Percepatan operasi matematika dasar (bidang Mersenne 31) sebesar 362 kali
Perhitungan kriptografi kompleks (kurva elips BN 254) dipercepat hingga 2826 kali
Sebuah perhitungan zk-SNARKs yang awalnya memakan waktu 21 menit, kini telah dikompresi menjadi hanya 450 milidetik.
Dengan kata lain, ini setara dengan waktu perjalanan puncak pagi Anda yang biasanya 20 menit berkurang menjadi kurang dari setengah detik. Ini bukan optimasi bertahap, tetapi sebuah lompatan komputasi pada tingkat paradigma.
Mengapa terobosan ini terkait langsung dengan Anda?
Biaya transaksi yang lebih rendah: Kecepatan pembuatan bukti yang lebih cepat berarti biaya komputasi keseluruhan menurun secara signifikan, yang pada gilirannya menghasilkan biaya Gas yang lebih rendah. Menang untuk pengguna dan jaringan.
Keamanan yang lebih kuat: Ingat ketika kami menyebutkan bahwa Ethereum memiliki anggaran keamanan rata-rata lebih dari $40 juta per tahun? Melalui teknologi kami, node ringan dapat dengan mudah memverifikasi seluruh rantai konsensus Ethereum dan menikmati keamanan tingkat mainnet tanpa overhead sumber daya yang besar.
Node yang lebih umum dapat dijalankan, ponsel juga bisa menjalankan Ethereum: Optimasi berkelanjutan kami dalam kinerja dan efisiensi sedang membuat kemungkinan menjalankan node Ethereum di perangkat biasa. Di masa depan, verifikasi data blockchain mungkin hanya memerlukan sebuah ponsel.
Inti Teknologi: Bagaimana Kami Melakukannya
1. Desain asli GPU: Protokol Sumcheck yang dioptimalkan dengan CUDA
Implementasi Sumcheck yang kami bangun berdasarkan CUDA, memanfaatkan sepenuhnya keunggulan komputasi paralel GPU:
Merancang kernel CUDA yang disesuaikan untuk operasi di domain bilangan (penjumlahan, perkalian, operasi pangkat)
Memanfaatkan pola akses memori gabungan untuk memaksimalkan pemanfaatan bandwidth GPU (RTX 4090 mengukur bandwidth hingga 1008 GB/s)
Menggunakan primitif tingkat warp, untuk melakukan operasi reduksi yang efisien.
Kustomisasi mendalam pada tingkat ini membuat protokol Sumcheck tidak lagi terikat pada batasan serial CPU.
Memori adalah Raja: Optimasi Bottleneck Bandwidth Pandangan tradisional menganggap bahwa bottleneck perhitungan ZK Prover terletak pada kekuatan komputasi, tetapi bukti empiris kami menunjukkan - Sumcheck adalah masalah bottleneck bandwidth memori yang khas:
Analisis throughput memori: penggunaan bandwidth mencapai batas teoritis 95% +
Optimasi struktur data: menggunakan Structure-of-Arrays (SoA) sebagai pengganti struktur Array-of-Structures (AoS) tradisional.
Peningkatan Utilisasi Unit SM: Mencapai penggunaan perangkat keras terbaik melalui pengoptimalan konfigurasi blok utas.
Dengan menyelesaikan masalah throughput memori, kami telah mengubah perhitungan ZK menjadi tugas aliran yang benar-benar efisien.
3. Strategi optimasi kustom untuk berbagai domain angka
Bidang kriptografi yang berbeda memiliki karakteristik operasi yang berbeda, kami telah menyesuaikan jalur optimasi untuk setiap bidang utama:
Mersenne 31 (M 31): Optimasi bilangan bulat 31 bit, struktur operasi modulus yang efisien
M 31 ext 3 : Dukungan bidang yang diperluas, memperhatikan perluasan polinomial dan biaya rendah
BN 254 : Pengali khusus berbasis algoritma Montgomery, dirancang untuk bidang bilangan bulat besar 254-bit
Optimisasi dasar yang sangat spesifik ini memungkinkan ZK Prover kami menjadi umum dan sangat efisien.
Pemecahan Data Kinerja: Tempat Terjadinya Optimasi
Kami tidak hanya melakukan "jauh lebih cepat", tetapi juga mendorong kinerja ZK ke tingkat yang belum pernah ada sebelumnya. Berikut adalah data kinerja yang diuji secara nyata:
Pengungkapan Arsitektur Teknologi: Kebenaran di Bawah Kap Mesin
Tumpukan Protokol GKR: Inti yang Dipercepat
Optimisasi percepatan kami berfokus pada protokol GKR (Goldwasser-Kalai-Rothblum), yang mencakup:
Lapisan GKR Linier: digunakan untuk memproses gerbang penjumlahan dan perkalian
Protokol Sumcheck: titik kemacetan kinerja, menyita hampir 50% dari total waktu komputasi CPU
Tahap evaluasi polinomial: Mengurangi waktu komputasi di GPU dari 8,4 detik menjadi 9,5 milidetik
Penjelasan Detil Desain Inti GPU
Tahap Pertama: Evaluasi Polinomial
Menghitung secara paralel pada 2 ^n titik
Menggunakan koefisien cache memori bersama untuk meningkatkan kecepatan akses
Mewujudkan operasi reduksi yang efisien dengan bantuan warp shuffle
Tahap Kedua: Tantangan Generasi
Melakukan operasi hash Fiat-Shamir di dalam GPU, menghindari perpindahan sering antara CPU-GPU
Mengurangi latensi komunikasi antara CPU dan GPU
Optimalisasi transfer memori: Menyambungkan "kilometer terakhir" aliran data
Kami juga telah melakukan optimasi sistematis dalam interaksi CPU-GPU untuk memastikan bandwidth tidak menjadi bottleneck:
Optimasi throughput data PCIe: memproses 2 ^{ 27 } elemen hanya memerlukan 737 milidetik
Memori Tersemat: Mendukung transfer data "tanpa salinan", mengurangi biaya penyalinan.
Penjadwalan operasi asinkron: perhitungan dan komunikasi dilakukan secara paralel, memaksimalkan pemanfaatan sumber daya
Bicara terus terang: tantangan masih ada
Kami selalu berpegang pada transparansi—penggunaan GPU tidak selalu merupakan solusi yang sempurna, dalam implementasinya, kami juga menghadapi banyak kendala teknis:
Bandwidth memori telah mencapai puncaknya
Meskipun H100 memiliki bandwidth hingga 3,35 TB/s, itu masih bisa menjadi bottleneck kinerja di bawah beban tinggi.
Jika dibandingkan: domain kurva elips yang lebih besar (seperti BN 254) lebih cepat mencapai puncaknya dibandingkan domain yang lebih kecil (seperti M 31)
Strategi penjadwalan memori yang cermat diperlukan saat penerapan nyata, untuk menghindari risiko overflow.
Perdagangan antara ukuran domain dan kinerja
Perbandingan "Keunggulan GPU": Sejak kapan mulai melampaui CPU?
Pengujian Kinerja Lintas Platform
Kami telah melakukan pengujian benchmark pada GPU dengan tingkat yang berbeda, mencakup perangkat keras kelas konsumen dan kelas pusat data:
GPU kelas konsumen
RTX 3090: Lebar pita memori 936 GB/s, peningkatan kinerja bisa mencapai 951 kali lipat
RTX 4090: bandwidth memori 1008 GB/s, peningkatan kinerja maksimum mencapai 1565 kali
Pusat data GPU
NVIDIA H100: Bandwidth hingga 3,35 TB/s, peningkatan kinerja maksimum hingga 2826 kali
Kesimpulan jelas dan tegas: bandwidth memori adalah variabel kunci dalam percepatan zk-SNARKs.
Melihat ke Depan: Peta Jalan Kami
Kami belum berhenti, selanjutnya kami akan terus berjuang untuk mencapai tujuan berikut:
Percepatan yang lebih ekstrem: untuk operasi tertentu, targetnya adalah mencapai peningkatan kecepatan 10.000 kali
Kompatibilitas perangkat keras yang lebih luas: dari kartu grafis game berkinerja tinggi hingga kartu akselerator tingkat pusat data.
Integrasi asli Ethereum: Kami sedang bekerja sama dengan tim pengembang klien Ethereum untuk mengintegrasikan tumpukan bukti ZK GPU kami secara langsung ke dalam lapisan L1
Bergabunglah dalam gelombang perubahan ini!
Ini bukan hanya peningkatan kecepatan, tetapi juga perombakan total terhadap aksesibilitas Blockchain. Siapa pun Anda, Anda dapat menemukan cara untuk berpartisipasi:
Pengembang: Selamat datang untuk melihat repositori Expander dan CUDA kami, bersama-sama membangun masa depan
Pembelajar: Ikuti seminar penelitian dan pendalaman teknis kami, terus perbarui agar tidak ketinggalan
Semua orang: Sebarkan teknologi ini! Semakin banyak yang memahami, semakin dekat masa depan Web3.
Tinjauan Pandangan Utama
Kita berada di titik balik teknologi yang menggembirakan. Kombinasi antara zk-SNARKs dan akselerasi GPU bukan hanya peningkatan marginal dalam kinerja, tetapi merupakan sebuah perubahan paradigma.
Kami sedang mendefinisikan ulang batas kecepatan, biaya, dan kegunaan Ethereum.
Daftar hasil teknologi kunci:
Implementasi ZK proof yang ditujukan untuk lingkungan produksi dengan percepatan lebih dari 1000 kali
Utilisasi bandwidth memori GPU melebihi 95%
Implementasi sumber terbuka, dapat diintegrasikan kapan saja
Masa depan Web3 tidak hanya terdesentralisasi, tetapi juga dapat diakses dengan sangat cepat, dan itu lebih cepat dari yang Anda bayangkan.
Apa yang paling menarik bagi Anda tentang kemajuan ini? Silakan tinggalkan komentar di kolom komentar, atau berinteraksi dengan saya di Twitter, kami sangat senang untuk mendalami detail teknis ini!
Masa depan milik kecepatan, dan juga milikmu. Sampai jumpa, terus membangun, tidak hanya cepat!
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
Revolusi GPU: Bagaimana kami menggunakan zk-SNARKs untuk membuat Ethereum 1000 kali lebih cepat
Artikel ini akan menganalisis terobosan teknologi kunci: melalui kombinasi GPU berkinerja tinggi dan zk-SNARKs, kami sedang meningkatkan efisiensi operasional Ethereum hingga ratusan bahkan ribuan kali lipat. Ini tidak hanya menyelesaikan kendala kinerja yang telah lama ada di Blockchain, tetapi juga menyediakan jalur teknologi yang layak untuk infrastruktur Web3 di masa depan.
Jika Anda pernah bertanya-tanya: mengapa Ethereum berjalan lambat dan biaya transaksi tetap tinggi? Atau apakah Anda sedang memperhatikan faktor pendorong utama dari teknologi blockchain generasi berikutnya? Maka, artikel ini akan memberikan jawaban yang jelas untuk Anda.
Esensi Masalah: Mengapa Blockchain Seperti Jalan Tol yang Macet?
Pikirkan Ethereum sebagai jalan raya. Saat ini, semua pengguna dan aplikasi bersaing untuk sumber daya jalur yang terbatas, mengakibatkan kemacetan jaringan, pemrosesan transaksi yang lambat, dan biaya gas yang tinggi.
Dua pendekatan tradisional yang tersedia adalah:
Tapi bagaimana jika ada cara untuk "teleportasi" kendaraan alih-alih terus berlari di jalur? Ini adalah revolusi paradigma yang dibawa oleh Zero-Knowledge Proofs (ZKPs). Ide intinya adalah bahwa keaslian suatu transaksi dapat diverifikasi dengan menghasilkan bukti matematis tanpa perlu mengirimkan semua data transaksi itu sendiri. Dengan kata lain, alih-alih setiap mobil melaju melalui jalan raya, kita dapat langsung memverifikasi bahwa "mobil-mobil ini memang telah mencapai akhir". Ini tidak hanya mengurangi beban transmisi data, tetapi juga membuat "throughput tinggi + keamanan kuat + verifikasi tanpa kepercayaan" kompatibel.
The Verge: Evolusi Selanjutnya dari Ethereum
Ethereum saat ini bergerak maju dengan cetak biru teknis besar - The Verge, yang dapat Anda pahami sebagai "rencana pelangsingan" Ethereum. Tujuannya: untuk membuat menjalankan node Ethereum semudah menjalankan aplikasi di ponsel Anda. Di masa depan, semua orang akan dapat dengan mudah bergabung dengan jaringan Ethereum tanpa harus bergantung pada PC gaming berperforma tinggi.
Namun, di balik rencana ini ada tantangan teknis kunci: ini memerlukan penyelesaian jutaan operasi matematika kompleks dalam waktu yang sangat singkat.
Inilah arah terobosan yang difokuskan oleh tim Polyhedra —— bagaimana memanfaatkan GPU untuk mempercepat komputasi ZK skala besar, sambil menjamin keamanan verifikasi dan secara signifikan meningkatkan efisiensi eksekusi.
Tantangan Teknologi: Kumpulan data ini akan mengguncang pemahaman Anda
Untuk memahami kompleksitas yang kami hadapi, berikut adalah skala nyata dari operasi on-chain Ethereum saat ini:
Prover berbasis CPU saat ini hanya dapat memproses sekitar 2 juta perhitungan hash Poseidon per detik.
Tantangan sebenarnya adalah—kita perlu menggunakan teknologi zk-SNARKs untuk menyelesaikan semua perhitungan di atas, yang tentunya secara signifikan meningkatkan kompleksitas komputasi.
Titik Terobosan: Revolusi Kekuatan Komputasi GPU
Seperti yang kita ketahui, GPU adalah favorit para gamer dan insinyur AI. Namun, pada kenyataannya, unit pemrosesan grafis ini menunjukkan kemampuan yang jauh lebih baik daripada CPU dalam melakukan perhitungan matematis paralel skala besar yang diperlukan untuk zk-SNARKs.
Di Polyhedra, kami telah mengoptimalkan sistem ZK menggunakan GPU secara asli dan mencapai indikator kinerja yang mengejutkan.
Lompatan kinerja, jauh melebihi ekspektasi
Dengan kata lain, ini setara dengan waktu perjalanan puncak pagi Anda yang biasanya 20 menit berkurang menjadi kurang dari setengah detik. Ini bukan optimasi bertahap, tetapi sebuah lompatan komputasi pada tingkat paradigma.
Mengapa terobosan ini terkait langsung dengan Anda?
Inti Teknologi: Bagaimana Kami Melakukannya
1. Desain asli GPU: Protokol Sumcheck yang dioptimalkan dengan CUDA
Implementasi Sumcheck yang kami bangun berdasarkan CUDA, memanfaatkan sepenuhnya keunggulan komputasi paralel GPU:
Kustomisasi mendalam pada tingkat ini membuat protokol Sumcheck tidak lagi terikat pada batasan serial CPU.
Dengan menyelesaikan masalah throughput memori, kami telah mengubah perhitungan ZK menjadi tugas aliran yang benar-benar efisien.
3. Strategi optimasi kustom untuk berbagai domain angka
Bidang kriptografi yang berbeda memiliki karakteristik operasi yang berbeda, kami telah menyesuaikan jalur optimasi untuk setiap bidang utama:
Optimisasi dasar yang sangat spesifik ini memungkinkan ZK Prover kami menjadi umum dan sangat efisien.
Pemecahan Data Kinerja: Tempat Terjadinya Optimasi
Kami tidak hanya melakukan "jauh lebih cepat", tetapi juga mendorong kinerja ZK ke tingkat yang belum pernah ada sebelumnya. Berikut adalah data kinerja yang diuji secara nyata:
Pengungkapan Arsitektur Teknologi: Kebenaran di Bawah Kap Mesin
Tumpukan Protokol GKR: Inti yang Dipercepat
Optimisasi percepatan kami berfokus pada protokol GKR (Goldwasser-Kalai-Rothblum), yang mencakup:
Penjelasan Detil Desain Inti GPU
Tahap Pertama: Evaluasi Polinomial
Optimalisasi transfer memori: Menyambungkan "kilometer terakhir" aliran data
Kami juga telah melakukan optimasi sistematis dalam interaksi CPU-GPU untuk memastikan bandwidth tidak menjadi bottleneck:
Bicara terus terang: tantangan masih ada
Kami selalu berpegang pada transparansi—penggunaan GPU tidak selalu merupakan solusi yang sempurna, dalam implementasinya, kami juga menghadapi banyak kendala teknis:
Pengujian Kinerja Lintas Platform
Kami telah melakukan pengujian benchmark pada GPU dengan tingkat yang berbeda, mencakup perangkat keras kelas konsumen dan kelas pusat data:
GPU kelas konsumen
Kesimpulan jelas dan tegas: bandwidth memori adalah variabel kunci dalam percepatan zk-SNARKs.
Melihat ke Depan: Peta Jalan Kami
Kami belum berhenti, selanjutnya kami akan terus berjuang untuk mencapai tujuan berikut:
Bergabunglah dalam gelombang perubahan ini!
Ini bukan hanya peningkatan kecepatan, tetapi juga perombakan total terhadap aksesibilitas Blockchain. Siapa pun Anda, Anda dapat menemukan cara untuk berpartisipasi:
Tinjauan Pandangan Utama
Kita berada di titik balik teknologi yang menggembirakan. Kombinasi antara zk-SNARKs dan akselerasi GPU bukan hanya peningkatan marginal dalam kinerja, tetapi merupakan sebuah perubahan paradigma.
Kami sedang mendefinisikan ulang batas kecepatan, biaya, dan kegunaan Ethereum.
Daftar hasil teknologi kunci:
Masa depan Web3 tidak hanya terdesentralisasi, tetapi juga dapat diakses dengan sangat cepat, dan itu lebih cepat dari yang Anda bayangkan.
Apa yang paling menarik bagi Anda tentang kemajuan ini? Silakan tinggalkan komentar di kolom komentar, atau berinteraksi dengan saya di Twitter, kami sangat senang untuk mendalami detail teknis ini!
Masa depan milik kecepatan, dan juga milikmu. Sampai jumpa, terus membangun, tidak hanya cepat!