ثورة GPU: كيف يمكننا استخدام zk-SNARKs لجعل إثيريوم أسرع بمقدار 1000 مرة

ستقوم هذه المقالة بتحليل اختراق تقني رئيسي: من خلال دمج وحدات معالجة الرسوميات عالية الأداء مع zk-SNARKs، نحن نعمل على تحسين كفاءة تشغيل إثيريوم بمئات بل وحتى آلاف المرات. لا يحل هذا فقط مشكلة اختناق الأداء التي كانت موجودة منذ فترة طويلة في البلوكتشين، بل يوفر أيضًا مسارًا تقنيًا قابلاً للتطبيق للبنية التحتية لمستقبل Web3.

إذا كنت قد تساءلت: لماذا تعمل إثيريوم ببطء، وتظل تكاليف المعاملات مرتفعة؟ أو كنت تراقب العوامل الرئيسية التي تدفع تقنية البلوكتشين من الجيل التالي؟ إذن، ستوفر لك هذه المقالة إجابات واضحة.

جوهر المشكلة: لماذا تشبه البلوكتشين الطريق السريع المزدحم؟

فكر في Ethereum كطريق سريع. اليوم ، يتنافس جميع المستخدمين والتطبيقات على موارد المسار المحدودة ، مما يؤدي إلى ازدحام الشبكة ، وبطء معالجة المعاملات ، وارتفاع رسوم الغاز.

طرق الحل التقليدية لا تتجاوز نوعين:

  • إصلاح المزيد من المسارات - أي بناء شبكة Layer 2 (مثل Rollups)
  • جعل المركبات أصغر - أي ضغط بيانات المعاملات

لكن إذا كان هناك طريقة يمكن أن "تنقل" المركبات بدلاً من الاستمرار في التزاحم على الممرات؟ هذه هي بالضبط ثورة النموذج التي جلبتها zk-SNARKs. الفكرة الأساسية هي: لا حاجة لنقل جميع بيانات المعاملات نفسها، بل من خلال إنشاء إثبات رياضي، يمكن التحقق من صحة المعاملة. بعبارة أخرى، لم نعد بحاجة إلى جعل كل سيارة تمر عبر الطريق السريع، بل يمكننا ببساطة التحقق من "أن هذه السيارات وصلت بالفعل إلى الوجهة". وهذا لا يقلل فقط من عبء نقل البيانات، بل يسمح أيضًا بتوافق "عالية الإنتاجية + أمان قوي + تحقق غير موثوق به".

ذا فيرج: التطور التالي لإيثريوم

إثيريوم حاليا تقوم بتطوير مخطط تقني عظيم - The Verge، يمكنك أن تفهمه كـ "خطة تخفيف" لإثيريوم. الهدف هو: تقليل عتبة تشغيل عقد إثيريوم بشكل كبير، كما هو الحال في تشغيل تطبيق على الهاتف المحمول. في المستقبل، سيتمكن الجميع من الانضمام بسهولة إلى شبكة إثيريوم، دون الحاجة إلى الاعتماد على جهاز ألعاب عالي الأداء.

لكن هناك تحدٍ تقني رئيسي وراء هذه الخطة: يتطلب إكمال ملايين العمليات الرياضية المعقدة في وقت قصير جدًا.

هذا هو الاتجاه الذي يركز عليه فريق Polyhedra - كيفية استخدام تسريع GPU لحسابات ZK على نطاق واسع، مع ضمان أمان التحقق مع تحسين كبير في كفاءة التنفيذ.

التحديات التقنية: ستغير هذه المجموعة من البيانات فهمك

لفهم التعقيد الذي نتعامل معه ، إليك الحجم الحقيقي لعمليات الإثيريوم الحالية على الشبكة:

  • التحقق من الإجماع (Consensus Verification): كل كتلة تحتوي على حوالي 90 مليون عملية حسابية لتجزئة SHA 2-256، بالإضافة إلى 2048 تحقق من توقيع BLS الرقمي
  • إثبات تحويل الحالة (State Transition Proofs):
    تحتاج كل كتلة إلى تنفيذ حوالي 500,000 عملية تجزئة Keccak
  • العقبة الحالية:
    محرك إثبات المعرفة الصفرية المعتمد على وحدة المعالجة المركزية (Prover) يمكنه حاليًا معالجة حوالي 2 مليون عملية حساب هاش بوسيدون في الثانية.

التحدي الحقيقي هو - نحن بحاجة إلى استخدام تقنية zk-SNARKs لإكمال جميع العمليات المذكورة أعلاه، وهذا بلا شك يزيد بشكل كبير من تعقيد الحساب.

نقطة التحول: ثورة قوة حساب GPU

من المعروف أن وحدات معالجة الرسومات (GPU) هي المفضلة لدى لاعبي الألعاب ومهندسي الذكاء الاصطناعي. لكن في الواقع، تُظهر هذه الوحدات معالجة الرسوميات قدرة تفوق بكثير وحدة المعالجة المركزية (CPU) عند التعامل مع الحسابات الرياضية الكبيرة المطلوبة لإثباتات عدم المعرفة (zk-SNARKs).

في Polyhedra، قمنا بتحسين نظام إثبات ZK ليكون أصليًا على GPU، وحققنا مؤشرات أداء مذهلة وبارزة:

قفزة في الأداء ، تتجاوز التوقعات

  • تسريع العمليات الرياضية الأساسية (مجال Mersenne 31) بمقدار 362 مرة
  • تسريع العمليات التشفيرية المعقدة (منحنى إهليلجي BN 254) يصل إلى 2826 مرة
  • تم تقليص حسابات zk-SNARKs التي كانت تستغرق 21 دقيقة إلى 450 مللي ثانية فقط

بعبارة أخرى، هذا يعادل تقليص وقت تنقلاتك خلال ساعات الذروة الصباحية من 20 دقيقة إلى أقل من نصف ثانية. هذه ليست تحسينات تدريجية، بل هي قفزة حسابية على مستوى النموذج.

لماذا هذه الاختراقات تتعلق بك بشكل وثيق؟

  1. تكلفة معاملات أقل: سرعة توليد الإثباتات الأسرع تعني انخفاضًا كبيرًا في التكلفة الإجمالية للحوسبة، مما يؤدي بدوره إلى رسوم غاز أقل. فوز مزدوج للمستخدمين والشبكة.
  2. ضمان أمان أقوى: هل تذكر أننا ذكرنا أن ميزانية الأمان السنوية لإيثريوم تتجاوز 40 مليون دولار؟ من خلال تقنيتنا، يمكن للنقاط الخفيفة التحقق بسهولة من سلسلة توافق إيثريوم بأكملها، والاستمتاع بضمان أمان على مستوى الشبكة الرئيسية دون الحاجة إلى نفقات موارد ضخمة.
  3. تشغيل العقد الأكثر شيوعًا، يمكن للهاتف المحمول تشغيل إثيريوم: التحسين المستمر في الأداء والكفاءة يجعل من الممكن تشغيل عقد إثيريوم على الأجهزة العادية. في المستقبل، قد يتطلب التحقق من بيانات البلوكتشين هاتفًا محمولًا واحدًا فقط.

التقنية الأساسية: كيف حققنا ذلك

1. تصميم أصلي لوحدة معالجة الرسوميات: بروتوكول Sumcheck المحسن باستخدام CUDA

ننفذ Sumcheck المبني على CUDA، مستفيدين بالكامل من مزايا الحساب المتوازي لوحدة معالجة الرسوميات:

  • تصميم نواة CUDA مخصصة لعمليات الحقول (الجمع، الضرب، الأس)
  • الاستفادة من نمط الوصول إلى الذاكرة المدمج لتعظيم استخدام عرض النطاق الترددي لوحدة معالجة الرسوميات (تم قياس عرض النطاق الترددي لـ RTX 4090 حتى 1008 جيجابايت/ثانية)
  • استخدام بدائل warp لتحقيق عمليات تقليل فعالة (Reduction)

تتيح هذه الدرجة من التخصيص العميق لبروتوكول Sumcheck عدم التقيد بعائق التسلسل لوحدة المعالجة المركزية.

  1. الذاكرة هي الملك: تحسين عنق الزجاجة في النطاق الترددي تعتبر الآراء التقليدية أن عنق الزجاجة في حساب ZK Prover يكمن في القوة الحسابية، لكن أدلتنا التجريبية تظهر - Sumcheck هي مشكلة نموذجية عنق الزجاجة في عرض النطاق الترددي للذاكرة:
  • تحليل عرض النطاق الترددي للذاكرة: نسبة استخدام النطاق تصل إلى الحد الأقصى النظري 95% +
  • تحسين هيكل البيانات: استخدام هيكل المصفوفات (SoA) بدلاً من هيكل المصفوفات التقليدي (AoS)
  • تحسين كفاءة وحدة SM: تحقيق أفضل استخدام للأجهزة من خلال تحسين تكوين كتل الخيوط

من خلال حل مشكلة سعة الذاكرة، جعلنا حسابات ZK مهمة تدفق فعالة حقاً.

3. استراتيجيات تحسين مخصصة للمجالات الرقمية المختلفة

تتميز مجالات التشفير المختلفة بخصائص حسابية مختلفة، لقد قمنا بتصميم مسارات محسنة لكل مجال رئيسي.

  • Mersenne 31 (M 31): 31 بت عدد صحيح تحسين، هيكل عملية المود الفعالة
  • M 31 ext 3 : دعم الحقول الموسعة، مع مراعاة التمدد المتعدد الحدود والتكاليف المنخفضة
  • BN 254 : مضاعف مخصص يعتمد على خوارزمية مونتغومري، مصمم لحقول الأعداد الكبيرة بحجم 254 بت

هذا التحسين القاعدي الموجه بشكل كبير يجعل ZK Prover لدينا عالميًا وفعالًا للغاية.

تحليل بيانات الأداء: أماكن تحسين الأداء

نحن لم نقم فقط بتحسين السرعة بشكل كبير، بل دفعنا أداء ZK إلى آفاق غير مسبوقة. فيما يلي بيانات الأداء الفعلية:

ثورة GPU: كيف نجعل إثيريوم أسرع بمقدار 1000 مرة باستخدام zk-SNARKs

كشف عن هيكل التكنولوجيا: الحقيقة تحت الغطاء

GKR بروتوكول: تسريع النواة

تركز تحسيناتنا المعجلة على بروتوكول GKR (Goldwasser-Kalai-Rothblum) ، والذي يشمل ما يلي:

  • طبقة GKR الخطية: تستخدم لمعالجة بوابات الجمع والضرب
  • بروتوكول Sumcheck: مكان عنق الزجاجة في الأداء، حيث يشغل ما يقرب من 50% من إجمالي وقت حساب وحدة المعالجة المركزية
  • مرحلة تقييم متعددة الحدود: تقليل وقت الحساب على وحدة معالجة الرسومات من 8.4 ثانية إلى 9.5 مللي ثانية

تصميم نواة GPU بالتفصيل

المرحلة الأولى: تقييم كثيرات الحدود

  • حساب متوازي على 2 ^n نقطة
  • استخدام معامل ذاكرة مشتركة للتخزين المؤقت، لزيادة سرعة الوصول
  • باستخدام warp shuffle لتحقيق عمليات تقليل فعالة
  • المرحلة الثانية: توليد التحديات
  • تنفيذ عمليات هاش Fiat-Shamir داخل GPU، لتجنب التبديل المتكرر بين CPU و GPU
  • تقليل زمن الاتصال بين وحدة المعالجة المركزية ووحدة معالجة الرسومات

تحسين نقل الذاكرة: فتح "الآخر كيلومتر" لتدفق البيانات

لقد قمنا بتحسين منهجي في تفاعل وحدة المعالجة المركزية ووحدة معالجة الرسومات لضمان عدم كون النطاق الترددي عنق الزجاجة:

  • تحسين عرض النطاق الترددي لـ PCIe: معالجة 2 ^{ 27 } عنصر يستغرق فقط 737 مللي ثانية
  • الذاكرة المثبتة: تدعم نقل البيانات "بدون نسخ"، مما يقلل من تكاليف النسخ
  • جدولة العمليات غير المتزامنة: يتم تنفيذ الحسابات والاتصالات بالتوازي، مما يزيد من كفاءة استخدام الموارد

الحقيقة: التحديات لا تزال موجودة

نحن نتمسك دائمًا بالشفافية - تسريع GPU ليس الحل الشامل، وفي التقدم الفعلي، واجهنا أيضًا العديد من العقبات التقنية:

  1. تم الوصول إلى الحد الأقصى لعرض النطاق الترددي للذاكرة
  • حتى مع وجود H100 الذي يمتلك عرض نطاق يصل إلى 3.35 TB/s، فإنه سيصبح عنق زجاجة للأداء تحت تحميل عالٍ
  • بالمقارنة: نطاقات منحنيات بيضاوية كبيرة (مثل BN 254) أسرع في الوصول إلى القمة من النطاقات الصغيرة (مثل M 31)
  1. سعة ذاكرة GPU محدودة
  • RTX 4090 عند معالجة 2 ^{ 29 } عنصر الذاكرة نفدت
  • عند النشر الفعلي، هناك حاجة إلى استراتيجية دقيقة لجدولة الذاكرة لتجنب مخاطر الفائض
  1. توازن حجم النطاق والأداء

ثورة GPU: كيف نجعل إثيريوم أسرع بمقدار 1000 مرة باستخدام zk-SNARKs

  1. مقارنة "نقاط قوة GPU": منذ متى بدأت تتجاوز CPU؟

ثورة GPU: كيف جعلنا إثيريوم أسرع بمقدار 1000 مرة باستخدام zk-SNARKs

اختبار الأداء عبر المنصات

لقد أجرينا اختبارات معيارية على مستويات مختلفة من وحدات معالجة الرسوميات، تغطي الأجهزة الخاصة بالمستهلك ومراكز البيانات:

وحدة معالجة الرسومات للاستخدام الاستهلاكي

  • RTX 3090 : عرض النطاق الترددي للذاكرة 936 GB/s، يمكن أن يصل تحسين الأداء إلى 951 مرة
  • RTX 4090 : عرض النطاق الترددي للذاكرة 1008 جيجابايت/ثانية، زيادة في الأداء تصل إلى 1565 مرة
  • مركز البيانات GPU
  • NVIDIA H100: عرض نطاق يصل إلى 3.35 TB/s، أداء محسن يصل إلى 2826 مرة

الخلاصة واضحة: عرض النطاق الترددي للذاكرة هو المتغير الرئيسي في تسريع zk-SNARKs.

آفاق المستقبل: خارطة الطريق الخاصة بنا

لم نتوقف بعد، وسنستمر في مواجهة الأهداف التالية:

  • تسريع أكثر تطرفا: الهدف هو تحقيق زيادة في السرعة بمقدار 10, 000 مرة لبعض العمليات المحددة
  • توافق واسع مع الأجهزة: تغطية شاملة من بطاقات الرسومات عالية الأداء إلى بطاقات تسريع مستوى مركز البيانات
  • التكامل الأصلي مع إثيريوم: نحن نتعاون مع فريق تطوير عميل إثيريوم لدمج مجموعة إثبات GPU ZK لدينا مباشرة في طبقة L1

انضم إلى هذه الموجة من التغيير!

ليس هذا مجرد تحسين في السرعة، بل هو إعادة تشكيل شاملة لإمكانية الوصول إلى البلوكتشين. بغض النظر عن من تكون، يمكنك العثور على طريقة للمشاركة:

  • المطورون: مرحبًا بكم في الاطلاع على مستودعات Expander و CUDA، لبناء المستقبل معًا
  • المتعلمون: تابعوا ورش العمل البحثية لدينا والغوص الفني، وتحديثات مستمرة لا تفوت
  • الجميع: انشروا هذه التقنية! كلما زاد عدد الأشخاص الذين يفهمون، اقترب مستقبل Web3.

مراجعة النقاط الأساسية

نحن في نقطة تحول تقنية مثيرة. الجمع بين zk-SNARKs وتسريع GPU ليس مجرد تحسين هامشي للأداء، بل هو تغيير جذري في النموذج.

نحن نعيد تعريف حدود سرعة إثيريوم وتكاليفه وقابليته للاستخدام.

نظرة عامة على الإنجازات التكنولوجية الرئيسية:

  • تنفيذ إثبات ZK الموجه نحو بيئة الإنتاج بتسريع يزيد عن 1000 مرة
  • معدل استخدام عرض النطاق الترددي لذاكرة GPU يتجاوز 95%
  • تنفيذ مفتوح المصدر، يمكن دمجه في أي وقت

مستقبل Web3 ليس فقط لامركزياً، بل سريع الوصول أيضاً، وهو أسرع مما تتخيل.

ما هي النقطة التي تثير اهتمامك أكثر في هذه التطورات؟ مرحبًا بك في ترك تعليق في قسم التعليقات، أو التفاعل معي على تويتر، نحن سعداء جدًا بالتعمق في هذه التفاصيل التقنية!

المستقبل ينتمي إلى السرعة، وينتمي إليك أيضًا. نراكم في المرة القادمة، استمر في البناء، ليس فقط بسرعة!

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت