OpenLedger: بناء نماذج قائمة على البيانات يمكن تجميعها للاقتصاد الذكي.

OpenLedger العمق研报: باستخدام OP Stack+EigenDA كقاعدة، بناء اقتصاد وكيل مدفوع بالبيانات وقابل للتجميع بالنماذج

أ. المقدمة | انتقال طبقة النموذج لـ Crypto AI

البيانات والنماذج والقدرة الحاسوبية هي العناصر الأساسية الثلاثة للبنية التحتية للذكاء الاصطناعي، تشبه الوقود (البيانات) والمحرك (النموذج) والطاقة (القدرة الحاسوبية) التي لا يمكن الاستغناء عنها. على غرار مسار تطور البنية التحتية في صناعة الذكاء الاصطناعي التقليدية، شهدت مجال Crypto AI مراحل مماثلة. في أوائل عام 2024، كانت السوق تهيمن عليها مشاريع GPU اللامركزية، حيث كانت تؤكد بشكل عام على منطق النمو الواسع النطاق "تجميع القدرة الحاسوبية". ومع دخول عام 2025، بدأت الصناعة في تحويل تركيزها تدريجياً نحو طبقة النماذج والبيانات، مما يشير إلى أن Crypto AI تنتقل من المنافسة على الموارد الأساسية إلى بناء أكثر استدامة وقيمة تطبيقية في الطبقة المتوسطة.

نماذج اللغة العامة (LLM) مقابل النماذج المتخصصة (SLM)

تدريب نماذج اللغة الكبيرة التقليدية (LLM) يعتمد بشكل كبير على مجموعات البيانات الضخمة والهياكل الموزعة المعقدة، حيث يتراوح حجم المعلمات بين 70B و 500B، وغالبًا ما تصل تكاليف التدريب لمرة واحدة إلى ملايين الدولارات. بينما تُعتبر SLM (نموذج اللغة المتخصص) نمطًا للتعديل الخفيف على نموذج أساسي قابل لإعادة الاستخدام، وعادة ما تستند إلى نماذج مفتوحة المصدر، وتجمع بين كمية قليلة من البيانات المتخصصة عالية الجودة وتقنيات مثل LoRA، لبناء نماذج خبراء تتسم بمعرفة خاصة بمجالات معينة بشكل سريع، مما يقلل بشكل كبير من تكاليف التدريب والعقبات التقنية.

من الجدير بالذكر أن SLM لن يتم دمجه في أوزان LLM، بل سيتم تشغيله بالتعاون مع LLM من خلال استدعاء هيكل Agent، ونظام المكونات الإضافية للتوجيه الديناميكي، وقابلية الإزالة الساخنة لوحدات LoRA، وRAG (التوليد المعزز بالاسترجاع) وغيرها من الطرق. يحتفظ هذا الهيكل بقدرة LLM على التغطية الواسعة، بينما يعزز الأداء المتخصص من خلال وحدات التعديل الدقيق، مما يشكل نظام ذكاء مركب مرن للغاية.

قيمة وحدود الذكاء الاصطناعي في مستوى النموذج

مشاريع الذكاء الاصطناعي للعملات المشفرة في جوهرها صعبة في تعزيز القدرات الأساسية لنموذج اللغة الكبير (LLM) بشكل مباشر، والسبب الرئيسي في ذلك هو

  • عائق تقني مرتفع جداً: حجم البيانات والموارد الحسابية والقدرات الهندسية اللازمة لتدريب نموذج Foundation ضخمة للغاية، حالياً لا تمتلك القدرة المناسبة إلا شركات التكنولوجيا الكبرى مثل الولايات المتحدة والصين.
  • قيود النظام البيئي مفتوح المصدر: على الرغم من أن النماذج الأساسية السائدة مثل LLaMA و Mixtral قد تم فتح مصدرها، إلا أن المفتاح الحقيقي لدفع نماذج الاختراق لا يزال مركزيًا حول المؤسسات البحثية ونظام الهندسة المغلق، ويظل مجال مشاركة المشاريع على السلسلة في مستوى النموذج الأساسي محدودًا.

ومع ذلك، يمكن لمشاريع Crypto AI على نموذج الأساس المفتوح أن تحقق قيمة ممتدة من خلال التخصيص الدقيق لنماذج اللغة (SLM)، ودمج قابلية التحقق وآليات التحفيز الخاصة بـ Web3. كـ "طبقة واجهة محيطية" لسلسلة صناعة AI، تتجلى في اتجاهين رئيسيين:

  • طبقة التحقق الموثوق: من خلال تسجيل مسار توليد النموذج، ومساهمات البيانات، واستخدامها على السلسلة، يتم تعزيز قابلية تتبع مخرجات الذكاء الاصطناعي ومقاومة التلاعب.
  • آلية التحفيز: باستخدام توكن الأصلي، لتحفيز سلوكيات تحميل البيانات، استدعاء النماذج، وتنفيذ الوكلاء، لبناء حلقة دائرية إيجابية لتدريب النماذج والخدمات.

تصنيف أنواع نماذج الذكاء الاصطناعي وتحليل ملاءمتها للبلوكشين

من هنا يتضح أن النقاط القابلة للتطبيق لمشاريع Crypto AI من نوع نموذجية تتركز بشكل رئيسي على تحسين الخفة للـ SLM الصغيرة، وإدخال البيانات والتحقق من صحتها على السلسلة باستخدام بنية RAG، بالإضافة إلى النشر المحلي لنموذج Edge والتحفيز. بالجمع بين قابلية التحقق في blockchain وآلية الرموز، يمكن لـ Crypto أن تقدم قيمة فريدة لهذه السيناريوهات ذات الموارد المتوسطة والمنخفضة، مما يخلق قيمة متميزة لطبقة واجهة AI.

سلسلة البلوكشين AI المستندة إلى البيانات والنماذج، يمكنها تسجيل مصدر مساهمات كل بيانات ونماذج بوضوح وبدون تغيير على السلسلة، مما يعزز بشكل كبير موثوقية البيانات وقابلية تتبع تدريب النماذج. في نفس الوقت، من خلال آلية العقود الذكية، يتم تفعيل توزيع المكافآت تلقائيًا عند استدعاء البيانات أو النماذج، مما يحول سلوك AI إلى قيمة رمزية قابلة للقياس والتداول، وبناء نظام تحفيز مستدام. بالإضافة إلى ذلك، يمكن لمستخدمي المجتمع تقييم أداء النماذج من خلال تصويت الرموز، والمشاركة في وضع القواعد والتكرار، وتحسين هيكل الحوكمة اللامركزية.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-62B3FAe810F4772AABA3D91C74C1AA6)

الثاني، نظرة عامة على المشروع | رؤية OpenLedger للذكاء الاصطناعي في السلسلة

OpenLedger هو واحد من المشاريع القليلة في سوق blockchain AI التي تركز على آليات تحفيز البيانات والنماذج. لقد طرح مفهوم "Payable AI" لأول مرة، بهدف بناء بيئة تشغيل AI عادلة وشفافة وقابلة للتجميع، لتحفيز مساهمي البيانات ومطوري النماذج وبناة تطبيقات AI للتعاون على نفس المنصة، والحصول على عوائد على السلسلة بناءً على المساهمات الفعلية.

OpenLedger تقدم حلقة مغلقة كاملة من "توفير البيانات" إلى "نشر النموذج" ثم إلى "استدعاء توزيع الأرباح"، وتشمل وحداتها الأساسية:

  • مصنع النموذج: بدون الحاجة إلى البرمجة، يمكنك استخدام LoRA لتدريب وتخصيص النماذج بناءً على LLM مفتوح المصدر.
  • OpenLoRA: يدعم التعايش بين آلاف النماذج، تحميل ديناميكي حسب الحاجة، مما يقلل بشكل كبير من تكاليف النشر؛
  • PoA (إثبات النسبة): قياس المساهمة وتوزيع المكافآت من خلال سجلات استدعاء السلسلة.
  • Datanets: شبكة بيانات هيكلية موجهة نحو سيناريوهات فريدة، تم بناؤها والتحقق منها من خلال التعاون المجتمعي؛
  • منصة اقتراح النماذج (Model Proposal Platform): سوق نماذج على السلسلة قابلة للتجميع، قابلة للاستدعاء، وقابلة للدفع.

من خلال الوحدات المذكورة أعلاه، قامت OpenLedger ببناء "البنية التحتية للاقتصاد الذكي القائم على البيانات والموديلات القابلة للتجميع"، مما يعزز من تحويل سلسلة القيمة الخاصة بالذكاء الاصطناعي إلى سلسلة الكتل.

وفي اعتماد تكنولوجيا البلوك تشين، تستخدم OpenLedger OP Stack + EigenDA كأساس، لبناء بيئة تشغيل عالية الأداء ومنخفضة التكلفة وقابلة للتحقق للبيانات والعقود لنماذج الذكاء الاصطناعي.

  • مبني على OP Stack: مبني على تقنية Optimism، يدعم تنفيذ عالي الإنتاجية ومنخفض التكلفة؛
  • التسوية على شبكة الإيثيريوم الرئيسية: ضمان أمان المعاملات وسلامة الأصول؛
  • متوافق مع EVM: يسهل على المطورين نشر وتوسيع بسرعة بناءً على Solidity؛
  • EigenDA يوفر دعم توافر البيانات: يقلل بشكل كبير من تكاليف التخزين ويضمن قابلية التحقق من البيانات.

بالمقارنة مع NEAR، التي تركز أكثر على البنية التحتية الأساسية وتهدف إلى سيادة البيانات، و "AI Agents on BOS"، فإن OpenLedger تركز بشكل أكبر على بناء سلسلة AI مخصصة لتحفيز البيانات والنماذج، وتهدف إلى جعل تطوير النماذج واستدعائها قابلين للتتبع، وقابلين للتجميع، وقابلين للاستدامة على السلسلة. إنها بنية تحتية لتحفيز النماذج في عالم Web3، تجمع بين استضافة النماذج، وفوترة الاستخدام، وواجهات قابلة للتجميع على السلسلة، مما يدفع نحو تحقيق "النموذج كأصل".

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-19C2276FCCC616CCF9260FB7E35C9C24)

ثلاثة، المكونات الأساسية لـ OpenLedger وهندسة التكنولوجيا

3.1 مصنع النماذج، لا حاجة لبرمجة نموذج المصنع

ModelFactory هو منصة لتخصيص نموذج اللغة الكبير (LLM) تحت نظام OpenLedger. على عكس أطر التخصيص التقليدية، يقدم ModelFactory واجهة رسومية بالكامل دون الحاجة إلى أدوات سطر الأوامر أو تكامل API. يمكن للمستخدمين تخصيص النماذج بناءً على مجموعات البيانات التي تم تفويضها ومراجعتها في OpenLedger. تم تحقيق سير العمل المتكامل لتفويض البيانات، وتدريب النماذج، ونشرها، وتشمل العمليات الأساسية ما يلي:

  • التحكم في الوصول إلى البيانات: يقدم المستخدم طلب بيانات، ويقوم المزود بمراجعته والموافقة عليه، ويتم توصيل البيانات تلقائيًا بواجهة تدريب النموذج.
  • اختيار النموذج وتكوينه: يدعم LLM الرائجة (مثل LLaMA و Mistral)، من خلال واجهة المستخدم الرسومية لتكوين المعلمات الفائقة.
  • خفيفة الوزن ضبط دقيق: محرك LoRA / QLoRA المدمج، يعرض تقدم التدريب في الوقت الحقيقي.
  • تقييم النموذج ونشره: أدوات تقييم مدمجة، تدعم تصدير النشر أو مشاركة الاستدعاء البيئي.
  • واجهة التحقق التفاعلية: توفر واجهة دردشة، مما يسهل اختبار قدرة النموذج على الإجابة.
  • توليد تتبع RAG: إجابات تتضمن مراجع مصادر، تعزز الثقة وقابلية التدقيق.

نظام نموذج المصنع يتضمن ستة وحدات، تشمل المصادقة على الهوية، حقوق البيانات، ضبط النموذج الدقيق، التقييم والنشر، وRAG للتتبع، لإنشاء منصة خدمات نموذج متكاملة آمنة وقابلة للتحكم، تفاعلية في الوقت الحقيقي، وقابلة للتحقيق المستدام.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ Moments-F23F47F09226573B1FCACEBDCFB8c1f3)

تتضمن الجدول أدناه قدرات نماذج اللغة الكبيرة المدعومة من ModelFactory حالياً:

  • سلسلة LLaMA: الأكثر اتساعًا في النظام البيئي، المجتمع نشط، الأداء العام قوي، وهي واحدة من النماذج الأساسية مفتوحة المصدر الأكثر شيوعًا في الوقت الحالي.
  • Mistral: هيكل فعال، أداء استدلال ممتاز، مناسب للنشر المرن والسيناريوهات ذات الموارد المحدودة.
  • Qwen: منتج من علي بابا، أداء ممتاز في المهام الصينية، قدرة شاملة قوية، مناسب ليكون الخيار الأول للمطورين المحليين.
  • ChatGLM: التأثيرات الحوارية باللغة الصينية بارزة، مناسبة لخدمة العملاء في مجالات محددة والسيناريوهات المحلية.
  • Deepseek:تفوق في توليد الكود والتفكير الرياضي، مناسب لأدوات المساعدة في التطوير الذكي.
  • Gemma: نموذج خفيف الوزن أطلقته Google، هيكلها واضح، وسهلة الاستخدام والتجريب بسرعة.
  • فالكون: كان معيار الأداء، مناسب للبحوث الأساسية أو الاختبارات المقارنة، لكن نشاط المجتمع قد انخفض.
  • BLOOM: دعم متعدد اللغات قوي، لكن الأداء في الاستنتاج ضعيف، مناسب لأبحاث تغطي اللغات.
  • GPT-2: نموذج كلاسيكي مبكر، مناسب فقط للأغراض التعليمية والتحقق، لا يُنصح باستخدامه في النشر الفعلي.

على الرغم من أن مجموعة نماذج OpenLedger لا تحتوي على أحدث نماذج MoE عالية الأداء أو النماذج متعددة الأنماط، إلا أن استراتيجيتها ليست قديمة، بل هي تكوين "الأولوية العملية" الذي تم إجراؤه بناءً على القيود الواقعية للنشر على السلسلة (تكاليف الاستدلال، ملاءمة RAG، توافق LoRA، بيئة EVM).

تعتبر Model Factory كأداة بدون كود، حيث تم تضمين جميع النماذج آلية إثبات المساهمة، مما يضمن حقوق المساهمين في البيانات ومطوري النماذج، وتتميز بمتطلبات دخول منخفضة، وقابلية للتحقيق، وقابلية للتجميع، مقارنةً بأدوات تطوير النماذج التقليدية:

  • للمطورين: توفير مسار كامل لنمذجة الحضانة، التوزيع، والدخل؛
  • بالنسبة للمنصة: تشكيل تدفق أصول النموذج وإيكولوجيا التركيب؛
  • بالنسبة للمستخدمين: يمكن دمج النماذج أو الوكلاء كما هو الحال عند استدعاء API.

! [تقرير بحثي متعمق ل OpenLedger: بناء اقتصاد وكيل قائم على البيانات وقابل للتركيب على أساس OP Stack+EigenDA](https://img-cdn.gateio.im/social/ moments-909dc3f796ad6aa44a1c97a51ade4193)

3.2 OpenLoRA ،资产化 نماذج التخصيص على السلسلة

LoRA (التكيف منخفض الرتبة) هي طريقة فعالة لتعديل المعلمات، من خلال إدخال "مصفوفة منخفضة الرتبة" في نموذج كبير مدرب مسبقًا لتعلم مهام جديدة، دون تعديل معلمات النموذج الأصلي، مما يقلل بشكل كبير من تكاليف التدريب واحتياجات التخزين. عادة ما تحتوي نماذج اللغة الكبيرة التقليدية (مثل LLaMA و GPT-3) على عشرات المليارات أو حتى مئات المليارات من المعلمات. لاستخدامها في مهام محددة (مثل استفسارات قانونية أو استشارات طبية)، يلزم إجراء تعديل (تدريب دقيق). الاستراتيجية الأساسية لـ LoRA هي: "تجميد معلمات النموذج الكبير الأصلي، وتدريب فقط مصفوفة المعلمات الجديدة المضافة." تتميز بكفاءة المعلمات وسرعة التدريب ومرونة النشر، وهي الطريقة السائدة الأكثر ملاءمة لنشر نماذج Web3 واستدعائها بشكل مركب.

OpenLoRA هو إطار استدلال خفيف الوزن مصمم خصيصًا لنشر نماذج متعددة ومشاركة الموارد، تم بناؤه بواسطة OpenLedger. الهدف الرئيسي له هو حل المشكلات الشائعة في نشر نماذج الذكاء الاصطناعي الحالية مثل التكاليف العالية، وانخفاض إعادة الاستخدام، وهدر موارد GPU، ودفع تنفيذ "الذكاء الاصطناعي القابل للدفع".

مكونات النظام الأساسية لـ OpenLoRA ، تعتمد على تصميم معياري ، تغطي التخزين النموذجي ، تنفيذ الاستدلال ، توجيه الطلبات وغيرها من المراحل الحيوية ، لتحقيق قدرة فعالة ومنخفضة التكلفة على نشر واستدعاء نماذج متعددة:

  • وحدة تخزين محولات LoRA (LoRA Adapters Storage): يتم استضافة محول LoRA المعدل في OpenLedger، مما يتيح التحميل حسب الطلب، وتجنب تحميل جميع النماذج مسبقًا في ذاكرة الفيديو، مما يوفر الموارد.
  • استضافة النموذج وطبقة دمج المحولات (Model Hosting & Adapter Merging Layer): تشترك جميع نماذج التعديل في النموذج الأساسي (base model) أثناء الاستدلال.
OP-4.94%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 7
  • مشاركة
تعليق
0/400
airdrop_whisperervip
· منذ 2 س
لقد جئت مرة أخرى للاستفادة من حماس الذكاء الاصطناعي...
شاهد النسخة الأصليةرد0
MondayYoloFridayCryvip
· منذ 12 س
السوق متقلب للغاية...
شاهد النسخة الأصليةرد0
MentalWealthHarvestervip
· منذ 12 س
آلات مراقبة الحمقى المكلفة
شاهد النسخة الأصليةرد0
CantAffordPancakevip
· منذ 12 س
عالم العملات الرقمية أول مستثمر التجزئة في حيرة!
شاهد النسخة الأصليةرد0
fren.ethvip
· منذ 12 س
كتبت كل هذا مجرد دعاية
شاهد النسخة الأصليةرد0
SmartContractWorkervip
· منذ 12 س
يبدو أنه لا بد من العمل بجد لعدة سنوات أخرى.
شاهد النسخة الأصليةرد0
Blockblindvip
· منذ 13 س
بمجرد أن تزداد قوة الحوسبة، ستصبح الأمور باردة في النهاية
شاهد النسخة الأصليةرد0
  • تثبيت