معًا، قمنا بتحسين استدلال DeepSeek R1 للنشر على GB200 NVL72 - مما يوفر زيادة بمقدار 2x و 3x لكل وحدة معالجة رسومية مقارنةً بمجموعات H100 التي تبلغ تقريبًا ضعف الحجم.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 8
أعجبني
8
6
مشاركة
تعليق
0/400
WhaleWatcher
· منذ 14 س
الأداء تضاعف مرة أخرى، مذهل!
شاهد النسخة الأصليةرد0
Rugpull幸存者
· منذ 14 س
أنت تتحدث عن أداء卷 مرة أخرى، أليس كذلك؟
شاهد النسخة الأصليةرد0
OnChainDetective
· منذ 14 س
همم تتبع تلك المقاييس الخاصة بوحدة معالجة الرسومات... هناك شيء غير متطابق هنا
نحن متحمسون لمشاركة نتائج تعاوننا مع SGLang. 🎉
معًا، قمنا بتحسين استدلال DeepSeek R1 للنشر على GB200 NVL72 - مما يوفر زيادة بمقدار 2x و 3x لكل وحدة معالجة رسومية مقارنةً بمجموعات H100 التي تبلغ تقريبًا ضعف الحجم.
هذه هي كيفية ظهور استدلال MoE في المقدمة.