Мы рады поделиться результатами нашего сотрудничества с SGLang. 🎉



Вместе мы оптимизировали вывод DeepSeek R1 для развертывания на GB200 NVL72 — что обеспечило увеличение производительности на 2x и 3x на GPU по сравнению с кластерами H100 почти в два раза большими.

Вот как выглядит фронтовое MoE инференс.
LOOKS0.7%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Поделиться
комментарий
0/400
WhaleWatchervip
· 16ч назад
Производительность снова удвоилась, впечатляет!
Посмотреть ОригиналОтветить0
Rugpull幸存者vip
· 16ч назад
Опять прокручивается производительность, да?
Посмотреть ОригиналОтветить0
OnChainDetectivevip
· 16ч назад
хм, я проследил за этими метриками GPU... что-то здесь не сходится
Посмотреть ОригиналОтветить0
MetaverseVagabondvip
· 16ч назад
Вот это да, наконец-то я прошёл H100!
Посмотреть ОригиналОтветить0
ClassicDumpstervip
· 17ч назад
Снова на луну, да?
Посмотреть ОригиналОтветить0
WhaleMinionvip
· 17ч назад
Производительность GPU взорвалась.
Посмотреть ОригиналОтветить0
  • Закрепить