2025-08-01 23:22:59

Мы рады поделиться результатами нашего сотрудничества с SGLang. 🎉

Вместе мы оптимизировали вывод DeepSeek R1 для развертывания на GB200 NVL72 — что обеспечило увеличение производительности на 2x и 3x на GPU по сравнению с кластерами H100 почти в два раза большими.

Вот как выглядит фронтовое MoE инференс.

DEEPSEEK-1.1%

LOOKS0.7%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

8 Лайков

Награда
8
6
Поделиться

комментарий

0/400

WhaleWatcher

· 16ч назад

Производительность снова удвоилась, впечатляет!

Посмотреть ОригиналОтветить0

Rugpull幸存者

· 16ч назад

Опять прокручивается производительность, да?

Посмотреть ОригиналОтветить0

OnChainDetective

· 16ч назад

хм, я проследил за этими метриками GPU... что-то здесь не сходится

Посмотреть ОригиналОтветить0

MetaverseVagabond

· 16ч назад

Вот это да, наконец-то я прошёл H100!

Посмотреть ОригиналОтветить0

ClassicDumpster

· 17ч назад

Снова на луну, да?

Посмотреть ОригиналОтветить0

WhaleMinion

· 17ч назад

Производительность GPU взорвалась.

Посмотреть ОригиналОтветить0

Тема
1/3
1CandyDrop Airdrop Event 6.0
47k Популярность
2White House Crypto Report
50k Популярность
3Join Alpha RION Airdrop to Earn $40
34k Популярность
4Fed Holds Rates Decision
9k Популярность
5July Spark Program TOP 10 Creators Announced
2k Популярность

Закрепить

Карта сайта