2025-08-01 23:22:59

Chúng tôi rất vui mừng được chia sẻ kết quả của sự hợp tác với SGLang. 🎉

Chúng tôi đã tối ưu hóa suy diễn DeepSeek R1 cho triển khai trên GB200 NVL72—đem lại hiệu suất tăng gấp 2 và 3 lần trên mỗi GPU so với các cụm H100 gần gấp đôi kích thước.

Đây là hình ảnh của suy luận MoE tiên phong.

DEEPSEEK-1.1%

LOOKS0.7%

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

8 thích

Phần thưởng
8
6
Chia sẻ

Bình luận

0/400

WhaleWatcher

· 16giờ trước

Hiệu suất đã tăng gấp đôi rồi, thật tuyệt vời!

Xem bản gốcTrả lời0

Rugpull幸存者

· 16giờ trước

Lại đang cuốn hiệu suất phải không

Xem bản gốcTrả lời0

OnChainDetective

· 16giờ trước

hmm đã theo dõi những chỉ số gpu... có điều gì đó không khớp ở đây

Xem bản gốcTrả lời0

MetaverseVagabond

· 16giờ trước

Ôi trời ơi, cuối cùng cũng đã vượt qua H100 rồi!

Xem bản gốcTrả lời0

ClassicDumpster

· 16giờ trước

又跟着To da moon了吧

Xem bản gốcTrả lời0

WhaleMinion

· 17giờ trước

Hiệu suất GPU đã bùng nổ.

Xem bản gốcTrả lời0

Chủ đề
1/3
1CandyDrop Airdrop Event 6.0
47k Phổ biến
2White House Crypto Report
50k Phổ biến
3Join Alpha RION Airdrop to Earn $40
34k Phổ biến
4Fed Holds Rates Decision
9k Phổ biến
5July Spark Program TOP 10 Creators Announced
2k Phổ biến

Ghim

sơ đồ trang web