Chúng tôi rất vui mừng được chia sẻ kết quả của sự hợp tác với SGLang. 🎉



Chúng tôi đã tối ưu hóa suy diễn DeepSeek R1 cho triển khai trên GB200 NVL72—đem lại hiệu suất tăng gấp 2 và 3 lần trên mỗi GPU so với các cụm H100 gần gấp đôi kích thước.

Đây là hình ảnh của suy luận MoE tiên phong.
LOOKS0.7%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 6
  • Chia sẻ
Bình luận
0/400
WhaleWatchervip
· 16giờ trước
Hiệu suất đã tăng gấp đôi rồi, thật tuyệt vời!
Xem bản gốcTrả lời0
Rugpull幸存者vip
· 16giờ trước
Lại đang cuốn hiệu suất phải không
Xem bản gốcTrả lời0
OnChainDetectivevip
· 16giờ trước
hmm đã theo dõi những chỉ số gpu... có điều gì đó không khớp ở đây
Xem bản gốcTrả lời0
MetaverseVagabondvip
· 16giờ trước
Ôi trời ơi, cuối cùng cũng đã vượt qua H100 rồi!
Xem bản gốcTrả lời0
ClassicDumpstervip
· 16giờ trước
又跟着To da moon了吧
Xem bản gốcTrả lời0
WhaleMinionvip
· 17giờ trước
Hiệu suất GPU đã bùng nổ.
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)