DeepSeek випустив модель Prover-V2 з кількістю параметрів до 6710 мільярдів

2025-04-30 12:36:26

Генерація анотацій у процесі

【DeepSeek випустив модель Prover-V2, кількість параметрів досягла 6710 мільярдів】DeepSeek сьогодні на AI відкритому вихідному коді спільноті Hugging Face опублікував нову модель під назвою DeepSeek-Prover-V2-671B. Згідно з інформацією, DeepSeek-Prover-V2-671B використовує більш ефективний формат файлів safetensors і підтримує різні обчислювальні точності, що дозволяє моделі швидше і економніше тренуватися та розгортатися, кількість параметрів досягає 6710 мільярдів, що може бути оновленою версією математичної моделі Prover-V1.5, випущеної минулого року. У архітектурі моделі ця модель використовує архітектуру DeepSeek-V3, застосовуючи режим MoE (змішаних експертів), має 61 шар Transformer, 7168-розмірний прихований шар. Одночасно підтримує наддовгий контекст, максимальне позиційне вбудовування досягає 163800, що дозволяє їй обробляти складні математичні доведення, а також використовує FP8 квантування, що дозволяє зменшити розмір моделі та підвищити ефективність висновків. ( Jin10 )

DEEPSEEK-10.93%

Переглянути оригінал

Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.

Нагородити
подобається
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
#BTC#
231k публікації
#PI#
198k публікації
#ETH#
146k публікації
4#GateioInto11#
80k публікації
5#ContentStar#
66k публікації
6#GT#
64k публікації
7#BOME#
61k публікації
8#DOGE#
58k публікації
9#MAGA#
52k публікації
10#SLERF#
51k публікації

Закріпити

карта сайту