Atualização do modelo DeepSeek V3: 685 bilhões de parâmetros impulsionam a inovação em Web3 e IA

Atualização do modelo DeepSeek V3: otimização colaborativa do Poder de computação e Algoritmo

Recentemente, a DeepSeek lançou o seu mais recente modelo da versão V3 — DeepSeek-V3-0324, com parâmetros que atingem 685 bilhões, apresentando melhorias significativas em termos de capacidade de codificação, design de interface e capacidade de raciocínio.

Na recente conferência GTC 2025, os líderes da indústria deram altos elogios ao DeepSeek. Ele apontou que a visão anterior do mercado de que o modelo eficiente da DeepSeek reduziria a necessidade de chips estava errada, e que a demanda de computação no futuro só aumentará e não diminuirá.

DeepSeek, como um produto representativo do avanço do algoritmo, suscitou reflexões sobre o papel do poder de computação e do algoritmo no desenvolvimento da indústria, em relação à fornecimento de chips.

Poder de computação e a evolução simbiôntica do algoritmo

No campo da IA, o aumento do poder de computação fornece a base para a execução de algoritmos mais complexos, permitindo que os modelos processem maiores quantidades de dados e aprendam padrões mais complexos; enquanto a otimização dos algoritmos pode utilizar o poder de computação de forma mais eficiente, melhorando a eficiência do uso dos recursos computacionais.

Esta relação simbiótica está a remodelar o panorama da indústria de IA:

  1. Divergência de rotas tecnológicas: algumas empresas buscam construir clusters de poder de computação super grandes, enquanto outras se concentram na otimização da eficiência do algoritmo, formando diferentes escolas tecnológicas.

  2. Reestruturação da cadeia industrial: uma empresa de chips torna-se líder em poder de computação de IA através do ecossistema, enquanto os provedores de serviços de nuvem reduzem as barreiras de implementação através de serviços de poder de computação flexível.

  3. Ajuste da alocação de recursos: as empresas buscam um equilíbrio entre o investimento em infraestrutura de hardware e o desenvolvimento de algoritmos eficientes.

  4. A ascensão da comunidade de código aberto: os modelos de código aberto permitem que inovações em algoritmos e resultados de otimização de poder de computação sejam compartilhados, acelerando a iteração e difusão da tecnologia.

Da competição de poder de computação à inovação de algoritmos: o novo paradigma de IA liderado pela DeepSeek

Inovação tecnológica da DeepSeek

O rápido desenvolvimento da DeepSeek está intimamente ligado à sua inovação tecnológica. A seguir, uma breve explicação sobre os principais pontos de inovação:

Otimização da arquitetura do modelo

O DeepSeek utiliza uma arquitetura combinada de Transformer + MOE (Mistura de Especialistas) e introduz o mecanismo de atenção latente multi-cabeça (Multi-Head Latent Attention, MLA). Esta arquitetura é como uma equipe eficiente, onde diferentes membros desempenham funções distintas para melhorar conjuntamente a eficiência e a precisão do modelo.

Inovação nos métodos de treinamento

A DeepSeek propôs uma estrutura de treinamento de precisão mista FP8. Esta estrutura é capaz de ajustar dinamicamente a precisão de cálculo de acordo com as necessidades de treinamento, aumentando a velocidade de treinamento e reduzindo o consumo de memória, ao mesmo tempo que garante a precisão do modelo.

Aumento da eficiência de inferência

A DeepSeek introduziu a tecnologia de Previsão Multitoken (Multi-token Prediction, MTP), que permite prever vários Tokens de uma só vez, aumentando significativamente a velocidade de inferência e reduzindo os custos de inferência.

Avanços no algoritmo de aprendizado por reforço

O novo algoritmo de aprendizado reforçado GRPO (Otimização Generalizada de Recompensa-Penalização) da DeepSeek otimiza o processo de treinamento do modelo, garantindo uma melhoria de desempenho ao mesmo tempo que reduz cálculos desnecessários, alcançando um equilíbrio entre desempenho e custo.

Estas inovações formaram um sistema tecnológico completo, reduzindo de forma abrangente a necessidade de Poder de computação desde o treinamento até a inferência. Placas gráficas de consumo comuns agora também conseguem executar poderosos modelos de IA, reduzindo significativamente a barreira de entrada para aplicações de IA.

Impacto no fornecimento de chips

A DeepSeek não se desvinculou completamente da dependência de chips específicos, mas sim otimizou algoritmos através da camada PTX (Execução de Thread Paralela). Essa abordagem, por um lado, aprofunda a ligação com o hardware e o ecossistema, e por outro, pode alterar a estrutura de demanda do mercado por chips de alta gama.

Significado para a indústria de IA na China

A otimização do algoritmo da DeepSeek proporcionou um ponto de ruptura técnico para a indústria de IA na China. Num contexto de limitação no fornecimento de chips de alta gama, a ideia de "software complementando hardware" aliviou a dependência de chips importados.

Na parte superior da indústria, algoritmos eficientes reduziram a pressão sobre a demanda de poder de computação, permitindo que os prestadores de serviços de poder de computação prolongassem o ciclo de uso de hardware através da otimização de software. Na parte inferior, modelos de código aberto otimizados reduziram a barreira de entrada para o desenvolvimento de aplicações de IA, permitindo que mais pequenas e médias empresas participassem da inovação em IA.

O impacto profundo da Web3+AI

Infraestrutura de IA descentralizada

A inovação tecnológica da DeepSeek oferece novas possibilidades para a infraestrutura de IA Web3. A arquitetura MoE é adequada para implantação distribuída, e a estrutura de treinamento FP8 reduz a necessidade de recursos computacionais de alto desempenho, tudo isso ajuda a construir uma rede de IA descentralizada mais flexível e eficiente.

Aplicação de sistemas multiagentes

No campo do Web3, as inovações tecnológicas da DeepSeek podem trazer as seguintes aplicações:

  1. Otimização de estratégias de negociação inteligentes: através de múltiplos agentes de IA especializados trabalhando em conjunto, alcançando uma análise de mercado e execução de negociações mais precisas.

  2. Execução automatizada de contratos inteligentes: Utilizando múltiplos agentes de IA para monitorizar e executar contratos inteligentes, alcançando uma automação de lógica de negócios mais complexa.

  3. Gestão de portfólios personalizada: a IA pode otimizar em tempo real as estratégias de investimento com base nas preferências de risco e nos objetivos de investimento dos usuários.

A DeepSeek encontra inovações através de algoritmos, buscando avanços sob restrições de poder de computação, abrindo caminhos de desenvolvimento diferenciados para a indústria de IA. Ela reduz a barreira de entrada para aplicações, impulsiona a fusão entre Web3 e IA, diminui a dependência de chips de alta performance e oferece novas possibilidades para inovações financeiras. No futuro, o desenvolvimento da IA não será mais apenas uma corrida de poder de computação, mas uma competição de otimização colaborativa entre poder de computação e algoritmos. Neste novo cenário, os inovadores estão redefinindo as regras do jogo com sabedoria.

DEEPSEEK-3.78%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 4
  • Partilhar
Comentar
0/400
GateUser-75ee51e7vip
· 17h atrás
Poder de computação vai até à lua!
Ver originalResponder0
LidoStakeAddictvip
· 17h atrás
Fabricantes de chips em êxtase
Ver originalResponder0
ApeWithNoFearvip
· 17h atrás
Derrube o poder de computação monopolista!
Ver originalResponder0
CryptoAdventurervip
· 17h atrás
Sorrindo até morrer, chegou a parte que os idiotas não conseguem entender.
Ver originalResponder0
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)