Dados são ativos: DataFi está abrindo um novo mar azul
O maior tópico no círculo da IA este mês é a Meta que está a recrutar em grande, formando uma equipa de IA de luxo composta principalmente por investigadores chineses. O líder é Alexander Wang, que tem apenas 28 anos e fundou a Scale AI. A Scale AI tem atualmente uma avaliação de 29 mil milhões de dólares, prestando serviços de dados a várias gigantes da IA, incluindo o exército dos EUA, OpenAI, Anthropic e Meta, sendo o seu negócio principal fornecer grandes quantidades de dados rotulados precisos.
A razão pela qual a Scale AI consegue destacar-se entre os muitos unicórnios é porque percebeu cedo a posição crucial dos dados na indústria de IA. O poder computacional, os modelos e os dados são os três pilares dos modelos de IA. Se compararmos um grande modelo a uma pessoa, então o modelo é o corpo, o poder computacional é a comida e os dados são o conhecimento e a informação.
Durante o rápido desenvolvimento dos grandes modelos de linguagem, o foco da indústria passou de modelos para poder de computação. Hoje em dia, a maioria dos modelos utiliza o transformer como estrutura básica, com inovações ocasionais como MoE ou MoRe; as principais empresas ou constroem seus próprios clusters de computação superpoderosos ou assinam contratos de longo prazo com provedores de serviços em nuvem para resolver problemas de capacidade de computação. Com isso, a importância dos dados tem se tornado cada vez mais evidente.
A Scale AI foca em criar uma base de dados sólida para modelos de IA, e seus negócios incluem não apenas a extração de dados existentes, mas também a geração de dados. A empresa também formou uma equipe de treinamento de IA composta por especialistas de diferentes áreas, para fornecer dados de treinamento de alta qualidade para modelos de IA.
O treinamento do modelo é dividido em duas fases: pré-treinamento e ajuste fino. O pré-treinamento é semelhante ao processo de uma criança aprendendo a falar, necessitando de uma grande quantidade de textos, códigos e outras informações extraídas da internet. O ajuste fino, por sua vez, é semelhante à educação escolar, com objetivos e direções definidos, cultivando habilidades específicas do modelo através de conjuntos de dados cuidadosamente elaborados.
Assim, a pista de dados de IA inclui principalmente duas categorias de conjuntos de dados: uma categoria consiste em grandes volumes de dados que não requerem muitos processamentos, geralmente provenientes de plataformas UGC como Reddit, Twitter, Github, bases de dados de literatura pública ou bases de dados privadas de empresas; a outra categoria requer um design e seleção refinados, garantindo que possam desenvolver habilidades específicas do modelo, necessitando de limpeza de dados, seleção, rotulagem e feedback humano.
Com a melhoria contínua das capacidades dos modelos, diversos conjuntos de dados de treinamento mais refinados e especializados se tornarão fatores-chave na determinação das capacidades dos modelos. A longo prazo, os dados de IA também são uma pista de longo prazo com efeito bola de neve, à medida que o trabalho inicial se acumula, os ativos de dados terão a capacidade de juros compostos, aumentando continuamente de valor.
Web3 DataFi: A Terra Prometida dos Dados AI
Em comparação com as equipes de rotulagem humana remota de centenas de milhares de pessoas formadas por certas empresas em vários países, o Web3 tem uma vantagem natural no campo de dados de IA, resultando no surgimento do novo conceito de DataFi. Idealmente, as vantagens do Web3 DataFi incluem:
A soberania, segurança e privacidade dos dados garantidas por contratos inteligentes
Vantagens naturais de arbitragem geográfica: uma arquitetura distribuída livre que atrai a força de trabalho mais adequada.
Vantagens claras de incentivo e liquidação da blockchain
Contribui para a construção de um mercado de dados "one-stop" mais eficiente e aberto.
Para os usuários comuns, o DataFi também é o projeto de IA descentralizada mais fácil de participar. Os usuários só precisam realizar operações simples para se envolver, incluindo fornecer dados, avaliar modelos, utilizar ferramentas de IA para criações simples ou participar de transações de dados.
O potencial do projeto Web3 DataFi
Atualmente, vários projetos de DataFi obtiveram um financiamento considerável. Aqui estão alguns projetos representativos:
Sahara AI: Dedica-se a construir uma super infraestrutura descentralizada de IA e um mercado de negociação.
Yupp: Plataforma de feedback de modelos de IA, que recolhe feedback dos utilizadores sobre a saída dos modelos.
Vana: Transformar os dados pessoais dos usuários em ativos digitais que podem ser monetizados.
Chainbase: Focado em dados on-chain, cobre mais de 200 blockchains.
Sapien: Destina-se a transformar o conhecimento humano em grandes escalas em dados de treino de IA de alta qualidade.
Prisma X: dedicado a se tornar a camada de coordenação aberta para robôs.
Masa: Um dos principais projetos de sub-rede do ecossistema Bittensor.
Irys: Focado em armazenamento e computação de dados programáveis.
ORO: Capacitar pessoas comuns a participar nas contribuições de IA.
Gata: Posicionada como uma camada de dados descentralizada.
Estes projetos atualmente têm barreiras geralmente baixas, mas uma vez acumulados usuários e a adesão ao ecossistema, as vantagens da plataforma se acumularão rapidamente. Portanto, os projetos iniciais devem focar intensamente em incentivos e na experiência do usuário. Ao mesmo tempo, essas plataformas também precisam considerar como gerenciar os participantes, garantir a qualidade dos dados e evitar a situação de "moeda ruim expulsando moeda boa".
Além disso, aumentar a transparência também é um grande desafio que os projetos em blockchain enfrentam atualmente. Muitos projetos ainda carecem de dados públicos e rastreáveis suficientes, o que é prejudicial para o desenvolvimento saudável a longo prazo do Web3 DataFi.
O caminho para a aplicação em larga escala do DataFi pode ser dividido em duas partes: a primeira é atrair um número suficiente de usuários individuais para participar, formando uma força motriz para a coleta/geração de dados e consumidores da economia de IA; a segunda é obter o reconhecimento das empresas mainstream, pois a curto prazo, elas são a principal fonte de grandes contratos de dados.
DataFi representa o cultivo a longo prazo da inteligência humana sobre a inteligência das máquinas, garantindo ao mesmo tempo, através de contratos inteligentes, os rendimentos do trabalho humano, alcançando assim a retroalimentação da inteligência das máquinas para a humanidade. Para aqueles que se sentem incertos em relação à era da IA ou que ainda nutrem ideais de blockchain, participar do DataFi pode ser uma escolha que surge naturalmente.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
15 Curtidas
Recompensa
15
4
Compartilhar
Comentário
0/400
AirdropNinja
· 17h atrás
Outra boa oportunidade de fazer as pessoas de parvas, hehe
Ver originalResponder0
LoneValidator
· 17h atrás
Realmente rico, 290 bilhões aos 28 anos.
Ver originalResponder0
quiet_lurker
· 17h atrás
Os dados de marcação valem 29 bilhões? Esse dinheiro é fácil de ganhar.
Ver originalResponder0
NotSatoshi
· 18h atrás
Se ao menos a metade das pessoas estivesse atenta~
DataFi: O novo mar azul da economia de dados AI no domínio Web3
Dados são ativos: DataFi está abrindo um novo mar azul
O maior tópico no círculo da IA este mês é a Meta que está a recrutar em grande, formando uma equipa de IA de luxo composta principalmente por investigadores chineses. O líder é Alexander Wang, que tem apenas 28 anos e fundou a Scale AI. A Scale AI tem atualmente uma avaliação de 29 mil milhões de dólares, prestando serviços de dados a várias gigantes da IA, incluindo o exército dos EUA, OpenAI, Anthropic e Meta, sendo o seu negócio principal fornecer grandes quantidades de dados rotulados precisos.
A razão pela qual a Scale AI consegue destacar-se entre os muitos unicórnios é porque percebeu cedo a posição crucial dos dados na indústria de IA. O poder computacional, os modelos e os dados são os três pilares dos modelos de IA. Se compararmos um grande modelo a uma pessoa, então o modelo é o corpo, o poder computacional é a comida e os dados são o conhecimento e a informação.
Durante o rápido desenvolvimento dos grandes modelos de linguagem, o foco da indústria passou de modelos para poder de computação. Hoje em dia, a maioria dos modelos utiliza o transformer como estrutura básica, com inovações ocasionais como MoE ou MoRe; as principais empresas ou constroem seus próprios clusters de computação superpoderosos ou assinam contratos de longo prazo com provedores de serviços em nuvem para resolver problemas de capacidade de computação. Com isso, a importância dos dados tem se tornado cada vez mais evidente.
A Scale AI foca em criar uma base de dados sólida para modelos de IA, e seus negócios incluem não apenas a extração de dados existentes, mas também a geração de dados. A empresa também formou uma equipe de treinamento de IA composta por especialistas de diferentes áreas, para fornecer dados de treinamento de alta qualidade para modelos de IA.
O treinamento do modelo é dividido em duas fases: pré-treinamento e ajuste fino. O pré-treinamento é semelhante ao processo de uma criança aprendendo a falar, necessitando de uma grande quantidade de textos, códigos e outras informações extraídas da internet. O ajuste fino, por sua vez, é semelhante à educação escolar, com objetivos e direções definidos, cultivando habilidades específicas do modelo através de conjuntos de dados cuidadosamente elaborados.
Assim, a pista de dados de IA inclui principalmente duas categorias de conjuntos de dados: uma categoria consiste em grandes volumes de dados que não requerem muitos processamentos, geralmente provenientes de plataformas UGC como Reddit, Twitter, Github, bases de dados de literatura pública ou bases de dados privadas de empresas; a outra categoria requer um design e seleção refinados, garantindo que possam desenvolver habilidades específicas do modelo, necessitando de limpeza de dados, seleção, rotulagem e feedback humano.
Com a melhoria contínua das capacidades dos modelos, diversos conjuntos de dados de treinamento mais refinados e especializados se tornarão fatores-chave na determinação das capacidades dos modelos. A longo prazo, os dados de IA também são uma pista de longo prazo com efeito bola de neve, à medida que o trabalho inicial se acumula, os ativos de dados terão a capacidade de juros compostos, aumentando continuamente de valor.
Web3 DataFi: A Terra Prometida dos Dados AI
Em comparação com as equipes de rotulagem humana remota de centenas de milhares de pessoas formadas por certas empresas em vários países, o Web3 tem uma vantagem natural no campo de dados de IA, resultando no surgimento do novo conceito de DataFi. Idealmente, as vantagens do Web3 DataFi incluem:
Para os usuários comuns, o DataFi também é o projeto de IA descentralizada mais fácil de participar. Os usuários só precisam realizar operações simples para se envolver, incluindo fornecer dados, avaliar modelos, utilizar ferramentas de IA para criações simples ou participar de transações de dados.
O potencial do projeto Web3 DataFi
Atualmente, vários projetos de DataFi obtiveram um financiamento considerável. Aqui estão alguns projetos representativos:
Sahara AI: Dedica-se a construir uma super infraestrutura descentralizada de IA e um mercado de negociação.
Yupp: Plataforma de feedback de modelos de IA, que recolhe feedback dos utilizadores sobre a saída dos modelos.
Vana: Transformar os dados pessoais dos usuários em ativos digitais que podem ser monetizados.
Chainbase: Focado em dados on-chain, cobre mais de 200 blockchains.
Sapien: Destina-se a transformar o conhecimento humano em grandes escalas em dados de treino de IA de alta qualidade.
Prisma X: dedicado a se tornar a camada de coordenação aberta para robôs.
Masa: Um dos principais projetos de sub-rede do ecossistema Bittensor.
Irys: Focado em armazenamento e computação de dados programáveis.
ORO: Capacitar pessoas comuns a participar nas contribuições de IA.
Gata: Posicionada como uma camada de dados descentralizada.
Estes projetos atualmente têm barreiras geralmente baixas, mas uma vez acumulados usuários e a adesão ao ecossistema, as vantagens da plataforma se acumularão rapidamente. Portanto, os projetos iniciais devem focar intensamente em incentivos e na experiência do usuário. Ao mesmo tempo, essas plataformas também precisam considerar como gerenciar os participantes, garantir a qualidade dos dados e evitar a situação de "moeda ruim expulsando moeda boa".
Além disso, aumentar a transparência também é um grande desafio que os projetos em blockchain enfrentam atualmente. Muitos projetos ainda carecem de dados públicos e rastreáveis suficientes, o que é prejudicial para o desenvolvimento saudável a longo prazo do Web3 DataFi.
O caminho para a aplicação em larga escala do DataFi pode ser dividido em duas partes: a primeira é atrair um número suficiente de usuários individuais para participar, formando uma força motriz para a coleta/geração de dados e consumidores da economia de IA; a segunda é obter o reconhecimento das empresas mainstream, pois a curto prazo, elas são a principal fonte de grandes contratos de dados.
DataFi representa o cultivo a longo prazo da inteligência humana sobre a inteligência das máquinas, garantindo ao mesmo tempo, através de contratos inteligentes, os rendimentos do trabalho humano, alcançando assim a retroalimentação da inteligência das máquinas para a humanidade. Para aqueles que se sentem incertos em relação à era da IA ou que ainda nutrem ideais de blockchain, participar do DataFi pode ser uma escolha que surge naturalmente.