DataFi : un nouvel océan bleu de l'économie des données AI dans le domaine Web3

robot
Création du résumé en cours

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Le plus grand sujet de discussion dans le cercle de l'IA ce mois-ci est sans doute le recrutement massif de talents par Meta, qui a formé une équipe AI de luxe principalement composée de chercheurs d'origine chinoise. Le leader est Alexander Wang, âgé de seulement 28 ans, qui a créé Scale AI. Scale AI est actuellement évalué à 29 milliards de dollars et fournit des services de données à plusieurs géants de l'IA, y compris l'armée américaine, OpenAI, Anthropic et Meta. Son activité principale consiste à fournir une grande quantité de données annotées précises.

La raison pour laquelle Scale AI a pu se démarquer parmi de nombreux licornes est qu'elle a rapidement compris l'importance des données dans l'industrie de l'IA. La puissance de calcul, les modèles et les données sont les trois piliers des modèles d'IA. Si l'on compare un grand modèle à une personne, alors le modèle serait le corps, la puissance de calcul serait la nourriture, et les données seraient les connaissances et les informations.

Au cours du développement rapide des grands modèles de langage, l'accent dans l'industrie a évolué d'un modèle vers une puissance de calcul. Aujourd'hui, la plupart des modèles utilisent le transformer comme cadre de base, avec parfois des innovations telles que MoE ou MoRe ; les grandes entreprises construisent soit leurs propres clusters de supercalcul, soit signent des contrats à long terme avec des fournisseurs de services cloud pour résoudre les problèmes de puissance de calcul. Sur cette base, l'importance des données devient de plus en plus évidente.

Scale AI se concentre sur la création d'une base de données solide pour les modèles d'IA, son activité comprenant non seulement l'exploration des données existantes, mais aussi des activités de génération de données. L'entreprise a également constitué une équipe d'entraînement à l'IA composée d'experts de différents domaines pour fournir des données d'entraînement de haute qualité aux modèles d'IA.

L'entraînement des modèles se divise en deux phases : la pré-formation et le réglage fin. La pré-formation est similaire au processus d'apprentissage de la parole chez un bébé, nécessitant une grande quantité de textes, de codes et d'autres informations extraites d'Internet. Le réglage fin, quant à lui, est semblable à l'éducation scolaire, avec des objectifs et des orientations clairs, et il développe des capacités spécifiques du modèle à travers des ensembles de données soigneusement conçus.

Ainsi, la piste de données AI comprend principalement deux types de jeux de données : d'une part, un grand volume de données qui nécessite peu de traitement, généralement provenant de plateformes UGC telles que Reddit, Twitter, Github, de bases de données de littérature publique ou de bases de données privées d'entreprises ; d'autre part, des jeux de données qui nécessitent une conception et une sélection minutieuses, garantissant le développement de capacités spécifiques du modèle, nécessitant un nettoyage des données, une sélection, une annotation et des retours humains.

Avec l'amélioration continue des capacités des modèles, des données d'entraînement plus fines et professionnelles deviendront des facteurs clés déterminant les capacités des modèles. À long terme, les données AI représentent également un domaine à long terme avec un effet boule de neige ; avec l'accumulation des travaux préliminaires, les actifs de données acquerront la capacité d'intérêt composé, et leur valeur continuera d'augmenter.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Web3 DataFi : le terreau des données AI choisi par le ciel

Comparé à l'équipe de marquage manuel à distance de plusieurs centaines de milliers de personnes formée par certaines entreprises dans de nombreux pays, le Web3 a un avantage naturel dans le domaine des données AI, ce qui a donné naissance à ce nouveau concept de DataFi. Idéalement, les avantages de Web3 DataFi incluent :

  1. La souveraineté des données, la sécurité et la confidentialité garanties par des contrats intelligents.
  2. Avantages géographiques naturels de l'arbitrage : une architecture distribuée libre qui attire la main-d'œuvre la plus adaptée.
  3. Les avantages clairs d'incitation et de règlement de la blockchain
  4. Favorise la construction d'un marché de données "clé en main" plus efficace et ouvert.

Pour les utilisateurs ordinaires, DataFi est également le projet d'IA décentralisé le plus facile à rejoindre. Les utilisateurs peuvent participer simplement en effectuant des opérations simples, telles que fournir des données, évaluer des modèles, utiliser des outils d'IA pour des créations simples ou participer à des transactions de données.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Le projet potentiel de Web3 DataFi

Actuellement, plusieurs projets DataFi ont obtenu un financement considérable. Voici quelques projets représentatifs :

  1. Sahara AI : s'engage à créer une super infrastructure et un marché de trading décentralisés pour l'IA.

  2. Yupp : plateforme de retour d'information sur les modèles d'IA, recueille les commentaires des utilisateurs sur les sorties des modèles.

  3. Vana : Transformer les données personnelles des utilisateurs en actifs numériques monétisables.

  4. Chainbase : se concentre sur les données en chaîne, couvrant plus de 200 blockchains.

  5. Sapien : vise à transformer les connaissances humaines à grande échelle en données d'entraînement AI de haute qualité.

  6. Prisma X : s'engage à devenir la couche de coordination ouverte pour les robots.

  7. Masa : l'un des principaux projets de sous-réseau de l'écosystème Bittensor.

  8. Irys : axé sur le stockage de données et le calcul programmables.

  9. ORO : Permettre aux gens ordinaires de participer à la contribution à l'IA.

  10. Gata : Positionné comme une couche de données décentralisée.

Ces projets ont actuellement des barrières relativement basses, mais une fois qu'ils accumulent des utilisateurs et une adhérence à l'écosystème, les avantages de la plateforme s'accumulent rapidement. Par conséquent, les projets en phase de démarrage devraient se concentrer sur les incitations et l'expérience utilisateur. En même temps, ces plateformes doivent également envisager comment gérer les participants et garantir la qualité des données, afin d'éviter la situation où "les mauvaises monnaies chassent les bonnes".

De plus, améliorer la transparence est également un grand défi auquel sont confrontés les projets en chaîne actuels. De nombreux projets manquent encore de données suffisamment publiques et traçables, ce qui nuit au développement à long terme de Web3 DataFi.

Le chemin vers une large application de DataFi peut être divisé en deux parties : d'une part, attirer suffisamment d'utilisateurs individuels pour participer, formant ainsi une force vive pour la collecte/génération de données et les consommateurs de l'économie AI ; d'autre part, obtenir la reconnaissance des entreprises majeures, car à court terme, elles sont la principale source de gros volumes de données.

DataFi représente l'intelligence humaine cultivant à long terme l'intelligence des machines, tout en garantissant les bénéfices du travail humain grâce aux contrats intelligents, et en réalisant finalement le retour sur investissement des machines envers l'humanité. Pour ceux qui se sentent incertains face à l'ère de l'IA, ou qui nourrissent encore des idéaux de blockchain, participer à DataFi pourrait être un choix opportun.

Les données sont des actifs : DataFi ouvre un nouvel océan bleu

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 4
  • Partager
Commentaire
0/400
AirdropNinjavip
· Il y a 17h
Encore un bon projet pour se faire prendre pour des cons, hé hé
Voir l'originalRépondre0
LoneValidatorvip
· Il y a 17h
Vraiment riche, 290 milliards à 28 ans.
Voir l'originalRépondre0
quiet_lurkervip
· Il y a 17h
Les données marquées valent 29 milliards ? Cet argent est vraiment trop facile à gagner.
Voir l'originalRépondre0
NotSatoshivip
· Il y a 18h
Il suffit que quelqu'un soit à moitié éveillé~
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)