Nueva situación de la fusión AI+Web3: incentivos de distribución de cola larga y mercado de modelos de Código abierto

AI+Web3: Torres y plazas

Resumen de puntos clave

  1. Los proyectos Web3 con conceptos de IA se han convertido en objetivos de captación de fondos en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se reflejan en: el uso de incentivos distribuidos para coordinar la oferta potencial en la larga cola ( a través de datos, almacenamiento y computación ); al mismo tiempo, establecer modelos de código abierto y un mercado descentralizado para Agentes de IA.

  3. La IA se utiliza principalmente en la industria Web3 para finanzas en cadena ( pagos criptográficos, transacciones, análisis de datos ) y desarrollo asistido.

  4. La utilidad de AI+Web3 se manifiesta en la complementariedad de ambos: Web3 tiene el potencial de contrarrestar la centralización de la IA, y la IA tiene el potencial de ayudar a Web3 a romper fronteras.

Introducción

En los últimos dos años, el desarrollo de la IA ha parecido ser acelerado, y este efecto mariposa provocado por Chatgpt no solo ha abierto un nuevo mundo de inteligencia artificial generativa, sino que también ha generado una ola en el campo de Web3.

Con el impulso del concepto de IA, el financiamiento en el mercado de criptomonedas, que se ha ralentizado, ha mostrado una clara mejora. Los medios han contabilizado que, solo en la primera mitad de 2024, un total de 64 proyectos Web3+AI han completado financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró un financiamiento récord de 100 millones de dólares en su ronda A.

El mercado secundario está más próspero, los datos de los sitios web de agregación de criptomonedas muestran que en poco más de un año, el valor total del mercado de la pista de IA ha alcanzado los 48,5 mil millones de dólares, con un volumen de transacciones de casi 8,6 mil millones de dólares en 24 horas; los avances en la tecnología de IA han traído beneficios evidentes, después del lanzamiento del modelo de OpenAI Sora para convertir texto en video, el precio promedio del sector de IA aumentó un 151%; el efecto de la IA también se ha extendido a uno de los sectores de recaudación de fondos en criptomonedas, Meme: el primer concepto de MemeCoin de Agente de IA - GOAT se ha vuelto popular rápidamente y ha alcanzado una valoración de 1.4 mil millones de dólares, provocando con éxito un auge en los Memes de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+DePIN hasta AI Memecoin y, actualmente, AI Agent y AI DAO, la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.

AI+Web3, esta combinación de términos llena de dinero fácil, tendencias y fantasías futuras, inevitablemente es vista como un matrimonio arreglado orquestado por el capital; parece que es difícil discernir, bajo esta magnífica vestimenta, si realmente es el terreno de los especuladores o la víspera de una explosión al amanecer.

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿mejorará con la otra parte? ¿Se puede beneficiar de los modelos de la otra parte? En este artículo, también intentamos examinar este patrón desde la perspectiva de los pioneros: ¿cómo puede Web3 desempeñar un papel en cada etapa de la pila tecnológica de IA y qué nueva vitalidad puede aportar la IA a Web3?

AI+Web3: Torres y Plazas

Parte 1 ¿Qué oportunidades hay en Web3 bajo el stack de IA?

Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:

Expresar todo el proceso en un lenguaje más simple: "un gran modelo" es como el cerebro humano. En una etapa temprana, este cerebro pertenece a un bebé que acaba de llegar al mundo, que necesita observar y absorber una gran cantidad de información del entorno para entender este mundo. Esta es la fase de "recolección" de datos; dado que las computadoras no poseen múltiples sentidos como la visión y el oído humanos, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior necesita ser transformada a través de "preprocesamiento" en un formato de información que las computadoras puedan entender y utilizar.

Después de ingresar los datos, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento", lo que se puede ver como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta continuamente durante su proceso de aprendizaje. Cuando el contenido de aprendizaje comienza a especializarse, o se obtiene retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la etapa de "ajuste fino" del gran modelo.

Los niños, al crecer y aprender a hablar, pueden entender el significado y expresar sus sentimientos y pensamientos en nuevas conversaciones. Esta etapa es similar a la "inferencia" en los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo cual también es similar a cómo los grandes modelos de IA se aplican en la etapa de inferencia después de completar el entrenamiento y ser utilizados en diversas tareas específicas, como clasificación de imágenes, reconocimiento de voz, etc.

Y el Agente AI se acerca más a la próxima forma del gran modelo: capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y usar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diversas pilas, Web3 ha comenzado a formar un ecosistema interconectado y multicapas que abarca todas las etapas del proceso de modelos de IA.

AI+Web3: Torres y Plazas

Una, Capa Básica: Airbnb de Potencia de Cálculo y Datos

Potencia de cálculo

Actualmente, uno de los mayores costos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.

Un ejemplo es que el modelo de lenguaje grande de un gigante tecnológico necesita 16,000 GPU de alta gama producidas por un fabricante de GPU durante 30 días para completar el entrenamiento. El precio unitario de la versión de 80 GB oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de cálculo de entre 400 y 700 millones de dólares ( GPU + chip de red ). Al mismo tiempo, el entrenamiento mensual consume 1.6 mil millones de kilovatios hora, con gastos de energía de cerca de 20 millones de dólares al mes.

La descompresión de la potencia de cálculo de IA es precisamente el primer campo de intersección entre Web3 y la IA - DePIN(, la red de infraestructura física descentralizada), actualmente, los sitios web de datos relacionados han enumerado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen varias plataformas reconocidas.

La lógica principal es la siguiente: la plataforma permite a personas o entidades que tienen recursos de GPU inactivos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea para compradores y vendedores similar a Uber o Airbnb, aumentando así la tasa de utilización de recursos de GPU que no se están aprovechando completamente; al mismo tiempo, el mecanismo de staking también asegura que si se produce una violación de los mecanismos de control de calidad o una interrupción de la red, los proveedores de recursos tienen las sanciones correspondientes.

Su característica es que:

  • Reunir recursos de GPU ociosos: los proveedores son principalmente centros de datos independientes de terceros de tamaño pequeño y mediano, recursos de potencia de cálculo excedentes de operadores de granjas de minería, hardware de minería con mecanismo de consenso PoS, como las máquinas de minería de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar redes de potencia de cálculo para la inferencia de grandes modelos utilizando dispositivos locales como MacBook, iPhone, iPad, etc.

  • Frente al mercado de cola larga de la potencia de cálculo de IA:

a. Desde el punto de vista técnico, el mercado de potencia de cálculo descentralizado es más adecuado para los pasos de inferencia. El entrenamiento depende en mayor medida de la capacidad de procesamiento de datos que ofrecen los GPU en escalas de clústeres extremadamente grandes, mientras que la inferencia requiere un rendimiento de cálculo de GPU relativamente menor, como algunas plataformas que se centran en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.

b. Desde la perspectiva de la demanda, los demandantes de poder de cálculo medio y pequeño no entrenarán su propio gran modelo de forma independiente, sino que solo elegirán optimizar y ajustar finamente alrededor de unos pocos grandes modelos de cabecera, y estos escenarios son inherentemente adecuados para los recursos de cálculo distribuidos ociosos.

  • Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de recursos siempre mantienen el control sobre sus recursos, ajustándolos de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo sería tan inútil como una planta flotante. La relación entre los datos y el modelo es como el dicho "Garbage in, Garbage out"; la cantidad de datos y la calidad de la entrada determinan la calidad de salida del modelo final. Para el entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística del modelo, su capacidad de comprensión e incluso sus valores y su expresión humanizada. Actualmente, las dificultades de demanda de datos de la IA se centran principalmente en los siguientes cuatro aspectos:

  • Hambre de datos: El entrenamiento de modelos de IA depende de una gran cantidad de datos de entrada. La información pública muestra que el modelo de lenguaje de una conocida empresa de IA tiene un número de parámetros que alcanza el nivel de billones.

  • Calidad de los datos: Con la integración de la IA en diversas industrias, la puntualidad de los datos, la diversidad de datos, la especialización de los datos por sector y la incorporación de nuevas fuentes de datos, como las emociones en las redes sociales, han planteado nuevos requisitos para su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, varios países y empresas están comenzando a reconocer la importancia de los conjuntos de datos de calidad y están imponiendo restricciones sobre la recopilación de conjuntos de datos.

  • Costos de procesamiento de datos elevados: gran volumen de datos y procesos complejos. Los datos públicos muestran que más del 30% de los costos de I+D de las empresas de IA se destinan a la recolección y procesamiento de datos básicos.

Actualmente, las soluciones web3 se reflejan en los siguientes cuatro aspectos:

  1. Recolección de datos: La disponibilidad de datos del mundo real que se pueden extraer de forma gratuita se está agotando rápidamente, y el gasto de las empresas de IA en datos está aumentando año tras año. Sin embargo, al mismo tiempo, este gasto no se ha revertido en los verdaderos contribuyentes de datos, ya que las plataformas disfrutan plenamente de la creación de valor que aportan los datos. Por ejemplo, una plataforma social generó ingresos por un total de 203 millones de dólares a través de acuerdos de autorización de datos firmados con empresas de IA.

Permitir que los usuarios que realmente contribuyen participen en la creación de valor que aporta los datos, así como obtener datos más privados y valiosos de los usuarios de manera económica a través de una red distribuida y mecanismos de incentivos, es la visión de Web3.

  • Algunas plataformas son una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y retransmitir tráfico ejecutando nodos para capturar datos en tiempo real de toda la internet y recibir recompensas en tokens;

  • Algunas plataformas han introducido el concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados ( como registros de compras, hábitos de navegación, actividades en redes sociales, etc. ) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;

  • En algunas plataformas, los usuarios pueden utilizar etiquetas específicas en las redes sociales y @la plataforma para realizar la recopilación de datos.

  1. Preprocesamiento de datos: En el proceso de tratamiento de datos de la IA, dado que los datos recopilados suelen ser ruidosos y contener errores, deben ser limpiados y convertidos a un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y tratamiento de valores perdidos. Esta etapa es una de las pocas fases manuales en la industria de la IA, y ha dado lugar a la profesión de etiquetador de datos. A medida que las exigencias de calidad de los datos por parte de los modelos aumentan, también lo hace el umbral para convertirse en etiquetador de datos, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizados de Web3.
  • Actualmente, múltiples plataformas están considerando unirse a esta etapa clave de etiquetado de datos.

  • Algunos proyectos han propuesto el concepto de "Train2earn", enfatizando la calidad de los datos, los usuarios pueden obtener recompensas al proporcionar datos anotados, comentarios u otras formas de entrada.

  • El proyecto de etiquetado de datos gamificará las tareas de etiquetado y permitirá a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: es importante aclarar que la privacidad y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información de los datos contra el acceso no autorizado, la destrucción y el robo. Por lo tanto, las ventajas de la tecnología de privacidad en Web3 y los posibles escenarios de aplicación se manifiestan en dos aspectos: (1) entrenamiento de datos sensibles; (2) colaboración de datos: múltiples propietarios de datos pueden participar conjuntamente en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 actualmente incluyen:

  • Entorno de Ejecución Confiable(TEE)

  • Cifrado homomórfico completamente (FHE)

  • Tecnología de conocimiento cero ( zk ), como ciertos protocolos que utilizan la tecnología zkTLS, generan pruebas de conocimiento cero del tráfico HTTPS, permitiendo a los usuarios importar de forma segura datos de actividad, reputación e identidad desde sitios web externos sin exponer información sensible.

Sin embargo, en la actualidad este campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, y un dilema actual es que el costo de computación es demasiado alto, algunos ejemplos son:

  • Un marco zkML necesita aproximadamente 80 minutos para generar una prueba de un modelo 1M-nanoGPT.

  • Según los datos de un laboratorio, el costo de zkML es más de 1000 veces mayor que el de los cálculos puros.

  1. Almacenamiento de datos: Una vez que se tienen los datos, también se necesita un lugar para almacenar los datos en la cadena, así como el LLM generado a partir de esos datos. Con la disponibilidad de datos (DA) como cuestión central, antes de la actualización de Danksharding de Ethereum, su capacidad de procesamiento era de 0.08MB. Al mismo tiempo, el entrenamiento de modelos de IA y la inferencia en tiempo real suelen requerir un rendimiento de datos de 50 a 100GB por segundo. Esta diferencia de magnitud deja a las soluciones existentes en la cadena sin recursos frente a "aplicaciones de IA que consumen muchos recursos".
  • Algunas plataformas son proyectos representativos de esta categoría. Es una solución de almacenamiento centralizado diseñada para satisfacer las altas demandas de rendimiento de la IA, cuyas características clave incluyen: alta
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 8
  • Compartir
Comentar
0/400
MoonBoi42vip
· hace4h
La innovación avanza continuamente.
Ver originalesResponder0
GateUser-bd883c58vip
· 07-30 11:02
El futuro es prometedor.
Ver originalesResponder0
BearMarketBardvip
· 07-30 11:02
Hablemos cuando haya un bull run.
Ver originalesResponder0
GasFeeBarbecuevip
· 07-30 11:01
tomar a la gente por tonta
Ver originalesResponder0
PumpingCroissantvip
· 07-30 11:01
Ver este tendencia de manera racional
Ver originalesResponder0
AirdropHunterXMvip
· 07-30 10:52
alcista en este campo
Ver originalesResponder0
PebbleHandervip
· 07-30 10:43
El camino brillante avanza hacia adelante.
Ver originalesResponder0
BearMarketBuyervip
· 07-30 10:39
Los valientes del mercado bajista avanzan
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)