Как Web3 может играть роль на различных этапах цепочки поставок в индустрии ИИ

ИИ+Web3: Башни и площади

ТЛ; ДОКТОР

  1. Проекты Web3 с концепцией ИИ становятся магнитом для привлечения инвестиций на первичном и вторичном рынках.

  2. Возможности Web3 в AI-отрасли в основном заключаются в: использовании распределенных стимулов для координации долгого хвоста потенциального предложения ( через данные, хранение и вычисления ); одновременно создавая децентрализованный рынок для открытых моделей и AI-агентов.

  3. ИИ в индустрии Web3 в основном применяется в цепочечном финансировании( криптооплатах, сделках, анализе данных) и вспомогательной разработке.

  4. Эффективность AI+Web3 проявляется в взаимодополняемости сторон: Web3, как ожидается, будет противостоять централизации AI, а AI, в свою очередь, сможет помочь Web3 выйти за пределы.

! AI+Web3: Башни и площади

Введение

За последние два года искусственный интеллект развивался стремительно, появление ChatGPT открыло новую эру генеративного искусственного интеллекта и вызвало волну в области Web3.

Под влиянием концепции ИИ финансирование проектов Web3 значительно возросло. Только за первую половину 2024 года 64 проекта Web3+AI завершили финансирование, среди которых операционная система на базе ИИ Zyber365 достигла максимального финансирования в 100 миллионов долларов на этапе A.

Вторичный рынок становится все более процветающим. Данные Coingecko показывают, что общая капитализация сектора искусственного интеллекта достигла 48,5 миллиардов долларов, а объем торгов за 24 часа составил почти 8,6 миллиардов долларов. Прогресс в основных технологиях ИИ приносит заметные преимущества, например, после выпуска Sora от OpenAI средняя цена в сегменте ИИ выросла на 151%. Эффект ИИ также затрагивает сектор криптовалют, привлекающий капитал: первый концепт MemeCoin с AI Agent GOAT быстро стал популярным, его оценка достигла 1,4 миллиарда долларов, что вызвало бум AI Meme.

Исследования и темы, связанные с AI+Web3, набирают популярность; от AI+Depin до AI Memecoin и AI Agent, а также AI DAO, эмоции FOMO уже трудно угнаться за скоростью смены новых нарративов.

Концепция AI+Web3, наполненная горячими деньгами, трендами и будущими фантазиями, неизбежно воспринимается как организованный брак слияния капитала. Нам трудно судить, является ли это площадкой спекулянтов или же преддверием рассвета.

Чтобы ответить на этот вопрос, ключевым моментом является размышление: станет ли лучше с другой стороной? Можно ли извлечь выгоду из модели другой стороны? Эта статья пытается рассмотреть эту схему: как Web3 может играть роль на каждом этапе технологического стека AI, и что нового AI может привнести в Web3?

Часть 1. Какие возможности для Web3 существуют в рамках AI-стека?

Перед тем как обсудить эту тему, нам нужно понять технологический стек больших моделей ИИ:

Искусственный интеллект больших моделей можно сравнить с человеческим мозгом. На ранних стадиях, как у младенцев, требуется наблюдать и собирать огромное количество информации из внешнего мира, чтобы понять его. Это этап "сбора" данных. Поскольку компьютеры не обладают многими человеческими сенсорами, перед обучением необходимо "предобработать" неразмеченные данные, преобразовав их в формат, понятный компьютеру.

После ввода данных ИИ через "обучение" строит модель с предсказательной способностью, подобно тому, как младенец постепенно понимает и учится о внешнем мире. Параметры модели подобны языковым навыкам младенца, которые постоянно настраиваются. Содержание обучения делится на предметы или общение с людьми для получения обратной связи и корректировки, что приводит к этапу "тонкой настройки".

Когда дети вырастают и начинают говорить, они могут понимать и выражать себя в новых диалогах, что похоже на "этап рассуждений" в больших моделях ИИ, позволяя им предсказывать и анализировать новые вводимые данные. Младенцы выражают свои чувства с помощью языка, описывают объекты и решают проблемы, что похоже на применение больших моделей ИИ после их обучения к различным специфическим задачам, таким как классификация изображений, распознавание речи и т.д.

AI-агент становится более близким к следующей форме большого моделирования: способен самостоятельно выполнять задачи, стремясь к сложным целям, обладая способностями к мышлению, памяти и планированию, а также умея использовать инструменты для взаимодействия с миром.

В ответ на болевые точки всех стаков ИИ, Web3 в настоящее время первоначально формирует многослойную взаимосвязанную экосистему, охватывающую все этапы процесса моделей ИИ.

! AI+Web3: Башни и площади

Один. Базовый уровень: Airbnb для вычислительной мощности и данных

вычислительная мощность

В настоящее время одной из самых высоких затрат на ИИ является вычислительная мощность и энергия, необходимые для обучения и вывода моделей.

Для обучения LLAMA3 от Meta требуется 16000 графических процессоров NVIDIA H100 на 30 дней. Цена за 80 ГБ составляет 30-40 тысяч долларов, необходимы инвестиции в оборудование от 400 до 700 миллионов долларов, ежемесячное потребление электроэнергии составляет 1,6 миллиарда киловатт-часов, а расходы на энергетику близки к 20 миллионам долларов.

Распределение вычислительных мощностей ИИ — это одна из первых областей пересечения Web3 и ИИ ------ DePin( децентрализованная сеть физической инфраструктуры). DePin Ninja перечислила более 1400 проектов, таких как io.net, Aethir, Akash, Render Network, представляющие собой совместное использование GPU.

Основная логика: платформа позволяет владельцам неиспользуемых ресурсов GPU без разрешения децентрализованно вносить вычислительную мощность, подобно онлайн-рынку между покупателями и продавцами, как Uber или Airbnb, увеличивая использование недостаточно задействованных ресурсов GPU, конечные пользователи получают эффективные вычислительные ресурсы по низкой цене; в то же время механизм стейкинга гарантирует, что поставщики ресурсов будут наказаны за нарушение контроля качества или прерывание сети.

Особенности:

  • Сбор неиспользуемых ресурсов GPU: в основном для избыточной вычислительной мощности третьих сторон, таких как небольшие дата-центры и криптодобывающие фермы, оборудование для PoS-майнинга, такое как FileCoin и ETH-майнеры. Есть также проекты, стремящиеся запустить сети с более низким порогом входа, такие как exolab, использующий локальные устройства, такие как MacBook, iPhone, iPad, для создания сети вычислительной мощности для работы с большими моделями.

  • Ориентирован на длинный хвост рынка вычислительной мощности ИИ: a. Техническая сторона: более подходит для этапов вывода. Обучение зависит от огромных кластеров GPU, а требования к производительности GPU для вывода ниже, например, Aethir сосредоточен на рендеринге с низкой задержкой и AI-выводе. b. Сторона спроса: малые и средние потребители вычислительных ресурсов не будут отдельно обучать большие модели, а только оптимизируют и донастраивают существующие крупные модели, что естественно подходит для распределенных неиспользуемых вычислительных ресурсов.

  • Децентрализованное владение: Значение технологии блокчейн заключается в том, что владельцы ресурсов всегда сохраняют контроль над ресурсами, гибко регулируя их и одновременно получая доход.

Данные

Данные являются основой ИИ. Без данных вычисления, как водоросли, бесполезны; связь между данными и моделью подобна "мусор на входе, мусор на выходе"; количество и качество данных определяют качество конечного вывода модели. Для обучения модели ИИ данные определяют языковые способности, способности к пониманию, ценности и человекообразное поведение. В настоящее время основные проблемы с потребностями в данных для ИИ заключаются в том, что:

  • Жажда данных: обучение AI-моделей зависит от огромного объема данных. OpenAI обучил GPT-4 с количеством параметров в триллионы.

  • Качество данных: с интеграцией ИИ в различные отрасли появляются новые требования к актуальности, разнообразию, профессионализму данных и новым источникам данных, таким как анализ эмоций в социальных сетях.

  • Конфиденциальность и соблюдение: компании в разных странах постепенно осознают важность качественных наборов данных и начинают ограничивать сбор данных.

  • Высокие затраты на обработку данных: большой объем данных, сложная обработка. Более 30% затрат на НИОКР в AI-компаниях идет на сбор и обработку базовых данных.

Решения Web3 проявляются в четырех аспектах:

  1. Сбор данных: бесплатный сбор данных из реального мира быстро исчерпывается, расходы AI-компаний на данные растут с каждым годом, но это не приносит пользы настоящим вкладчикам; платформы извлекают всю ценность, например, Reddit получил доход в 203 миллиона долларов через лицензионное соглашение на данные с AI-компаниями.

Позволить настоящим участникам пользователей участвовать в создании ценности данных, получать более ценную личную информацию с низкими затратами через распределенную сеть и механизмы стимулов — это видение Web3.

  • Grass: Децентрализованный уровень данных и сеть, пользователи запускают узлы, вносят вклад в неиспользуемую полосу пропускания, ретранслируют трафик, захватывают реальные данные и получают токены в качестве вознаграждения.

  • Vana: введение концепции пула ликвидности данных (DLP), пользователи загружают частные данные в определенный DLP и могут гибко выбирать, разрешать ли третьим лицам их использование.

  • PublicAI: Пользователи могут собирать данные, используя #AI或#Web3 метку на X и @PublicAI.

  1. Предобработка данных: в обработке данных ИИ сбор данных обычно шумный и содержит ошибки, перед обучением необходимо очистить и преобразовать в пригодный формат, включая стандартизацию, фильтрацию, обработку отсутствующих значений и другие повторяющиеся задачи. Этот этап является одним из немногих ручных процессов в индустрии ИИ, породившим профессию аннотаторов данных; с повышением требований к качеству данных для моделей, барьер для входа также возрастает, что естественно подходит для механизмов децентрализованного стимулирования Web3.
  • Grass и OpenLayer рассматривают возможность добавления этапа аннотирования данных.

  • Synesis предложил концепцию "Train2earn", подчеркивая качество данных, пользователи предоставляют аннотированные данные, комментарии и получают вознаграждение.

  • Проект по аннотации данных Sapien геймифицирует задачи по маркировке, пользователи ставят свои очки, чтобы зарабатывать больше очков.

  1. Конфиденциальность и безопасность данных: необходимо прояснить, что конфиденциальность данных и безопасность данных - это два разных понятия. Конфиденциальность данных связана с обработкой чувствительной информации, безопасность данных защищает информацию от несанкционированного доступа, разрушения и кражи. Преимущества технологий конфиденциальности Web3 и потенциальные области применения: (1) обучение на чувствительных данных; (2) сотрудничество данных: несколько владельцев данных совместно участвуют в обучении ИИ, не требуя обмена исходными данными.

Текущие технологии конфиденциальности в Web3:

  • Достоверная исполняемая среда ( TEE ), как Super Protocol

  • Полностью гомоморфное шифрование ( FHE ), такие как BasedAI, Fhenix.io, Inco Network

  • Технология нулевых знаний (zk), такая как Reclaim Protocol, использует технологию zkTLS для генерации нулевых доказательств трафика HTTPS, позволяя пользователям безопасно импортировать данные о внешней активности, репутации и идентичности без раскрытия конфиденциальной информации.

Эта область все еще на ранней стадии, большинство проектов находятся в процессе исследования, текущая проблема заключается в высоких затратах на вычисления, такие как:

  • Фреймворк zkML EZKL требует около 80 минут для генерации доказательства модели 1M-nanoGPT.

  • Данные Modulus Labs показывают, что затраты на zkML в 1000 раз выше, чем на чистые вычисления.

  1. Хранение данных: необходимо место для хранения данных на цепи и генерации LLM. Основной проблемой является доступность данных (DA), до обновления Danksharding на Ethereum производительность составила 0.08MB. Для обучения AI-моделей и реального вывода обычно требуется пропускная способность данных от 50 до 100 ГБ в секунду. Эта разница в масштабах делает существующие решения на цепи трудными для обработки ресурсоемких AI-приложений.
  • 0g.AI является представителем проекта. Это централизованное решение для хранения, разработанное для высокопроизводительных требований AI, ключевые характеристики: высокая производительность и масштабируемость, поддержка быстрой загрузки и скачивания масштабных наборов данных с помощью технологий продвинутой шардирования и кодов исправления ошибок, скорость передачи данных достигает почти 5 ГБ в секунду.

2. Промежуточное ПО: Обучение и вывод модели

Децентрализованный рынок открытых моделей

Дебаты о закрытых и открытых моделях ИИ продолжаются. Открытые модели обеспечивают коллективные инновации, что является несравненным преимуществом перед закрытыми моделями, но как повысить мотивацию разработчиков без модели получения прибыли? Основатель Baidu Ли Яньхонг в апреле заявил: "Открытые модели будут все больше отставать".

Web3 предлагает возможность децентрализованного рынка открытых моделей: токенизация самих моделей, сохранение определенной доли токенов для команды, направление части будущих доходов на держателей токенов.

  • Протокол Bittensor создает открытый P2P-рынок моделей, состоящий из десятков "подсетей", где провайдеры ресурсов ( вычисляют, собирают/хранят данные и конкурируют с талантами в области машинного обучения ) для удовлетворения целей конкретных владельцев подсетей. Подсети могут взаимодействовать и учиться друг у друга, чтобы достичь более мощного интеллекта. Награды распределяются через голосование сообщества и далее распределяются по производительности конкуренции каждой подсети.

  • ORA вводит концепцию первичного размещения модели (IMO), токенизируя AI модели, которые можно покупать, продавать и разрабатывать через децентрализованную сеть.

  • Sentient, децентрализованная платформа AGI, побуждающая людей сотрудничать, строить, копировать и расширять AI модели, а также вознаграждающая вкладчиков.

  • Spectral Nova, сосредотачивается на создании и применении моделей ИИ и МЛ.

Проверяемое умозаключение

Стандартное решение Web3 для проблемы "черного ящика" AI-инференса заключается в повторном сравнении результатов множеством валидаторов, но нехватка высококлассных "чипов Nvidia" приводит к высоким затратам на AI-инференс, что ставит под угрозу этот подход.

Более обнадеживающим является выполнение ZK-доказательства для выполнения вычислений AI вне цепи, что позволяет верифицировать вычисления AI-модели без разрешения на цепи. Необходимо зашифровать доказательства на цепи, что вычисления вне цепи выполнены корректно (, если набор данных не был изменен ), при этом обеспечивая конфиденциальность всех данных.

Основные преимущества:

  • Масштабируемость: нулевые доказательства могут быстро подтверждать большое количество вычислений вне цепочки. Даже если количество транзакций увеличивается, одно доказательство может подтвердить все транзакции.

  • Защита конфиденциальности: информация о данных и моделях ИИ остается конфиденциальной, стороны могут подтвердить, что данные и модели не были повреждены.

  • Не требует доверия: подтверждение вычислений не зависит от централизованных сторон.

  • Интеграция Web2: по определению, Web2 представляет собой интеграцию вне цепочки, верифицируемое умозаключение может помочь перенести его наборы данных и вычисления ИИ на цепочку, что способствует увеличению уровня принятия Web3.

Технологии Web3 для верифицируемого вывода в настоящее время:

  • zkML: сочетание нулевых знаний и машинного обучения, обеспечивающее конфиденциальность данных и моделей, позволяющее выполнять проверяемые вычисления без раскрытия основных атрибутов, такие как ZK-продукт, выпущенный Modulus Labs на основе ZKML, эффективно проверяет, правильно ли поставщики ИИ выполняют алгоритмы в цепочке, в настоящее время клиентами в основном являются DApp на блокчейне.

  • opML: Используя принцип оптимистичного агрегирования, повышаем ML счет через верификацию времени возникновения спора.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 3
  • Поделиться
комментарий
0/400
AirdropHuntervip
· 12ч назад
еще не были разыграны как неудачники большими капиталами
Посмотреть ОригиналОтветить0
OnChainDetectivevip
· 12ч назад
Смотрел на направление денежных потоков три дня. Все киты накапливают ai концепцию.
Посмотреть ОригиналОтветить0
MEVSupportGroupvip
· 12ч назад
Это всего лишь новая игрушка для капиталистов.
Посмотреть ОригиналОтветить0
  • Закрепить