Поиск возможностей AI в Web3: от вычислительной мощности до конфиденциальности данных

AI+Web3: Башни и площади

ТЛ; ДОКТОР

  1. Проекты Web3 с концепцией ИИ становятся объектами привлечения капитала на первичном и вторичном рынках.

  2. Возможности Web3 в индустрии ИИ заключаются в: использовании распределенных стимулов для координации потенциальных поставок в длинном хвосте ------ через данные, хранение и вычисления; в то же время, создание открытой модели и децентрализованного рынка для AI-агентов.

  3. Основные области применения ИИ в индустрии Web3 — это финансовые услуги на блокчейне (криптовалютные платежи, торговля, анализ данных) и помощь в разработке.

  4. Эффективность AI+Web3 проявляется в взаимодополнении двух технологий: Web3 ожидается, что будет противостоять централизации AI, а AI, в свою очередь, поможет Web3 выйти за пределы.

! AI+Web3: Башни и площади

Введение

За последние два года развитие ИИ похоже на нажатую кнопку ускорения; это влияние, вызванное Chatgpt, не только открыло новый мир генеративного искусственного интеллекта, но также создало волну в Web3 на другом берегу.

С учетом концепции ИИ, заметно увеличилось финансирование в замедляющемся крипторынке. Согласно статистике СМИ, только в первой половине 2024 года 64 проекта Web3+AI завершили финансирование, а основанная на искусственном интеллекте операционная система Zyber365 в раунде А достигла максимального объема финансирования в 100 миллионов долларов.

Вторичный рынок становится более процветающим. Данные с одного из криптоагрегаторов показывают, что всего за чуть более года общая рыночная капитализация сектора ИИ достигла 48,5 миллиарда долларов, а объем торгов за 24 часа приближается к 8,6 миллиарда долларов; очевидно, что положительное влияние прогресса основных технологий ИИ заметно, после выпуска текстово-видеомодели Sora от одной компании средняя цена в секторе ИИ возросла на 151%; эффект ИИ также затрагивает одну из областей привлечения средств в криптовалюте - Meme: первая концепция AI Agent MemeCoin ------ GOAT быстро завоевала популярность и достигла оценки в 1,4 миллиарда долларов, успешно инициировав бум AI Meme.

Исследования и обсуждения по теме AI+Web3 также нарастили популярность, от AI+Depin до AI Memecoin и текущих AI Agent и AI DAO, эмоции FOMO уже не успевают за скоростью смены новых нарративов.

AI+Web3, эта комбинация терминов, наполненная горячими деньгами, трендами и будущими фантазиями, неизбежно воспринимается как сделанный капиталом фиктивный брак. Нам кажется, что трудно отличить под этой великолепной одеждой, действительно ли это арена спекулянтов или предрассветная пора пробуждения?

Чтобы ответить на этот вопрос, важным размышлением для обеих сторон является то, станет ли им лучше с другой стороной? Могут ли они извлечь выгоду из модели другой стороны? В этой статье мы также пытаемся посмотреть на эту структуру, опираясь на достижения предшественников: как Web3 может играть роль на каждом этапе технологического стека AI, и что AI может принести новому дыханию Web3?

Часть 1 Какие возможности предоставляет Web3 в рамках AI-стека?

Перед тем как раскрыть эту тему, нам необходимо понять технологический стек больших моделей ИИ:

! AI+Web3: Башни и площади

Выражаясь более простым языком, весь процесс можно описать так: «Большая модель» похожа на человеческий мозг. На ранней стадии этот мозг принадлежит новорожденному, который только что появился на свет, и ему необходимо наблюдать и поглощать огромное количество информации из окружающего мира, чтобы понять его. Это стадия «сбор данных». Поскольку компьютеры не обладают человеческими зрительными, слуховыми и другими чувствами, перед обучением большие объемы неразмеченной информации должны быть преобразованы с помощью «предобработки» в формат информации, который может быть понятен и полезен компьютеру.

После ввода данных ИИ строит модель с пониманием и предсказательными способностями через "обучение", что можно рассматривать как процесс, в котором младенец постепенно понимает и изучает внешний мир. Параметры модели похожи на языковые способности младенца, которые постоянно корректируются в процессе обучения. Когда изучаемый материал начинает делиться на предметы, или когда происходит общение с людьми, что дает обратную связь и корректировки, это переходит в стадию "тонкой настройки" большой модели.

Дети, постепенно подрастая и научившись говорить, могут понимать смысл в новых разговорах и выражать свои чувства и мысли. Этот этап похож на «вывод» больших моделей ИИ, которые могут предсказывать и анализировать новые языковые и текстовые входные данные. Младенцы используют свои языковые навыки для выражения чувств, описания объектов и решения различных задач, что также похоже на применение больших моделей ИИ на этапе вывода для выполнения различных специфических задач, таких как классификация изображений, распознавание речи и др.

А AI Agent становится более близким к следующей форме большого модели ------ способной независимо выполнять задачи и стремиться к сложным целям, обладая не только способностью к мышлению, но и способностью к памяти, планированию, а также использованию инструментов для взаимодействия с миром.

В настоящее время, учитывая проблемы AI на различных уровнях, Web3 в настоящее время предварительно сформировала многоуровневую, взаимосвязанную экосистему, охватывающую все этапы процесса AI моделей.

Один. Базовый уровень: Airbnb для вычислительной мощности и данных

Хэшрейт

В настоящее время одной из самых высоких затрат ИИ является вычислительная мощность и энергия, необходимые для обучения и вывода моделей.

Примером является то, что компании LLAMA3 требуется 16000 H100GPU, произведенных одним из производителей (это высококачественный графический процессор, специально разработанный для искусственного интеллекта и высокопроизводительных вычислительных задач). Обучение занимает 30 дней. Цена за версию 80GB колеблется от 30 000 до 40 000 долларов, что требует инвестиций в вычислительное оборудование (GPU + сетевые чипы) в размере 400-700 миллионов долларов, при этом ежемесячное обучение требует 1,6 миллиарда киловатт-часов, а расходы на энергию составляют почти 20 миллионов долларов в месяц.

Разгрузка AI-вычислительных мощностей является одной из первых областей пересечения Web3 и AI ------ DePin (децентрализованная сеть физической инфраструктуры). В настоящее время один из сайтов по данным уже перечислил более 1400 проектов, среди которых проекты, представляющие собой совместное использование GPU-вычислительных мощностей, включают io.net, Aethir, Akash, Render Network и другие.

Основная логика заключается в том, что платформа позволяет индивидуумам или организациям, обладающим неиспользуемыми GPU-ресурсами, вносить свой вычислительный потенциал в децентрализованной форме без необходимости получения разрешения, создавая онлайн-рынок для покупателей и продавцов, подобно некоторым сервисам такси или аренды, что повышает коэффициент использования не полностью задействованных GPU-ресурсов. Конечные пользователи, в свою очередь, получают более доступные эффективные вычислительные ресурсы; в то же время механизм стейкинга также гарантирует, что в случае нарушения механизмов контроля качества или прерывания сети поставщики ресурсов понесут соответствующие наказания.

Его особенности заключаются в том, что:

  • Сбор неиспользуемых ресурсов GPU: поставщиками в основном являются независимые малые и средние дата-центры, операторы избыточных вычислительных ресурсов крипто-майнинг-ферм и т.д., оборудование для майнинга с механизмом консенсуса PoS, как, например, некоторые сетевые хранилища и некоторые майнеры основных блокчейнов. В настоящее время также есть проекты, направленные на снижение порога входа для оборудования, такие как exolab, использующий местные устройства, такие как ноутбуки, телефоны, планшеты определённого бренда для создания сети вычислительных ресурсов для запуска больших моделей вывода.

  • Столкновение с длинным хвостом рынка вычислительной мощности ИИ:

a. «С точки зрения технологии» децентрализованный рынок вычислительной мощности лучше подходит для этапов вывода. Обучение в большей степени зависит от вычислительной способности обработки данных, обеспечиваемой сверхбольшими кластерными GPU, в то время как для вывода требования к вычислительной производительности GPU относительно ниже, как, например, Aethir, который сосредоточен на рендеринге с низкой задержкой и приложениях AI вывода.

b. С точки зрения спроса, малые и средние потребители вычислительных мощностей не будут отдельно обучать свои большие модели, а просто выберут оптимизацию и донастройку вокруг нескольких ведущих больших моделей, и эти сценарии естественно подходят для распределенных неиспользуемых вычислительных ресурсов.

  • Децентрализованное владение: техническое значение блокчейна заключается в том, что владельцы ресурсов всегда сохраняют контроль над своими ресурсами, могут гибко регулировать их в зависимости от потребностей и одновременно получать прибыль.

Данные

Данные являются основой ИИ. Без данных вычисления будут бесполезны, как водоросли на поверхности воды, а связь между данными и моделью напоминает пословицу "Мусор на входе, мусор на выходе". Количество данных и качество ввода определяют качество конечного вывода модели. Для обучения современных ИИ-моделей данные определяют языковые способности модели, способности к пониманию, а также мировоззрение и гуманистическое проявление. В настоящее время трудности с потребностью в данных для ИИ в основном сосредоточены на следующих четырех аспектах:

  • Жажда данных: обучение моделей ИИ зависит от большого объема входных данных. Открытые данные показывают, что для обучения GPT-4 компания использовала триллионы параметров.

  • Качество данных: с учетом интеграции ИИ и различных отраслей, актуальность данных, разнообразие данных, профессионализм специализированных данных, а также влияние новых источников данных, таких как эмоции в социальных сетях, выдвигает новые требования к их качеству.

  • Проблемы конфиденциальности и соблюдения: в настоящее время страны и компании постепенно осознают важность качественных наборов данных и вводят ограничения на сбор данных.

  • Высокие затраты на обработку данных: большой объем данных, сложный процесс обработки. По公开资料, более 30% затрат на研发 у AI компаний идет на сбор и обработку базовых данных.

В настоящее время решения web3 проявляются в следующих четырех аспектах:

  1. Сбор данных: возможность бесплатно предоставлять захваченные данные из реального мира стремительно иссякает, расходы AI компаний на данные растут из года в год. Но в то же время эти расходы не возвращаются к настоящим вкладчикам данных; платформы полностью наслаждаются созданием ценности, которую приносит данные. Например, одна социальная платформа получила доход в 203 миллиона долларов США благодаря подписанию соглашения о лицензировании данных с AI компанией.

Видение Web3 заключается в том, чтобы дать возможность пользователям, которые действительно вносят вклад, участвовать в создании ценности, которую приносит данные, а также получать более личные и ценные данные от пользователей с помощью распределенной сети и механизмов стимулов при низких затратах.

  • Grass является децентрализованным уровнем данных и сетью, пользователи могут запустить узлы Grass, чтобы внести свой вклад в неиспользуемую пропускную способность и релейный трафик для захвата в реальном времени данных из всего Интернета и получения токенов в качестве вознаграждения;

  • Vana ввела уникальную концепцию пула ликвидности данных (DLP), позволяя пользователям загружать свои личные данные (такие как записи покупок, привычки просмотра, активность в социальных сетях и т. д.) в определённый DLP и гибко выбирать, разрешать ли использование этих данных определённым третьим лицам;

  • В PublicAI пользователи могут использовать #AI 或#Web3 в качестве категориальной метки и @PublicAI на определенной социальной платформе для сбора данных.

  1. Предобработка данных: в процессе обработки данных ИИ, поскольку собранные данные обычно шумные и содержат ошибки, их необходимо очистить и преобразовать в пригодный формат перед обучением модели, что включает в себя стандартизацию, фильтрацию и обработку отсутствующих значений с повторяющимися задачами. Этот этап является одним из немногих ручных этапов в индустрии ИИ, в результате чего возникла профессия аннотаторов данных. С повышением требований моделей к качеству данных, порог для аннотаторов данных также увеличивается, и эта задача естественно подходит для децентрализованной системы вознаграждений Web3.
  • В настоящее время Grass и OpenLayer рассматривают возможность включения аннотирования данных в этот ключевой этап.

  • Synesis предложила концепцию «Train2earn», подчеркивая качество данных, пользователи могут получать вознаграждения за предоставление аннотированных данных, комментариев или других форм ввода.

  • Проект маркировки данных Sapien геймифицирует задачи по маркировке и позволяет пользователям ставить очки, чтобы зарабатывать больше очков.

  1. Конфиденциальность и безопасность данных: необходимо прояснить, что конфиденциальность и безопасность данных — это два разных понятия. Конфиденциальность данных касается обработки чувствительной информации, в то время как безопасность данных защищает информацию от несанкционированного доступа, разрушения и кражи. Таким образом, преимущества технологий конфиденциальности Web3 и потенциальные сценарии применения проявляются в двух аспектах: (1) обучение на чувствительных данных; (2) сотрудничество по данным: несколько владельцев данных могут совместно участвовать в обучении ИИ, не делясь своими исходными данными.

Текущие распространенные технологии конфиденциальности в Web3 включают:

  • Достоверная исполняемая среда ( TEE ), например, Super Protocol;

  • Полная гомоморфная криптография (FHE), например, BasedAI, Fhenix.io или Inco Network;

  • Технология нулевых знаний (zk), такая как Reclaim Protocol, использует технологию zkTLS для генерации доказательств нулевых знаний для HTTPS-трафика, позволяя пользователям безопасно импортировать данные о деятельности, репутации и идентичности с внешних сайтов, не раскрывая конфиденциальную информацию.

Однако в настоящее время эта область все еще находится на ранней стадии, большинство проектов все еще находятся в стадии исследования, текущая проблема заключается в слишком высоких вычислительных затратах, некоторые примеры это:

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Поделиться
комментарий
0/400
HashBanditvip
· 07-16 03:50
в мои дни майнинга у нас была настоящая децентрализация... а не этот хайп с ИИ, смх
Посмотреть ОригиналОтветить0
CoconutWaterBoyvip
· 07-16 03:50
Деньги зарабатываем вместе, ага~
Посмотреть ОригиналОтветить0
CryptoTherapistvip
· 07-16 03:39
скоро вернусь, делаю дыхательные упражнения, чтобы справиться с тревогой по поводу слияния ai и web3, если честно
Посмотреть ОригиналОтветить0
SleepTradervip
· 07-16 03:39
Снова играют в концепции, это просто инструмент для сбора денег.
Посмотреть ОригиналОтветить0
shadowy_supercodervip
· 07-16 03:21
ai зарабатывает деньги и всё.
Посмотреть ОригиналОтветить0
  • Закрепить