Дані як активи: DataFi відкриває новий блакитний океан
Цього місяця найбільшою темою в AI-колах стало те, що Meta активно набирає кадри, формуючи розкішну команду AI, до складу якої входять переважно китайські науковці. Керівником є лише 28-річний Александр Ванг, який заснував Scale AI. На сьогоднішній день оцінка Scale AI становить 29 мільярдів доларів США, і компанія надає послуги з обробки даних для багатьох великих AI-гігантів, включаючи армію США, OpenAI, Anthropic, Meta та інші, основний бізнес якої полягає у наданні великої кількості точних даних з позначками.
Причиною, по якій Scale AI змогла вирізнитися серед численних єдинорогів, є те, що вона рано усвідомила ключову роль даних в індустрії ШІ. Обчислювальна потужність, моделі та дані є трьома основними стовпами моделей ШІ. Якщо великий модель порівняти з людиною, то модель - це тіло, обчислювальна потужність - це їжа, а дані - це знання та інформація.
У процесі швидкого розвитку великих мовних моделей акцент в галузі змістився від моделей до обчислювальної потужності. Сьогодні більшість моделей використовують трансформер як базову структуру, іноді з'являються інновації, такі як MoE або MoRe; великі компанії або створюють власні суперобчислювальні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг для вирішення проблеми обчислювальної потужності. На цьому фоні важливість даних стає все більш очевидною.
Scale AI зосереджується на створенні надійної даної основи для AI-моделей, їхній бізнес не лише включає видобуток існуючих даних, а й охоплює бізнес з генерації даних. Компанія також сформувала команду тренування AI, до складу якої входять експерти з різних галузей, щоб забезпечити AI-моделі високоякісними навчальними даними.
Навчання моделі поділяється на два етапи: попереднє навчання та доопрацювання. Попереднє навчання подібне до процесу, коли дитина вчиться говорити, і вимагає великої кількості текстової, кодової та іншої інформації, зібраної з Інтернету. Доопрацювання ж подібне до шкільної освіти, має чітку мету та напрямок, і виховує специфічні здібності моделі за допомогою ретельно розроблених наборів даних.
Отже, AI-дані в основному включають два типи наборів даних: один тип - це велика кількість даних, які не потребують значної обробки, зазвичай з платформ UGC, таких як Reddit, Twitter, Github, відкриті бібліотеки або приватні бази даних компаній; інший тип потребує точного дизайну та відбору, щоб забезпечити розвиток специфічних можливостей моделі, що вимагає очищення даних, відбору, маркування та зворотного зв'язку від людей.
З підвищенням можливостей моделей різноманітні більш детальні та професійні навчальні дані стануть ключовими факторами, що визначають можливості моделі. У довгостроковій перспективі дані AI також є довгостроковою траєкторією з ефектом снігової кулі; з накопиченням попередньої роботи, активи даних набудуть здатності до складних відсотків, а їхня вартість постійно зростатиме.
Web3 DataFi: Обрана AI даних родючий край
На відміну від десятків тисяч людей, які працюють віддалено в командах з розмітки даних у багатьох країнах, Web3 має природну перевагу в сфері AI-даних, що призвело до виникнення нової концепції DataFi. Ідеально, переваги Web3 DataFi включають:
Інтелектуальні контракти забезпечують суверенітет даних, безпеку та конфіденційність
Природна географічна арбітражна перевага: вільна розподілена архітектура, що приваблює найкращу робочу силу
Чіткі переваги стимулювання та розрахунків у блокчейні
Сприяє створенню більш ефективного та відкритого "одного візка" ринку даних
Для звичайних користувачів DataFi є найпростішим децентралізованим AI проектом для участі. Користувачі можуть долучитися до нього за допомогою простих дій, включаючи надання даних, оцінку моделей, використання AI інструментів для простого творчого процесу або участь у торгівлі даними тощо.
Потенційні проекти Web3 DataFi
Наразі кілька проектів DataFi отримали значне фінансування. Ось деякі представницькі проекти:
Sahara AI: прагне створити суперінфраструктуру та торговельний ринок для децентралізованого штучного інтелекту.
Yupp: Платформа зворотного зв'язку для AI моделей, що збирає відгуки користувачів про вихід моделей.
Vana: Перетворення особистих даних користувачів на цифрові активи, які можна монетизувати.
Chainbase: зосереджений на даних блокчейну, охоплює більше 200 блокчейнів.
Sapien: призначений для масового перетворення людських знань на якісні дані для навчання ШІ.
Prisma X: прагне стати відкритим координаційним рівнем для роботів.
Masa: один з провідних підмережевих проєктів екосистеми Bittensor.
Irys: зосереджений на програмованому зберіганні даних та обчисленнях.
ORO: Надання можливості звичайним людям брати участь у внесках в AI.
Gata: позиціюється як децентралізований шар даних.
Ці проекти наразі мають відносно низькі бар'єри входу, але як тільки вони накопичать користувачів та екосистемну відданість, переваги платформи швидко наростуть. Тому раннім проектам варто зосередитися на стимулюванні та користувацькому досвіді. Одночасно, цим платформам потрібно розглянути, як управляти учасниками, забезпечувати якість даних і уникати ситуації "погані гроші витісняють добрі".
Крім того, підвищення прозорості також є великою проблемою, з якою стикаються сучасні проекти на блокчейні. Багато проектів все ще не мають достатньо відкритих, відслідковуваних даних, що негативно впливає на довгостроковий здоровий розвиток Web3 DataFi.
Шлях до масового впровадження DataFi можна розділити на дві частини: перша - залучення достатньої кількості особистих користувачів для формування активу збору/генерації даних та споживачів економіки ШІ; друга - отримання визнання від основних підприємств, оскільки в найближчій перспективі вони є основним джерелом великих даних.
DataFi представляє собою довгострокове виховання людського інтелекту в машинному інтелекті, одночасно забезпечуючи прибуток від людської праці за допомогою смарт-контрактів, врешті-решт реалізуючи повернення машинного інтелекту до людини. Для тих, хто відчуває невизначеність в епоху AI або все ще має ідеали блокчейну, участь у DataFi може бути вдалим вибором.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
15 лайків
Нагородити
15
4
Поділіться
Прокоментувати
0/400
AirdropNinja
· 17год тому
Знову гарний проект для обману невдахів, хе-хе
Переглянути оригіналвідповісти на0
LoneValidator
· 17год тому
Справді багатий, у 28 років вже 290 мільярдів.
Переглянути оригіналвідповісти на0
quiet_lurker
· 17год тому
Дані оцінюються в 29 мільярдів? Ці гроші занадто легко заробити.
Переглянути оригіналвідповісти на0
NotSatoshi
· 18год тому
Якщо б у когось було хоча б половина уваги, було б добре~
DataFi: нова блакитна економіка даних AI у сфері Web3
Дані як активи: DataFi відкриває новий блакитний океан
Цього місяця найбільшою темою в AI-колах стало те, що Meta активно набирає кадри, формуючи розкішну команду AI, до складу якої входять переважно китайські науковці. Керівником є лише 28-річний Александр Ванг, який заснував Scale AI. На сьогоднішній день оцінка Scale AI становить 29 мільярдів доларів США, і компанія надає послуги з обробки даних для багатьох великих AI-гігантів, включаючи армію США, OpenAI, Anthropic, Meta та інші, основний бізнес якої полягає у наданні великої кількості точних даних з позначками.
Причиною, по якій Scale AI змогла вирізнитися серед численних єдинорогів, є те, що вона рано усвідомила ключову роль даних в індустрії ШІ. Обчислювальна потужність, моделі та дані є трьома основними стовпами моделей ШІ. Якщо великий модель порівняти з людиною, то модель - це тіло, обчислювальна потужність - це їжа, а дані - це знання та інформація.
У процесі швидкого розвитку великих мовних моделей акцент в галузі змістився від моделей до обчислювальної потужності. Сьогодні більшість моделей використовують трансформер як базову структуру, іноді з'являються інновації, такі як MoE або MoRe; великі компанії або створюють власні суперобчислювальні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг для вирішення проблеми обчислювальної потужності. На цьому фоні важливість даних стає все більш очевидною.
Scale AI зосереджується на створенні надійної даної основи для AI-моделей, їхній бізнес не лише включає видобуток існуючих даних, а й охоплює бізнес з генерації даних. Компанія також сформувала команду тренування AI, до складу якої входять експерти з різних галузей, щоб забезпечити AI-моделі високоякісними навчальними даними.
Навчання моделі поділяється на два етапи: попереднє навчання та доопрацювання. Попереднє навчання подібне до процесу, коли дитина вчиться говорити, і вимагає великої кількості текстової, кодової та іншої інформації, зібраної з Інтернету. Доопрацювання ж подібне до шкільної освіти, має чітку мету та напрямок, і виховує специфічні здібності моделі за допомогою ретельно розроблених наборів даних.
Отже, AI-дані в основному включають два типи наборів даних: один тип - це велика кількість даних, які не потребують значної обробки, зазвичай з платформ UGC, таких як Reddit, Twitter, Github, відкриті бібліотеки або приватні бази даних компаній; інший тип потребує точного дизайну та відбору, щоб забезпечити розвиток специфічних можливостей моделі, що вимагає очищення даних, відбору, маркування та зворотного зв'язку від людей.
З підвищенням можливостей моделей різноманітні більш детальні та професійні навчальні дані стануть ключовими факторами, що визначають можливості моделі. У довгостроковій перспективі дані AI також є довгостроковою траєкторією з ефектом снігової кулі; з накопиченням попередньої роботи, активи даних набудуть здатності до складних відсотків, а їхня вартість постійно зростатиме.
Web3 DataFi: Обрана AI даних родючий край
На відміну від десятків тисяч людей, які працюють віддалено в командах з розмітки даних у багатьох країнах, Web3 має природну перевагу в сфері AI-даних, що призвело до виникнення нової концепції DataFi. Ідеально, переваги Web3 DataFi включають:
Для звичайних користувачів DataFi є найпростішим децентралізованим AI проектом для участі. Користувачі можуть долучитися до нього за допомогою простих дій, включаючи надання даних, оцінку моделей, використання AI інструментів для простого творчого процесу або участь у торгівлі даними тощо.
Потенційні проекти Web3 DataFi
Наразі кілька проектів DataFi отримали значне фінансування. Ось деякі представницькі проекти:
Sahara AI: прагне створити суперінфраструктуру та торговельний ринок для децентралізованого штучного інтелекту.
Yupp: Платформа зворотного зв'язку для AI моделей, що збирає відгуки користувачів про вихід моделей.
Vana: Перетворення особистих даних користувачів на цифрові активи, які можна монетизувати.
Chainbase: зосереджений на даних блокчейну, охоплює більше 200 блокчейнів.
Sapien: призначений для масового перетворення людських знань на якісні дані для навчання ШІ.
Prisma X: прагне стати відкритим координаційним рівнем для роботів.
Masa: один з провідних підмережевих проєктів екосистеми Bittensor.
Irys: зосереджений на програмованому зберіганні даних та обчисленнях.
ORO: Надання можливості звичайним людям брати участь у внесках в AI.
Gata: позиціюється як децентралізований шар даних.
Ці проекти наразі мають відносно низькі бар'єри входу, але як тільки вони накопичать користувачів та екосистемну відданість, переваги платформи швидко наростуть. Тому раннім проектам варто зосередитися на стимулюванні та користувацькому досвіді. Одночасно, цим платформам потрібно розглянути, як управляти учасниками, забезпечувати якість даних і уникати ситуації "погані гроші витісняють добрі".
Крім того, підвищення прозорості також є великою проблемою, з якою стикаються сучасні проекти на блокчейні. Багато проектів все ще не мають достатньо відкритих, відслідковуваних даних, що негативно впливає на довгостроковий здоровий розвиток Web3 DataFi.
Шлях до масового впровадження DataFi можна розділити на дві частини: перша - залучення достатньої кількості особистих користувачів для формування активу збору/генерації даних та споживачів економіки ШІ; друга - отримання визнання від основних підприємств, оскільки в найближчій перспективі вони є основним джерелом великих даних.
DataFi представляє собою довгострокове виховання людського інтелекту в машинному інтелекті, одночасно забезпечуючи прибуток від людської праці за допомогою смарт-контрактів, врешті-решт реалізуючи повернення машинного інтелекту до людини. Для тих, хто відчуває невизначеність в епоху AI або все ще має ідеали блокчейну, участь у DataFi може бути вдалим вибором.