Dù là Web3 AI hay Web2 AI, đã từ "cuốn khả năng tính toán" đi đến ngã ba "cuốn chất lượng dữ liệu".
Tác giả: Haotian
Một bên là Meta chi 14,8 tỷ USD để mua gần một nửa cổ phần của Scale AI, toàn bộ Silicon Valley đều đang kêu gọi rằng gã khổng lồ đang định giá lại "gán nhãn dữ liệu" với mức giá trên trời; bên kia là sắp TGE.
@SaharaLabsAI, vẫn bị mắc kẹt trong nhãn thiên lệch của Web3 AI "mượn khái niệm, không thể tự chứng minh". Đằng sau sự tương phản lớn này, thị trường đã bỏ qua điều gì?
Trước tiên, đánh dấu dữ liệu là một lĩnh vực có giá trị hơn so với việc tập hợp khả năng tính toán phi tập trung.
Câu chuyện về việc thách thức các ông lớn trong ngành điện toán đám mây bằng GPU không sử dụng thật sự rất hấp dẫn, nhưng khả năng tính toán về bản chất là hàng hóa tiêu chuẩn hóa, sự khác biệt chủ yếu nằm ở giá cả và khả năng tiếp cận. Lợi thế về giá có vẻ như tìm thấy khe hở từ sự độc quyền của các ông lớn, nhưng khả năng tiếp cận bị hạn chế bởi phân bố địa lý, độ trễ mạng và động lực không đủ cho người dùng, một khi các ông lớn giảm giá hoặc tăng cung, lợi thế này ngay lập tức sẽ bị xóa nhòa.
Gán nhãn dữ liệu thì hoàn toàn khác - đây là một lĩnh vực khác biệt cần đến trí tuệ và phán đoán chuyên nghiệp của con người. Mỗi gán nhãn chất lượng cao đều mang trong mình kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, v.v., hoàn toàn không thể được "chuẩn hóa" sao chép như khả năng tính toán của GPU.
Một sự đánh dấu chẩn đoán hình ảnh ung thư chính xác cần có trực giác chuyên nghiệp của các bác sĩ ung thư có kinh nghiệm; một phân tích cảm xúc thị trường tài chính có kinh nghiệm không thể thiếu kinh nghiệm thực chiến của các Trader trên Phố Wall. Sự khan hiếm và tính không thể thay thế tự nhiên này đã tạo ra một chiều sâu của "đánh dấu dữ liệu" mà khả năng tính toán mãi mãi không thể đạt tới.
Vào ngày 10 tháng 6, Meta chính thức thông báo rằng họ sẽ mua lại 49% cổ phần của công ty gán nhãn dữ liệu Scale AI với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI trong năm nay. Điều đáng chú ý hơn là, nhà sáng lập và CEO của Scale AI, Alexandr Wang, sẽ đảm nhiệm vị trí trưởng phòng thí nghiệm nghiên cứu "siêu trí tuệ" mới thành lập của Meta.
Doanh nhân gốc Hoa 25 tuổi này đã thành lập Scale AI vào năm 2016 khi còn là sinh viên bỏ học tại Stanford, và hiện nay công ty mà anh ta điều hành đã đạt giá trị 30 tỷ USD. Danh sách khách hàng của Scale AI được coi là "đội hình ngôi sao" trong lĩnh vực AI: OpenAI, Tesla, Microsoft, Bộ Quốc phòng và nhiều đối tác lâu dài khác. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo mô hình AI, với hơn 300.000 nhân viên gán nhãn được đào tạo chuyên nghiệp.
Bạn xem, khi tất cả mọi người vẫn đang tranh luận về việc mô hình của ai chạy điểm cao hơn, thì những người chơi thực sự đã lặng lẽ di chuyển chiến trường đến nguồn dữ liệu.
Một cuộc "chiến tranh âm thầm" về quyền kiểm soát tương lai của AI đã bắt đầu.
Sự thành công của Scale AI đã phơi bày một sự thật bị bỏ qua: Khả năng tính toán không còn khan hiếm, kiến trúc mô hình có xu hướng đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu được "chuẩn bị" một cách tỉ mỉ. Meta không mua một công ty gia công với giá trên trời, mà đang mua "quyền khai thác dầu" của thời đại AI.
Câu chuyện về độc quyền luôn có kẻ nổi loạn.
Cũng giống như nền tảng tổng hợp khả năng tính toán đám mây đang cố gắng lật đổ dịch vụ điện toán đám mây tập trung, Sahara AI đang cố gắng hoàn toàn viết lại quy tắc phân phối giá trị của việc gán nhãn dữ liệu bằng blockchain. Thiếu sót chết người của mô hình gán nhãn dữ liệu truyền thống không phải là vấn đề kỹ thuật, mà là vấn đề thiết kế động lực.
Một bác sĩ dành vài giờ để đánh dấu hình ảnh y tế, có thể chỉ nhận được vài chục đô la tiền công, trong khi mô hình AI được đào tạo từ những dữ liệu này có giá trị lên đến hàng tỷ đô la, bác sĩ lại không nhận được một xu nào. Sự phân phối giá trị cực kỳ không công bằng này đã làm giảm nghiêm trọng ý chí cung cấp dữ liệu chất lượng cao.
Và với sự thúc đẩy của cơ chế khuyến khích token web3, họ không còn là những "công nhân giá rẻ" dữ liệu nữa, mà là những "cổ đông" thực sự của mạng AI LLM. Rõ ràng, lợi thế của web3 trong việc cải cách quan hệ sản xuất so với Khả năng tính toán phù hợp hơn với các tình huống gán nhãn dữ liệu.
Thú vị là, Sahara AI lại đúng lúc ở Node TGE mà Meta đã mua với giá trên trời, đó là một sự trùng hợp hay được lên kế hoạch một cách tinh vi? Theo tôi, điều này thực sự phản ánh một điểm chuyển mình của thị trường: Dù là Web3 AI hay Web2 AI, cả hai đã bước từ "cuộc cạnh tranh khả năng tính toán" sang "cuộc cạnh tranh chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng hàng rào dữ liệu bằng tiền bạc, Web3 đang xây dựng một thí nghiệm "dân chủ hóa dữ liệu" lớn hơn bằng Tokenomics.
Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
Meta mua lại gần nửa cổ phần của Scale AI với giá trên trời, Web3 AI làm thế nào để thoát khỏi định kiến?
Tác giả: Haotian
Một bên là Meta chi 14,8 tỷ USD để mua gần một nửa cổ phần của Scale AI, toàn bộ Silicon Valley đều đang kêu gọi rằng gã khổng lồ đang định giá lại "gán nhãn dữ liệu" với mức giá trên trời; bên kia là sắp TGE.
@SaharaLabsAI, vẫn bị mắc kẹt trong nhãn thiên lệch của Web3 AI "mượn khái niệm, không thể tự chứng minh". Đằng sau sự tương phản lớn này, thị trường đã bỏ qua điều gì?
Trước tiên, đánh dấu dữ liệu là một lĩnh vực có giá trị hơn so với việc tập hợp khả năng tính toán phi tập trung.
Câu chuyện về việc thách thức các ông lớn trong ngành điện toán đám mây bằng GPU không sử dụng thật sự rất hấp dẫn, nhưng khả năng tính toán về bản chất là hàng hóa tiêu chuẩn hóa, sự khác biệt chủ yếu nằm ở giá cả và khả năng tiếp cận. Lợi thế về giá có vẻ như tìm thấy khe hở từ sự độc quyền của các ông lớn, nhưng khả năng tiếp cận bị hạn chế bởi phân bố địa lý, độ trễ mạng và động lực không đủ cho người dùng, một khi các ông lớn giảm giá hoặc tăng cung, lợi thế này ngay lập tức sẽ bị xóa nhòa.
Gán nhãn dữ liệu thì hoàn toàn khác - đây là một lĩnh vực khác biệt cần đến trí tuệ và phán đoán chuyên nghiệp của con người. Mỗi gán nhãn chất lượng cao đều mang trong mình kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, v.v., hoàn toàn không thể được "chuẩn hóa" sao chép như khả năng tính toán của GPU.
Một sự đánh dấu chẩn đoán hình ảnh ung thư chính xác cần có trực giác chuyên nghiệp của các bác sĩ ung thư có kinh nghiệm; một phân tích cảm xúc thị trường tài chính có kinh nghiệm không thể thiếu kinh nghiệm thực chiến của các Trader trên Phố Wall. Sự khan hiếm và tính không thể thay thế tự nhiên này đã tạo ra một chiều sâu của "đánh dấu dữ liệu" mà khả năng tính toán mãi mãi không thể đạt tới.
Vào ngày 10 tháng 6, Meta chính thức thông báo rằng họ sẽ mua lại 49% cổ phần của công ty gán nhãn dữ liệu Scale AI với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI trong năm nay. Điều đáng chú ý hơn là, nhà sáng lập và CEO của Scale AI, Alexandr Wang, sẽ đảm nhiệm vị trí trưởng phòng thí nghiệm nghiên cứu "siêu trí tuệ" mới thành lập của Meta.
Doanh nhân gốc Hoa 25 tuổi này đã thành lập Scale AI vào năm 2016 khi còn là sinh viên bỏ học tại Stanford, và hiện nay công ty mà anh ta điều hành đã đạt giá trị 30 tỷ USD. Danh sách khách hàng của Scale AI được coi là "đội hình ngôi sao" trong lĩnh vực AI: OpenAI, Tesla, Microsoft, Bộ Quốc phòng và nhiều đối tác lâu dài khác. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo mô hình AI, với hơn 300.000 nhân viên gán nhãn được đào tạo chuyên nghiệp.
Bạn xem, khi tất cả mọi người vẫn đang tranh luận về việc mô hình của ai chạy điểm cao hơn, thì những người chơi thực sự đã lặng lẽ di chuyển chiến trường đến nguồn dữ liệu.
Một cuộc "chiến tranh âm thầm" về quyền kiểm soát tương lai của AI đã bắt đầu.
Sự thành công của Scale AI đã phơi bày một sự thật bị bỏ qua: Khả năng tính toán không còn khan hiếm, kiến trúc mô hình có xu hướng đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu được "chuẩn bị" một cách tỉ mỉ. Meta không mua một công ty gia công với giá trên trời, mà đang mua "quyền khai thác dầu" của thời đại AI.
Câu chuyện về độc quyền luôn có kẻ nổi loạn.
Cũng giống như nền tảng tổng hợp khả năng tính toán đám mây đang cố gắng lật đổ dịch vụ điện toán đám mây tập trung, Sahara AI đang cố gắng hoàn toàn viết lại quy tắc phân phối giá trị của việc gán nhãn dữ liệu bằng blockchain. Thiếu sót chết người của mô hình gán nhãn dữ liệu truyền thống không phải là vấn đề kỹ thuật, mà là vấn đề thiết kế động lực.
Một bác sĩ dành vài giờ để đánh dấu hình ảnh y tế, có thể chỉ nhận được vài chục đô la tiền công, trong khi mô hình AI được đào tạo từ những dữ liệu này có giá trị lên đến hàng tỷ đô la, bác sĩ lại không nhận được một xu nào. Sự phân phối giá trị cực kỳ không công bằng này đã làm giảm nghiêm trọng ý chí cung cấp dữ liệu chất lượng cao.
Và với sự thúc đẩy của cơ chế khuyến khích token web3, họ không còn là những "công nhân giá rẻ" dữ liệu nữa, mà là những "cổ đông" thực sự của mạng AI LLM. Rõ ràng, lợi thế của web3 trong việc cải cách quan hệ sản xuất so với Khả năng tính toán phù hợp hơn với các tình huống gán nhãn dữ liệu.
Thú vị là, Sahara AI lại đúng lúc ở Node TGE mà Meta đã mua với giá trên trời, đó là một sự trùng hợp hay được lên kế hoạch một cách tinh vi? Theo tôi, điều này thực sự phản ánh một điểm chuyển mình của thị trường: Dù là Web3 AI hay Web2 AI, cả hai đã bước từ "cuộc cạnh tranh khả năng tính toán" sang "cuộc cạnh tranh chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng hàng rào dữ liệu bằng tiền bạc, Web3 đang xây dựng một thí nghiệm "dân chủ hóa dữ liệu" lớn hơn bằng Tokenomics.