Tiềm năng của lĩnh vực dữ liệu AI và sự trỗi dậy của Web3 DataFi
Gần đây, sự kiện thu hút sự chú ý nhất trong giới AI chính là sức mạnh ấn tượng mà Meta thể hiện. Zuckerberg đang tích cực tuyển dụng nhân tài và đã thành lập một đội ngũ AI hùng mạnh chủ yếu là các nhà nghiên cứu người Hoa. Trong số đó, Alexander Wang chỉ mới 28 tuổi đã trở thành trưởng nhóm. Wang từng thành lập Scale AI với giá trị 29 tỷ USD, cung cấp dịch vụ dữ liệu cho nhiều ông lớn AI như quân đội Hoa Kỳ, OpenAI, Anthropic và Meta. Hoạt động cốt lõi của Scale AI là cung cấp một lượng lớn dữ liệu được gán nhãn chính xác.
Lý do Scale AI có thể nổi bật giữa nhiều kỳ lân là vì nó đã sớm nhận ra tầm quan trọng của dữ liệu trong ngành công nghiệp AI. Năng lực tính toán, mô hình và dữ liệu là ba trụ cột chính của mô hình AI. Nếu coi mô hình lớn như một con người, thì mô hình là cơ thể, năng lực tính toán là thức ăn, còn dữ liệu là kiến thức và thông tin.
Trong quá trình phát triển nhanh chóng của các mô hình ngôn ngữ lớn, trọng tâm của ngành đã chuyển từ mô hình sang sức mạnh tính toán. Hiện nay, hầu hết các mô hình đều sử dụng transformer làm khung, thỉnh thoảng có các đổi mới như MoE hay MoRe. Các ông lớn either xây dựng cụm siêu máy tính riêng hoặc ký kết hợp đồng dài hạn với các nhà cung cấp dịch vụ đám mây như AWS. Sau khi giải quyết được vấn đề sức mạnh tính toán cơ bản, tầm quan trọng của dữ liệu dần dần được làm nổi bật.
Khác với các công ty dữ liệu lớn truyền thống dành cho doanh nghiệp, Scale AI tập trung vào việc xây dựng một nền tảng dữ liệu vững chắc cho các mô hình AI. Hoạt động kinh doanh của họ không chỉ bao gồm việc khai thác dữ liệu hiện có mà còn liên quan đến các hoạt động tạo dữ liệu lâu dài hơn. Công ty cũng đã thành lập một đội ngũ huấn luyện AI gồm các chuyên gia từ nhiều lĩnh vực khác nhau, cung cấp dữ liệu huấn luyện chất lượng cao hơn cho các mô hình AI.
Mô hình đào tạo được chia thành hai giai đoạn: tiền huấn luyện và tinh chỉnh. Giai đoạn tiền huấn luyện tương tự như quá trình trẻ em học nói, cần cung cấp cho mô hình AI một lượng lớn thông tin như văn bản, mã nguồn từ internet. Giai đoạn tinh chỉnh thì giống như giáo dục ở trường học, thường có sự đúng sai, câu trả lời và định hướng rõ ràng. Thông qua các tập dữ liệu cụ thể, chúng ta có thể phát triển khả năng cần thiết cho mô hình.
Do đó, dữ liệu cần thiết cũng được chia thành hai loại: một loại là dữ liệu lớn không cần xử lý quá nhiều, thường đến từ dữ liệu thu thập từ các nền tảng UGC như Reddit, Twitter, Github, cơ sở dữ liệu tài liệu công khai và cơ sở dữ liệu riêng của doanh nghiệp; loại còn lại cần được thiết kế và sàng lọc một cách tinh tế để phát triển các phẩm chất cụ thể của mô hình, điều này yêu cầu phải thực hiện công việc làm sạch dữ liệu, sàng lọc, gán nhãn và phản hồi từ con người.
Với sự nâng cao hơn nữa của khả năng mô hình, các loại dữ liệu đào tạo tinh vi và chuyên nghiệp hơn sẽ trở thành yếu tố ảnh hưởng chính đến khả năng của mô hình. Về lâu dài, dữ liệu AI cũng là một lĩnh vực có khả năng tích lũy theo kiểu quả cầu tuyết, với việc tích lũy công việc ban đầu, tài sản dữ liệu sẽ có khả năng sinh lãi kép, càng cũ càng có giá trị.
Trong lĩnh vực Web3, khái niệm DataFi đã ra đời. Web3 DataFi có nhiều ưu điểm đa dạng:
Hợp đồng thông minh đảm bảo quyền sở hữu dữ liệu, an toàn và quyền riêng tư
Lợi thế địa lý tự nhiên thu hút lực lượng lao động phân tán toàn cầu phù hợp nhất.
Lợi ích rõ ràng của blockchain về khuyến khích và thanh toán
Hữu ích cho việc xây dựng một thị trường dữ liệu "một cửa" hiệu quả và mở hơn.
Đối với người dùng bình thường, DataFi là dự án AI phi tập trung có lợi nhất để tham gia. Người dùng không cần ký hợp đồng nhà máy dữ liệu, chỉ cần đăng nhập ví là có thể tham gia bằng cách hoàn thành các nhiệm vụ đơn giản như cung cấp dữ liệu, đánh giá mô hình, sử dụng công cụ AI để sáng tạo đơn giản hoặc tham gia giao dịch dữ liệu.
Hiện tại, lĩnh vực Web3 DataFi đã xuất hiện một loạt các dự án tiềm năng như Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO và Gata. Những dự án này tập trung vào các lĩnh vực dịch vụ dữ liệu khác nhau, bao gồm thu thập dữ liệu, đánh giá mô hình, chuyển đổi dữ liệu cá nhân thành tiền, chỉ mục dữ liệu trên chuỗi, v.v.
Mặc dù hiện tại các rào cản của những dự án này thường không cao, nhưng một khi đã tích lũy được người dùng và độ gắn bó với hệ sinh thái, lợi thế của nền tảng sẽ nhanh chóng tích lũy. Do đó, các dự án giai đoạn đầu nên tập trung vào các biện pháp khuyến khích và trải nghiệm người dùng. Đồng thời, những nền tảng dữ liệu này cũng cần xem xét cách quản lý nhân lực, đảm bảo chất lượng sản xuất dữ liệu, tránh tình trạng "tiền kém đuổi tiền tốt".
Ngoài ra, việc nâng cao tính minh bạch cũng là một thách thức quan trọng mà các dự án trên chuỗi hiện nay đang phải đối mặt. Ngày càng nhiều dự án cần thể hiện quyết tâm lâu dài công khai, minh bạch để thúc đẩy sự phát triển lành mạnh của Web3 DataFi.
Đường hướng ứng dụng quy mô lớn của DataFi bao gồm hai khía cạnh: một là thu hút đủ nhiều người dùng thông thường tham gia vào việc thu thập và tạo ra dữ liệu, hình thành nhóm người tiêu dùng cho nền kinh tế AI; hai là nhận được sự công nhận từ các công ty lớn chủ chốt, vì trong ngắn hạn, họ vẫn là nguồn chính của các hợp đồng dữ liệu lớn.
Tổng thể, DataFi đại diện cho quá trình nuôi dưỡng trí tuệ máy móc bằng trí tuệ con người trong thời gian dài, đồng thời đảm bảo lợi ích lao động của con người thông qua hợp đồng thông minh, cuối cùng đạt được sự hồi báo của trí tuệ máy móc đối với con người. Đối với những ai đang cảm thấy không chắc chắn về kỷ nguyên AI, việc tham gia vào DataFi là một lựa chọn khôn ngoan phù hợp với xu hướng.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
11 thích
Phần thưởng
11
4
Đăng lại
Chia sẻ
Bình luận
0/400
TommyTeacher1
· 16giờ trước
Anh trai kiếm tiền ơi, hãy đưa tôi bay.
Xem bản gốcTrả lời0
FOMOmonster
· 16giờ trước
28 đã có giá trị hàng tỷ rồi, có bị đánh bại không?
Xem bản gốcTrả lời0
LidoStakeAddict
· 16giờ trước
28 tuổi định giá đã 29 tỷ, không thể nằm im được.
Xem bản gốcTrả lời0
MetaReckt
· 17giờ trước
Zach làm lớn như vậy, học Huawei để tuyển người à?
Web3 DataFi nổi lên, tiềm năng của lĩnh vực dữ liệu AI là vô hạn
Tiềm năng của lĩnh vực dữ liệu AI và sự trỗi dậy của Web3 DataFi
Gần đây, sự kiện thu hút sự chú ý nhất trong giới AI chính là sức mạnh ấn tượng mà Meta thể hiện. Zuckerberg đang tích cực tuyển dụng nhân tài và đã thành lập một đội ngũ AI hùng mạnh chủ yếu là các nhà nghiên cứu người Hoa. Trong số đó, Alexander Wang chỉ mới 28 tuổi đã trở thành trưởng nhóm. Wang từng thành lập Scale AI với giá trị 29 tỷ USD, cung cấp dịch vụ dữ liệu cho nhiều ông lớn AI như quân đội Hoa Kỳ, OpenAI, Anthropic và Meta. Hoạt động cốt lõi của Scale AI là cung cấp một lượng lớn dữ liệu được gán nhãn chính xác.
Lý do Scale AI có thể nổi bật giữa nhiều kỳ lân là vì nó đã sớm nhận ra tầm quan trọng của dữ liệu trong ngành công nghiệp AI. Năng lực tính toán, mô hình và dữ liệu là ba trụ cột chính của mô hình AI. Nếu coi mô hình lớn như một con người, thì mô hình là cơ thể, năng lực tính toán là thức ăn, còn dữ liệu là kiến thức và thông tin.
Trong quá trình phát triển nhanh chóng của các mô hình ngôn ngữ lớn, trọng tâm của ngành đã chuyển từ mô hình sang sức mạnh tính toán. Hiện nay, hầu hết các mô hình đều sử dụng transformer làm khung, thỉnh thoảng có các đổi mới như MoE hay MoRe. Các ông lớn either xây dựng cụm siêu máy tính riêng hoặc ký kết hợp đồng dài hạn với các nhà cung cấp dịch vụ đám mây như AWS. Sau khi giải quyết được vấn đề sức mạnh tính toán cơ bản, tầm quan trọng của dữ liệu dần dần được làm nổi bật.
Khác với các công ty dữ liệu lớn truyền thống dành cho doanh nghiệp, Scale AI tập trung vào việc xây dựng một nền tảng dữ liệu vững chắc cho các mô hình AI. Hoạt động kinh doanh của họ không chỉ bao gồm việc khai thác dữ liệu hiện có mà còn liên quan đến các hoạt động tạo dữ liệu lâu dài hơn. Công ty cũng đã thành lập một đội ngũ huấn luyện AI gồm các chuyên gia từ nhiều lĩnh vực khác nhau, cung cấp dữ liệu huấn luyện chất lượng cao hơn cho các mô hình AI.
Mô hình đào tạo được chia thành hai giai đoạn: tiền huấn luyện và tinh chỉnh. Giai đoạn tiền huấn luyện tương tự như quá trình trẻ em học nói, cần cung cấp cho mô hình AI một lượng lớn thông tin như văn bản, mã nguồn từ internet. Giai đoạn tinh chỉnh thì giống như giáo dục ở trường học, thường có sự đúng sai, câu trả lời và định hướng rõ ràng. Thông qua các tập dữ liệu cụ thể, chúng ta có thể phát triển khả năng cần thiết cho mô hình.
Do đó, dữ liệu cần thiết cũng được chia thành hai loại: một loại là dữ liệu lớn không cần xử lý quá nhiều, thường đến từ dữ liệu thu thập từ các nền tảng UGC như Reddit, Twitter, Github, cơ sở dữ liệu tài liệu công khai và cơ sở dữ liệu riêng của doanh nghiệp; loại còn lại cần được thiết kế và sàng lọc một cách tinh tế để phát triển các phẩm chất cụ thể của mô hình, điều này yêu cầu phải thực hiện công việc làm sạch dữ liệu, sàng lọc, gán nhãn và phản hồi từ con người.
Với sự nâng cao hơn nữa của khả năng mô hình, các loại dữ liệu đào tạo tinh vi và chuyên nghiệp hơn sẽ trở thành yếu tố ảnh hưởng chính đến khả năng của mô hình. Về lâu dài, dữ liệu AI cũng là một lĩnh vực có khả năng tích lũy theo kiểu quả cầu tuyết, với việc tích lũy công việc ban đầu, tài sản dữ liệu sẽ có khả năng sinh lãi kép, càng cũ càng có giá trị.
Trong lĩnh vực Web3, khái niệm DataFi đã ra đời. Web3 DataFi có nhiều ưu điểm đa dạng:
Đối với người dùng bình thường, DataFi là dự án AI phi tập trung có lợi nhất để tham gia. Người dùng không cần ký hợp đồng nhà máy dữ liệu, chỉ cần đăng nhập ví là có thể tham gia bằng cách hoàn thành các nhiệm vụ đơn giản như cung cấp dữ liệu, đánh giá mô hình, sử dụng công cụ AI để sáng tạo đơn giản hoặc tham gia giao dịch dữ liệu.
Hiện tại, lĩnh vực Web3 DataFi đã xuất hiện một loạt các dự án tiềm năng như Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO và Gata. Những dự án này tập trung vào các lĩnh vực dịch vụ dữ liệu khác nhau, bao gồm thu thập dữ liệu, đánh giá mô hình, chuyển đổi dữ liệu cá nhân thành tiền, chỉ mục dữ liệu trên chuỗi, v.v.
Mặc dù hiện tại các rào cản của những dự án này thường không cao, nhưng một khi đã tích lũy được người dùng và độ gắn bó với hệ sinh thái, lợi thế của nền tảng sẽ nhanh chóng tích lũy. Do đó, các dự án giai đoạn đầu nên tập trung vào các biện pháp khuyến khích và trải nghiệm người dùng. Đồng thời, những nền tảng dữ liệu này cũng cần xem xét cách quản lý nhân lực, đảm bảo chất lượng sản xuất dữ liệu, tránh tình trạng "tiền kém đuổi tiền tốt".
Ngoài ra, việc nâng cao tính minh bạch cũng là một thách thức quan trọng mà các dự án trên chuỗi hiện nay đang phải đối mặt. Ngày càng nhiều dự án cần thể hiện quyết tâm lâu dài công khai, minh bạch để thúc đẩy sự phát triển lành mạnh của Web3 DataFi.
Đường hướng ứng dụng quy mô lớn của DataFi bao gồm hai khía cạnh: một là thu hút đủ nhiều người dùng thông thường tham gia vào việc thu thập và tạo ra dữ liệu, hình thành nhóm người tiêu dùng cho nền kinh tế AI; hai là nhận được sự công nhận từ các công ty lớn chủ chốt, vì trong ngắn hạn, họ vẫn là nguồn chính của các hợp đồng dữ liệu lớn.
Tổng thể, DataFi đại diện cho quá trình nuôi dưỡng trí tuệ máy móc bằng trí tuệ con người trong thời gian dài, đồng thời đảm bảo lợi ích lao động của con người thông qua hợp đồng thông minh, cuối cùng đạt được sự hồi báo của trí tuệ máy móc đối với con người. Đối với những ai đang cảm thấy không chắc chắn về kỷ nguyên AI, việc tham gia vào DataFi là một lựa chọn khôn ngoan phù hợp với xu hướng.