Нещодавно найпомітнішою подією в сфері ШІ стало вражаюче досягнення Meta. Цукерберг активно шукає таланти і формує розкішну команду ШІ, в основному з китайських науковців. Серед них 28-річний Александр Ванг став лідером. Ванг раніше заснував Scale AI, яка оцінюється в 29 мільярдів доларів, і надає послуги з обробки даних для кількох гігантів ШІ, включаючи армію США, OpenAI, Anthropic та Meta. Основним бізнесом Scale AI є надання великої кількості точних позначених даних.
Причиною, чому Scale AI змогла вирізнитися серед численних єдинорогів, є те, що вона рано усвідомила важливість даних у галузі ШІ. Обчислювальна потужність, моделі та дані є трьома основними опорами моделей ШІ. Якщо порівняти велику модель з людиною, то модель є тілом, обчислювальна потужність — їжею, а дані — знаннями та інформацією.
У процесі швидкого розвитку великих мовних моделей акцент в індустрії перейшов від моделей до обчислювальної потужності. Сьогодні більшість моделей використовують трансформер як основу, іноді з'являються інновації, такі як MoE або MoRe. Великі компанії або створюють власні суперкомп'ютерні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг, такими як AWS. Після вирішення базової проблеми обчислювальної потужності важливість даних поступово почала зростати.
На відміну від традиційних компаній з обробки великих даних для бізнесу, Scale AI прагне створити надійну базу даних для AI-моделей. Її бізнес не лише включає видобуток існуючих даних, а й охоплює довгостроковий бізнес з генерації даних. Компанія також створила команду з тренування AI, що складається з експертів у різних сферах, щоб забезпечити AI-моделі високоякісними навчальними даними.
Моделювання навчання поділяється на два етапи: попереднє навчання та доопрацювання. Етап попереднього навчання подібний до процесу, коли дитина навчається говорити, і вимагає введення великої кількості тексту, коду та іншої інформації, зібраної з Інтернету, в модель ШІ. Етап доопрацювання подібний до шкільної освіти, зазвичай має чіткі правильні та неправильні відповіді та напрямки. Завдяки специфічному набору даних ми можемо виховати модель, яка має необхідні можливості.
Отже, потрібні дані також поділяються на дві категорії: перша - це велика кількість даних, які не потребують надмірної обробки, зазвичай отримані з платформ UGC, таких як Reddit, Twitter, Github, а також з відкритих баз даних наукових публікацій та приватних баз даних компаній; друга ж категорія вимагає ретельного проектування та відбору для формування специфічних позитивних якостей моделі, що потребує роботи з очищення даних, відбору, маркування та зворотного зв'язку від людей.
Зі збільшенням можливостей моделей різноманітні більш детальні та професійні навчальні дані стануть ключовими чинниками, що впливають на можливості моделі. У довгостроковій перспективі AI-дані також є довгостроковою стратегією з ефектом снігової кулі: з накопиченням попередніх робіт, дані стають активами з ефектом складних відсотків, стаючи дедалі ціннішими з часом.
У сфері Web3 виникла концепція DataFi. Web3 DataFi має багато переваг:
Смарт-контракти забезпечують суверенітет даних, безпеку та конфіденційність
Природна географічна арбітражна перевага, що приваблює найбільш підходящу глобальну розподілену робочу силу
Чіткі переваги стимулювання та розрахунків блокчейну
Сприяє створенню більш ефективного та відкритого "одного візка" ринкового даних
Для звичайних користувачів DataFi є найбільш вигідним децентралізованим AI проектом для участі. Користувачам не потрібно підписувати контракт на дані, достатньо увійти до гаманця, щоб брати участь у виконанні різних простих завдань, таких як надання даних, оцінка моделей, використання AI інструментів для простого творчого процесу або участь у торгівлі даними.
На даний момент у сфері Web3 DataFi з'явилася низка перспективних проєктів, таких як Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO та Gata. Ці проєкти зосереджені на різних областях послуг даних, включаючи збір даних, оцінку моделей, монетизацію особистих даних, індексацію даних на блокчейні тощо.
Хоча поточні бар'єри для цих проектів загалом не високі, як тільки накопичаться користувачі та екологічна прихильність, переваги платформи швидко зростуть. Таким чином, ранні проекти повинні зосередитися на заохоченнях і досвіді користувачів. Одночасно ці дані платформи також повинні враховувати, як управляти людськими ресурсами, забезпечувати якість виходу даних і уникати ситуації, коли погане витискає хороше.
Крім того, підвищення прозорості є важливим викликом, з яким стикаються сучасні проекти на блокчейні. Все більше проектів повинні демонструвати відкриту та прозору довгострокову рішучість для сприяння здоровому розвитку Web3 DataFi.
Шляхи масового застосування DataFi включають два аспекти: по-перше, залучення достатньої кількості звичайних користувачів до збору та генерації даних, формуючи споживчу групу AI-економіки; по-друге, отримання визнання від основних великих компаній, оскільки в короткостроковій перспективі вони все ще є основним джерелом великих замовлень даних.
В цілому, DataFi представляє собою процес тривалого виховання машинного інтелекту людським розумом, одночасно забезпечуючи через смарт-контракти прибуток від праці людей, врешті-решт досягаючи віддачі машинного інтелекту людству. Для тих, хто відчуває невизначеність в епоху ШІ, приєднання до DataFi може стати розумним вибором, що відповідає тенденціям.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
11 лайків
Нагородити
11
4
Репост
Поділіться
Прокоментувати
0/400
TommyTeacher1
· 13год тому
Грошей великий брате, візьми мене з собою
Переглянути оригіналвідповісти на0
FOMOmonster
· 13год тому
28 вже оцінюється в сотні мільярдів, це справді вражає.
Переглянути оригіналвідповісти на0
LidoStakeAddict
· 13год тому
28 років, оцінка 29 мільярдів, не можу залишатися спокійним.
Переглянути оригіналвідповісти на0
MetaReckt
· 13год тому
Зак так розгорнув таку велику кампанію, що вчиться у Huawei вербувати людей.
Виникнення Web3 DataFi: потенціал AI-даних безмежний
Потенціал AI-даних та зростання Web3 DataFi
Нещодавно найпомітнішою подією в сфері ШІ стало вражаюче досягнення Meta. Цукерберг активно шукає таланти і формує розкішну команду ШІ, в основному з китайських науковців. Серед них 28-річний Александр Ванг став лідером. Ванг раніше заснував Scale AI, яка оцінюється в 29 мільярдів доларів, і надає послуги з обробки даних для кількох гігантів ШІ, включаючи армію США, OpenAI, Anthropic та Meta. Основним бізнесом Scale AI є надання великої кількості точних позначених даних.
Причиною, чому Scale AI змогла вирізнитися серед численних єдинорогів, є те, що вона рано усвідомила важливість даних у галузі ШІ. Обчислювальна потужність, моделі та дані є трьома основними опорами моделей ШІ. Якщо порівняти велику модель з людиною, то модель є тілом, обчислювальна потужність — їжею, а дані — знаннями та інформацією.
У процесі швидкого розвитку великих мовних моделей акцент в індустрії перейшов від моделей до обчислювальної потужності. Сьогодні більшість моделей використовують трансформер як основу, іноді з'являються інновації, такі як MoE або MoRe. Великі компанії або створюють власні суперкомп'ютерні кластери, або укладають довгострокові угоди з постачальниками хмарних послуг, такими як AWS. Після вирішення базової проблеми обчислювальної потужності важливість даних поступово почала зростати.
На відміну від традиційних компаній з обробки великих даних для бізнесу, Scale AI прагне створити надійну базу даних для AI-моделей. Її бізнес не лише включає видобуток існуючих даних, а й охоплює довгостроковий бізнес з генерації даних. Компанія також створила команду з тренування AI, що складається з експертів у різних сферах, щоб забезпечити AI-моделі високоякісними навчальними даними.
Моделювання навчання поділяється на два етапи: попереднє навчання та доопрацювання. Етап попереднього навчання подібний до процесу, коли дитина навчається говорити, і вимагає введення великої кількості тексту, коду та іншої інформації, зібраної з Інтернету, в модель ШІ. Етап доопрацювання подібний до шкільної освіти, зазвичай має чіткі правильні та неправильні відповіді та напрямки. Завдяки специфічному набору даних ми можемо виховати модель, яка має необхідні можливості.
Отже, потрібні дані також поділяються на дві категорії: перша - це велика кількість даних, які не потребують надмірної обробки, зазвичай отримані з платформ UGC, таких як Reddit, Twitter, Github, а також з відкритих баз даних наукових публікацій та приватних баз даних компаній; друга ж категорія вимагає ретельного проектування та відбору для формування специфічних позитивних якостей моделі, що потребує роботи з очищення даних, відбору, маркування та зворотного зв'язку від людей.
Зі збільшенням можливостей моделей різноманітні більш детальні та професійні навчальні дані стануть ключовими чинниками, що впливають на можливості моделі. У довгостроковій перспективі AI-дані також є довгостроковою стратегією з ефектом снігової кулі: з накопиченням попередніх робіт, дані стають активами з ефектом складних відсотків, стаючи дедалі ціннішими з часом.
У сфері Web3 виникла концепція DataFi. Web3 DataFi має багато переваг:
Для звичайних користувачів DataFi є найбільш вигідним децентралізованим AI проектом для участі. Користувачам не потрібно підписувати контракт на дані, достатньо увійти до гаманця, щоб брати участь у виконанні різних простих завдань, таких як надання даних, оцінка моделей, використання AI інструментів для простого творчого процесу або участь у торгівлі даними.
На даний момент у сфері Web3 DataFi з'явилася низка перспективних проєктів, таких як Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO та Gata. Ці проєкти зосереджені на різних областях послуг даних, включаючи збір даних, оцінку моделей, монетизацію особистих даних, індексацію даних на блокчейні тощо.
Хоча поточні бар'єри для цих проектів загалом не високі, як тільки накопичаться користувачі та екологічна прихильність, переваги платформи швидко зростуть. Таким чином, ранні проекти повинні зосередитися на заохоченнях і досвіді користувачів. Одночасно ці дані платформи також повинні враховувати, як управляти людськими ресурсами, забезпечувати якість виходу даних і уникати ситуації, коли погане витискає хороше.
Крім того, підвищення прозорості є важливим викликом, з яким стикаються сучасні проекти на блокчейні. Все більше проектів повинні демонструвати відкриту та прозору довгострокову рішучість для сприяння здоровому розвитку Web3 DataFi.
Шляхи масового застосування DataFi включають два аспекти: по-перше, залучення достатньої кількості звичайних користувачів до збору та генерації даних, формуючи споживчу групу AI-економіки; по-друге, отримання визнання від основних великих компаній, оскільки в короткостроковій перспективі вони все ще є основним джерелом великих замовлень даних.
В цілому, DataFi представляє собою процес тривалого виховання машинного інтелекту людським розумом, одночасно забезпечуючи через смарт-контракти прибуток від праці людей, врешті-решт досягаючи віддачі машинного інтелекту людству. Для тих, хто відчуває невизначеність в епоху ШІ, приєднання до DataFi може стати розумним вибором, що відповідає тенденціям.