Недавно самым примечательным событием в мире ИИ стало демонстрация мощи Meta. Цукерберг активно ищет таланты и создает роскошную команду ИИ, в которой основными являются китайские научные специалисты. В числе них 28-летний Александр Ванг стал лидером команды. Ванг ранее основал компанию Scale AI, стоимость которой оценивается в 29 миллиардов долларов, и предоставлял услуги по обработке данных для таких гигантов ИИ, как американские вооруженные силы, OpenAI, Anthropic и Meta. Основной бизнес Scale AI заключается в предоставлении большого объема точных аннотированных данных.
Причина, по которой Scale AI выделяется среди множества единорогов, заключается в том, что она рано осознала важность данных в AI-индустрии. Вычислительная мощность, модели и данные — это три основных столпа AI-моделей. Если рассматривать большие модели как человека, то модель — это тело, вычислительная мощность — это пища, а данные — это знания и информация.
В процессе быстрого развития больших языковых моделей акцент в индустрии сместился от моделей к вычислительной мощности. В настоящее время большинство моделей используют трансформеры в качестве основы, иногда встречаются инновации, такие как MoE или MoRe. Крупные компании либо создают собственные суперкомпьютерные кластеры, либо подписывают долгосрочные контракты с облачными провайдерами, такими как AWS. После того как была решена базовая проблема вычислительной мощности, важность данных постепенно проявляется.
В отличие от традиционных компаний по обработке больших данных для бизнеса, Scale AI стремится создать надежную базу данных для моделей ИИ. Его деятельность включает не только добычу существующих данных, но и более долгосрочные операции по генерации данных. Компания также создала команду тренеров ИИ, состоящую из экспертов в различных областях, чтобы предоставить более качественные тренировочные данные для моделей ИИ.
Обучение модели делится на два этапа: предварительное обучение и дообучение. Этап предварительного обучения похож на процесс, когда младенец учится говорить, требуется вводить в модель ИИ большое количество информации, полученной из текстов, кода и т.д. с интернета. Этап дообучения аналогичен школьному обучению, обычно имеет четкие правильные и неправильные ответы и направления. С помощью определенного набора данных мы можем развить у модели необходимые способности.
Таким образом, необходимые данные делятся на два типа: один тип — это большое количество данных, которые не требуют значительной обработки, обычно поступающие из платформ UGC, таких как Reddit, Twitter, Github, данные веб-сканирования, открытые базы данных научной литературы и частные базы данных компаний; другой тип требует тщательного проектирования и отбора, чтобы развить определенные качества модели, что требует очистки данных, отбора, аннотирования и обратной связи от пользователей.
С повышением возможностей моделей различного рода более детализированные и специализированные тренировочные данные станут ключевыми факторами, влияющими на способности модели. В долгосрочной перспективе данные AI также представляют собой долгосрочную стратегию с эффектом снежного кома; по мере накопления предварительных работ, данные активы будут обладать способностью к сложным процентам, становясь все более ценными с течением времени.
В области Web3 концепция DataFi появилась как ответ на новые вызовы. Web3 DataFi обладает множеством преимуществ:
Умные контракты обеспечивают суверенитет данных, безопасность и конфиденциальность
Естественное географическое арбитражное преимущество привлекает наиболее подходящую глобальную распределенную рабочую силу
Явные преимущества стимулов и расчетов в блокчейне
Способствует созданию более эффективного и открытого "одного окна" рынка данных
Для обычных пользователей DataFi является наиболее выгодным децентрализованным AI проектом для участия. Пользователям не нужно подписывать контракт с фабрикой данных, достаточно войти в кошелек и участвовать, выполняя различные простые задачи, такие как предоставление данных, оценка моделей, использование AI инструментов для простого творчества или участие в торговле данными.
В настоящее время в области Web3 DataFi появилось множество перспективных проектов, таких как Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO и Gata. Эти проекты сосредоточены на различных областях услуг данных, включая сбор данных, оценку моделей, монетизацию личных данных, индексирование данных на блокчейне и т.д.
Хотя в настоящее время барьеры для этих проектов в целом невысоки, как только накапливаются пользователи и экосистемная привязанность, преимущества платформы будут быстро накапливаться. Поэтому ранние проекты должны сосредоточиться на стимулах и пользовательском опыте. В то же время эти платформы данных также должны учитывать, как управлять трудозатратами и обеспечивать качество выходных данных, чтобы избежать ситуации, когда плохие деньги вытесняют хорошие.
Кроме того, повышение прозрачности также является важной задачей, с которой сталкиваются текущие проекты на блокчейне. Все больше проектов необходимо демонстрировать публичную и прозрачную долгосрочную приверженность для содействия здоровому развитию Web3 DataFi.
Масштабный путь применения DataFi включает два аспекта: во-первых, привлечение достаточного количества обычных пользователей для участия в сборе и генерации данных, формируя потребительскую группу AI-экономики; во-вторых, получение признания со стороны крупных компаний, так как в краткосрочной перспективе они по-прежнему являются основным источником крупных данных.
В целом, DataFi представляет собой процесс долгосрочного воспитания машинного интеллекта с помощью человеческого интеллекта, одновременно обеспечивая доходы человеческого труда через смарт-контракты, в конечном итоге достигая взаимной выгоды машинного интеллекта и человечества. Для тех, кто полон неопределенности в эпоху ИИ, присоединение к DataFi может стать разумным выбором, соответствующим трендам.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
11 Лайков
Награда
11
4
Репост
Поделиться
комментарий
0/400
TommyTeacher1
· 16ч назад
Генератор денег, брат, унеси меня с собой!
Посмотреть ОригиналОтветить0
FOMOmonster
· 16ч назад
28 лет - уже стоимость в миллиарды, это меня ударило.
Посмотреть ОригиналОтветить0
LidoStakeAddict
· 16ч назад
В 28 лет оценка 29 миллиардов, не могу оставаться в стороне.
Посмотреть ОригиналОтветить0
MetaReckt
· 17ч назад
Зак搞 такую большую шумиху, учится у Хуавей, чтобы переманивать людей.
Возрождение Web3 DataFi, неограниченный потенциал AI в области данных
Потенциал AI-данных и восход Web3 DataFi
Недавно самым примечательным событием в мире ИИ стало демонстрация мощи Meta. Цукерберг активно ищет таланты и создает роскошную команду ИИ, в которой основными являются китайские научные специалисты. В числе них 28-летний Александр Ванг стал лидером команды. Ванг ранее основал компанию Scale AI, стоимость которой оценивается в 29 миллиардов долларов, и предоставлял услуги по обработке данных для таких гигантов ИИ, как американские вооруженные силы, OpenAI, Anthropic и Meta. Основной бизнес Scale AI заключается в предоставлении большого объема точных аннотированных данных.
Причина, по которой Scale AI выделяется среди множества единорогов, заключается в том, что она рано осознала важность данных в AI-индустрии. Вычислительная мощность, модели и данные — это три основных столпа AI-моделей. Если рассматривать большие модели как человека, то модель — это тело, вычислительная мощность — это пища, а данные — это знания и информация.
В процессе быстрого развития больших языковых моделей акцент в индустрии сместился от моделей к вычислительной мощности. В настоящее время большинство моделей используют трансформеры в качестве основы, иногда встречаются инновации, такие как MoE или MoRe. Крупные компании либо создают собственные суперкомпьютерные кластеры, либо подписывают долгосрочные контракты с облачными провайдерами, такими как AWS. После того как была решена базовая проблема вычислительной мощности, важность данных постепенно проявляется.
В отличие от традиционных компаний по обработке больших данных для бизнеса, Scale AI стремится создать надежную базу данных для моделей ИИ. Его деятельность включает не только добычу существующих данных, но и более долгосрочные операции по генерации данных. Компания также создала команду тренеров ИИ, состоящую из экспертов в различных областях, чтобы предоставить более качественные тренировочные данные для моделей ИИ.
Обучение модели делится на два этапа: предварительное обучение и дообучение. Этап предварительного обучения похож на процесс, когда младенец учится говорить, требуется вводить в модель ИИ большое количество информации, полученной из текстов, кода и т.д. с интернета. Этап дообучения аналогичен школьному обучению, обычно имеет четкие правильные и неправильные ответы и направления. С помощью определенного набора данных мы можем развить у модели необходимые способности.
Таким образом, необходимые данные делятся на два типа: один тип — это большое количество данных, которые не требуют значительной обработки, обычно поступающие из платформ UGC, таких как Reddit, Twitter, Github, данные веб-сканирования, открытые базы данных научной литературы и частные базы данных компаний; другой тип требует тщательного проектирования и отбора, чтобы развить определенные качества модели, что требует очистки данных, отбора, аннотирования и обратной связи от пользователей.
С повышением возможностей моделей различного рода более детализированные и специализированные тренировочные данные станут ключевыми факторами, влияющими на способности модели. В долгосрочной перспективе данные AI также представляют собой долгосрочную стратегию с эффектом снежного кома; по мере накопления предварительных работ, данные активы будут обладать способностью к сложным процентам, становясь все более ценными с течением времени.
В области Web3 концепция DataFi появилась как ответ на новые вызовы. Web3 DataFi обладает множеством преимуществ:
Для обычных пользователей DataFi является наиболее выгодным децентрализованным AI проектом для участия. Пользователям не нужно подписывать контракт с фабрикой данных, достаточно войти в кошелек и участвовать, выполняя различные простые задачи, такие как предоставление данных, оценка моделей, использование AI инструментов для простого творчества или участие в торговле данными.
В настоящее время в области Web3 DataFi появилось множество перспективных проектов, таких как Sahara AI, Yupp, Vana, Chainbase, Sapien, Prisma X, Masa, Irys, ORO и Gata. Эти проекты сосредоточены на различных областях услуг данных, включая сбор данных, оценку моделей, монетизацию личных данных, индексирование данных на блокчейне и т.д.
Хотя в настоящее время барьеры для этих проектов в целом невысоки, как только накапливаются пользователи и экосистемная привязанность, преимущества платформы будут быстро накапливаться. Поэтому ранние проекты должны сосредоточиться на стимулах и пользовательском опыте. В то же время эти платформы данных также должны учитывать, как управлять трудозатратами и обеспечивать качество выходных данных, чтобы избежать ситуации, когда плохие деньги вытесняют хорошие.
Кроме того, повышение прозрачности также является важной задачей, с которой сталкиваются текущие проекты на блокчейне. Все больше проектов необходимо демонстрировать публичную и прозрачную долгосрочную приверженность для содействия здоровому развитию Web3 DataFi.
Масштабный путь применения DataFi включает два аспекта: во-первых, привлечение достаточного количества обычных пользователей для участия в сборе и генерации данных, формируя потребительскую группу AI-экономики; во-вторых, получение признания со стороны крупных компаний, так как в краткосрочной перспективе они по-прежнему являются основным источником крупных данных.
В целом, DataFi представляет собой процесс долгосрочного воспитания машинного интеллекта с помощью человеческого интеллекта, одновременно обеспечивая доходы человеческого труда через смарт-контракты, в конечном итоге достигая взаимной выгоды машинного интеллекта и человечества. Для тех, кто полон неопределенности в эпоху ИИ, присоединение к DataFi может стать разумным выбором, соответствующим трендам.