В индустрии ИИ разразилась "война животных", Falcon и Llama борются за господствующее положение открытых исходных кодов больших моделей
В прошлом месяце в области ИИ разразилась "битва животных". С одной стороны, модель Llama, представленная Meta, а с другой — крупная модель под названием Falcon.
Llama благодаря своей Открытый исходный код особенностью, долгое время пользовалась популярностью в сообществе разработчиков. А Falcon-40B, выпущенный в мае, сразу занял первое место в "рейтинге Открытый исходный код LLM". Этот список был составлен сообществом Hugging Face и предоставляет стандарты для оценки возможностей больших языковых моделей. С тех пор Llama и Falcon поочередно обновляют свои позиции в рейтинге.
Интересно, что разработчики Falcon не являются технологической компанией, а представляют собой Исследовательский институт технологических инноваций в столице ОАЭ, Абу-Даби. ОАЭ заявили, что они участвуют в соревнованиях по ИИ, чтобы "потрясти основных игроков".
Сегодня область ИИ вошла в стадию активной конкуренции. Страны и компании с большими финансовыми возможностями массово запускают локализованные версии ChatGPT. Только в регионе Персидского залива несколько игроков вступили в борьбу. В августе Саудовская Аравия приобрела более 3000 чипов H100 для своих университетов, чтобы тренировать большие модели.
Один опытный инвестор воскликнул: "Я думал, что в области жестких технологий будут высокие барьеры, но не ожидал, что стартапы на базе больших моделей также превратятся в битву ста моделей..."
За этой "битвой ста моделей" стоит появление алгоритма Transformer. В 2017 году восемь ученых из Google опубликовали алгоритм Transformer в своей статье, заложив основу для текущей волны искусственного интеллекта. Сегодня все основные модели, включая серию GPT, построены на основе Transformer.
Появление Transformer замедлило скорость инноваций в базовых алгоритмах академической среды. Инженерные факторы, такие как обработка данных, масштаб вычислительных мощностей и архитектура моделей, постепенно становятся ключевыми в соревнованиях по ИИ. При наличии определенных технических навыков любая компания может разработать крупную модель.
Это также привело к резкому увеличению числа больших моделей в стране и за рубежом. По отчетам, на июль в стране уже насчитывается 130 больших моделей, что превышает количество в США — 114. Кроме Китая и США, такие страны, как Япония, Индия и Южная Корея, также начали запускать свои собственные большие модели.
Однако, легкий вход на рынок не означает, что можно стать лидером в отрасли. Например, в споре между Falcon и Llama, хотя Falcon временно занимает более высокую позицию в рейтинге, трудно сказать, что это нанесло серьезный удар по Meta. Для открытых больших моделей активное сообщество разработчиков является основной конкурентоспособностью. Meta, обладая многолетним опытом управления социальными медиа, имеет преимущество в управлении открытым сообществом.
В настоящее время в топ-10 рейтинга Hugging Face 8 моделей основаны на Llama 2. Только на этой платформе более 1500 крупных моделей используют Открытый исходный код Llama 2.
Кроме экологического строительства, чисто технические способности также являются ключевыми. В недавнем тесте AgentBench GPT-4 с оценкой 4.41 значительно опережает, на втором месте Claude с 2.77 балла, другие открытые модели колеблются около 1 балла. Это отражает долгосрочное накопление технологического преимущества командой OpenAI.
С увеличением активности сообщества с открытым исходным кодом производительность различных моделей может стать схожей. В будущем основное конкурентное преимущество больших моделей будет сосредоточено на экосистеме или чистой способности к выводу.
Другой более реальный вопрос заключается в том, что, за редкими исключениями, большинство поставщиков крупных моделей еще не нашли прибыльную модель. Высокие затраты на вычислительные мощности стали препятствием для развития отрасли. Некоторые организации прогнозируют, что ежегодные расходы мировых технологических компаний на инфраструктуру крупных моделей достигнут 200 миллиардов долларов, в то время как доходы от крупных моделей составят не более 75 миллиардов долларов, что приведет к дефициту как минимум 125 миллиардов долларов.
Даже такие гиганты программного обеспечения, как Microsoft и Adobe, сталкиваются с трудностями в ценообразовании на услуги ИИ. Например, GitHub Copilot стоит 10 долларов в месяц, но Microsoft теряет 20 долларов на каждого пользователя.
В целом, если бы не появление OpenAI и ChatGPT, эта революция в области ИИ могла бы не произойти. Но на текущем этапе ценность, которую можно создать, просто обучая большие модели, еще предстоит оценить. С увеличением конкуренции и ростом числа открытых моделей поставщики чисто больших моделей могут столкнуться с большим давлением. Как успех iPhone 4 зависел не только от процессора, так и ценность больших моделей будет больше проявляться в конкретных сценариях применения.
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
18 Лайков
Награда
18
10
Поделиться
комментарий
0/400
ContractCollector
· 07-23 10:56
В зоопарке началась драка, ха-ха
Посмотреть ОригиналОтветить0
YieldChaser
· 07-22 14:46
Узнайте о битве сжигания денег
Посмотреть ОригиналОтветить0
ApeWithNoFear
· 07-22 06:05
Можно ли еще играть в революцию ИИ? В итоге всё равно придется тратить деньги.
Посмотреть ОригиналОтветить0
CryingOldWallet
· 07-22 00:04
Как все это связано с именованием животных
Посмотреть ОригиналОтветить0
GraphGuru
· 07-21 22:50
Овца победила орла, ха-ха
Посмотреть ОригиналОтветить0
Lonely_Validator
· 07-21 22:49
Кто может, тот и использует.
Посмотреть ОригиналОтветить0
NftBankruptcyClub
· 07-21 22:48
Стоять и просто расслабляться — это хорошо, супер удвоение.
Посмотреть ОригиналОтветить0
RugpullSurvivor
· 07-21 22:43
Только так можно победить VC
Посмотреть ОригиналОтветить0
SleepyValidator
· 07-21 22:35
Просто два животных дерутся.
Посмотреть ОригиналОтветить0
ChainMaskedRider
· 07-21 22:28
Вычислительная мощность такая дорогая, играть в ИИ — это растрата денег.
Эскалация войны ИИ: Falcon бросает вызов Llama в борьбе открытых исходных кодов больших моделей.
В индустрии ИИ разразилась "война животных", Falcon и Llama борются за господствующее положение открытых исходных кодов больших моделей
В прошлом месяце в области ИИ разразилась "битва животных". С одной стороны, модель Llama, представленная Meta, а с другой — крупная модель под названием Falcon.
Llama благодаря своей Открытый исходный код особенностью, долгое время пользовалась популярностью в сообществе разработчиков. А Falcon-40B, выпущенный в мае, сразу занял первое место в "рейтинге Открытый исходный код LLM". Этот список был составлен сообществом Hugging Face и предоставляет стандарты для оценки возможностей больших языковых моделей. С тех пор Llama и Falcon поочередно обновляют свои позиции в рейтинге.
Интересно, что разработчики Falcon не являются технологической компанией, а представляют собой Исследовательский институт технологических инноваций в столице ОАЭ, Абу-Даби. ОАЭ заявили, что они участвуют в соревнованиях по ИИ, чтобы "потрясти основных игроков".
Сегодня область ИИ вошла в стадию активной конкуренции. Страны и компании с большими финансовыми возможностями массово запускают локализованные версии ChatGPT. Только в регионе Персидского залива несколько игроков вступили в борьбу. В августе Саудовская Аравия приобрела более 3000 чипов H100 для своих университетов, чтобы тренировать большие модели.
Один опытный инвестор воскликнул: "Я думал, что в области жестких технологий будут высокие барьеры, но не ожидал, что стартапы на базе больших моделей также превратятся в битву ста моделей..."
За этой "битвой ста моделей" стоит появление алгоритма Transformer. В 2017 году восемь ученых из Google опубликовали алгоритм Transformer в своей статье, заложив основу для текущей волны искусственного интеллекта. Сегодня все основные модели, включая серию GPT, построены на основе Transformer.
Появление Transformer замедлило скорость инноваций в базовых алгоритмах академической среды. Инженерные факторы, такие как обработка данных, масштаб вычислительных мощностей и архитектура моделей, постепенно становятся ключевыми в соревнованиях по ИИ. При наличии определенных технических навыков любая компания может разработать крупную модель.
Это также привело к резкому увеличению числа больших моделей в стране и за рубежом. По отчетам, на июль в стране уже насчитывается 130 больших моделей, что превышает количество в США — 114. Кроме Китая и США, такие страны, как Япония, Индия и Южная Корея, также начали запускать свои собственные большие модели.
Однако, легкий вход на рынок не означает, что можно стать лидером в отрасли. Например, в споре между Falcon и Llama, хотя Falcon временно занимает более высокую позицию в рейтинге, трудно сказать, что это нанесло серьезный удар по Meta. Для открытых больших моделей активное сообщество разработчиков является основной конкурентоспособностью. Meta, обладая многолетним опытом управления социальными медиа, имеет преимущество в управлении открытым сообществом.
В настоящее время в топ-10 рейтинга Hugging Face 8 моделей основаны на Llama 2. Только на этой платформе более 1500 крупных моделей используют Открытый исходный код Llama 2.
Кроме экологического строительства, чисто технические способности также являются ключевыми. В недавнем тесте AgentBench GPT-4 с оценкой 4.41 значительно опережает, на втором месте Claude с 2.77 балла, другие открытые модели колеблются около 1 балла. Это отражает долгосрочное накопление технологического преимущества командой OpenAI.
С увеличением активности сообщества с открытым исходным кодом производительность различных моделей может стать схожей. В будущем основное конкурентное преимущество больших моделей будет сосредоточено на экосистеме или чистой способности к выводу.
Другой более реальный вопрос заключается в том, что, за редкими исключениями, большинство поставщиков крупных моделей еще не нашли прибыльную модель. Высокие затраты на вычислительные мощности стали препятствием для развития отрасли. Некоторые организации прогнозируют, что ежегодные расходы мировых технологических компаний на инфраструктуру крупных моделей достигнут 200 миллиардов долларов, в то время как доходы от крупных моделей составят не более 75 миллиардов долларов, что приведет к дефициту как минимум 125 миллиардов долларов.
Даже такие гиганты программного обеспечения, как Microsoft и Adobe, сталкиваются с трудностями в ценообразовании на услуги ИИ. Например, GitHub Copilot стоит 10 долларов в месяц, но Microsoft теряет 20 долларов на каждого пользователя.
В целом, если бы не появление OpenAI и ChatGPT, эта революция в области ИИ могла бы не произойти. Но на текущем этапе ценность, которую можно создать, просто обучая большие модели, еще предстоит оценить. С увеличением конкуренции и ростом числа открытых моделей поставщики чисто больших моделей могут столкнуться с большим давлением. Как успех iPhone 4 зависел не только от процессора, так и ценность больших моделей будет больше проявляться в конкретных сценариях применения.