"Битва ста моделей" в AI-індустрії: технічні інновації та промислові труднощі
Минулого місяця в AI-індустрії розгорілася "Битва тварин". Це змагання переважно відбувалося між великими моделями Llama (військовий) і Falcon (сокіл) від Meta. Llama завдяки своїй відкритій архітектурі користується великою популярністю серед розробників. А Falcon був розроблений Науково-дослідним інститутом технологічних інновацій ОАЕ і на деякий час випередив Llama у рейтингу відкритих LLM.
Ця конкуренція відображає сучасну ситуацію в сфері ШІ, що характеризується "хаосом демонів". Багато країн і компаній намагаються створити свої власні великі мовні моделі, країни Перської затоки не є винятком. Проте така, здавалося б, розмаїта ситуація викликає у деяких експертів думки про те, що "підприємництво у галузі жорстких технологій великих моделей все ще є битвою сотень моделей".
Причини цієї ситуації можна простежити до статті Google 2017 року «Увага — це все, що вам потрібно», у якій було представлено алгоритм Transformer. Поява Transformer перетворила великі моделі з теоретичного дослідження на інженерну задачу, що значно знизило бар'єр для входу. Якщо маєте достатньо коштів і обчислювальної потужності, майже будь-яка компанія може навчити свою власну велику модель.
Однак, легкість входу не означає, що кожен може стати лідером епохи штучного інтелекту. Справжня ключова конкурентна перевага полягає в активній спільноті розробників або видатних можливостях виведення висновків. Серія Llama від Meta стала орієнтиром у світі відкритих LLM, в значній мірі завдяки її довгостроковій стратегії відкритого коду та управлінню спільнотою.
У порівнянні з цим, найпотужніший GPT-4 все ще значно випереджає інші моделі. Ця різниця виникає з потужної науково-дослідної команди OpenAI та накопиченого досвіду. Можна сказати, що основні можливості великої моделі полягають не лише в масштабах параметрів, а й у розвитку екосистеми або чистій технічній спроможності.
Окрім технологічних викликів, індустрія великих моделей також стикається з серйозною проблемою дисбалансу між витратами та доходами. Високі витрати на обчислення стали перешкодою для розвитку галузі. За оцінками, світові технологічні компанії щороку витрачають на інфраструктуру великих моделей 200 мільярдів доларів, але очікуваний дохід становитиме лише 75 мільярдів доларів.
Наразі, справжніми вигодами від буму штучного інтелекту користуються переважно виробники чіпів, такі як NVIDIA. А для більшості програмних компаній питання перетворення технологій ШІ на стійку бізнес-модель залишається складним. Навіть такі технологічні гіганти, як Microsoft і Adobe, страждають від проблем з ціноутворенням на послуги ШІ та контролем витрат.
Хоча поява ChatGPT спричинила цю революцію в AI, але фактична цінність, яка виникає від навчання великих моделей, все ще потребує перевірки. З посиленням конкуренції та поширенням відкритих моделей, чисто спиратися на надання послуг великих моделей може ще більше звузити комерційний простір.
У майбутньому вартість AI-індустрії, ймовірно, не буде в самих моделях, а в тому, як поєднати можливості AI з реальними сценаріями застосування, створюючи дійсно такі продукти та послуги, які можуть вирішити потреби користувачів.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
16 лайків
Нагородити
16
5
Поділіться
Прокоментувати
0/400
TokenVelocity
· 08-03 03:29
Всі цвіти розквітають? Це всього лише курячі пір'я.
Битва AI-багато моделей: технологічні інновації та промислові труднощі
"Битва ста моделей" в AI-індустрії: технічні інновації та промислові труднощі
Минулого місяця в AI-індустрії розгорілася "Битва тварин". Це змагання переважно відбувалося між великими моделями Llama (військовий) і Falcon (сокіл) від Meta. Llama завдяки своїй відкритій архітектурі користується великою популярністю серед розробників. А Falcon був розроблений Науково-дослідним інститутом технологічних інновацій ОАЕ і на деякий час випередив Llama у рейтингу відкритих LLM.
Ця конкуренція відображає сучасну ситуацію в сфері ШІ, що характеризується "хаосом демонів". Багато країн і компаній намагаються створити свої власні великі мовні моделі, країни Перської затоки не є винятком. Проте така, здавалося б, розмаїта ситуація викликає у деяких експертів думки про те, що "підприємництво у галузі жорстких технологій великих моделей все ще є битвою сотень моделей".
Причини цієї ситуації можна простежити до статті Google 2017 року «Увага — це все, що вам потрібно», у якій було представлено алгоритм Transformer. Поява Transformer перетворила великі моделі з теоретичного дослідження на інженерну задачу, що значно знизило бар'єр для входу. Якщо маєте достатньо коштів і обчислювальної потужності, майже будь-яка компанія може навчити свою власну велику модель.
Однак, легкість входу не означає, що кожен може стати лідером епохи штучного інтелекту. Справжня ключова конкурентна перевага полягає в активній спільноті розробників або видатних можливостях виведення висновків. Серія Llama від Meta стала орієнтиром у світі відкритих LLM, в значній мірі завдяки її довгостроковій стратегії відкритого коду та управлінню спільнотою.
У порівнянні з цим, найпотужніший GPT-4 все ще значно випереджає інші моделі. Ця різниця виникає з потужної науково-дослідної команди OpenAI та накопиченого досвіду. Можна сказати, що основні можливості великої моделі полягають не лише в масштабах параметрів, а й у розвитку екосистеми або чистій технічній спроможності.
Окрім технологічних викликів, індустрія великих моделей також стикається з серйозною проблемою дисбалансу між витратами та доходами. Високі витрати на обчислення стали перешкодою для розвитку галузі. За оцінками, світові технологічні компанії щороку витрачають на інфраструктуру великих моделей 200 мільярдів доларів, але очікуваний дохід становитиме лише 75 мільярдів доларів.
Наразі, справжніми вигодами від буму штучного інтелекту користуються переважно виробники чіпів, такі як NVIDIA. А для більшості програмних компаній питання перетворення технологій ШІ на стійку бізнес-модель залишається складним. Навіть такі технологічні гіганти, як Microsoft і Adobe, страждають від проблем з ціноутворенням на послуги ШІ та контролем витрат.
Хоча поява ChatGPT спричинила цю революцію в AI, але фактична цінність, яка виникає від навчання великих моделей, все ще потребує перевірки. З посиленням конкуренції та поширенням відкритих моделей, чисто спиратися на надання послуг великих моделей може ще більше звузити комерційний простір.
У майбутньому вартість AI-індустрії, ймовірно, не буде в самих моделях, а в тому, як поєднати можливості AI з реальними сценаріями застосування, створюючи дійсно такі продукти та послуги, які можуть вирішити потреби користувачів.