Вийшла версія 4.5 Turbo, але Лі Яньхун сказав, що застосунки є королями.

Зображення заголовка: Baidu

У 2025 році, коли швидкість ітерації технологій штучного інтелекту перевищує очікування, одним з основних питань, з яким стикаються розробники та підприємства, є: як уникнути затоплення цінності застосування, коли можливості моделей швидко зростають?

百度 на конференції розробників Create, що відбулася 25 квітня, дала відповідь. На конференції офіційно презентували модель великого штучного інтелекту 4.5 Turbo та X1 Turbo, а також одночасно випустили операційну систему для контентної сфери Цан Чжоу ОС. Загальний суперінтелектуальний додаток «Серце звуку» також запущено. Презентуючи технологічні досягнення, 百度 також відповіла на запити галузі щодо реальної вартості штучного інтелекту за допомогою сценічних застосувань і комплексного розвитку екосистеми MCP (Model Context Protocol).

Лі Яньхун на місці заявив розробникам: «Якщо знайти правильний сценарій, вибрати правильну базову модель, іноді ще потрібно вивчити деякі методи налаштування моделі, то на цій основі створені додатки не застаріють». Він підкреслив: «Без додатків чіпи та моделі не мають цінності. Моделей буде багато, але в майбутньому справжнім володарем цього світу будуть саме додатки, додатки — це королі.»

Велика модель Wenxin 4.5 Turbo: мультимодальна, низька вартість, сильна логіка

На даний момент конкуренція великих моделей штучного інтелекту вже вступила в гарячу стадію, але проблеми, такі як однобокість модальностей, ілюзія розуміння та високі витрати на виконання, все ще турбують галузь. Відповідаючи на ці проблеми, Baidu представила моделі Wenxin 4.5 Turbo та X1 Turbo, які мають ядром своїх характеристик мультимодальні можливості, низьку вартість та сильне розуміння, демонструючи баланс між технологіями та вартістю.

Модель Wencin 4.5 Turbo зробила подальший прорив у мультимодальних можливостях, стала швидшою, але ціна значно знизилася — вартість введення становить лише 0,8 юаня за мільйон токенів, а вартість виведення — 3,2 юаня, що на 40% нижче за DeepSeek-V3. У кількох бенчмарках 4.5 Turbo з середнім балом 77,68 перевершила GPT-4o з 72,76, демонструючи свою конкурентоспроможність. А X1 Turbo пішла ще далі, базуючись на оптимізації глибокого мислення 4.5 Turbo, вартість введення становить 1 юань за мільйон токенів, а вартість виведення — 4 юаня, що становить лише 25% від DeepSeek-R1, показуючи лідерство в сценаріях запитань і відповідей, творчості, логічного висновку та виклику інструментів.

Лі Янхун на місці заявив: «Моделі швидко ітеруються, але їхня прикладна цінність не буде перекрита. Якщо знайти правильний контекст, вибрати правильну модель і добре використовувати налаштування, AI-додатки можуть постійно створювати цінність». Ця думка надала розробникам потужний імпульс — справжня цінність великих моделей полягає в глибокій інтеграції з контекстом.

Якщо модель Wenxin є «серцем» AI від Baidu, то новий випущений Cangzhou OS є «нервовою системою», що з'єднує контент та застосунки. Як операційна система для контенту, Cangzhou OS зосереджена на Chatfile Plus, інтегрує «три бібліотеки» – публічну бібліотеку знань, приватну бібліотеку знань та бібліотеку пам'яті, а також «три інструменти» – рідер, редактор, плеєр, через динамічний виклик великої моделі реалізує аналіз та обробку мультимодального контенту.

Цанжоу OS|Джерело зображення: Байду

Спираючись на операційну систему Cangzhou OS, Baidu Wenku та Baidu Wangpan спільно запустили функцію «AI нотатки». Користувачі можуть в один клік створювати структуровані нотатки та AI мапи думок під час перегляду відео в хмарному сховищі, а також генерувати тестові завдання на основі вмісту відео, забезпечуючи безшовну інтеграцію відео та нотаток. Станом на сьогодні платних користувачів AI функцій Baidu Wenku вже понад 40 мільйонів, а щомісячна активність користувачів AI досягла 97 мільйонів; щомісячна активність користувачів AI Baidu Wangpan перевищує 80 мільйонів. Ці дані не тільки відображають продуктивність Cangzhou OS, але й передбачають величезний потенціал застосування AI в галузі контенту.

Ще одним застосуванням мультимодальних можливостей є дуже переконлива цифрова людина Baidu. У сценарії прямої трансляції електронної комерції традиційні цифрові люди, як правило, мають нудний копірайтинг і жорсткі рухи, тоді як дуже переконливі цифрові люди Baidu досягли надреалістичних голосів, професійного контенту та гнучкої взаємодії за допомогою мультимодальних великих моделей. Його функція «генерації сценарію» може регулювати вирази обличчя, тон і дії в режимі реального часу відповідно до рядків, в той час як «мозок штучного інтелекту» може динамічно планувати такі ролі, як помічники мовників і контроль поля, відповідно до популярності кімнати для прямих трансляцій, дійсно досягаючи «одна людина - це команда». Платформа Baidu Huiboxing також запустила функцію «клонування в один клік», де користувачам потрібно лише завантажити 2-хвилинне відео, щоб створити ексклюзивну цифрову людину, зробивши «кожен може бути якорем» реальністю.

Агенти та MCP: запуск механізму екосистеми для додатків штучного інтелекту

У той час, коли агенти стали гарячою темою в галузі, Baidu також запустила додаток «Серце звуку», щоб приєднатися до битви.

Як продукт, основою якого є «Двигун виконання завдань на основі ШІ», Xinxiang реалізує розподіл, виконання та доставку результатів складних завдань через взаємодію природною мовою. Наразі Xinxiang охоплює понад 200 завдань у десяти основних сценаріях, таких як глибоке дослідження, розумні графіки, розробка ігор, а в майбутньому планується розширити їх до понад 100 000.

Система Xinxiang підтримує механізм "мультиагентної співпраці". У сценах медичних консультацій система може координувати кілька "лікарських AI-двійників" для спільної діагностики; у правових послугах це робить "юридична мозкова атака" для спільної відповіді. Цей механізм долає обмеження традиційних інструментів, забезпечуючи більш ефективні рішення для професійних сцен. Безкоштовний доступ до Xinxiang та запуск версії для Android (версія для iOS найближчим часом) також дозволяє більшій кількості користувачів відчути魅力 AI-агентів.

Потенціал багатогранної співпраці також виявляється в безкодному програмному інструменті «Сяо Да», який був запущений Baidu минулого року. «Сяо Да» дозволяє створювати додатки всього за одне речення, за ним співпрацюють кілька агентів, таких як менеджери продуктів, архітектори, дизайнери тощо, використовуючи компоненти інструментів, такі як хмарне сховище, бази даних, навігація по картам. З «Сяо Да» команда студентів університету змогла розробити маркетинговий інструмент, який раніше вимагав цілий тиждень, всього за кілька хвилин, а вартість виклику моделі становила всього 5 юанів.

Лі Янхун заявив: «У світі є 8 мільярдів людей, коли технологічний бар'єр зникне, кожен зможе мати навички програміста». Відкриття «Сяо Да» для всього суспільства ще більше знизило бар'єри для розробки AI-додатків.

MCP (Model Context Protocol) як новий напрямок в екосистемі ШІ, перебудовує спосіб взаємодії розробників з великими моделями. Baidu на цій конференції оголосила про повне прийняття MCP, представивши перші у світі послуги електронної комерції MCP, пошукового MCP тощо, а також оптимізувавши здатності моделі Wenxin у плануванні та розподілі завдань MCP.

У той же час інтелектуальна хмарна платформа Qianfan від Baidu взяла на себе лідерство в сумісності з MCP, підтримуючи розробників у створенні та публікації серверів MCP; Baidu Search створила платформу виявлення сервера MCP для індексації високоякісних послуг у мережі; Wenxin Quick Code став першим інтелектуальним помічником з кодування в Китаї, який підтримує сервер MCP. Крім того, бібліотека Baidu, мережевий диск, карта та інші додатки також є повністю відкритими службами сервера MCP, а послуга MCP, запущена Baidu e-commerce, охоплює такі функції, як пошук товарів, транзакція, порівняння параметрів тощо, ставши першим сервісом MCP у Китаї, який підтримує транзакції електронної комерції. Ця серія макетів не тільки знижує поріг доступу для розробників, але й вносить новий імпульс у процвітання екосистеми MCP.

Запуск підприємницького конкурсу «Вэньсіньбей» від Baidu|Джерело зображення: Baidu

Окрім проривів у технологіях та продуктах, Baidu також багато інвестувала в навчання талантів штучного інтелекту та підтримку підприємництва. План талантів у 5 мільйонів ШІ, запропонований п'ять років тому, був завершений достроково, і Робін Лі оголосив на зустрічі, що Baidu культивуватиме ще 10 мільйонів талантів у галузі штучного інтелекту протягом наступних п'яти років. Крім того, 3-й конкурс з підприємництва «Wenxin Cup» збільшив максимальну суму інвестицій для одного проекту до 70 мільйонів юанів, надавши сильнішу підтримку підприємцям.

На апаратному рівні Baidu запустила перший в Китаї повністю самостійно розроблений кластер на 30 тисяч карт, який може одночасно підтримувати тренування кількох великих моделей з мільярдами параметрів та підтримувати 1000 клієнтів для тонкої налаштування моделей з десятками мільярдів параметрів. Цей кластер має високу продуктивність мережі та інноваційні рішення для охолодження, що забезпечує стабільність та енергоефективність тренувальних завдань.

Технічна матриця, представленна Baidu, виявляє три основні тенденції розвитку AI: мультимодальність стає основною здатністю (велика модель Wenxin), інтелектуальні агенти реконструюють співпрацю людини та машини (додаток Xinxiang), протокол MCP уніфікує інтерфейси сервісів (екосистема Baidu MCP). Коли можливості моделі перевищують поріг, виклики інструментів реалізуються в стандартизованому вигляді, а витрати на обчислювальні потужності продовжують знижуватися, нова ера застосування AI наближається. Як сказав Лі Яньхун: "AI-додатки, які можуть проникати у сцени і приносити реальну цінність, - це справжня можливість для розробників."

«Усі ці публікації спрямовані на те, щоб розробники могли не турбуватися про можливості моделей, не хвилюватися про витрати на моделі, і ще менше переживати про інструменти та платформи для розробки, щоб вони могли спокійно займатися створенням застосунків і робити найкращі застосунки». Лі Яньхун заявив на місці.

Для вітчизняної індустрії штучного інтелекту серія дій Baidu є не лише демонстрацією технічної сили, але й глибоким розумінням сценаріїв додатків та екологічної співпраці. У цій трансформації Baidu прокладає «магістраль» від моделі до програми для забудовників за допомогою технологічних інновацій та екологічного будівництва. Завдяки безперервній ітерації великої моделі Wenxin, Cangzhou OS і Xinxiang, «суперпродуктивність» штучного інтелекту може бути швидше і по-справжньому інтегрована в роботу та життя кожного.

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити