La version 4.5 Turbo de Wenxin a été publiée, mais Li Yanhong a déclaré que l'application est le véritable roi.

Image de couverture : Baidu

En 2025, où la vitesse d'itération de la technologie AI dépasse largement les attentes, un des enjeux clés auxquels les développeurs et les entreprises sont confrontés est le suivant : comment éviter que la valeur d'application ne soit submergée par la vague technologique lorsque les capacités des modèles évoluent rapidement ?

Baidu a donné sa réponse lors de la conférence des développeurs Create le 25 avril. Lors de la conférence, le modèle Wenxin 4.5 Turbo et le X1 Turbo ont été présentés officiellement, et le système d'exploitation Cangzhou OS a été lancé simultanément dans le domaine du contenu. L'application d'agent intelligent général « Xinxiang » est également en ligne. En présentant ses percées technologiques, Baidu a également répondu aux attentes ardentes de l'industrie concernant la concrétisation de la valeur de l'IA grâce à des applications scénarisées et à une disposition complète de l'écosystème MCP (Model Context Protocol).

Li Yanhong a déclaré aux développeurs sur place : « Tant que vous trouvez le bon scénario, choisissez le bon modèle de base, et parfois apprenez un peu à ajuster le modèle, les applications créées sur cette base ne seront jamais obsolètes. » Il a souligné : « Sans application, les puces et les modèles n'ont aucune valeur. Il y aura beaucoup de modèles, mais à l'avenir, ce sont les applications qui domineront réellement ce monde, les applications sont les vraies souveraines. »

Modèle Wenxin 4.5 Turbo : multimodal, à faible coût, forte capacité de raisonnement

Actuellement, la concurrence entre les grands modèles d'IA est entrée dans une phase aiguë, mais des problèmes tels que la modalité unique, les hallucinations de raisonnement et les coûts d'exploitation élevés continuent de gêner l'industrie. Pour répondre à ces points douloureux, Baidu a lancé le modèle Wenxin 4.5 Turbo et le X1 Turbo, qui se caractérisent respectivement par des capacités multimodales, des coûts réduits et une forte capacité de raisonnement, montrant un équilibre entre technologie et rapport qualité-prix.

Wenxin 4.5 Turbo a fait de nouvelles percées dans les capacités multimodales, avec des vitesses plus rapides, mais le prix a fortement chuté - le prix d’entrée par million de jetons n’est que de 0,8 yuan et la sortie est de 3,2 yuans, soit 40% de moins que DeepSeek-V3. Dans un certain nombre de benchmarks, le 4.5 Turbo a surpassé les 72.76 du GPT-4o avec un score moyen de 77.68, démontrant ainsi sa compétitivité. X1 Turbo va encore plus loin, en se basant sur l’optimisation approfondie de 4.5 Turbo, avec 1 yuan d’entrée et 4 yuans de sortie par million de jetons, ce qui ne représente que 25 % de celui de DeepSeek-R1, et mène dans des scénarios tels que les questions-réponses, la création, le raisonnement logique et l’appel d’outils.

Robin Li a déclaré sur les lieux : « Le modèle itère rapidement, mais la valeur de l’application ne sera pas couverte. Tant que vous trouvez le bon scénario, que vous choisissez le bon modèle et que vous faites bon usage du réglage, les applications d’IA peuvent continuer à créer de la valeur. Ce point de vue donne un coup de fouet aux développeurs : la véritable valeur des grands modèles réside dans l’intégration profonde avec la scène.

Si le modèle Wenxin est le « cœur » de l'IA de Baidu, alors le nouvel OS Cangzhou publié est le « système nerveux » qui relie le contenu et les applications. En tant que système d'exploitation de contenu, l'OS Cangzhou repose sur Chatfile Plus et intègre trois bibliothèques : la bibliothèque de connaissances publiques, la bibliothèque de connaissances privées et la bibliothèque de mémoire, ainsi que trois outils : le lecteur, l'éditeur et le lecteur multimédia, permettant l'analyse et le traitement de contenu multimodal grâce à l'appel dynamique des grands modèles.

Cangzhou OS | Source de l'image : Baidu

S’appuyant sur Cangzhou OS, Baidu Library et Baidu Netdisk ont lancé conjointement la fonction « AI note ». Lorsque les utilisateurs regardent des vidéos sur le disque réseau, ils peuvent générer des notes structurées, des cartes mentales IA et même des questions de test basées sur le contenu vidéo en un seul clic, afin de réaliser le lien transparent entre les vidéos et les notes. Jusqu’à présent, la fonction d’IA de Baidu Wenku compte plus de 40 millions d’utilisateurs payants, et les utilisateurs actifs mensuels de l’IA ont atteint 97 millions ; Baidu Netdisk AI compte plus de 80 millions d’utilisateurs actifs mensuels. Ces données reflètent non seulement la productivité de Cangzhou OS, mais indiquent également l’énorme potentiel des applications d’IA dans le domaine du contenu.

Une autre application des capacités multimodales est l’humain numérique très persuasif de Baidu. Dans le scénario de diffusion en direct du commerce électronique, les humains numériques traditionnels ont tendance à avoir une rédaction ennuyeuse et des mouvements raides, tandis que les humains numériques très persuasifs de Baidu ont obtenu des voix super réalistes, un contenu professionnel et une interaction flexible grâce à de grands modèles multimodaux. Sa fonction de « génération de script » peut ajuster les expressions, le ton et les actions en temps réel en fonction des lignes, tandis que le « cerveau de l’IA » peut planifier dynamiquement des rôles tels que les assistants diffuseurs et le contrôle du terrain en fonction de la popularité de la salle de diffusion en direct, réalisant vraiment « une personne est une équipe ». La plate-forme Huiboxing de Baidu a également lancé une fonction de « clonage en un clic », où les utilisateurs n’ont qu’à télécharger une vidéo de 2 minutes pour générer un humain numérique exclusif, faisant de « tout le monde peut être un point d’ancrage » une réalité.

Agents intelligents et MCP : allumer le moteur écologique des applications IA

Alors que les agents intelligents deviennent une tendance dans l'industrie, Baidu a également lancé l'application "Xinxiang" pour rejoindre la bataille.

En tant que produit dont le cœur est le « moteur d’achèvement des tâches d’IA », Xinxiang réalise le désassemblage, l’exécution et la livraison de résultats de tâches complexes grâce à l’interaction en langage naturel. À l’heure actuelle, Xinxiang a couvert plus de 200 tâches dans dix scénarios majeurs tels que la recherche approfondie, les graphiques intelligents et le développement de jeux, et prévoit de s’étendre à plus de 100 000 à l’avenir.

Xinxin prend en charge le mécanisme de « collaboration multi-agents ». Dans le cadre des consultations de santé, le système peut programmer plusieurs « avatars d'IA médecins » pour des consultations conjointes ; dans le domaine des services juridiques, c'est le « groupe de réflexion des avocats » qui collabore pour répondre. Ce mécanisme surmonte les limites des outils traditionnels, offrant des solutions plus efficaces pour des scénarios professionnels. L'ouverture gratuite de Xinxin et le lancement de la version Android (la version iOS sera bientôt disponible) permettent également à un plus grand nombre d'utilisateurs de découvrir le charme des agents intelligents de l'IA.

Le potentiel de la collaboration entre agents intelligents se manifeste également dans l'outil de programmation sans code "Miao Da" lancé par Baidu l'année dernière. "Miao Da" permet de générer des applications en une seule phrase, en collaborant avec plusieurs agents intelligents tels que des chefs de produit, des architectes et des designers, tout en utilisant des composants d'outils tels que le stockage cloud, les bases de données et la navigation sur carte. Avec "Miao Da", une équipe d'étudiants universitaires a pu développer en quelques minutes un outil marketing qui aurait nécessité une semaine auparavant, avec un coût d'appel de modèle de seulement 5 yuans.

Li Yanhong a déclaré : « Il y a 8 milliards de personnes dans le monde, lorsque la barrière technologique disparaît, chacun peut acquérir les compétences d'un programmeur. » L'ouverture totale de « Miaoda » a encore abaissé le seuil de développement des applications d'IA.

Le MCP (Model Context Protocol), en tant que nouveau point d'orgue de l'écosystème IA, est en train de redéfinir la manière dont les développeurs interagissent avec les grands modèles. Baidu a annoncé lors de cette conférence qu'il adoptait pleinement le MCP, en lançant les premiers services MCP pour le commerce électronique et la recherche au monde, et en optimisant les capacités du grand modèle Wenxin dans la planification et la gestion des tâches MCP.

En outre, la plateforme Qianfan de Baidu Intelligent Cloud a été la première à être compatible avec MCP, permettant aux développeurs de créer et de publier des serveurs MCP ; Baidu Search a construit une plateforme de découverte de serveurs MCP, indexant les services de qualité sur l'ensemble du web ; Wenxin Kuai Ma est devenu le premier assistant de codage intelligent en Chine à prendre en charge les serveurs MCP. De plus, des applications telles que Baidu Wenku, Baidu Netdisk et Baidu Maps ont également ouvert des services de serveurs MCP, tandis que le service MCP lancé par Baidu E-commerce couvre des fonctionnalités telles que la recherche de produits, les transactions et la comparaison de paramètres, devenant ainsi le premier service MCP en Chine à prendre en charge les transactions e-commerce. Cette série d'initiatives a non seulement réduit le seuil d'entrée pour les développeurs, mais a également insufflé une nouvelle dynamique à la prospérité de l'écosystème MCP.

Le concours entrepreneurial "Wenxin Cup" de Baidu est lancé|Source de l'image : Baidu

En plus des percées technologiques et des produits, Baidu a également beaucoup investi dans la formation des talents en IA et le soutien à l’entrepreneuriat. Le plan de 5 millions de talents en IA proposé il y a cinq ans a été achevé plus tôt que prévu, et Robin Li a annoncé lors de la réunion que Baidu cultiverait 10 millions de talents supplémentaires en IA au cours des cinq prochaines années. En outre, la 3e édition du concours d’entrepreneuriat « Wenxin Cup » a augmenté le montant maximum de l’investissement pour un seul projet à 70 millions de yuans, offrant ainsi un soutien plus important aux entrepreneurs.

Sur le plan matériel, Baidu a éclairé le premier cluster de 30 000 cartes entièrement auto-développé en Chine, capable de supporter simultanément l'entraînement de plusieurs grands modèles de plusieurs centaines de milliards de paramètres, et prend en charge 1000 clients pour le réglage fin de modèles de 10 milliards de paramètres. Ce cluster, avec un réseau haute performance et une solution de refroidissement innovante, garantit la stabilité et l'efficacité énergétique des tâches d'entraînement.

La matrice technologique publiée par Baidu révèle trois grandes tendances du développement de l'IA : la multimodalité devient une capacité fondamentale (modèle Wenxin), les agents réinventent la collaboration homme-machine (application Xinxang), et le protocole MCP unifie l'interface de service (écosystème MCP de Baidu). Lorsque les capacités des modèles franchissent le seuil, que l'appel aux outils se standardise et que le coût de calcul continue de diminuer, une nouvelle ère des applications IA est en train d'émerger. Comme l'a dit Li Yanhong : « Les applications IA qui peuvent s'infiltrer dans les scénarios et apporter une valeur réelle sont la véritable opportunité pour les développeurs. »

« Toutes ces publications visent à permettre aux développeurs de ne pas se soucier des capacités des modèles, de ne pas se soucier des coûts des modèles, et encore moins de se soucier des outils et des plateformes de développement, afin qu'ils puissent se concentrer sur la création d'applications et réaliser les meilleures applications. » a déclaré Li Yanhong sur place.

Pour l'industrie de l'IA domestique, cette série d'actions de Baidu est non seulement une démonstration de sa puissance technologique, mais aussi une profonde compréhension des applications scénarisées et de la synergie écologique. Dans cette transformation, Baidu pave la voie pour les développeurs avec une « autoroute » allant du modèle à l'application grâce à l'innovation technologique et à la construction d'écosystèmes. Avec l'itération continue du grand modèle Wenxin, du système d'exploitation Cangzhou et de Xinxiang, la « super productivité » de l'IA pourrait s'intégrer plus rapidement dans le travail et la vie de chacun.

Voir l'original
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate.io app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)