En 2025, cuando la velocidad de iteración de la tecnología de IA supera con creces las expectativas, una de las preguntas centrales que enfrentan los desarrolladores y las empresas es: ¿cómo evitar que el valor de la aplicación se vea inundado por la ola tecnológica cuando las capacidades del modelo avanzan rápidamente?
Baidu dio la respuesta en la conferencia de desarrolladores Create el 25 de abril. En la conferencia, el modelo grande Wenxin 4.5 Turbo y el X1 Turbo se presentaron oficialmente, y el sistema operativo de contenido Cangzhou OS se lanzó simultáneamente. La aplicación de superinteligencia general "Xinxiang" también ha sido lanzada. Mientras Baidu muestra avances en el nivel tecnológico, también responde a las expectativas entusiastas de la industria sobre la materialización del valor de la IA con aplicaciones contextualizadas y una disposición integral del ecosistema MCP (Modelo de Protocolo de Contexto).
Li Yanhong dijo a los desarrolladores en el sitio que "siempre que se elija el escenario correcto, el modelo base adecuado, a veces también hay que aprender un poco sobre cómo ajustar el modelo, las aplicaciones que se desarrollen sobre esta base no quedarán obsoletas." Enfatizó que "sin aplicaciones, los chips y los modelos no tienen valor. Habrá muchos modelos, pero lo que realmente dominará este mundo en el futuro son las aplicaciones, las aplicaciones son las reinas."
Modelo Wenxin 4.5 Turbo: multimodal, bajo costo, fuerte razonamiento
Actualmente, la competencia en modelos de IA ha entrado en una fase intensa, pero problemas como la modalidad única, las alucinaciones de razonamiento y los altos costos operativos siguen afectando a la industria. Para abordar estos puntos críticos, Baidu ha lanzado los modelos Wenxin 4.5 Turbo y X1 Turbo, que se centran respectivamente en la capacidad multimodal, el bajo costo y un fuerte razonamiento, mostrando un equilibrio entre tecnología y relación calidad-precio.
La versión 4.5 Turbo de Wenxin ha logrado un avance adicional en la capacidad multimodal, con una velocidad más rápida y una drástica reducción de precios: el costo de entrada por cada millón de tokens es de solo 0.8 yuanes, y el de salida es de 3.2 yuanes, hasta un 40% más bajo que el DeepSeek-V3. En varias pruebas de referencia, el 4.5 Turbo superó al GPT-4o con un promedio de 77.68 frente a 72.76, demostrando su competitividad. El X1 Turbo va aún más lejos, optimizando el pensamiento profundo basado en el 4.5 Turbo, con un costo de entrada de 1 yuan y un costo de salida de 4 yuanes por cada millón de tokens, solo el 25% del DeepSeek-R1, destacándose en escenarios de preguntas y respuestas, creación, razonamiento lógico y llamadas a herramientas.
Li Yanhong dijo en el evento: "La iteración de modelos es rápida, pero el valor de la aplicación no será eclipsado. Siempre que encontremos el escenario adecuado, elijamos el modelo correcto y utilicemos bien la optimización, las aplicaciones de IA pueden seguir creando valor." Este punto de vista inyectó una dosis de estímulo a los desarrolladores: el verdadero valor de los grandes modelos radica en su profunda integración con los escenarios.
Si el modelo de gran escala Wenxin es el "corazón" de la IA de Baidu, entonces el recién lanzado Cangzhou OS es el "sistema nervioso" que conecta el contenido y las aplicaciones. Como sistema operativo de contenido, Cangzhou OS tiene a Chatfile Plus como núcleo, integra tres bibliotecas: la biblioteca de conocimiento público, la biblioteca de conocimiento privado y la biblioteca de memoria, así como tres herramientas: lector, editor y reproductor, logrando la interpretación y procesamiento de contenido multimodal a través de la llamada dinámica del gran modelo.
Cangzhou OS|Fuente de la imagen: Baidu
Apoyándose en el sistema operativo Cangzhou, Baidu Wenku y Baidu Wangpan han lanzado conjuntamente la función "Notas AI". Los usuarios pueden generar notas estructuradas y mapas mentales AI con un solo clic mientras ven videos en Wangpan, e incluso crear preguntas basadas en el contenido del video, logrando una conexión perfecta entre el video y las notas. Hasta la fecha, el número de usuarios de pago de funciones AI en Baidu Wenku ha superado los 40 millones, y los usuarios activos mensuales de AI alcanzan los 97 millones; los usuarios activos mensuales de AI en Baidu Wangpan superan los 80 millones. Esta cifra no solo refleja la productividad del sistema operativo Cangzhou, sino que también presagia el enorme potencial de las aplicaciones de AI en el ámbito del contenido.
Otra aplicación de las capacidades multimodales es el humano digital altamente persuasivo de Baidu. En el escenario de la transmisión en vivo del comercio electrónico, los humanos digitales tradicionales tienden a tener una redacción aburrida y movimientos rígidos, mientras que los humanos digitales altamente persuasivos de Baidu han logrado voces súper realistas, contenido profesional e interacción flexible a través de grandes modelos multimodales. Su función de "generación de guiones" puede ajustar las expresiones, el tono y las acciones en tiempo real de acuerdo con las líneas, mientras que el "cerebro de IA" puede programar dinámicamente roles como locutores asistentes y control de campo de acuerdo con la popularidad de la sala de transmisión en vivo, logrando realmente "una persona es un equipo". La plataforma Huiboxing de Baidu también ha lanzado una función de "clonación con un solo clic", en la que los usuarios solo necesitan subir un video de 2 minutos para generar un humano digital exclusivo, lo que hace que "todos puedan ser un ancla" sea una realidad.
Agentes inteligentes y MCP: encendiendo el motor ecológico de las aplicaciones de IA
En un momento en que los agentes (inteligencias artificiales) se han convertido en un tema candente en la industria, Baidu también ha lanzado la aplicación «Xinxiang» para unirse a la batalla.
Como un producto centrado en el "motor de finalización de tareas de IA", Xinxiang logra la descomposición, ejecución y entrega de resultados de tareas complejas a través de interacciones en lenguaje natural. Actualmente, Xinxiang abarca más de 200 tareas en más de diez escenarios, incluyendo investigación profunda, gráficos inteligentes y desarrollo de juegos, y planea expandirse a más de 100,000 en el futuro.
Xinxing admite el mecanismo de "colaboración de múltiples agentes inteligentes". En el escenario de consultas de salud, el sistema puede programar múltiples "dobles de AI médicos" para consultas conjuntas; en los servicios legales, es el "grupo de expertos legales" el que colabora en las respuestas. Este mecanismo rompe las limitaciones de las herramientas tradicionales, ofreciendo soluciones más eficientes para escenarios profesionales. La apertura gratuita de Xinxing y el lanzamiento de la versión para Android (la versión para iOS estará disponible pronto) también permiten que más usuarios experimenten el atractivo de los agentes inteligentes de IA.
El potencial de la colaboración entre múltiples agentes inteligentes también se refleja en la herramienta de programación sin código "Miao Da" lanzada por Baidu el año pasado. "Miao Da" puede generar aplicaciones con una sola frase, coordinando a varios agentes inteligentes como gerentes de producto, arquitectos y diseñadores, y utilizando componentes de herramientas como almacenamiento en la nube, bases de datos y navegación por mapas. Con "Miao Da", un equipo de estudiantes universitarios desarrolló en solo unos minutos una herramienta de marketing que anteriormente requería una semana, y el costo de uso del modelo fue de solo 5 yuanes.
Li Yanhong dijo: "Hay 8 mil millones de personas en el mundo, cuando la barrera tecnológica desaparece, cada persona puede tener las habilidades de un programador." La apertura total de "Miao Da" ha reducido aún más la barrera de desarrollo para la aplicación de la IA.
MCP (Modelo de Contexto Protocolo) como una nueva tendencia en el ecosistema de IA, está remodelando la forma en que los desarrolladores interactúan con los grandes modelos. Baidu anunció en esta conferencia que abrazará completamente MCP, lanzando el primer MCP de comercio electrónico del mundo, MCP de búsqueda y otros servicios, y optimizó la capacidad del gran modelo Wenxin en la planificación y programación de tareas de MCP.
Al mismo tiempo, la plataforma Qianfan en la nube inteligente de Baidu ha tomado la delantera en ser compatible con MCP, ayudando a los desarrolladores a crear y publicar servidores MCP; Baidu Search ha creado una plataforma de descubrimiento de servidores MCP para indexar servicios de alta calidad en toda la red; Wenxin Quick Code se ha convertido en el primer asistente de codificación inteligente en China que es compatible con el servidor MCP. Además, la biblioteca de Baidu, el disco de red, el mapa y otras aplicaciones también son servicios de servidor MCP totalmente abiertos, y el servicio MCP lanzado por el comercio electrónico de Baidu cubre funciones como la recuperación de productos básicos, transacciones, comparación de parámetros, etc., convirtiéndose en el primer servicio MCP en China en admitir transacciones de comercio electrónico. Esta serie de diseños no solo reduce el umbral de acceso para los desarrolladores, sino que también inyecta un nuevo impulso a la prosperidad del ecosistema MCP.
El concurso de emprendimiento "Wenxin Cup" de Baidu ha comenzado | Fuente de la imagen: Baidu
Además de los avances tecnológicos y de productos, Baidu también ha invertido considerablemente en la formación de talento en IA y apoyo a emprendedores. El plan de 5 millones de talentos en IA propuesto hace 5 años ya se ha completado antes de lo previsto. Li Yanhong anunció en la reunión que en los próximos 5 años, Baidu formará otros 10 millones de talentos en IA. Además, la tercera edición de la "Copa Wenxin" ha aumentado la inversión máxima por proyecto a 70 millones de yuanes, proporcionando un apoyo más sólido a los emprendedores.
En el ámbito del hardware, Baidu ha iluminado el primer clúster de 30,000 tarjetas completamente autodiseñado en el país, que puede soportar simultáneamente el entrenamiento de múltiples modelos grandes de cientos de miles de millones de parámetros, y admite a 1,000 clientes para el ajuste fino de modelos de 10,000 millones de parámetros. Este clúster, con una red de alto rendimiento y una solución de refrigeración innovadora, garantiza la estabilidad y la eficiencia energética de las tareas de entrenamiento.
La matriz tecnológica publicada por Baidu revela tres grandes tendencias en el desarrollo de la IA: la multimodalidad se convierte en una capacidad básica (modelo Wenxin), los agentes reconfiguran la colaboración humano-máquina (App Xinhxiang), y el protocolo MCP unifica la interfaz de servicio (ecosistema Baidu MCP). Cuando la capacidad del modelo supera el umbral, la llamada a herramientas se estandariza y el costo de computación sigue disminuyendo, una nueva era de aplicaciones de IA está llegando. Como dijo Li Yanhong: "Las aplicaciones de IA que pueden penetrar en los escenarios y aportar un valor real son la verdadera oportunidad para los desarrolladores."
"Todas estas publicaciones están destinadas a que los desarrolladores no tengan que preocuparse por la capacidad del modelo, no tengan que preocuparse por el costo del modelo y, aún menos, por las herramientas y plataformas de desarrollo, para que puedan concentrarse en crear aplicaciones y hacer las mejores aplicaciones." Dijo Li Yanhong en el evento.
Para la industria de la IA en el país, esta serie de acciones de Baidu no solo es una demostración de su fortaleza tecnológica, sino también una profunda comprensión de la aplicación contextual y la colaboración ecológica. En esta transformación, Baidu está creando una "autopista" para los desarrolladores, desde modelos hasta aplicaciones, a través de la innovación tecnológica y la construcción de ecosistemas. Con la continua iteración de los modelos de gran escala, el sistema operativo Cangzhou y el sonido del corazón, la "superproducción" de la IA podría integrarse más rápidamente en el trabajo y la vida de cada persona.
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
Se lanza Wenxin 4.5 Turbo, pero Li Yanhong dice que la aplicación es el rey.
Fuente de la imagen principal: Baidu
En 2025, cuando la velocidad de iteración de la tecnología de IA supera con creces las expectativas, una de las preguntas centrales que enfrentan los desarrolladores y las empresas es: ¿cómo evitar que el valor de la aplicación se vea inundado por la ola tecnológica cuando las capacidades del modelo avanzan rápidamente?
Baidu dio la respuesta en la conferencia de desarrolladores Create el 25 de abril. En la conferencia, el modelo grande Wenxin 4.5 Turbo y el X1 Turbo se presentaron oficialmente, y el sistema operativo de contenido Cangzhou OS se lanzó simultáneamente. La aplicación de superinteligencia general "Xinxiang" también ha sido lanzada. Mientras Baidu muestra avances en el nivel tecnológico, también responde a las expectativas entusiastas de la industria sobre la materialización del valor de la IA con aplicaciones contextualizadas y una disposición integral del ecosistema MCP (Modelo de Protocolo de Contexto).
Li Yanhong dijo a los desarrolladores en el sitio que "siempre que se elija el escenario correcto, el modelo base adecuado, a veces también hay que aprender un poco sobre cómo ajustar el modelo, las aplicaciones que se desarrollen sobre esta base no quedarán obsoletas." Enfatizó que "sin aplicaciones, los chips y los modelos no tienen valor. Habrá muchos modelos, pero lo que realmente dominará este mundo en el futuro son las aplicaciones, las aplicaciones son las reinas."
Modelo Wenxin 4.5 Turbo: multimodal, bajo costo, fuerte razonamiento
Actualmente, la competencia en modelos de IA ha entrado en una fase intensa, pero problemas como la modalidad única, las alucinaciones de razonamiento y los altos costos operativos siguen afectando a la industria. Para abordar estos puntos críticos, Baidu ha lanzado los modelos Wenxin 4.5 Turbo y X1 Turbo, que se centran respectivamente en la capacidad multimodal, el bajo costo y un fuerte razonamiento, mostrando un equilibrio entre tecnología y relación calidad-precio.
La versión 4.5 Turbo de Wenxin ha logrado un avance adicional en la capacidad multimodal, con una velocidad más rápida y una drástica reducción de precios: el costo de entrada por cada millón de tokens es de solo 0.8 yuanes, y el de salida es de 3.2 yuanes, hasta un 40% más bajo que el DeepSeek-V3. En varias pruebas de referencia, el 4.5 Turbo superó al GPT-4o con un promedio de 77.68 frente a 72.76, demostrando su competitividad. El X1 Turbo va aún más lejos, optimizando el pensamiento profundo basado en el 4.5 Turbo, con un costo de entrada de 1 yuan y un costo de salida de 4 yuanes por cada millón de tokens, solo el 25% del DeepSeek-R1, destacándose en escenarios de preguntas y respuestas, creación, razonamiento lógico y llamadas a herramientas.
Li Yanhong dijo en el evento: "La iteración de modelos es rápida, pero el valor de la aplicación no será eclipsado. Siempre que encontremos el escenario adecuado, elijamos el modelo correcto y utilicemos bien la optimización, las aplicaciones de IA pueden seguir creando valor." Este punto de vista inyectó una dosis de estímulo a los desarrolladores: el verdadero valor de los grandes modelos radica en su profunda integración con los escenarios.
Si el modelo de gran escala Wenxin es el "corazón" de la IA de Baidu, entonces el recién lanzado Cangzhou OS es el "sistema nervioso" que conecta el contenido y las aplicaciones. Como sistema operativo de contenido, Cangzhou OS tiene a Chatfile Plus como núcleo, integra tres bibliotecas: la biblioteca de conocimiento público, la biblioteca de conocimiento privado y la biblioteca de memoria, así como tres herramientas: lector, editor y reproductor, logrando la interpretación y procesamiento de contenido multimodal a través de la llamada dinámica del gran modelo.
Cangzhou OS|Fuente de la imagen: Baidu
Apoyándose en el sistema operativo Cangzhou, Baidu Wenku y Baidu Wangpan han lanzado conjuntamente la función "Notas AI". Los usuarios pueden generar notas estructuradas y mapas mentales AI con un solo clic mientras ven videos en Wangpan, e incluso crear preguntas basadas en el contenido del video, logrando una conexión perfecta entre el video y las notas. Hasta la fecha, el número de usuarios de pago de funciones AI en Baidu Wenku ha superado los 40 millones, y los usuarios activos mensuales de AI alcanzan los 97 millones; los usuarios activos mensuales de AI en Baidu Wangpan superan los 80 millones. Esta cifra no solo refleja la productividad del sistema operativo Cangzhou, sino que también presagia el enorme potencial de las aplicaciones de AI en el ámbito del contenido.
Otra aplicación de las capacidades multimodales es el humano digital altamente persuasivo de Baidu. En el escenario de la transmisión en vivo del comercio electrónico, los humanos digitales tradicionales tienden a tener una redacción aburrida y movimientos rígidos, mientras que los humanos digitales altamente persuasivos de Baidu han logrado voces súper realistas, contenido profesional e interacción flexible a través de grandes modelos multimodales. Su función de "generación de guiones" puede ajustar las expresiones, el tono y las acciones en tiempo real de acuerdo con las líneas, mientras que el "cerebro de IA" puede programar dinámicamente roles como locutores asistentes y control de campo de acuerdo con la popularidad de la sala de transmisión en vivo, logrando realmente "una persona es un equipo". La plataforma Huiboxing de Baidu también ha lanzado una función de "clonación con un solo clic", en la que los usuarios solo necesitan subir un video de 2 minutos para generar un humano digital exclusivo, lo que hace que "todos puedan ser un ancla" sea una realidad.
Agentes inteligentes y MCP: encendiendo el motor ecológico de las aplicaciones de IA
En un momento en que los agentes (inteligencias artificiales) se han convertido en un tema candente en la industria, Baidu también ha lanzado la aplicación «Xinxiang» para unirse a la batalla.
Como un producto centrado en el "motor de finalización de tareas de IA", Xinxiang logra la descomposición, ejecución y entrega de resultados de tareas complejas a través de interacciones en lenguaje natural. Actualmente, Xinxiang abarca más de 200 tareas en más de diez escenarios, incluyendo investigación profunda, gráficos inteligentes y desarrollo de juegos, y planea expandirse a más de 100,000 en el futuro.
Xinxing admite el mecanismo de "colaboración de múltiples agentes inteligentes". En el escenario de consultas de salud, el sistema puede programar múltiples "dobles de AI médicos" para consultas conjuntas; en los servicios legales, es el "grupo de expertos legales" el que colabora en las respuestas. Este mecanismo rompe las limitaciones de las herramientas tradicionales, ofreciendo soluciones más eficientes para escenarios profesionales. La apertura gratuita de Xinxing y el lanzamiento de la versión para Android (la versión para iOS estará disponible pronto) también permiten que más usuarios experimenten el atractivo de los agentes inteligentes de IA.
El potencial de la colaboración entre múltiples agentes inteligentes también se refleja en la herramienta de programación sin código "Miao Da" lanzada por Baidu el año pasado. "Miao Da" puede generar aplicaciones con una sola frase, coordinando a varios agentes inteligentes como gerentes de producto, arquitectos y diseñadores, y utilizando componentes de herramientas como almacenamiento en la nube, bases de datos y navegación por mapas. Con "Miao Da", un equipo de estudiantes universitarios desarrolló en solo unos minutos una herramienta de marketing que anteriormente requería una semana, y el costo de uso del modelo fue de solo 5 yuanes.
Li Yanhong dijo: "Hay 8 mil millones de personas en el mundo, cuando la barrera tecnológica desaparece, cada persona puede tener las habilidades de un programador." La apertura total de "Miao Da" ha reducido aún más la barrera de desarrollo para la aplicación de la IA.
MCP (Modelo de Contexto Protocolo) como una nueva tendencia en el ecosistema de IA, está remodelando la forma en que los desarrolladores interactúan con los grandes modelos. Baidu anunció en esta conferencia que abrazará completamente MCP, lanzando el primer MCP de comercio electrónico del mundo, MCP de búsqueda y otros servicios, y optimizó la capacidad del gran modelo Wenxin en la planificación y programación de tareas de MCP.
Al mismo tiempo, la plataforma Qianfan en la nube inteligente de Baidu ha tomado la delantera en ser compatible con MCP, ayudando a los desarrolladores a crear y publicar servidores MCP; Baidu Search ha creado una plataforma de descubrimiento de servidores MCP para indexar servicios de alta calidad en toda la red; Wenxin Quick Code se ha convertido en el primer asistente de codificación inteligente en China que es compatible con el servidor MCP. Además, la biblioteca de Baidu, el disco de red, el mapa y otras aplicaciones también son servicios de servidor MCP totalmente abiertos, y el servicio MCP lanzado por el comercio electrónico de Baidu cubre funciones como la recuperación de productos básicos, transacciones, comparación de parámetros, etc., convirtiéndose en el primer servicio MCP en China en admitir transacciones de comercio electrónico. Esta serie de diseños no solo reduce el umbral de acceso para los desarrolladores, sino que también inyecta un nuevo impulso a la prosperidad del ecosistema MCP.
El concurso de emprendimiento "Wenxin Cup" de Baidu ha comenzado | Fuente de la imagen: Baidu
Además de los avances tecnológicos y de productos, Baidu también ha invertido considerablemente en la formación de talento en IA y apoyo a emprendedores. El plan de 5 millones de talentos en IA propuesto hace 5 años ya se ha completado antes de lo previsto. Li Yanhong anunció en la reunión que en los próximos 5 años, Baidu formará otros 10 millones de talentos en IA. Además, la tercera edición de la "Copa Wenxin" ha aumentado la inversión máxima por proyecto a 70 millones de yuanes, proporcionando un apoyo más sólido a los emprendedores.
En el ámbito del hardware, Baidu ha iluminado el primer clúster de 30,000 tarjetas completamente autodiseñado en el país, que puede soportar simultáneamente el entrenamiento de múltiples modelos grandes de cientos de miles de millones de parámetros, y admite a 1,000 clientes para el ajuste fino de modelos de 10,000 millones de parámetros. Este clúster, con una red de alto rendimiento y una solución de refrigeración innovadora, garantiza la estabilidad y la eficiencia energética de las tareas de entrenamiento.
La matriz tecnológica publicada por Baidu revela tres grandes tendencias en el desarrollo de la IA: la multimodalidad se convierte en una capacidad básica (modelo Wenxin), los agentes reconfiguran la colaboración humano-máquina (App Xinhxiang), y el protocolo MCP unifica la interfaz de servicio (ecosistema Baidu MCP). Cuando la capacidad del modelo supera el umbral, la llamada a herramientas se estandariza y el costo de computación sigue disminuyendo, una nueva era de aplicaciones de IA está llegando. Como dijo Li Yanhong: "Las aplicaciones de IA que pueden penetrar en los escenarios y aportar un valor real son la verdadera oportunidad para los desarrolladores."
"Todas estas publicaciones están destinadas a que los desarrolladores no tengan que preocuparse por la capacidad del modelo, no tengan que preocuparse por el costo del modelo y, aún menos, por las herramientas y plataformas de desarrollo, para que puedan concentrarse en crear aplicaciones y hacer las mejores aplicaciones." Dijo Li Yanhong en el evento.
Para la industria de la IA en el país, esta serie de acciones de Baidu no solo es una demostración de su fortaleza tecnológica, sino también una profunda comprensión de la aplicación contextual y la colaboración ecológica. En esta transformación, Baidu está creando una "autopista" para los desarrolladores, desde modelos hasta aplicaciones, a través de la innovación tecnológica y la construcción de ecosistemas. Con la continua iteración de los modelos de gran escala, el sistema operativo Cangzhou y el sonido del corazón, la "superproducción" de la IA podría integrarse más rápidamente en el trabajo y la vida de cada persona.