¡Huawei es el primero en integrar modelos grandes en teléfonos móviles! Xiaoyi + modelo grande, asistente inteligente IQ +++

2023-08-12 05:23:27

Fuente: Xinzhiyuan

Buen chico, HUAWEI HarmonyOS Access modelo grande, ¿puede el asistente inteligente jugar así?

Con solo un comando chino, Huawei Xiaoyi escribirá un correo electrónico en inglés:

Puede usar AI para hacer sus propias fotos en diferentes estilos:

También puede hablar una larga lista de instrucciones, dejar que cree escenas complejas por sí mismo y puede entenderlo en un lenguaje sencillo:

Este es el Nuevo Xiaoyi en HUAWEI HarmonyOS 4.

Se basa en el modelo grande de la base Pangu L0 de Huawei, incorporando una gran cantidad de datos de escena, ajustando el modelo y finalmente refinando un modelo de diálogo de capa L1.

Puede manejar tareas como la generación de texto, la búsqueda de conocimientos, el resumen de datos, la disposición inteligente y la comprensión de intenciones difusas/complejas.

Además, también se pueden llamar varios servicios de aplicaciones para realizar una experiencia inteligente a nivel de sistema.

Entonces, ¿qué puede hacer el nuevo Huawei Xiaoyi?

Más inteligente, más capaz, más solidario

Basado en la capacidad de los modelos grandes, Huawei Xiaoyi se ha actualizado principalmente en tres aspectos esta vez:

Interacción inteligente
Alta productividad
Servicio personalizado

Las mejoras de capacidades específicas incluyen diálogos en lenguaje más natural, cuestionarios de conocimiento en máquinas de juego, búsqueda de servicios de vida, contenido de pantalla de reconocimiento de diálogo, generación de imágenes de redacción de resumen, etc.

**En primer lugar, la actualización de interacción inteligente hace que el diálogo y la interacción sean más naturales y fluidos. **

Huawei Xiaoyi puede entender vernáculo, comprender intenciones difusas y comandos complejos.

Si no puede encontrar la función de configuración de fondo de pantalla más reciente y no conoce el nombre de la función, puede preguntar directamente:

¿Cómo cambiar el fondo de pantalla que puede cambiar en tiempo real según el clima?

O un comando complejo con múltiples requisitos:

Encuentre un restaurante de mariscos de alta calificación cerca del lago Songshan, preferiblemente con un menú fijo con descuento para cuatro personas.

Xiaoyi también puede llamar al servicio para encontrar un restaurante que cumpla con los requisitos.

Al mismo tiempo, Xiaoyi también tiene capacidades multimodales, puede entender el contenido de la imagen. De esta manera, los pasos que los usuarios tenían que leer y luego operar manualmente también pueden transferirse a Xiaoyi.

Por ejemplo, que mire una carta de invitación y diga:

Navegue hasta la dirección en el mapa.

Puede extraer la información de la dirección en el mapa y llamar al servicio de mapas para la navegación.

O guarde la información de contacto en la invitación, y puede ver que puede entender muy bien la información de texto en la imagen.

Yendo un paso más allá, ahora podemos realizar organización de tareas complejas a través de Xiaoyi, por lo que no necesitamos configurarlo manualmente repetidamente.

Por ejemplo, puede dejar que configure una escena de carrera matutina:

Ayúdame a crear la escena de la carrera matutina. Todos los lunes a viernes a las 6:30 de la mañana, transmitiré el clima del día para mí. Cuando me pongo los auriculares bluetooth, reproduzco mis canciones favoritas y pongo mi teléfono en modo silencioso.

Xiaoyi puede entender esta larga lista de requisitos y luego llamar a diferentes funciones. Y según el estado del teléfono móvil (si los auriculares Bluetooth están conectados), puede decidir si debe realizar ciertas operaciones.

En segundo lugar, gracias a capacidades como modelos grandes, Xiaoyi ahora puede proporcionar herramientas de productividad más eficientes.

Ayudarle a ver, leer y escribir.

Por ejemplo, muéstrele un artículo en inglés y luego pregunte qué se dice en este artículo.

Xiaoyi puede dar explicaciones simples y concisas en chino.

Si el usuario le ha pedido que recuerde alguna información en el pasado, también se le puede llamar para generar el contenido correspondiente.

En unos días, haré una cita con David para discutir el proyecto Combinando la información de la última reunión, escribiré un correo electrónico de cita de reunión en inglés.

Incluyendo lo que se mencionó al principio, Xiaoyi también puede usar la capacidad visual de la IA para crear fotos en varios estilos.

**Finalmente, como asistente inteligente, Xiaoyi ahora admite servicios más personalizados y puede entenderlo mejor. **

Se puede usar como bloc de notas y memorándum, y algunas cosas pequeñas se pueden registrar oralmente.

Huawei declaró que ** todo el contenido de la memoria se completa con la autorización del usuario y protegerá completamente la privacidad del usuario. **

Además, Xiaoyi Suggestion ahora puede percibir más escenas de usuarios de alta frecuencia y puede proporcionar activamente sugerencias de combinación inteligente de una sola parada, ahorrando una gran cantidad de procesos de búsqueda manual.

Por ejemplo, en el escenario de los viajes de ida, Xiaoyi puede recordar el último tipo de cambio en tiempo real antes de la salida, cambiar moneda extranjera y ayudar a los usuarios a obtener estrategias de viaje en el destino en tiempo real, herramientas de traducción en tiempo real y más.

Según los informes, La nueva escena inteligente de Xiaoyi se ha multiplicado por 3, y la cantidad de puntos de interés se ha multiplicado por 7, lo que puede cubrir las principales tiendas de catering y compras, los distritos comerciales, las estaciones de tren de alta velocidad del aeropuerto y otros escenarios

En resumen, el nuevo Xiaoyi no solo obtuvo las últimas capacidades de AIGC, sino que también mejoró algunas deficiencias de los asistentes de voz de teléfonos móviles que a menudo se criticaban en el pasado.

Tales como falta de memoria, diálogo aburrido, incomprensión de la lengua vernácula, etc...

Todo esto, por supuesto, se beneficia de la bendición del gran modelo, pero ¿cómo lo hizo Xiaoyi?

Xiaoyi abraza a la gran modelo

El modelo subyacente en el que se basa Xiaoyi es Huawei Pangu Series.

En julio de este año, Huawei lanzó oficialmente Pangu Large Model 3.0 y propuso una arquitectura modelo de tres capas.

L0: Grandes modelos básicos, que incluyen lenguaje natural, visión, multimodalidad, predicción y computación científica;
L1: Grandes modelos de N industrias, como asuntos gubernamentales, finanzas, manufactura, minería, meteorología, etc.;
L2: un modelo más detallado de la escena, que proporciona servicios de modelo "listos para usar"

Entre ellos, la versión más grande del modelo grande básico de capa L0 contiene 100 mil millones de parámetros, y el entrenamiento previo usa más de 3 billones de tokens.

Basado en el modelo grande de la base Pangu L0 de Huawei, Xiaoyi creó una gran cantidad de datos de escena para escenarios de consumidores finales, ajustó el modelo y finalmente refinó el modelo de diálogo de capa L1.

En el ajuste fino, Xiaoyi ha agregado tipos de datos principales que cubren a los consumidores finales, como conversaciones, guías de viaje, control de equipos, alimentos, ropa, vivienda y transporte, etc.

Esto bien puede cubrir el rango de conocimiento de las conversaciones diarias de los usuarios comunes y puede mejorar la factualidad, el rendimiento en tiempo real, el cumplimiento de la seguridad, etc. en el proceso de diálogo del modelo.

Sin embargo, como todos sabemos, los modelos grandes son muy desafiantes en implementación y respuesta rápida debido a sus características a gran escala.

En términos de implementación, Huawei está mejorando continuamente la capacidad del modelo a gran escala colaboración dispositivo-nube. El modelo grande del lado del dispositivo puede realizar una capa de preprocesamiento en las solicitudes de los usuarios y la información de contexto, y luego enviar la solicitud preprocesada. al lado de la nube.

La ventaja de hacer esto es que no solo puede aprovechar la respuesta rápida del modelo final, sino también mejorar la calidad de las preguntas y respuestas y la respuesta a través del modelo en la nube y, al mismo tiempo, proteger aún más la privacidad del usuario. datos.

En cuanto a la reducción del retraso de la inferencia, Huawei Xiaoyi realizó una optimización de ingeniería sistemática, incluido el enlace completo desde el chip subyacente, el marco de inferencia, el operador del modelo y la longitud de entrada y salida.

Al desmantelar el tiempo de retraso de cada módulo, el equipo de I+D aclaró los objetivos de optimización de cada parte y redujo el tiempo de retraso por medio de la fusión del operador, la optimización de la memoria y la optimización de la canalización.

Al mismo tiempo, la longitud y la longitud de salida también afectarán la velocidad de inferencia de los modelos grandes.

En este sentido, Huawei realizó análisis y compresión palabra por palabra para diferentes escenarios y formatos de salida, y finalmente se dio cuenta de que la demora de razonamiento se redujo a la mitad.

Desde la perspectiva de la arquitectura técnica general, la integración de Huawei Xiaoyi y el modelo grande no es simplemente para mejorar tareas como el chat, AIGC y responder, sino para llevar a cabo mejoras a nivel del sistema con el modelo grande como núcleo.

**En otras palabras, que el modelo grande se convierta en el "cerebro" del sistema. **

Su lógica subyacente es: asignar tareas de usuario a los sistemas apropiados, cada sistema realiza sus propias funciones y, al mismo tiempo, mejora la experiencia en escenarios complejos.

Mirando específicamente el proceso de diálogo típico de Xiaoyi, se puede dividir en tres pasos:

El primer paso es recibir las preguntas de los usuarios y analizar cómo tratarlas en función de la comprensión contextual/la capacidad de memoria de Xiaoyi.

Segundo paso, invoque diferentes capacidades según el tipo de solicitud, incluida la recuperación de metaservicios, la generación de ideas y la recuperación de conocimientos.

Si la solicitud iniciada por el usuario involucra meta-servicios, por ejemplo, si pregunta por restaurantes cercanos que puedan atender, esto involucra la llamada del servicio de APP gourmet, el sistema necesita generar una API, y finalmente el parte del servicio dará una respuesta basada en el mecanismo de recomendación.

Si el usuario hace una pregunta de conocimiento, como cuántos parámetros tiene el modelo Pangu. En este momento, el sistema llamará al motor de búsqueda, el conocimiento del dominio correspondiente y el conocimiento del vector para consultar, y luego generará una respuesta a través de la fusión.

Si la solicitud del usuario es una tarea generativa, entonces el modelo grande puede dar una respuesta por su propia habilidad.

En el último paso, todas las respuestas generadas serán evaluadas por el control de riesgos y devueltas al usuario.

Además, Xiaoyi controló aún más los detalles y llevó a cabo una serie de desarrollos de bajo nivel para garantizar el efecto de las preguntas y respuestas y la ejecución de tareas.

Puedes mirar el aspecto de los datos.

Desde que Xiaoyi se conectó a HarmonyOS en 2017, ha acumulado una cierta cantidad de hábitos de diálogo para los usuarios comunes. Además de esto, Huawei ha creado un gran corpus de diferentes tipos de expresiones para cubrir la mayor cantidad posible de expresiones escritas y habladas, de modo que el modelo grande pueda dominar varias expresiones durante la etapa previa al entrenamiento.

Para evaluar y mejorar mejor la capacidad de Xiaoyi, Huawei ha creado un conjunto completo de datos de prueba.

Esto no solo puede evaluar las capacidades de los grandes modelos abiertos existentes, sino también guiar a Xiaoyi para crear datos y capacidades en función de los resultados de la evaluación.

Quiero que Xiaoyi domine la llamada de herramientas, lo cual es muy desafiante.

El control del equipo requiere un modelo grande para generar un texto de formato complejo con cientos de tokens, y no debe haber errores de formato, de lo contrario, el sistema de control central no podrá analizar y conectarse.

Para permitir que el modelo grande cumpla con ese estándar de generación, Huawei solía comprender el "temperamento" del modelo grande por un lado y, al mismo tiempo, fortalecer la capacidad de código del modelo grande y luego mejorar el formato. capacidad de cumplimiento del modelo, y finalmente se dio cuenta de que el formato ** es casi 100% compatible **.

Para escenarios complejos, el método de Xiaoyi es utilizar la capacidad de los modelos grandes para aprender y comprender completamente los escenarios de herramientas y luego razonar.

Se entiende que el equipo optimizó el efecto de control del equipo modelo de ser completamente inutilizable a una disponibilidad de más del 80%.

Además, HarmonyOS nativo también permite optimizar la API existente y, a través de esta adaptación inversa, también se pueden utilizar mejor las ventajas de los modelos grandes.

De cara a todo el escenario, no limitado al terminal móvil

Entonces, ¿por qué Huawei puede implementar capacidades de modelos a gran escala para asistentes inteligentes tan rápido?

La acumulación y la investigación de la investigación y el desarrollo básicos subyacentes son esenciales, pero hay una cosa más que merece atención:

Huawei optó por partir del escenario real para determinar cómo combinar el modelo grande con el asistente inteligente e incluso todo el sistema operativo.

En las propias palabras de Huawei:

Hablar es barato. Muéstrame la demostración.

Muchas de las experiencias que se muestran arriba también provienen de las percepciones diarias de los miembros del equipo de I+D de Huawei.

Por ejemplo, algunas personas están acostumbradas a recibir noticias en el camino hacia y desde el trabajo, y es inconveniente leer y escuchar información demasiado larga, por lo que la función de resumen de información aparece en Huawei Xiaoyi.

Algunas personas descubren que siempre les faltan palabras cuando escriben reseñas de compras y deseos de cumpleaños, por lo que Huawei Xiaoyi ofrece una función de redacción.

Y este enfoque en la experiencia de la escena es la ventaja natural de HarmonyOS.

Desde su nacimiento, HarmonyOS no se ha limitado a los teléfonos móviles, sino que se ha orientado a varios terminales y todos los escenarios.

Ahora ha creado una ecología de escenario completo "1+8+N".

Huawei Xiaoyi también se implementó en dispositivos 1 + 8. En el futuro, combinará la forma comercial de dispositivos de escenario completo e implementará gradualmente Xiaoyi con capacidades de modelo a gran escala para la experiencia de escenario completo de los consumidores.

Como asistente inteligente impulsado por IA, Xiaoyi ha estado integrando varias capacidades de IA desde su nacimiento, como subtítulos de IA y lectura en voz alta de Xiaoyi. El equipo de I + D detrás de esto siempre ha prestado atención a más posibilidades de IA y asistentes inteligentes.

Según los informes, el año pasado, el equipo notó que las decenas de miles de millones de modelos de capacitación previa combinados con la tecnología rápida ya pueden brindar muy buenas capacidades de comprensión y generación de textos, y se pueden usar en conversaciones triviales, preguntas y respuestas y tareas. diálogo basado.

Con el estallido de la última ronda de tendencias de IA, RLHF ha traído mejoras significativas a los modelos grandes y la puerta al aterrizaje industrial se ha abierto oficialmente.

Desde el surgimiento de la tendencia de la IA generativa este año, muchas aplicaciones han optado por acceder a capacidades de modelos grandes y asistentes inteligentes integrados.

Sin embargo, como uno de los fabricantes de sistemas operativos más importantes del mundo, Huawei optó por intervenir desde un nivel más bajo y usar un modelo grande para remodelar el sistema operativo.

El nivel inferior significa más completo y completo.

Pero para la investigación y el desarrollo, el desafío es aún mayor.

Esto no solo requiere una base de modelo suficientemente sólida, sino que también requiere la optimización de la fusión a nivel del sistema y también presenta requisitos para la comprensión de la escena y la percepción de la demanda del usuario.

En consecuencia, Huawei es uno de los primeros fabricantes nacionales con capacidades de modelos a gran escala; construye capacidades de desarrollo de IA de pila completa; HarmonyOS cubre más de 700 millones de dispositivos...

Por lo tanto, no es difícil entender por qué Huawei Xiaoyi accede rápidamente a la capacidad de los modelos grandes, convirtiendo a HarmonyOS 4 en el primer sistema operativo en acceder completamente a los modelos grandes.

Como uno de los sistemas operativos más preocupados del mundo, HarmonyOS toma la delantera en la adopción de modelos grandes y también puede abrir un nuevo paradigma, permitiendo que todos abran sus teléfonos para experimentar las capacidades de los modelos grandes, que ya no se limitan a la imaginación.

Actualmente, Huawei ha anunciado el plan de prueba de Xiaoyi:

Se invitará al nuevo Xiaoyi a probarse a fines de agosto de este año y se actualizará a través de OTA en algunos modelos equipados con HarmonyOS 4.0 y superior más adelante. El plan de actualización específico se anunciará más adelante.

Si está interesado en zapatos para niños, puede venir y echar un vistazo ~

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

1 me gusta

Recompensa
1
Comentar
Republicar
Compartir

Comentar

0/400

Sin comentarios

Tema
#Gate & WLFI USD1 Points Program
61k Popularidad
#Trump Allows 401(k) Crypto Investing
36k Popularidad
#Join Copy Trading Share to Win $2,000
29k Popularidad
#Show My Alpha Points
77k Popularidad
#SOL Futures Reach New High
22k Popularidad

Anclado