A Huawei é a primeira a integrar modelos grandes em telemóveis! Xiaoyi + modelo grande, assistente inteligente IQ +++

2023-08-12 05:23:27

Fonte: Xinzhiyuan

Bom rapaz, HUAWEI HarmonyOS Access Large Model, o assistente inteligente pode jogar assim?

Com apenas um comando chinês, Huawei Xiaoyi escreverá um e-mail em inglês:

Você pode usar AI para fazer suas próprias fotos em diferentes estilos:

Você também pode falar uma longa lista de instruções, deixá-lo criar cenas complexas por si só e entendê-lo em linguagem simples:

Este é o Novo Xiaoyi no HUAWEI HarmonyOS 4.

Ele é baseado no grande modelo da base Pangu L0 da Huawei, incorporando uma grande quantidade de dados de cena, ajustando o modelo e, finalmente, refinando um modelo de diálogo de camada L1.

Ele pode lidar com tarefas como geração de texto, pesquisa de conhecimento, resumo de dados, organização inteligente e compreensão de intenção difusa/complexa.

Além disso, vários serviços de APP também podem ser chamados para realizar uma experiência inteligente no nível do sistema.

Então, o que o novo Huawei Xiaoyi pode fazer?

Mais inteligente, mais capaz, mais atencioso

Com base na capacidade de modelos grandes, a Huawei Xiaoyi atualizou principalmente em três aspectos desta vez:

Interação inteligente
Alta produtividade
Serviço personalizado

Aprimoramentos de recursos específicos incluem diálogos em linguagem mais natural, questionários de conhecimento em máquinas de jogos, busca por serviços de vida, conteúdo da tela de reconhecimento de diálogo, geração de imagens de redação de resumo, etc.

**Em primeiro lugar, a atualização de interação inteligente torna o diálogo e a interação mais naturais e suaves. **

Huawei Xiaoyi pode entender vernáculo, entender intenções difusas e comandos complexos.

Se você não conseguir encontrar a função de configuração de papel de parede mais recente e não souber o nome da função, pergunte diretamente:

Como mudar o papel de parede que pode mudar em tempo real de acordo com o clima?

Ou um comando complexo com vários requisitos:

Encontre um restaurante de frutos do mar com boa classificação perto do Lago Songshan, de preferência com uma refeição fixa com desconto para quatro pessoas.

Xiaoyi também pode ligar para o serviço para encontrar um restaurante que atenda aos requisitos.

Ao mesmo tempo, Xiaoyi também possui recursos multimodais, pode entender o conteúdo da imagem. Dessa forma, as etapas que os usuários tiveram que ler e operar manualmente também podem ser entregues a Xiaoyi.

Por exemplo, deixe-o olhar para uma carta-convite e dizer:

Navegue até o endereço no mapa.

Ele pode extrair as informações de endereço no mapa e chamar o serviço de mapa para navegação.

Ou salve as informações de contato no convite e você verá que ele pode entender muito bem as informações de texto na imagem.

Indo um passo além, agora podemos executar organização de tarefas complexas por meio do Xiaoyi, portanto, não precisamos configurá-lo manualmente repetidamente.

Por exemplo, você pode definir uma cena de corrida matinal:

Ajude-me a criar a cena da corrida matinal. Todas as segundas a sextas-feiras, às 6h30 da manhã, transmitirei o clima do dia para mim. Quando coloco meus fones de ouvido bluetooth, toco músicas favoritas e coloco meu telefone no modo silencioso.

Xiaoyi pode entender essa longa lista de requisitos e, em seguida, chamar diferentes funções. E com base no status do telefone celular (se o fone de ouvido Bluetooth está conectado), ele pode julgar se deve executar determinadas operações.

Em segundo lugar, graças a recursos como modelos grandes, a Xiaoyi agora pode fornecer ferramentas de produtividade mais eficientes.

Ajudá-lo a ver, ler e escrever.

Por exemplo, mostre um artigo em inglês e pergunte o que é dito nesse artigo.

Xiaoyi pode dar explicações simples e concisas em chinês.

Se o usuário pediu para lembrar alguma informação no passado, também pode ser chamado para gerar o conteúdo correspondente.

Em alguns dias, vou marcar uma reunião com David para discutir o projeto.Combinando as informações da última reunião, escreverei um e-mail de reunião em inglês.

Incluindo o que foi mencionado no início, Xiaoyi também pode usar a capacidade visual da IA para criar fotos em vários estilos.

**Finalmente, como assistente inteligente, Xiaoyi agora oferece suporte a serviços mais personalizados e pode entendê-lo melhor. **

Pode ser usado como um bloco de notas e um memorando, e algumas pequenas coisas podem ser registradas oralmente.

A Huawei afirmou que ** todo o conteúdo da memória é concluído sob a autorização do usuário e protegerá totalmente a privacidade do usuário. **

Além disso, a Sugestão Xiaoyi agora pode perceber mais cenas de alta frequência dos usuários e pode fornecer ativamente sugestões de combinações inteligentes completas, economizando muitos processos de pesquisa manual.

Por exemplo, no cenário de viagem de saída, Xiaoyi pode lembrar a última taxa de câmbio em tempo real antes da partida, trocar moeda estrangeira e ajudar os usuários a obter estratégias de viagem no destino em tempo real; Ferramentas de tradução em tempo real e muito mais.

Segundo relatos, A nova cena inteligente de Xiaoyi aumentou 3 vezes e o número de POIs aumentou 7 vezes, que pode abranger restaurantes e lojas de compras, distritos comerciais, estações ferroviárias de alta velocidade em aeroportos e outros cenários.

Para resumir, o novo Xiaoyi não apenas obteve os recursos AIGC mais recentes, mas também melhorou algumas deficiências dos assistentes de voz do telefone móvel que eram frequentemente criticados no passado.

Tais como falta de memória, diálogo maçante, incompreensão do vernáculo, etc...

É claro que tudo isso é beneficiado pela bênção do grande modelo, mas como Xiaoyi fez isso?

Xiaoyi abraça o grande modelo

O modelo subjacente do qual Xiaoyi depende é a série Huawei Pangu.

Em julho deste ano, a Huawei lançou oficialmente o Pangu Large Model 3.0 e propôs uma arquitetura de modelo de três camadas.

L0: Grandes modelos básicos, incluindo linguagem natural, visão, multimodalidade, predição e computação científica;
L1: Grandes modelos de N indústrias, como assuntos governamentais, finanças, manufatura, mineração, meteorologia, etc.;
L2: Um modelo mais detalhado da cena, fornecendo serviços de modelo "out-of-the-box"

Entre eles, a maior versão do modelo grande básico da camada L0 contém 100 bilhões de parâmetros e o pré-treinamento usa mais de 3 trilhões de tokens.

Com base no grande modelo da base Pangu L0 da Huawei, Xiaoyi construiu uma grande quantidade de dados de cena para cenários do consumidor final, ajustou o modelo e, finalmente, refinou o modelo de diálogo da camada L1.

No ajuste fino, Xiaoyi adicionou tipos de dados convencionais que cobrem os consumidores finais, como conversas, guias de viagem, controle de equipamentos, alimentos, roupas, moradia e transporte, etc.

Isso pode cobrir bem a gama de conhecimento das conversas diárias dos usuários comuns e pode melhorar a factualidade, o desempenho em tempo real, a conformidade com a segurança, etc. no processo de diálogo do modelo.

No entanto, como todos sabemos, modelos grandes são muito desafiadores na implantação e resposta rápida devido às suas características de grande escala.

Em termos de implantação, a Huawei está aprimorando continuamente a capacidade do modelo de grande escala colaboração dispositivo-nuvem. O modelo de grande escala no lado do dispositivo pode executar uma camada de pré-processamento nas solicitações do usuário e informações de contexto e, em seguida, enviar a solicitação pré-processada para o lado da nuvem.

A vantagem de fazer isso é que ele pode não apenas aproveitar a resposta rápida do modelo final, mas também melhorar a qualidade das perguntas e respostas e da resposta por meio do modelo de nuvem e, ao mesmo tempo, proteger ainda mais a privacidade do usuário dados.

Em termos de redução do atraso de inferência, a Huawei Xiaoyi fez otimização sistemática de engenharia, incluindo todo o link do chip subjacente, estrutura de inferência, operador de modelo e comprimento de entrada e saída.

Ao desmontar o atraso de tempo de cada módulo, a equipe de P&D esclareceu as metas de otimização de cada parte e reduziu o atraso por meio da fusão do operador, otimização de memória e otimização de pipeline.

Ao mesmo tempo, o comprimento e o comprimento de saída também afetarão a velocidade de inferência de modelos grandes.

A esse respeito, a Huawei fez análise e compactação palavra por palavra para diferentes cenários e formatos de saída e, finalmente, percebeu o atraso de raciocínio reduzido pela metade.

Do ponto de vista da arquitetura técnica geral, a integração do Huawei Xiaoyi e do modelo grande não é simplesmente para aprimorar tarefas como bate-papo, AIGC e resposta, mas para realizar aprimoramentos no nível do sistema com o modelo grande como núcleo.

**Em outras palavras, deixe o modelo grande se tornar o "cérebro" do sistema. **

Sua lógica subjacente é: atribuir tarefas do usuário a sistemas apropriados, cada sistema executa suas próprias funções e, ao mesmo tempo, aprimora a experiência em cenários complexos.

Olhando especificamente para o processo de diálogo típico de Xiaoyi, ele pode ser dividido em três etapas:

O primeiro passo é receber as perguntas do usuário e analisar como lidar com elas com base na compreensão contextual/capacidade de lembrar de Xiaoyi.

Segunda etapa, invoque diferentes recursos de acordo com o tipo de solicitação, incluindo recuperação de meta-serviço, geração de ideias e recuperação de conhecimento.

Se a solicitação iniciada pelo usuário envolver meta-serviços, por exemplo, se ele perguntar sobre restaurantes próximos que podem atender, isso envolve a chamada do serviço do APP gourmet. O sistema precisa gerar uma API e, por fim, o a parte de serviço dará uma resposta com base no mecanismo de recomendação.

Se o usuário fizer uma pergunta de conhecimento, como perguntar quantos parâmetros o modelo Pangu possui. Nesse momento, o sistema chamará o mecanismo de pesquisa, o conhecimento de domínio correspondente e o conhecimento de vetor para consulta e, em seguida, gerará uma resposta por meio da fusão.

Se a solicitação do usuário for uma tarefa generativa, o modelo grande poderá responder por sua própria capacidade.

Na última etapa, todas as respostas geradas serão avaliadas pelo controle de risco e devolvidas ao usuário.

Além disso, Xiaoyi controlou ainda mais os detalhes e realizou uma série de desenvolvimento de baixo nível para garantir o efeito de perguntas e respostas e execução de tarefas.

Você pode olhar para o aspecto dos dados.

Desde que Xiaoyi ficou online no HarmonyOS em 2017, ele acumulou uma certa quantidade de hábitos de diálogo para usuários comuns. Além disso, a Huawei construiu um grande corpus de diferentes tipos de expressões para abranger o maior número possível de expressões escritas e faladas, para que o modelo grande possa ser proficiente em várias expressões durante o estágio de pré-treinamento.

A fim de avaliar melhor e melhorar a capacidade de Xiaoyi, Huawei construiu um conjunto de dados de teste completo.

Isso pode não apenas avaliar os recursos dos grandes modelos abertos existentes, mas também orientar Xiaoyi a criar dados e recursos com base nos resultados da avaliação.

Quero que Xiaoyi domine a chamada da ferramenta, o que é muito desafiador.

O controle do equipamento requer um modelo grande para gerar um texto de formato complexo com centenas de tokens e não deve haver erros de formato, caso contrário, o sistema de controle central não será capaz de analisar e conectar.

Para permitir que o modelo grande atenda a esse padrão de geração, a Huawei costumava entender o "temperamento" do modelo grande por um lado e, ao mesmo tempo, fortalecer a capacidade de código do modelo grande e, em seguida, aprimorar o formato capacidade de conformidade do modelo e, finalmente, percebi que o formato ** é quase 100% compatível **.

Para cenários complexos, o método de Xiaoyi é usar a capacidade de grandes modelos para aprender e entender totalmente os cenários de ferramentas e, em seguida, raciocinar.

Entende-se que a equipe otimizou o efeito de controle do equipamento modelo de completamente inutilizável para uma disponibilidade de mais de 80%.

Além disso, o HarmonyOS nativo também permite otimizar a API existente e, por meio dessa adaptação reversa, as vantagens de modelos grandes também podem ser melhor utilizadas.

Virado para todo o cenário, não limitado ao terminal móvel

Então, por que a Huawei é capaz de implantar recursos de modelo em larga escala para assistentes inteligentes tão rapidamente?

O acúmulo e a pesquisa da pesquisa e desenvolvimento básicos subjacentes são essenciais, mas há mais uma coisa digna de atenção——

A Huawei optou por partir do cenário real para determinar como combinar o modelo grande com o assistente inteligente e até com todo o sistema operacional.

Nas próprias palavras da Huawei:

Falar é barato. Mostre-me a demonstração.

Muitas das experiências mostradas acima também vêm das percepções diárias dos membros da equipe de P&D da Huawei.

Por exemplo, algumas pessoas estão acostumadas a receber notícias no caminho de ida e volta do trabalho, e é inconveniente ler e ouvir informações muito longas, então a função de resumo de informações aparece no Huawei Xiaoyi.

Algumas pessoas acham que sempre ficam sem palavras ao escrever resenhas de compras e desejos de aniversário, então a Huawei Xiaoyi fornece uma função de redação.

E esse foco na experiência da cena é a vantagem natural do HarmonyOS.

Desde o seu nascimento, o HarmonyOS não se limitou aos telemóveis, mas foi orientado para vários terminais e todos os cenários.

Agora ele criou uma ecologia de cenário completo "1+8+N".

Huawei Xiaoyi também foi implantado em dispositivos 1 + 8. No futuro, combinará a forma comercial de dispositivos de cenário completo e implantará gradualmente o Xiaoyi com recursos de modelo em grande escala para a experiência de cenário completo dos consumidores.

Como um assistente inteligente orientado por IA, Xiaoyi integra vários recursos de IA desde o seu nascimento, como legendas de IA e leitura em voz alta de Xiaoyi. A equipe de P&D por trás dele sempre prestou atenção a mais possibilidades de IA e assistentes inteligentes.

Segundo relatos, no ano passado, a equipe notou que as dezenas de bilhões de modelos de pré-treinamento combinados com a tecnologia pronta já podem trazer muito bons recursos de geração e compreensão de texto e podem ser usados em conversa fiada, perguntas e respostas e tarefas. diálogo baseado.

Com o surgimento da última rodada de tendências de IA, o RLHF trouxe melhorias significativas para modelos grandes e a porta para o pouso industrial foi oficialmente aberta.

Desde o surgimento da tendência de IA generativa neste ano, muitos aplicativos optaram por acessar recursos de modelos grandes e assistentes inteligentes integrados.

No entanto, como um dos maiores fabricantes de sistemas operacionais do mundo, a Huawei optou por cortar de um nível inferior e usar um modelo grande para remodelar o sistema operacional.

O nível mais baixo significa mais completo e abrangente.

Mas para pesquisa e desenvolvimento, o desafio é ainda maior.

Isso não apenas requer uma base de modelo suficientemente sólida, mas também requer otimização de fusão no nível do sistema e também apresenta requisitos para compreensão da cena e percepção da demanda do usuário.

Da mesma forma, a Huawei é um dos primeiros fabricantes nacionais com recursos de modelo em grande escala; cria recursos de desenvolvimento de IA full-stack; HarmonyOS cobre mais de 700 milhões de dispositivos...

Portanto, não é difícil entender por que o Huawei Xiaoyi acessa rapidamente a capacidade de modelos grandes, tornando o HarmonyOS 4 o primeiro sistema operacional a acessar totalmente modelos grandes.

Como um dos sistemas operacionais mais preocupados do mundo, o HarmonyOS é o primeiro a abraçar modelos em grande escala, e também pode abrir um novo paradigma, permitindo que todos abram seus telefones para experimentar os recursos de modelos em grande escala, o que não é mais limitado à imaginação.

Atualmente, a Huawei anunciou o plano de teste Xiaoyi:

O novíssimo Xiaoyi será convidado para testes no final de agosto deste ano e será atualizado por OTA em alguns modelos equipados com HarmonyOS 4.0 e superior posteriormente. O plano de atualização específico será anunciado posteriormente.

Se você está interessado em calçados infantis, pode vir e dar uma olhada~

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

1 gostos

Recompensa
1
Comentar
Republicar
Partilhar

Comentar

0/400

Nenhum comentário

Tópico
#Gate & WLFI USD1 Points Program
61k Popularidade
#Trump Allows 401(k) Crypto Investing
36k Popularidade
#Join Copy Trading Share to Win $2,000
29k Popularidade
#Show My Alpha Points
77k Popularidade
#SOL Futures Reach New High
22k Popularidade

Pino