Fonte da imagem: Gerada pela ferramenta Unbounded AI
Depois de deixar o JD.com, Zhou Bowen não ficava tão animado há muito tempo.
O ChatGPT acabou por agitar o mundo, como um trovão de primavera despertou praticantes de todas as esferas da vida, para que todos ouvissem os passos da AGI entrando na realidade.
Sob o aumento, as pessoas viram Wang Huiwen e Wang Xiaochuan abrirem seus próprios negócios e também viram Baidu e Alibaba dominando o mercado. Zhou Bowen, como ex-reitor do AI Research Institute da IBM e JD.com, estudou a teoria básica da inteligência artificial e tecnologias de ponta, aplicações e industrialização por mais de 25 anos. Ele fundou a Lianyuan Technology como no início de 2021. O modelo, com IA generativa, diálogo em várias rodadas e tecnologia de colaboração humano-computador, ajuda empresas e consumidores a concluir a inovação de produtos e a transformação da inteligência digital na nova era da inteligência artificial. “Não é tanto que eu decidi começar um negócio neste campo, é melhor dizer que este negócio me encontrou.” Zhou Bowen descreveu isso como algo que deve ser feito, como se um senso de missão o incitasse a agir.
Zhou Bowen se formou na Universidade de Ciência e Tecnologia da China e depois foi para a Universidade do Colorado em Boulder para obter um doutorado. Como ex-presidente do instituto de pesquisa básica de inteligência artificial da sede da IBM Research nos EUA, ele retornou à China depois de presidir o trabalho relacionado à IA por muitos anos e atuou sucessivamente como vice-presidente sênior do JD Group, presidente do comitê técnico do grupo, presidente do JD Cloud and AI, e presidente fundador do JD Artificial Intelligence Research Institute e outros cargos. Como fundador da JD AI, ele é responsável pela pesquisa técnica e desenvolvimento de negócios da JD AI. Ele estabeleceu a JD AI Division, AI Research Institute e JD AI Accelerator de 0 para criar uma plataforma aberta nacional para inteligência artificial da cadeia de suprimentos inteligente , percebendo o volume diário de chamadas de 0 a dezenas de bilhões, liderou a reconstrução técnica do atendimento ao cliente de inteligência artificial de Jingdong e lançou a produtização externa, gerenciou bilhões de negócios de serviços técnicos e milhares de equipes integradas de tecnologia, produto, marketing e vendas.
Em 2021, Zhou Bowen previu que a IA generativa explodiria em um futuro próximo e decidiu deixar a JD.com para fundar a Lianyuan Technology, que está empenhada em ajudar empresas verticais a realizar inovação de produtos e transformação digital com recursos gerais de modelo em larga escala, e reformular com o valor AI Commodity; em 2022, ele atuará como professor da cátedra Huiyan da Universidade de Tsinghua e professor titular do Departamento de Engenharia Eletrônica e, em maio do mesmo ano, estabelecerá o Centro de Pesquisa de Inteligência Interativa Colaborativa da Universidade de Tsinghua. Coincidentemente. **
O ChatGPT está prestes a chegar, e Zhou Bowen também postou em Moments: “Acredito que a OpenAI da China precisa explorar um novo caminho!” Sob o orgulho, ele está ansioso para buscar talentos. Mas, diferente de outros empreendedores, Zhou Bowen e Lianyuan Technology optaram por confiar em dezenas de bilhões de parâmetros e métodos de treinamento exclusivos para tornar o grande modelo melhor na compreensão da relação entre pessoas e mercadorias com base em capacidades gerais. A tecnologia inteligente ajuda as empresas a reconstruir o sistema de inovação de link completo, desde percepção do produto, posicionamento, design, P&D até marketing.
Zhou Bowen declarou uma vez em público que sua direção empresarial é assumir a liderança na integração de inteligência artificial com indústrias tradicionais para agregar maior valor à inovação de inteligência digital corporativa, ou seja, alcançar um avanço na capacidade de grandes modelos gerais em cenários verticais.
Recentemente, um repórter da AI Technology Review teve uma conversa com Zhou Bowen. A seguir está a transcrição da conversa. A AI Technology Review editou o conteúdo sem alterar seu significado original:
Deixe a IA aprender a sabedoria humana, um novo paradigma de interação e colaboração
**Revisão da Tecnologia AI: O ChatGPT trouxe esse método de interação, o que você acha que é diferente do método de interação anterior? **
Zhou Bowen: Uma das minhas linhas de pesquisa é a interação entre IA e pessoas, e o aprendizado na interação. A interação humano-computador é diferente do diálogo humano-computador. Por meio da interação humano-computador, a IA pode aprender coisas no processo, portanto, esta não é uma tarefa simples de executar, mas um meio para alcançar o aprendizado.
Conforme registrado em "Os Analectos de Confúcio", é a história de Confúcio e seus setenta e dois discípulos aprendendo por meio da interação. No Ocidente, semelhante à Academia de Atenas de Platão e Aristóteles, a herança do conhecimento e da sabedoria mais antigos é realizada por meio do diálogo entre as pessoas, e os professores ajudam os alunos a concluir melhor seus estudos por meio da interação com os alunos.
Por exemplo, se o professor pede aos alunos para derramar um copo d'água, essas ações simples de "execução de comando" são difíceis de aumentar a sabedoria; Como superar as dificuldades, essa é a interação que pode aumentar a sabedoria e também reflete meu núcleo ponto de vista sobre a interação colaborativa entre humanos e IA.
A essência da IA é a colaboração e a interação com os humanos. Ela aprende continuamente com as interações e, então, coopera com os humanos para resolver melhor os problemas. Esse ponto de vista se tornará cada vez mais importante em um futuro próximo e, ao mesmo tempo, enfrentará mais desafios técnicos e éticos.No final, não será fácil manter o resultado final. Como o AI Alignment que todo mundo diz, os humanos podem passar sua vontade para a AI e, em seguida, dividir as tarefas com AI, permitindo que a AI aprenda e realize a vontade humana no processo. Esta é uma nova forma de colaboração, ou seja, inteligência interativa colaborativa.
**Análise de tecnologia de IA: você acha que alcançar o alinhamento de valores por meio da interação é uma maneira eficaz de o cérebro humano e o GPT colaborarem? Como os humanos e a IA devem trabalhar melhor juntos? **
**Zhou Bowen: **Após a explosão da IA generativa, a IA que aprende por meio da interação colaborativa com humanos se tornará cada vez mais forte.
Daniel Kahneman, ganhador do Prêmio Nobel de Economia em 2002, propôs em seu best-seller Thinking Fast And Slow que existem dois modos de pensamento humano - sistema 1 e sistema 2, e o sistema 1 é rápido. O Sistema 2 é um pensamento lento, que requer muito raciocínio e cálculo.
Inicialmente, as pessoas pensaram que a IA era mais adequada para o trabalho do "sistema 1", como reconhecimento facial e inspeção de qualidade, que se baseavam no reconhecimento de padrões do "sistema 1". Mas insisto que o valor real da IA está no 2, que é ajudar os humanos a concluir melhor tarefas complexas de raciocínio lógico. O surgimento do ChatGPT verificou a viabilidade da IA como Sistema 2, o que significa que a IA pode descobrir novos conhecimentos, e a descoberta de novos conhecimentos ajudará os humanos a projetar uma IA melhor, como ciência do cérebro e descoberta de otimização de computação e surge um volante para criar novos conhecimentos. O efeito volante significa que a IA pode permitir que todo o sistema descubra melhor novos conhecimentos, e esse novo conhecimento pode ajudar a projetar melhores sistemas de IA, formando assim um círculo virtuoso. Portanto, uma relação de reforço mútuo foi formada entre IA, conhecimento e inovação, o que exige que a forma como a IA e os humanos colaboram seja transformada.
Eu propus uma direção de pesquisa "3 + 1" antes, ou seja, usar IA confiável como base de pesquisa e meta de longo prazo, para focar na interação de representação multimodal, interpretação colaborativa humano-computador e evolução colaborativa ambiental. O núcleo é ser humano A colaboração e a cocriação de máquinas podem realizar o objetivo dos seres humanos ajudarem a IA a inovar e a IA ajudar os seres humanos a inovar.
Uma delas é a interação de representação multimodal, onde pode haver uma grande teoria unificada. Em 2022, as pessoas ainda estão céticas sobre isso, mas com o advento do GPT-4, essa interação de representação unificada multimodal tornou-se mais convincente; Outro ponto é a interação colaborativa humano-computador. As pessoas também estavam céticas sobre isso em 2022, mas agora esse método de interação tornou-se mais confiável e as pessoas começaram a acreditar que é provável que isso aconteça; O terceiro ponto é a coevolução da IA e do meio ambiente, Este significa que a IA não só precisa cooperar com os humanos, mas também deve se adaptar ao ambiente circundante. Propusemos esse conceito pela primeira vez no início de 2022 e até agora não vimos nenhum caso de sucesso nessa direção, nem mesmo o OpenAI.
Se você não pode aprender OpenAI, mas não pode fazer Microsoft, você precisa subtrair para startups domésticas de grande escala
**Revisão da tecnologia AI: A característica especial do modelo Transformer é que ele usa um mecanismo de atenção (Atenção) para modelar o texto. Percebemos que você realizou pesquisas relacionadas ao mecanismo de atenção AI muito cedo. **
**Zhou Bowen:**Os principais destaques do Transformer são o mecanismo de auto-atenção e o mecanismo de várias cabeças. Em junho de 2017, "Atenção é tudo que você precisa", publicado pelo Google Brain, introduziu o conceito de mecanismo de auto-atenção (auto-atenção) e Transformer. Mais tarde, o GPT da OpenAI também foi profundamente influenciado por este artigo.
Antes disso, publiquei o primeiro artigo como autor correspondente para introduzir um mecanismo de auto-atenção multi-hop para melhorar o codificador - "A Structured Self-Attentive Sentence Embedding". Este artigo foi concluído e carregado no arXiv em 2016 e foi publicado oficialmente no ICLR no início de 2017. Também somos a primeira equipe a propor esse mecanismo e, mais importante, este é o primeiro modelo de representação de linguagem natural que não considera tarefas downstream de forma alguma. Todo mundo já usou atenção ou auto-atenção em alguns casos antes, mas todos dependem da tarefa.
**Revisão de tecnologia de IA: neste artigo, o que você encontrou? Como essas descobertas afetaram as mudanças subsequentes na tecnologia do Transformer? **
Zhou Bowen: Propusemos no artigo que o melhor método de representação é usar a autoatenção estruturada para representar a linguagem natural (PNL). Este artigo foi citado mais de 2.300 vezes desde sua publicação.
Antes disso, Ilya Sutskever, cientista-chefe da OpenAI, acreditava que o melhor método de representação era "sequence-to-sequence (Seq2Seq)", ou seja, treinar o modelo para converter a sequência de um domínio na sequência de outro domínio , como o idioma de origem correspondente na tradução automática e o idioma de destino; ou em resposta a perguntas, em que a pergunta é uma sequência e a resposta é uma sequência. Com base nisso, a relação de mapeamento entre os dois representados pela rede neural profunda é aprendida.
Mais tarde, porém, a equipe do especialista em aprendizado profundo e vencedor do Turing Award, Yoshua Bengio, propôs um "mecanismo de atenção", cujo núcleo é que nem todas as palavras são igualmente importantes ao responder a perguntas; identificando as partes mais críticas e, em seguida, prestando mais atenção a esta parte, você pode dar uma resposta melhor. Esse modelo de atenção rapidamente ganhou ampla aceitação. Em 2015, liderei a equipe da IBM para iniciar a pesquisa com base na arquitetura e nas ideias de "Seq2Seq+Attention Mechanism" ao mesmo tempo e, sucessivamente, lancei vários primeiros modelos generativos para escrita de IA em linguagem natural. Documentos relacionados também foram citados mais de 3000 vezes.
Mas não fiquei satisfeito com o conteúdo do papel na época, porque havia um problema nele, ou seja, a atenção era construída a partir da resposta. A IA treinada dessa maneira é como um aluno que pede ao professor para marcar os pontos-chave antes do exame final da universidade e, em seguida, revisa os pontos-chave com atenção direcionada. Desta forma, embora o desempenho da IA em problemas específicos possa ser melhorado, não é universal. Portanto, propusemos que não dependa da tarefa e da saída fornecidas, e apenas com base na estrutura interna da linguagem natural de entrada, por meio de leituras múltiplas da IA para aprender quais partes são mais importantes e a relação entre elas, isso é auto-atenção mais Representação Aprendizagem para Mecanismos Multi-Head. Este tipo de mecanismo de aprendizagem olha apenas para a entrada, mais como os alunos estudam e entendem o curso várias vezes e sistematicamente antes do exame, em vez de aprender de forma segmentada e fragmentada com base nos pontos-chave do exame, que está mais próximo do propósito de inteligência artificial geral e capacidade de aprendizado muito aprimorada da IA.
**Revisão de tecnologia de IA: qual é a relação entre o artigo "Atenção é tudo o que você precisa" e você? **
Zhou Bowen: Sabemos que todos os grandes modelos desta onda vêm do Transformer, então quando você vê um T no modelo, então o T provavelmente representa o Transformer. Sinto-me muito honrado por ter feito algum trabalho voltado para o futuro nesta área. No final de 2017, pesquisadores do Google publicaram "Atenção é tudo o que você precisa", um marco que trouxe o modelo Transformer para o mundo. E nosso artigo "A Structured Self-attentive Sentence Embedding", que propôs pela primeira vez um "mecanismo de auto-atenção multi-hop" publicado no início de 2017, foi citado. E o primeiro autor deste artigo, Ashish Vaswani, foi um aluno de quem fui mentor na IBM. O título do artigo "Atenção é tudo que você precisa" também expressa o significado de "auto-atenção é muito importante, multi-head é muito importante, mas RNN pode não ser tão importante quanto pensávamos antes" proposto por nós.
**Análise de tecnologia de IA: que julgamentos técnicos consistentes você e a OpenAI têm? **
**Zhou Bowen: Este artigo e a arquitetura do Transformer mudaram tudo completamente e resolveram o problema de memória de longa distância do modelo. Ilya Sutskever lembrou em uma entrevista recente que o OpenAI mudou completamente para a arquitetura Transformer no dia seguinte à publicação do artigo. **
Sabemos que o GPT é muito diferente do modelo de Bert, e a razão pela qual Bert foi muito bem-sucedido no início, mas não tão bom quanto o GPT depois, é que ele usa informações da esquerda para a direita e da direita para a esquerda. Em outras palavras, Bert usa informações futuras para ajudar a IA a aprender como representar, enquanto GPT insiste em prever qual será a próxima palavra com base apenas em informações passadas. **A abordagem da OpenAI neste ponto está alinhada com o pensamento da nossa equipe, ou seja: tente não usar as respostas para aprender. **Da atenção à auto-atenção, do BERT ao GPT-3, a ideia central é quando você não depende mais de informações futuras, como a saída ou o contexto da palavra a ser prevista, ou quando mais dados podem ser usados para totalmente Ao treinar modelos de IA, começamos a ver a possibilidade de AGI.
Além disso, a OpenAI acredita que os modelos grandes aprendem o conhecimento do mundo por meio da linguagem natural, comprimindo o conhecimento do mundo em modelos grandes. Os modelos grandes da série GPT e o ChatGPT também são promovidos de acordo com esse conceito. O mesmo vale para o conceito e a visão minha e da minha equipe, ou seja, construir um modelo de larga escala de uso geral e permitir que ele exerça maior valor e capacidade no campo vertical por meio de treinamento profissional e integre consumidores ' emoções complexas, necessidades e experiências, bem como inovação de produto, design, parâmetros de produto, materiais, funções, etc., são compactados em um grande modelo para reconstruir a relação binária entre pessoas e produtos e usar IA para remodelar o valor de produtos.
**Análise da tecnologia de IA: além da força técnica, que outros aspectos da OpenAI fazem você pensar que há méritos? **
Zhou Bowen: Não apenas em termos de julgamentos técnicos, toda a abordagem de negócios da OpenAI é representativa, incluindo: o estabelecimento do ecossistema, o anúncio da nova Lei de Moore, a redução dos preços da API em 90%, etc. Expandir o espaço de imaginação do capital e dos usuários para a aplicação comercial de grandes modelos e deriva cenários de aplicação quase ilimitados. Além disso, os planos da OpenAI para governança ética, desenvolvimento de negócios, tecnologia ecológica e desenvolvimento futuro também são muito claros.
**Análise de tecnologia de IA: a próxima OpenAI aparecerá na China? **
**Zhou Bowen:**A dificuldade técnica de construir um modelo grande está além da imaginação de muitos empresários chineses. Portanto, não recomendo que as empresas nacionais sigam e copiem cegamente o modelo "OpenAI+Microsoft", porque a maioria das empresas de tecnologia chinesas na China não são tão boas na tomada de decisões de negócios quanto a Microsoft e seu julgamento de tecnologia não é tão bom quanto o OpenAI . **
O sucesso da OpenAI é o resultado de muitos fatores. Por exemplo, Ilya Sutskever fez julgamentos técnicos, Greg Brockman fez funções e Sam Altman integrou recursos, incluindo pesquisas sobre o impacto da IA na ética e na sociedade. Se as empresas domésticas simplesmente imitarem o OpenAI, a distância entre elas ficará cada vez mais distante.
O julgamento técnico da OpenAI pode ser visto a partir da latitude dos dados, porque nem todos os dados do mundo são igualmente importantes. Por que a OpenAI escolheu usar a linguagem de programação do Github para treinar a cadeia de pensamento? Como a semântica e a sintaxe da linguagem de programação são extremamente simples, a lógica do processo de execução é rigorosa. Isso também representa uma característica e vantagem do OpenAI: ele não atacará cegamente. Portanto, acho que o desenvolvimento da IA da China precisa encontrar outro caminho, ou seja, contar com a capacidade de grandes modelos gerais para começar a partir da aplicação de cenários verticais, com maior probabilidade de sucesso.
A IA generativa interromperá a experiência existente do consumidor
**Revisão de tecnologia de IA: por que você está visando o setor de consumo? **
Zhou Bowen: Quando eu estava na JD.com, vi uma grande oportunidade de negócios de "combinar dinamicamente a demanda do consumidor e o design do produto com inteligência artificial". Em 2021, decidi deixar meu emprego e abrir um negócio para desenvolver um modelo geral de linguagem grande para indústrias verticais (o modelo de linguagem grande não havia explodido na época), esperando cobrir todos os comportamentos do consumidor de cenários não específicos. Sabemos que as cenas de tempo e espaço são diferentes de segunda a sexta-feira, e o foco dos trabalhadores de colarinho branco ou outras ocupações também é diferente. Por trás desses símbolos culturais que afetam o comportamento de compra estão emoções complexas, experiências e escolhas de produtos dos consumidores. Logicamente , esta é exatamente a informação valiosa que as empresas precisam. Ao fazer produtos do lado da oferta, inclui criatividade, design, parâmetros do produto, funções, materiais e posicionamento da marca, slogan, marketing, publicidade, marketing, imagens promocionais etc.
Este tipo de relacionamento correspondente nunca foi passado por seres humanos antes. Os profissionais de planejamento, marketing e vendas só entendem os links pelos quais são responsáveis. E vamos fazer o primeiro modelo de uso geral em grande escala da cadeia de suprimentos de commodities, ou seja, comprimir todas essas informações em um modelo de uso geral com alta fidelidade e com base nesse modelo de grande escala para capacitar todo o ciclo de vida dos produtos corporativos, incluindo: Insight de oportunidades (Descoberta), definição de produto (Definir), design de programa (Design), direcionar P&D (Desenvolver), transformação de marketing (Distribuir). Dessa forma, as empresas podem descobrir oportunidades de inovação com mais eficiência, projetar e produzir de forma mais criativa, realizar promoções de marketing, alcançar usuários e concluir a transformação com mais eficiência.
**Revisão da Tecnologia AI: Em termos de modelo de negócios, isso parece ser mais avançado. **
Zhou Bowen: Para qualquer equipe empreendedora, é muito importante ser capaz de cultivar mais capacidades profissionais depois de ter as capacidades técnicas gerais de grandes modelos. Atualmente, o avanço do GPT está principalmente em sua capacidade geral, mas seu valor para indústrias específicas e campos verticais ainda não foi desenvolvido. Por exemplo: GPT pode desenhar pinturas artísticas muito realistas, mas não pode desenhar diagramas de circuitos, porque não não tem conhecimento suficiente de conhecimento físico. Julgamentos profundos e relevantes não são profissionais o suficiente.
Portanto, acho que existe a necessidade de tal ferramenta (um modelo grande de uso geral com recursos profissionais) para tornar mais fácil para os consumidores encontrar e estar mais dispostos a comprar os produtos de que precisam, o que pode mudar completamente os caminhos de compra existentes das pessoas . A IA generativa pode compactar grandes quantidades de informações de negócios em modelos tão grandes, de modo a aprender todos os aspectos da cadeia de suprimentos de commodities e melhorar a eficiência dos principais links centrados nos consumidores. Essa é a ideia e a criatividade que já foi gerada em 2021.
**A Lianyuan Technology está desenvolvendo um grande modelo com capacidades gerais. Este grande modelo possui experiência em vincular produtos e consumidores. **Temos 37 indicadores de avaliação de modelos em larga escala, sendo 2/3 deles capacidades de uso geral, como capacidade de raciocínio e capacidade de computação, e mais de uma dezena de itens são especialmente aplicados à conexão entre produtos e consumidores, de modo a perceba o objetivo "deixe todo produto nascer da necessidade, deixe cada consumidor conseguir o que deseja".
**Análise de tecnologia de IA: como a IA generativa pode se integrar melhor a cenários de consumo, como comércio eletrônico? **
**Zhou Bowen:**Os humanos podem entender apenas a lógica de negócios do planejamento ou a lógica do marketing, mas a IA pode abrir todas as cadeias de negócios.
Os consumidores precisam de muito vocabulário profissional para encontrar os produtos que desejam em cenários como plataformas de comércio eletrônico; mas, por outro lado, os comerciantes não entendem as reais necessidades dos consumidores e só conseguem chegar aos consumidores por meio de transações de comércio eletrônico, por meio de consultoria instituições de pesquisa para entender melhor os consumidores. Depois de introduzir uma função de diálogo multi-round como o ProductGPT, a eficiência de correspondência dinâmica de comerciantes e consumidores em produtos será mais eficiente do que a pesquisa de mercado, para que as plataformas de comércio eletrônico possam participar mais profundamente da inovação, design, pesquisa e desenvolvimento de produtos e marketing. promoção etc.
Na sociedade comercial atual, existe uma forte correspondência entre o lado da demanda e o lado da oferta. Nossa plataforma de inovação colaborativa líder autodesenvolvida SaaS é baseada na compreensão multimodal, raciocínio e recursos de geração de grandes modelos e ajuda as empresas a descobrir oportunidades de negócios e inovação de produtos por meio de insights profundos sobre consumidores, cenários, produtos, referências de produtos e P&D . Ao mesmo tempo, a plataforma de diálogo multi-rodada ProductGPT da Lianyuan Technology fornece a cada funcionário da empresa um assistente pessoal profundamente personalizado de acordo com diferentes funções profissionais e atende às suas necessidades específicas de trabalho, fornecendo habilidades e conhecimentos específicos da função. Por exemplo, o assistente pessoal de pesquisa do consumidor da Lianyuan Technology fornecerá habilidades profissionais e conhecimento relevante, como pesquisa de tendências de mercado, compreensão das necessidades do consumidor e pesquisa de mercado.
**Análise de tecnologia de IA: você usou IA generativa para ganhar dinheiro no JD.com, como fez isso? **
**Zhou Bowen:**Em 2019, liderei a equipe de IA da JD.com para aplicar inteligência artificial generativa para criar direitos autorais de produtos e selecionar fotos. Esse também é o primeiro modelo generativo em grande escala da JD.com. Naquela época, nosso modelo de IA realizava principalmente três coisas:
Primeiro, você pode ler o conteúdo da página de detalhes do produto sozinho e gerar diretamente de 8 a 9 pontos de venda desse produto por meio de análise;
Em segundo lugar, quando um consumidor navega em um determinado produto, o grande modelo descobrirá rapidamente quais pontos de venda podem impressionar mais o usuário, analisando os dados de comportamento de diferentes consumidores;
Em terceiro lugar, a AIGC gerará slogans exclusivos em torno dos pontos de venda que mais preocupam os consumidores, com base nos retratos dos usuários.
Após um período de implementação, a taxa de conversão das recomendações de produtos aumentou 30% em relação a antes. Os consumidores podem não perceber que, quando pesquisam e compram no JD.com, as categorias e descrições de produtos que veem são geradas automaticamente pelo AIGC, palavra por palavra, de acordo com as preferências do usuário e os pontos de venda dos produtos no momento em que ele navega pelos produtos .
**Análise de tecnologia de IA: o que você acha da API aberta da OpenAI e o que ela significa para o setor? **
Zhou Bowen: Falando por experiência própria, eu costumava ser o cientista-chefe do IBM Watson Group. Naquela época, os dados de algumas indústrias nos Estados Unidos eram regulamentados e essas empresas geralmente não podiam cooperar e só podiam implantar nuvens privadas. Por esta razão, em 2015-2016, eu estava determinado a ser uma nuvem pública. Para conseguir isso, é necessário APIizar os recursos de IA do Watson. Naquela época, liderei o lançamento de dezenas de APIs, incluindo diálogo e compreensão de linguagem natural. Coloque essas APIs na plataforma de nuvem e agora o negócio de IA da IBM ganha principalmente dinheiro com isso.
Voltei para a China no final de 2017 e, em abril de 2018, lancei a plataforma aberta de inteligência artificial da JD.com. Naquela época, basicamente não havia plataforma de IA na China, o que também trouxe uma receita considerável para o JD.com. Em 2019, a equipe de IA do JD.com liderada por mim gerou 170 milhões de yuans em receita, o que não é ruim para uma equipe de 200 pessoas.
**Análise de tecnologia de IA: há uma percepção na indústria de que o risco de fazer um modelo grande vertical é muito alto. O que você acha? **
Zhou Bowen: Acho que, no futuro, esses fluxos de trabalho bem definidos e de alto valor serão concluídos por modelos profissionais de IA, em vez de modelos gerais de IA. É fácil melhorar ainda mais os recursos básicos de um modelo grande de propósito geral depois que uma certa cena vertical é concluída com sucesso. Além disso, se começarmos a partir de um cenário vertical, nosso acúmulo anterior em termos de poder computacional, dados e algoritmos poderá ser mais plenamente utilizado. Portanto, na tecnologia Lianyuan, o modelo grande deve ter os recursos básicos da tecnologia geral de modelos grandes na estrutura subjacente da tecnologia e deve ser avaliado com métodos científicos, mas também requer treinamento profissional.
Em 2023, devido à repentina popularidade do ChatGPT, o mercado começou a usar AI 2.0 para descrever seu enorme potencial. Além disso, quase todos os gigantes da tecnologia entraram na batalha, o mercado de capital de risco está tentando aproveitar novas oportunidades e o ambiente de mercado também está mudando rapidamente. O GPT é uma oportunidade empreendedora sistemática, mas apenas copiar, seguir e atualizar é arriscado e difícil.
Depois de fundar a Lianyuan Technology, nos comunicamos com mais de 100 clientes, vimos as necessidades reais e melhoramos o caminho de realização da tecnologia otimizando continuamente o grande modelo: "Em 2022, demonstramos o valor comercial e a viabilidade técnica desse cenário. Isso significa que mesmo que estejamos fazendo um modelo grande, estamos em um caminho diferente do OpenAI, e o modelo de lucro também é diferente.
O que eu quero fazer é um compressor de conhecimento de mundo melhor do que o GPT atual, que requer dados muito interativos, e os dados obviamente estão intimamente relacionados à cena. Quanto a que tipo de dados tem o significado de inteligência humana superior, na verdade há muito trabalho teórico a ser feito e é uma direção que vale a pena explorar no futuro.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
Diálogo 丨Bowen Zhou: Como o modelo geral de grande escala rompe os cenários verticais da indústria?
Autor: Wang Yongang Editor: Dong Zibo
**Fonte:**Análise de tecnologia de IA
Depois de deixar o JD.com, Zhou Bowen não ficava tão animado há muito tempo.
O ChatGPT acabou por agitar o mundo, como um trovão de primavera despertou praticantes de todas as esferas da vida, para que todos ouvissem os passos da AGI entrando na realidade.
Sob o aumento, as pessoas viram Wang Huiwen e Wang Xiaochuan abrirem seus próprios negócios e também viram Baidu e Alibaba dominando o mercado. Zhou Bowen, como ex-reitor do AI Research Institute da IBM e JD.com, estudou a teoria básica da inteligência artificial e tecnologias de ponta, aplicações e industrialização por mais de 25 anos. Ele fundou a Lianyuan Technology como no início de 2021. O modelo, com IA generativa, diálogo em várias rodadas e tecnologia de colaboração humano-computador, ajuda empresas e consumidores a concluir a inovação de produtos e a transformação da inteligência digital na nova era da inteligência artificial. “Não é tanto que eu decidi começar um negócio neste campo, é melhor dizer que este negócio me encontrou.” Zhou Bowen descreveu isso como algo que deve ser feito, como se um senso de missão o incitasse a agir.
Zhou Bowen se formou na Universidade de Ciência e Tecnologia da China e depois foi para a Universidade do Colorado em Boulder para obter um doutorado. Como ex-presidente do instituto de pesquisa básica de inteligência artificial da sede da IBM Research nos EUA, ele retornou à China depois de presidir o trabalho relacionado à IA por muitos anos e atuou sucessivamente como vice-presidente sênior do JD Group, presidente do comitê técnico do grupo, presidente do JD Cloud and AI, e presidente fundador do JD Artificial Intelligence Research Institute e outros cargos. Como fundador da JD AI, ele é responsável pela pesquisa técnica e desenvolvimento de negócios da JD AI. Ele estabeleceu a JD AI Division, AI Research Institute e JD AI Accelerator de 0 para criar uma plataforma aberta nacional para inteligência artificial da cadeia de suprimentos inteligente , percebendo o volume diário de chamadas de 0 a dezenas de bilhões, liderou a reconstrução técnica do atendimento ao cliente de inteligência artificial de Jingdong e lançou a produtização externa, gerenciou bilhões de negócios de serviços técnicos e milhares de equipes integradas de tecnologia, produto, marketing e vendas.
Em 2021, Zhou Bowen previu que a IA generativa explodiria em um futuro próximo e decidiu deixar a JD.com para fundar a Lianyuan Technology, que está empenhada em ajudar empresas verticais a realizar inovação de produtos e transformação digital com recursos gerais de modelo em larga escala, e reformular com o valor AI Commodity; em 2022, ele atuará como professor da cátedra Huiyan da Universidade de Tsinghua e professor titular do Departamento de Engenharia Eletrônica e, em maio do mesmo ano, estabelecerá o Centro de Pesquisa de Inteligência Interativa Colaborativa da Universidade de Tsinghua. Coincidentemente. **
O ChatGPT está prestes a chegar, e Zhou Bowen também postou em Moments: “Acredito que a OpenAI da China precisa explorar um novo caminho!” Sob o orgulho, ele está ansioso para buscar talentos. Mas, diferente de outros empreendedores, Zhou Bowen e Lianyuan Technology optaram por confiar em dezenas de bilhões de parâmetros e métodos de treinamento exclusivos para tornar o grande modelo melhor na compreensão da relação entre pessoas e mercadorias com base em capacidades gerais. A tecnologia inteligente ajuda as empresas a reconstruir o sistema de inovação de link completo, desde percepção do produto, posicionamento, design, P&D até marketing.
Zhou Bowen declarou uma vez em público que sua direção empresarial é assumir a liderança na integração de inteligência artificial com indústrias tradicionais para agregar maior valor à inovação de inteligência digital corporativa, ou seja, alcançar um avanço na capacidade de grandes modelos gerais em cenários verticais.
Recentemente, um repórter da AI Technology Review teve uma conversa com Zhou Bowen. A seguir está a transcrição da conversa. A AI Technology Review editou o conteúdo sem alterar seu significado original:
Deixe a IA aprender a sabedoria humana, um novo paradigma de interação e colaboração
**Revisão da Tecnologia AI: O ChatGPT trouxe esse método de interação, o que você acha que é diferente do método de interação anterior? **
Zhou Bowen: Uma das minhas linhas de pesquisa é a interação entre IA e pessoas, e o aprendizado na interação. A interação humano-computador é diferente do diálogo humano-computador. Por meio da interação humano-computador, a IA pode aprender coisas no processo, portanto, esta não é uma tarefa simples de executar, mas um meio para alcançar o aprendizado.
Conforme registrado em "Os Analectos de Confúcio", é a história de Confúcio e seus setenta e dois discípulos aprendendo por meio da interação. No Ocidente, semelhante à Academia de Atenas de Platão e Aristóteles, a herança do conhecimento e da sabedoria mais antigos é realizada por meio do diálogo entre as pessoas, e os professores ajudam os alunos a concluir melhor seus estudos por meio da interação com os alunos.
Por exemplo, se o professor pede aos alunos para derramar um copo d'água, essas ações simples de "execução de comando" são difíceis de aumentar a sabedoria; Como superar as dificuldades, essa é a interação que pode aumentar a sabedoria e também reflete meu núcleo ponto de vista sobre a interação colaborativa entre humanos e IA.
A essência da IA é a colaboração e a interação com os humanos. Ela aprende continuamente com as interações e, então, coopera com os humanos para resolver melhor os problemas. Esse ponto de vista se tornará cada vez mais importante em um futuro próximo e, ao mesmo tempo, enfrentará mais desafios técnicos e éticos.No final, não será fácil manter o resultado final. Como o AI Alignment que todo mundo diz, os humanos podem passar sua vontade para a AI e, em seguida, dividir as tarefas com AI, permitindo que a AI aprenda e realize a vontade humana no processo. Esta é uma nova forma de colaboração, ou seja, inteligência interativa colaborativa.
**Análise de tecnologia de IA: você acha que alcançar o alinhamento de valores por meio da interação é uma maneira eficaz de o cérebro humano e o GPT colaborarem? Como os humanos e a IA devem trabalhar melhor juntos? **
**Zhou Bowen: **Após a explosão da IA generativa, a IA que aprende por meio da interação colaborativa com humanos se tornará cada vez mais forte.
Daniel Kahneman, ganhador do Prêmio Nobel de Economia em 2002, propôs em seu best-seller Thinking Fast And Slow que existem dois modos de pensamento humano - sistema 1 e sistema 2, e o sistema 1 é rápido. O Sistema 2 é um pensamento lento, que requer muito raciocínio e cálculo.
Inicialmente, as pessoas pensaram que a IA era mais adequada para o trabalho do "sistema 1", como reconhecimento facial e inspeção de qualidade, que se baseavam no reconhecimento de padrões do "sistema 1". Mas insisto que o valor real da IA está no 2, que é ajudar os humanos a concluir melhor tarefas complexas de raciocínio lógico. O surgimento do ChatGPT verificou a viabilidade da IA como Sistema 2, o que significa que a IA pode descobrir novos conhecimentos, e a descoberta de novos conhecimentos ajudará os humanos a projetar uma IA melhor, como ciência do cérebro e descoberta de otimização de computação e surge um volante para criar novos conhecimentos. O efeito volante significa que a IA pode permitir que todo o sistema descubra melhor novos conhecimentos, e esse novo conhecimento pode ajudar a projetar melhores sistemas de IA, formando assim um círculo virtuoso. Portanto, uma relação de reforço mútuo foi formada entre IA, conhecimento e inovação, o que exige que a forma como a IA e os humanos colaboram seja transformada.
Eu propus uma direção de pesquisa "3 + 1" antes, ou seja, usar IA confiável como base de pesquisa e meta de longo prazo, para focar na interação de representação multimodal, interpretação colaborativa humano-computador e evolução colaborativa ambiental. O núcleo é ser humano A colaboração e a cocriação de máquinas podem realizar o objetivo dos seres humanos ajudarem a IA a inovar e a IA ajudar os seres humanos a inovar.
Uma delas é a interação de representação multimodal, onde pode haver uma grande teoria unificada. Em 2022, as pessoas ainda estão céticas sobre isso, mas com o advento do GPT-4, essa interação de representação unificada multimodal tornou-se mais convincente; Outro ponto é a interação colaborativa humano-computador. As pessoas também estavam céticas sobre isso em 2022, mas agora esse método de interação tornou-se mais confiável e as pessoas começaram a acreditar que é provável que isso aconteça; O terceiro ponto é a coevolução da IA e do meio ambiente, Este significa que a IA não só precisa cooperar com os humanos, mas também deve se adaptar ao ambiente circundante. Propusemos esse conceito pela primeira vez no início de 2022 e até agora não vimos nenhum caso de sucesso nessa direção, nem mesmo o OpenAI.
Se você não pode aprender OpenAI, mas não pode fazer Microsoft, você precisa subtrair para startups domésticas de grande escala
**Revisão da tecnologia AI: A característica especial do modelo Transformer é que ele usa um mecanismo de atenção (Atenção) para modelar o texto. Percebemos que você realizou pesquisas relacionadas ao mecanismo de atenção AI muito cedo. **
**Zhou Bowen:**Os principais destaques do Transformer são o mecanismo de auto-atenção e o mecanismo de várias cabeças. Em junho de 2017, "Atenção é tudo que você precisa", publicado pelo Google Brain, introduziu o conceito de mecanismo de auto-atenção (auto-atenção) e Transformer. Mais tarde, o GPT da OpenAI também foi profundamente influenciado por este artigo.
Antes disso, publiquei o primeiro artigo como autor correspondente para introduzir um mecanismo de auto-atenção multi-hop para melhorar o codificador - "A Structured Self-Attentive Sentence Embedding". Este artigo foi concluído e carregado no arXiv em 2016 e foi publicado oficialmente no ICLR no início de 2017. Também somos a primeira equipe a propor esse mecanismo e, mais importante, este é o primeiro modelo de representação de linguagem natural que não considera tarefas downstream de forma alguma. Todo mundo já usou atenção ou auto-atenção em alguns casos antes, mas todos dependem da tarefa.
**Revisão de tecnologia de IA: neste artigo, o que você encontrou? Como essas descobertas afetaram as mudanças subsequentes na tecnologia do Transformer? **
Zhou Bowen: Propusemos no artigo que o melhor método de representação é usar a autoatenção estruturada para representar a linguagem natural (PNL). Este artigo foi citado mais de 2.300 vezes desde sua publicação.
Antes disso, Ilya Sutskever, cientista-chefe da OpenAI, acreditava que o melhor método de representação era "sequence-to-sequence (Seq2Seq)", ou seja, treinar o modelo para converter a sequência de um domínio na sequência de outro domínio , como o idioma de origem correspondente na tradução automática e o idioma de destino; ou em resposta a perguntas, em que a pergunta é uma sequência e a resposta é uma sequência. Com base nisso, a relação de mapeamento entre os dois representados pela rede neural profunda é aprendida.
Mais tarde, porém, a equipe do especialista em aprendizado profundo e vencedor do Turing Award, Yoshua Bengio, propôs um "mecanismo de atenção", cujo núcleo é que nem todas as palavras são igualmente importantes ao responder a perguntas; identificando as partes mais críticas e, em seguida, prestando mais atenção a esta parte, você pode dar uma resposta melhor. Esse modelo de atenção rapidamente ganhou ampla aceitação. Em 2015, liderei a equipe da IBM para iniciar a pesquisa com base na arquitetura e nas ideias de "Seq2Seq+Attention Mechanism" ao mesmo tempo e, sucessivamente, lancei vários primeiros modelos generativos para escrita de IA em linguagem natural. Documentos relacionados também foram citados mais de 3000 vezes.
Mas não fiquei satisfeito com o conteúdo do papel na época, porque havia um problema nele, ou seja, a atenção era construída a partir da resposta. A IA treinada dessa maneira é como um aluno que pede ao professor para marcar os pontos-chave antes do exame final da universidade e, em seguida, revisa os pontos-chave com atenção direcionada. Desta forma, embora o desempenho da IA em problemas específicos possa ser melhorado, não é universal. Portanto, propusemos que não dependa da tarefa e da saída fornecidas, e apenas com base na estrutura interna da linguagem natural de entrada, por meio de leituras múltiplas da IA para aprender quais partes são mais importantes e a relação entre elas, isso é auto-atenção mais Representação Aprendizagem para Mecanismos Multi-Head. Este tipo de mecanismo de aprendizagem olha apenas para a entrada, mais como os alunos estudam e entendem o curso várias vezes e sistematicamente antes do exame, em vez de aprender de forma segmentada e fragmentada com base nos pontos-chave do exame, que está mais próximo do propósito de inteligência artificial geral e capacidade de aprendizado muito aprimorada da IA.
**Revisão de tecnologia de IA: qual é a relação entre o artigo "Atenção é tudo o que você precisa" e você? **
Zhou Bowen: Sabemos que todos os grandes modelos desta onda vêm do Transformer, então quando você vê um T no modelo, então o T provavelmente representa o Transformer. Sinto-me muito honrado por ter feito algum trabalho voltado para o futuro nesta área. No final de 2017, pesquisadores do Google publicaram "Atenção é tudo o que você precisa", um marco que trouxe o modelo Transformer para o mundo. E nosso artigo "A Structured Self-attentive Sentence Embedding", que propôs pela primeira vez um "mecanismo de auto-atenção multi-hop" publicado no início de 2017, foi citado. E o primeiro autor deste artigo, Ashish Vaswani, foi um aluno de quem fui mentor na IBM. O título do artigo "Atenção é tudo que você precisa" também expressa o significado de "auto-atenção é muito importante, multi-head é muito importante, mas RNN pode não ser tão importante quanto pensávamos antes" proposto por nós.
**Análise de tecnologia de IA: que julgamentos técnicos consistentes você e a OpenAI têm? **
**Zhou Bowen: Este artigo e a arquitetura do Transformer mudaram tudo completamente e resolveram o problema de memória de longa distância do modelo. Ilya Sutskever lembrou em uma entrevista recente que o OpenAI mudou completamente para a arquitetura Transformer no dia seguinte à publicação do artigo. **
Sabemos que o GPT é muito diferente do modelo de Bert, e a razão pela qual Bert foi muito bem-sucedido no início, mas não tão bom quanto o GPT depois, é que ele usa informações da esquerda para a direita e da direita para a esquerda. Em outras palavras, Bert usa informações futuras para ajudar a IA a aprender como representar, enquanto GPT insiste em prever qual será a próxima palavra com base apenas em informações passadas. **A abordagem da OpenAI neste ponto está alinhada com o pensamento da nossa equipe, ou seja: tente não usar as respostas para aprender. **Da atenção à auto-atenção, do BERT ao GPT-3, a ideia central é quando você não depende mais de informações futuras, como a saída ou o contexto da palavra a ser prevista, ou quando mais dados podem ser usados para totalmente Ao treinar modelos de IA, começamos a ver a possibilidade de AGI.
Além disso, a OpenAI acredita que os modelos grandes aprendem o conhecimento do mundo por meio da linguagem natural, comprimindo o conhecimento do mundo em modelos grandes. Os modelos grandes da série GPT e o ChatGPT também são promovidos de acordo com esse conceito. O mesmo vale para o conceito e a visão minha e da minha equipe, ou seja, construir um modelo de larga escala de uso geral e permitir que ele exerça maior valor e capacidade no campo vertical por meio de treinamento profissional e integre consumidores ' emoções complexas, necessidades e experiências, bem como inovação de produto, design, parâmetros de produto, materiais, funções, etc., são compactados em um grande modelo para reconstruir a relação binária entre pessoas e produtos e usar IA para remodelar o valor de produtos.
**Análise da tecnologia de IA: além da força técnica, que outros aspectos da OpenAI fazem você pensar que há méritos? **
Zhou Bowen: Não apenas em termos de julgamentos técnicos, toda a abordagem de negócios da OpenAI é representativa, incluindo: o estabelecimento do ecossistema, o anúncio da nova Lei de Moore, a redução dos preços da API em 90%, etc. Expandir o espaço de imaginação do capital e dos usuários para a aplicação comercial de grandes modelos e deriva cenários de aplicação quase ilimitados. Além disso, os planos da OpenAI para governança ética, desenvolvimento de negócios, tecnologia ecológica e desenvolvimento futuro também são muito claros.
**Análise de tecnologia de IA: a próxima OpenAI aparecerá na China? **
**Zhou Bowen:**A dificuldade técnica de construir um modelo grande está além da imaginação de muitos empresários chineses. Portanto, não recomendo que as empresas nacionais sigam e copiem cegamente o modelo "OpenAI+Microsoft", porque a maioria das empresas de tecnologia chinesas na China não são tão boas na tomada de decisões de negócios quanto a Microsoft e seu julgamento de tecnologia não é tão bom quanto o OpenAI . **
O sucesso da OpenAI é o resultado de muitos fatores. Por exemplo, Ilya Sutskever fez julgamentos técnicos, Greg Brockman fez funções e Sam Altman integrou recursos, incluindo pesquisas sobre o impacto da IA na ética e na sociedade. Se as empresas domésticas simplesmente imitarem o OpenAI, a distância entre elas ficará cada vez mais distante.
O julgamento técnico da OpenAI pode ser visto a partir da latitude dos dados, porque nem todos os dados do mundo são igualmente importantes. Por que a OpenAI escolheu usar a linguagem de programação do Github para treinar a cadeia de pensamento? Como a semântica e a sintaxe da linguagem de programação são extremamente simples, a lógica do processo de execução é rigorosa. Isso também representa uma característica e vantagem do OpenAI: ele não atacará cegamente. Portanto, acho que o desenvolvimento da IA da China precisa encontrar outro caminho, ou seja, contar com a capacidade de grandes modelos gerais para começar a partir da aplicação de cenários verticais, com maior probabilidade de sucesso.
A IA generativa interromperá a experiência existente do consumidor
**Revisão de tecnologia de IA: por que você está visando o setor de consumo? **
Zhou Bowen: Quando eu estava na JD.com, vi uma grande oportunidade de negócios de "combinar dinamicamente a demanda do consumidor e o design do produto com inteligência artificial". Em 2021, decidi deixar meu emprego e abrir um negócio para desenvolver um modelo geral de linguagem grande para indústrias verticais (o modelo de linguagem grande não havia explodido na época), esperando cobrir todos os comportamentos do consumidor de cenários não específicos. Sabemos que as cenas de tempo e espaço são diferentes de segunda a sexta-feira, e o foco dos trabalhadores de colarinho branco ou outras ocupações também é diferente. Por trás desses símbolos culturais que afetam o comportamento de compra estão emoções complexas, experiências e escolhas de produtos dos consumidores. Logicamente , esta é exatamente a informação valiosa que as empresas precisam. Ao fazer produtos do lado da oferta, inclui criatividade, design, parâmetros do produto, funções, materiais e posicionamento da marca, slogan, marketing, publicidade, marketing, imagens promocionais etc.
Este tipo de relacionamento correspondente nunca foi passado por seres humanos antes. Os profissionais de planejamento, marketing e vendas só entendem os links pelos quais são responsáveis. E vamos fazer o primeiro modelo de uso geral em grande escala da cadeia de suprimentos de commodities, ou seja, comprimir todas essas informações em um modelo de uso geral com alta fidelidade e com base nesse modelo de grande escala para capacitar todo o ciclo de vida dos produtos corporativos, incluindo: Insight de oportunidades (Descoberta), definição de produto (Definir), design de programa (Design), direcionar P&D (Desenvolver), transformação de marketing (Distribuir). Dessa forma, as empresas podem descobrir oportunidades de inovação com mais eficiência, projetar e produzir de forma mais criativa, realizar promoções de marketing, alcançar usuários e concluir a transformação com mais eficiência.
**Revisão da Tecnologia AI: Em termos de modelo de negócios, isso parece ser mais avançado. **
Zhou Bowen: Para qualquer equipe empreendedora, é muito importante ser capaz de cultivar mais capacidades profissionais depois de ter as capacidades técnicas gerais de grandes modelos. Atualmente, o avanço do GPT está principalmente em sua capacidade geral, mas seu valor para indústrias específicas e campos verticais ainda não foi desenvolvido. Por exemplo: GPT pode desenhar pinturas artísticas muito realistas, mas não pode desenhar diagramas de circuitos, porque não não tem conhecimento suficiente de conhecimento físico. Julgamentos profundos e relevantes não são profissionais o suficiente.
Portanto, acho que existe a necessidade de tal ferramenta (um modelo grande de uso geral com recursos profissionais) para tornar mais fácil para os consumidores encontrar e estar mais dispostos a comprar os produtos de que precisam, o que pode mudar completamente os caminhos de compra existentes das pessoas . A IA generativa pode compactar grandes quantidades de informações de negócios em modelos tão grandes, de modo a aprender todos os aspectos da cadeia de suprimentos de commodities e melhorar a eficiência dos principais links centrados nos consumidores. Essa é a ideia e a criatividade que já foi gerada em 2021.
**A Lianyuan Technology está desenvolvendo um grande modelo com capacidades gerais. Este grande modelo possui experiência em vincular produtos e consumidores. **Temos 37 indicadores de avaliação de modelos em larga escala, sendo 2/3 deles capacidades de uso geral, como capacidade de raciocínio e capacidade de computação, e mais de uma dezena de itens são especialmente aplicados à conexão entre produtos e consumidores, de modo a perceba o objetivo "deixe todo produto nascer da necessidade, deixe cada consumidor conseguir o que deseja".
**Análise de tecnologia de IA: como a IA generativa pode se integrar melhor a cenários de consumo, como comércio eletrônico? **
**Zhou Bowen:**Os humanos podem entender apenas a lógica de negócios do planejamento ou a lógica do marketing, mas a IA pode abrir todas as cadeias de negócios.
Os consumidores precisam de muito vocabulário profissional para encontrar os produtos que desejam em cenários como plataformas de comércio eletrônico; mas, por outro lado, os comerciantes não entendem as reais necessidades dos consumidores e só conseguem chegar aos consumidores por meio de transações de comércio eletrônico, por meio de consultoria instituições de pesquisa para entender melhor os consumidores. Depois de introduzir uma função de diálogo multi-round como o ProductGPT, a eficiência de correspondência dinâmica de comerciantes e consumidores em produtos será mais eficiente do que a pesquisa de mercado, para que as plataformas de comércio eletrônico possam participar mais profundamente da inovação, design, pesquisa e desenvolvimento de produtos e marketing. promoção etc.
Na sociedade comercial atual, existe uma forte correspondência entre o lado da demanda e o lado da oferta. Nossa plataforma de inovação colaborativa líder autodesenvolvida SaaS é baseada na compreensão multimodal, raciocínio e recursos de geração de grandes modelos e ajuda as empresas a descobrir oportunidades de negócios e inovação de produtos por meio de insights profundos sobre consumidores, cenários, produtos, referências de produtos e P&D . Ao mesmo tempo, a plataforma de diálogo multi-rodada ProductGPT da Lianyuan Technology fornece a cada funcionário da empresa um assistente pessoal profundamente personalizado de acordo com diferentes funções profissionais e atende às suas necessidades específicas de trabalho, fornecendo habilidades e conhecimentos específicos da função. Por exemplo, o assistente pessoal de pesquisa do consumidor da Lianyuan Technology fornecerá habilidades profissionais e conhecimento relevante, como pesquisa de tendências de mercado, compreensão das necessidades do consumidor e pesquisa de mercado.
**Análise de tecnologia de IA: você usou IA generativa para ganhar dinheiro no JD.com, como fez isso? **
**Zhou Bowen:**Em 2019, liderei a equipe de IA da JD.com para aplicar inteligência artificial generativa para criar direitos autorais de produtos e selecionar fotos. Esse também é o primeiro modelo generativo em grande escala da JD.com. Naquela época, nosso modelo de IA realizava principalmente três coisas:
Primeiro, você pode ler o conteúdo da página de detalhes do produto sozinho e gerar diretamente de 8 a 9 pontos de venda desse produto por meio de análise;
Em segundo lugar, quando um consumidor navega em um determinado produto, o grande modelo descobrirá rapidamente quais pontos de venda podem impressionar mais o usuário, analisando os dados de comportamento de diferentes consumidores;
Em terceiro lugar, a AIGC gerará slogans exclusivos em torno dos pontos de venda que mais preocupam os consumidores, com base nos retratos dos usuários.
Após um período de implementação, a taxa de conversão das recomendações de produtos aumentou 30% em relação a antes. Os consumidores podem não perceber que, quando pesquisam e compram no JD.com, as categorias e descrições de produtos que veem são geradas automaticamente pelo AIGC, palavra por palavra, de acordo com as preferências do usuário e os pontos de venda dos produtos no momento em que ele navega pelos produtos .
**Análise de tecnologia de IA: o que você acha da API aberta da OpenAI e o que ela significa para o setor? **
Zhou Bowen: Falando por experiência própria, eu costumava ser o cientista-chefe do IBM Watson Group. Naquela época, os dados de algumas indústrias nos Estados Unidos eram regulamentados e essas empresas geralmente não podiam cooperar e só podiam implantar nuvens privadas. Por esta razão, em 2015-2016, eu estava determinado a ser uma nuvem pública. Para conseguir isso, é necessário APIizar os recursos de IA do Watson. Naquela época, liderei o lançamento de dezenas de APIs, incluindo diálogo e compreensão de linguagem natural. Coloque essas APIs na plataforma de nuvem e agora o negócio de IA da IBM ganha principalmente dinheiro com isso.
Voltei para a China no final de 2017 e, em abril de 2018, lancei a plataforma aberta de inteligência artificial da JD.com. Naquela época, basicamente não havia plataforma de IA na China, o que também trouxe uma receita considerável para o JD.com. Em 2019, a equipe de IA do JD.com liderada por mim gerou 170 milhões de yuans em receita, o que não é ruim para uma equipe de 200 pessoas.
**Análise de tecnologia de IA: há uma percepção na indústria de que o risco de fazer um modelo grande vertical é muito alto. O que você acha? **
Zhou Bowen: Acho que, no futuro, esses fluxos de trabalho bem definidos e de alto valor serão concluídos por modelos profissionais de IA, em vez de modelos gerais de IA. É fácil melhorar ainda mais os recursos básicos de um modelo grande de propósito geral depois que uma certa cena vertical é concluída com sucesso. Além disso, se começarmos a partir de um cenário vertical, nosso acúmulo anterior em termos de poder computacional, dados e algoritmos poderá ser mais plenamente utilizado. Portanto, na tecnologia Lianyuan, o modelo grande deve ter os recursos básicos da tecnologia geral de modelos grandes na estrutura subjacente da tecnologia e deve ser avaliado com métodos científicos, mas também requer treinamento profissional.
Em 2023, devido à repentina popularidade do ChatGPT, o mercado começou a usar AI 2.0 para descrever seu enorme potencial. Além disso, quase todos os gigantes da tecnologia entraram na batalha, o mercado de capital de risco está tentando aproveitar novas oportunidades e o ambiente de mercado também está mudando rapidamente. O GPT é uma oportunidade empreendedora sistemática, mas apenas copiar, seguir e atualizar é arriscado e difícil.
Depois de fundar a Lianyuan Technology, nos comunicamos com mais de 100 clientes, vimos as necessidades reais e melhoramos o caminho de realização da tecnologia otimizando continuamente o grande modelo: "Em 2022, demonstramos o valor comercial e a viabilidade técnica desse cenário. Isso significa que mesmo que estejamos fazendo um modelo grande, estamos em um caminho diferente do OpenAI, e o modelo de lucro também é diferente.
O que eu quero fazer é um compressor de conhecimento de mundo melhor do que o GPT atual, que requer dados muito interativos, e os dados obviamente estão intimamente relacionados à cena. Quanto a que tipo de dados tem o significado de inteligência humana superior, na verdade há muito trabalho teórico a ser feito e é uma direção que vale a pena explorar no futuro.