A indústria de IA explode em "guerra dos animais", Falcon e Llama competem pela posição de líder em Código aberto de grandes modelos
No mês passado, o campo da IA teve uma "batalha animal". De um lado está o modelo Llama lançado pela Meta, do outro lado está um grande modelo chamado Falcon.
Llama, graças à sua característica de Código aberto, tem sido apreciado pela comunidade de desenvolvedores ao longo do tempo. O Falcon-40B, lançado em maio, subiu ao topo da "classificação de LLM de Código aberto". Esta lista foi criada pela comunidade Hugging Face e fornece padrões para avaliar a capacidade de grandes modelos de linguagem. Desde então, Llama e Falcon têm alternado na atualização das classificações.
Curiosamente, os desenvolvedores do Falcon não são uma empresa de tecnologia, mas sim o Instituto de Pesquisa em Inovação Tecnológica de Abu Dhabi, na capital dos Emirados Árabes Unidos. As autoridades dos Emirados afirmaram que a sua participação na competição de IA é para "desestabilizar os jogadores principais".
Hoje, o campo da IA entrou na fase de competição acirrada. Países e empresas com forte poder financeiro estão lançando versões locais do ChatGPT. Apenas na região do Golfo, há vários jogadores no mercado. Em agosto, a Arábia Saudita comprou mais de 3000 chips H100 para universidades locais, para treinar grandes modelos.
Um investidor experiente exclamou: "Pensava que o campo da tecnologia avançada teria altas barreiras de entrada, mas não esperava que o empreendedorismo em grandes modelos também se tornasse uma batalha de centenas de modelos..."
Por trás desta "batalha dos cem modelos", está o surgimento do algoritmo Transformer. Em 2017, oito cientistas do Google tornaram público o algoritmo Transformer em um artigo, estabelecendo a base para esta onda atual de IA. Hoje, diversos modelos, incluindo a série GPT, são construídos sobre o Transformer.
O surgimento do Transformer fez com que a inovação em algoritmos de base na academia desacelerasse. Elementos de engenharia, como engenharia de dados, escala de computação e arquitetura de modelos, tornaram-se gradualmente essenciais nas competições de IA. Desde que possuam uma certa capacidade técnica, qualquer empresa pode desenvolver um grande modelo.
Isto também levou a um aumento explosivo no número de grandes modelos, tanto a nível nacional como internacional. Relatórios indicam que, até julho, havia 130 grandes modelos na China, superando os 114 dos Estados Unidos. Além da China e dos EUA, países como Japão, Índia e Coreia do Sul também lançaram seus próprios grandes modelos.
No entanto, entrar no mercado facilmente não significa que se pode tornar um gigante da indústria. Tomando a disputa entre Falcon e Llama como exemplo, embora a Falcon esteja temporariamente à frente no ranking, é difícil dizer o quanto isso impactou a Meta. Para modelos de código aberto, uma comunidade de desenvolvedores ativa é a verdadeira vantagem competitiva. A Meta beneficia-se da experiência acumulada ao longo de anos na gestão de redes sociais, tendo uma vantagem na operação dentro da comunidade de código aberto.
Atualmente, entre os 10 primeiros do ranking da Hugging Face, 8 modelos são baseados no Llama 2. Apenas nesta plataforma, há mais de 1500 grandes modelos que utilizam a licença Código aberto do Llama 2.
Além da construção ecológica, a capacidade técnica pura também é fundamental. No recente teste AgentBench, o GPT-4 obteve uma pontuação de 4,41, liderando com larga margem, enquanto o segundo colocado, Claude, ficou com apenas 2,77 pontos, e outros modelos de Código aberto ficaram em torno de 1 ponto. Isso reflete a vantagem técnica acumulada pela equipe da OpenAI ao longo do tempo.
Com a crescente atividade da comunidade de Código aberto, o desempenho dos principais modelos pode tornar-se semelhante. No futuro, a principal vantagem competitiva dos grandes modelos estará concentrada na construção de ecossistemas ou na pura capacidade de raciocínio.
Outra questão mais realista é: além de alguns casos isolados, a maioria dos provedores de grandes modelos ainda não encontrou um modelo de lucro. O alto custo de computação tornou-se um obstáculo ao desenvolvimento da indústria. Algumas instituições estimam que os gastos anuais das empresas de tecnologia em infraestrutura de grandes modelos alcançarão 200 mil milhões de dólares, enquanto a receita dos grandes modelos será de no máximo 75 mil milhões de dólares, com um déficit de pelo menos 125 mil milhões de dólares.
Mesmo gigantes de software como a Microsoft e a Adobe enfrentam dificuldades na precificação de serviços de IA. Por exemplo, o GitHub Copilot cobra 10 dólares por mês, mas a Microsoft perde 20 dólares por usuário.
No geral, se não fosse o aparecimento da OpenAI e do ChatGPT, esta revolução da IA talvez não tivesse ocorrido. Mas, nesta fase atual, o valor que pode ser criado apenas com o treinamento de grandes modelos ainda está por observar. Com a intensificação da concorrência homogênea e o aumento dos modelos Código aberto, os fornecedores de grandes modelos puros podem enfrentar uma pressão maior. Assim como o sucesso do iPhone 4 não dependia apenas do processador, o valor dos grandes modelos também será mais evidente em cenários de aplicação concretos.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
18 Curtidas
Recompensa
18
10
Compartilhar
Comentário
0/400
ContractCollector
· 07-23 10:56
O zoológico começou a brigar, haha
Ver originalResponder0
YieldChaser
· 07-22 14:46
Entenda a guerra de queimar dinheiro
Ver originalResponder0
ApeWithNoFear
· 07-22 06:05
A revolução da IA ainda pode ser jogada? O resultado ainda requer gastar dinheiro.
Ver originalResponder0
CryingOldWallet
· 07-22 00:04
Como é que se fazem os nomes dos animais?
Ver originalResponder0
GraphGuru
· 07-21 22:50
A ovelhinha derrotou a águia hahah
Ver originalResponder0
Lonely_Validator
· 07-21 22:49
Quem puder usar, que use.
Ver originalResponder0
NftBankruptcyClub
· 07-21 22:48
Estar de pé e deixar andar está ótimo. Super dobrado.
Ver originalResponder0
RugpullSurvivor
· 07-21 22:43
Onde só se pode vencer o VC
Ver originalResponder0
SleepyValidator
· 07-21 22:35
São apenas dois animais a lutar.
Ver originalResponder0
ChainMaskedRider
· 07-21 22:28
Poder de computação tão caro, jogar AI custa dinheiro.
A guerra de IA se intensifica: Falcon desafia Llama na competição acirrada de modelos de código aberto
A indústria de IA explode em "guerra dos animais", Falcon e Llama competem pela posição de líder em Código aberto de grandes modelos
No mês passado, o campo da IA teve uma "batalha animal". De um lado está o modelo Llama lançado pela Meta, do outro lado está um grande modelo chamado Falcon.
Llama, graças à sua característica de Código aberto, tem sido apreciado pela comunidade de desenvolvedores ao longo do tempo. O Falcon-40B, lançado em maio, subiu ao topo da "classificação de LLM de Código aberto". Esta lista foi criada pela comunidade Hugging Face e fornece padrões para avaliar a capacidade de grandes modelos de linguagem. Desde então, Llama e Falcon têm alternado na atualização das classificações.
Curiosamente, os desenvolvedores do Falcon não são uma empresa de tecnologia, mas sim o Instituto de Pesquisa em Inovação Tecnológica de Abu Dhabi, na capital dos Emirados Árabes Unidos. As autoridades dos Emirados afirmaram que a sua participação na competição de IA é para "desestabilizar os jogadores principais".
Hoje, o campo da IA entrou na fase de competição acirrada. Países e empresas com forte poder financeiro estão lançando versões locais do ChatGPT. Apenas na região do Golfo, há vários jogadores no mercado. Em agosto, a Arábia Saudita comprou mais de 3000 chips H100 para universidades locais, para treinar grandes modelos.
Um investidor experiente exclamou: "Pensava que o campo da tecnologia avançada teria altas barreiras de entrada, mas não esperava que o empreendedorismo em grandes modelos também se tornasse uma batalha de centenas de modelos..."
Por trás desta "batalha dos cem modelos", está o surgimento do algoritmo Transformer. Em 2017, oito cientistas do Google tornaram público o algoritmo Transformer em um artigo, estabelecendo a base para esta onda atual de IA. Hoje, diversos modelos, incluindo a série GPT, são construídos sobre o Transformer.
O surgimento do Transformer fez com que a inovação em algoritmos de base na academia desacelerasse. Elementos de engenharia, como engenharia de dados, escala de computação e arquitetura de modelos, tornaram-se gradualmente essenciais nas competições de IA. Desde que possuam uma certa capacidade técnica, qualquer empresa pode desenvolver um grande modelo.
Isto também levou a um aumento explosivo no número de grandes modelos, tanto a nível nacional como internacional. Relatórios indicam que, até julho, havia 130 grandes modelos na China, superando os 114 dos Estados Unidos. Além da China e dos EUA, países como Japão, Índia e Coreia do Sul também lançaram seus próprios grandes modelos.
No entanto, entrar no mercado facilmente não significa que se pode tornar um gigante da indústria. Tomando a disputa entre Falcon e Llama como exemplo, embora a Falcon esteja temporariamente à frente no ranking, é difícil dizer o quanto isso impactou a Meta. Para modelos de código aberto, uma comunidade de desenvolvedores ativa é a verdadeira vantagem competitiva. A Meta beneficia-se da experiência acumulada ao longo de anos na gestão de redes sociais, tendo uma vantagem na operação dentro da comunidade de código aberto.
Atualmente, entre os 10 primeiros do ranking da Hugging Face, 8 modelos são baseados no Llama 2. Apenas nesta plataforma, há mais de 1500 grandes modelos que utilizam a licença Código aberto do Llama 2.
Além da construção ecológica, a capacidade técnica pura também é fundamental. No recente teste AgentBench, o GPT-4 obteve uma pontuação de 4,41, liderando com larga margem, enquanto o segundo colocado, Claude, ficou com apenas 2,77 pontos, e outros modelos de Código aberto ficaram em torno de 1 ponto. Isso reflete a vantagem técnica acumulada pela equipe da OpenAI ao longo do tempo.
Com a crescente atividade da comunidade de Código aberto, o desempenho dos principais modelos pode tornar-se semelhante. No futuro, a principal vantagem competitiva dos grandes modelos estará concentrada na construção de ecossistemas ou na pura capacidade de raciocínio.
Outra questão mais realista é: além de alguns casos isolados, a maioria dos provedores de grandes modelos ainda não encontrou um modelo de lucro. O alto custo de computação tornou-se um obstáculo ao desenvolvimento da indústria. Algumas instituições estimam que os gastos anuais das empresas de tecnologia em infraestrutura de grandes modelos alcançarão 200 mil milhões de dólares, enquanto a receita dos grandes modelos será de no máximo 75 mil milhões de dólares, com um déficit de pelo menos 125 mil milhões de dólares.
Mesmo gigantes de software como a Microsoft e a Adobe enfrentam dificuldades na precificação de serviços de IA. Por exemplo, o GitHub Copilot cobra 10 dólares por mês, mas a Microsoft perde 20 dólares por usuário.
No geral, se não fosse o aparecimento da OpenAI e do ChatGPT, esta revolução da IA talvez não tivesse ocorrido. Mas, nesta fase atual, o valor que pode ser criado apenas com o treinamento de grandes modelos ainda está por observar. Com a intensificação da concorrência homogênea e o aumento dos modelos Código aberto, os fornecedores de grandes modelos puros podem enfrentar uma pressão maior. Assim como o sucesso do iPhone 4 não dependia apenas do processador, o valor dos grandes modelos também será mais evidente em cenários de aplicação concretos.