A guerra de IA se intensifica: Falcon desafia Llama na competição acirrada de modelos de código aberto

robot
Geração de resumo em curso

A indústria de IA explode em "guerra dos animais", Falcon e Llama competem pela posição de líder em Código aberto de grandes modelos

No mês passado, o campo da IA teve uma "batalha animal". De um lado está o modelo Llama lançado pela Meta, do outro lado está um grande modelo chamado Falcon.

Llama, graças à sua característica de Código aberto, tem sido apreciado pela comunidade de desenvolvedores ao longo do tempo. O Falcon-40B, lançado em maio, subiu ao topo da "classificação de LLM de Código aberto". Esta lista foi criada pela comunidade Hugging Face e fornece padrões para avaliar a capacidade de grandes modelos de linguagem. Desde então, Llama e Falcon têm alternado na atualização das classificações.

Curiosamente, os desenvolvedores do Falcon não são uma empresa de tecnologia, mas sim o Instituto de Pesquisa em Inovação Tecnológica de Abu Dhabi, na capital dos Emirados Árabes Unidos. As autoridades dos Emirados afirmaram que a sua participação na competição de IA é para "desestabilizar os jogadores principais".

Hoje, o campo da IA entrou na fase de competição acirrada. Países e empresas com forte poder financeiro estão lançando versões locais do ChatGPT. Apenas na região do Golfo, há vários jogadores no mercado. Em agosto, a Arábia Saudita comprou mais de 3000 chips H100 para universidades locais, para treinar grandes modelos.

Um investidor experiente exclamou: "Pensava que o campo da tecnologia avançada teria altas barreiras de entrada, mas não esperava que o empreendedorismo em grandes modelos também se tornasse uma batalha de centenas de modelos..."

Por trás desta "batalha dos cem modelos", está o surgimento do algoritmo Transformer. Em 2017, oito cientistas do Google tornaram público o algoritmo Transformer em um artigo, estabelecendo a base para esta onda atual de IA. Hoje, diversos modelos, incluindo a série GPT, são construídos sobre o Transformer.

O surgimento do Transformer fez com que a inovação em algoritmos de base na academia desacelerasse. Elementos de engenharia, como engenharia de dados, escala de computação e arquitetura de modelos, tornaram-se gradualmente essenciais nas competições de IA. Desde que possuam uma certa capacidade técnica, qualquer empresa pode desenvolver um grande modelo.

Isto também levou a um aumento explosivo no número de grandes modelos, tanto a nível nacional como internacional. Relatórios indicam que, até julho, havia 130 grandes modelos na China, superando os 114 dos Estados Unidos. Além da China e dos EUA, países como Japão, Índia e Coreia do Sul também lançaram seus próprios grandes modelos.

No entanto, entrar no mercado facilmente não significa que se pode tornar um gigante da indústria. Tomando a disputa entre Falcon e Llama como exemplo, embora a Falcon esteja temporariamente à frente no ranking, é difícil dizer o quanto isso impactou a Meta. Para modelos de código aberto, uma comunidade de desenvolvedores ativa é a verdadeira vantagem competitiva. A Meta beneficia-se da experiência acumulada ao longo de anos na gestão de redes sociais, tendo uma vantagem na operação dentro da comunidade de código aberto.

Atualmente, entre os 10 primeiros do ranking da Hugging Face, 8 modelos são baseados no Llama 2. Apenas nesta plataforma, há mais de 1500 grandes modelos que utilizam a licença Código aberto do Llama 2.

Além da construção ecológica, a capacidade técnica pura também é fundamental. No recente teste AgentBench, o GPT-4 obteve uma pontuação de 4,41, liderando com larga margem, enquanto o segundo colocado, Claude, ficou com apenas 2,77 pontos, e outros modelos de Código aberto ficaram em torno de 1 ponto. Isso reflete a vantagem técnica acumulada pela equipe da OpenAI ao longo do tempo.

Com a crescente atividade da comunidade de Código aberto, o desempenho dos principais modelos pode tornar-se semelhante. No futuro, a principal vantagem competitiva dos grandes modelos estará concentrada na construção de ecossistemas ou na pura capacidade de raciocínio.

Outra questão mais realista é: além de alguns casos isolados, a maioria dos provedores de grandes modelos ainda não encontrou um modelo de lucro. O alto custo de computação tornou-se um obstáculo ao desenvolvimento da indústria. Algumas instituições estimam que os gastos anuais das empresas de tecnologia em infraestrutura de grandes modelos alcançarão 200 mil milhões de dólares, enquanto a receita dos grandes modelos será de no máximo 75 mil milhões de dólares, com um déficit de pelo menos 125 mil milhões de dólares.

Mesmo gigantes de software como a Microsoft e a Adobe enfrentam dificuldades na precificação de serviços de IA. Por exemplo, o GitHub Copilot cobra 10 dólares por mês, mas a Microsoft perde 20 dólares por usuário.

No geral, se não fosse o aparecimento da OpenAI e do ChatGPT, esta revolução da IA talvez não tivesse ocorrido. Mas, nesta fase atual, o valor que pode ser criado apenas com o treinamento de grandes modelos ainda está por observar. Com a intensificação da concorrência homogênea e o aumento dos modelos Código aberto, os fornecedores de grandes modelos puros podem enfrentar uma pressão maior. Assim como o sucesso do iPhone 4 não dependia apenas do processador, o valor dos grandes modelos também será mais evidente em cenários de aplicação concretos.

GPT-7.77%
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 10
  • Partilhar
Comentar
0/400
ContractCollectorvip
· 07-23 10:56
O zoológico começou a brigar, haha
Ver originalResponder0
YieldChaservip
· 07-22 14:46
Entenda a guerra de queimar dinheiro
Ver originalResponder0
ApeWithNoFearvip
· 07-22 06:05
A revolução da IA ainda pode ser jogada? O resultado ainda requer gastar dinheiro.
Ver originalResponder0
CryingOldWalletvip
· 07-22 00:04
Como é que se fazem os nomes dos animais?
Ver originalResponder0
GraphGuruvip
· 07-21 22:50
A ovelhinha derrotou a águia hahah
Ver originalResponder0
Lonely_Validatorvip
· 07-21 22:49
Quem puder usar, que use.
Ver originalResponder0
NftBankruptcyClubvip
· 07-21 22:48
Estar de pé e deixar andar está ótimo. Super dobrado.
Ver originalResponder0
RugpullSurvivorvip
· 07-21 22:43
Onde só se pode vencer o VC
Ver originalResponder0
SleepyValidatorvip
· 07-21 22:35
São apenas dois animais a lutar.
Ver originalResponder0
ChainMaskedRidervip
· 07-21 22:28
Poder de computação tão caro, jogar AI custa dinheiro.
Ver originalResponder0
Ver mais
Negocie cripto em qualquer lugar e a qualquer hora
qrCode
Digitalizar para transferir a aplicação Gate
Novidades
Português (Portugal)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)