L'industrie de l'IA connaît une "guerre des animaux", Falcon et Llama se disputent le statut de leader des modèles Open Source.
Le mois dernier, le domaine de l'IA a connu une "guerre des animaux". D'un côté se trouve le modèle Llama lancé par Meta, de l'autre le grand modèle nommé Falcon.
Llama, grâce à ses caractéristiques Open Source, a longtemps été prisé par la communauté des développeurs. Le Falcon-40B, lancé en mai, a immédiatement atteint la première place du "classement des LLM Open Source". Ce classement a été élaboré par la communauté Hugging Face et fournit des critères pour évaluer les capacités des grands modèles de langage. Par la suite, Llama et Falcon ont tour à tour renouvelé leur classement.
Il est intéressant de noter que les développeurs de Falcon ne sont pas une société technologique, mais plutôt l'Institut de recherche sur l'innovation technologique d'Abou Dhabi, la capitale des Émirats arabes unis. Les Émirats ont déclaré qu'ils participaient à la compétition AI pour "déclasser les acteurs clés".
Aujourd'hui, le domaine de l'IA est entré dans une phase de compétition acharnée. Des pays et des entreprises disposant de ressources financières importantes lancent chacun leur propre version de ChatGPT. Rien que dans la région du Golfe, plusieurs acteurs ont fait leur entrée. En août, l'Arabie saoudite a acheté plus de 3000 puces H100 pour les universités nationales, afin de former de grands modèles.
Un investisseur chevronné s'est exclamé : "Je pensais que le domaine des technologies avancées aurait un haut niveau d'entrée, mais je ne m'attendais pas à ce que l'entrepreneuriat autour des grands modèles se transforme en une bataille de centaines de modèles..."
Derrière cette "Guerre des Cent Modèles", se trouve l'émergence de l'algorithme Transformer. En 2017, huit scientifiques de Google ont publié l'algorithme Transformer dans un article, établissant ainsi les bases de cette vague actuelle d'IA. Aujourd'hui, de nombreux modèles, y compris la série GPT, sont construits sur la base de Transformer.
L'apparition des Transformers a ralenti la vitesse d'innovation des algorithmes de base dans le milieu académique. Les éléments d'ingénierie tels que l'ingénierie des données, l'échelle de calcul et l'architecture des modèles sont progressivement devenus clés dans la compétition en IA. Tant qu'une entreprise dispose d'une certaine capacité technique, elle peut développer de grands modèles.
Cela a également entraîné une explosion du nombre de grands modèles tant au niveau national qu'international. Des rapports montrent qu'à la fin du mois de juillet, il y avait déjà 130 grands modèles dans le pays, dépassant les 114 des États-Unis. En dehors de la Chine et des États-Unis, des pays comme le Japon, l'Inde et la Corée du Sud ont également lancé leurs propres grands modèles.
Cependant, le fait d'entrer sur le marché facilement ne signifie pas qu'on pourra devenir un géant de l'industrie. Prenons l'exemple de la lutte entre Falcon et Llama ; bien que Falcon soit temporairement en tête du classement, il est difficile de dire quel impact cela a eu sur Meta. Pour les modèles de grande échelle Open Source, une communauté de développeurs active est le véritable atout concurrentiel. Grâce à des années d'expérience dans la gestion des réseaux sociaux, Meta a un avantage dans la gestion de la communauté Open Source.
Actuellement, parmi les 10 premiers du classement de Hugging Face, 8 sont des modèles basés sur Llama 2. Rien que sur cette plateforme, il y a plus de 1500 grands modèles utilisant le protocole Open Source Llama 2.
En plus de la construction écologique, la capacité technique pure est également essentielle. Lors du récent test AgentBench, GPT-4 a obtenu un score de 4,41, loin devant, tandis que le deuxième, Claude, n'a obtenu que 2,77, et les autres modèles open source se situent autour de 1 point. Cela reflète l'avantage technique accumulé par l'équipe d'OpenAI au fil du temps.
Avec l'Open Source de plus en plus actif, les performances des grands modèles pourraient converger. À l'avenir, la principale compétitivité des grands modèles sera concentrée sur la construction d'écosystèmes ou sur la capacité de raisonnement pure.
Un autre problème plus réaliste est que, à part quelques cas isolés, la plupart des fournisseurs de grands modèles n'ont pas encore trouvé de modèle de rentabilité. Le coût élevé de la puissance de calcul est devenu un obstacle au développement de l'industrie. Certaines organisations prévoient que les entreprises technologiques du monde entier dépenseront chaque année 200 milliards de dollars sur l'infrastructure des grands modèles, tandis que les revenus des grands modèles atteindront au maximum 75 milliards de dollars, avec un déficit d'au moins 125 milliards de dollars.
Même des géants du logiciel comme Microsoft et Adobe font face à des difficultés en matière de tarification des services d'IA. Par exemple, GitHub Copilot coûte 10 dollars par mois, mais Microsoft perd en fait 20 dollars par utilisateur.
Dans l'ensemble, sans l'émergence d'OpenAI et de ChatGPT, cette révolution de l'IA n'aurait peut-être pas eu lieu. Mais à ce stade actuel, la valeur que peut créer la simple formation de grands modèles reste à observer. Avec l'intensification de la concurrence homogène et l'augmentation des modèles Open Source, les fournisseurs de grands modèles purement concentrés pourraient faire face à une pression plus importante. Tout comme le succès de l'iPhone 4 ne dépendait pas seulement du processeur, la valeur des grands modèles se manifestera davantage dans des scénarios d'application concrets.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
18 J'aime
Récompense
18
10
Partager
Commentaire
0/400
ContractCollector
· 07-23 10:56
Le zoo s'est battu, haha
Voir l'originalRépondre0
YieldChaser
· 07-22 14:46
Découvrez la guerre de l'argent brûlé
Voir l'originalRépondre0
ApeWithNoFear
· 07-22 06:05
La révolution de l'IA peut-elle encore être jouée ? Il faut encore dépenser de l'argent.
Voir l'originalRépondre0
CryingOldWallet
· 07-22 00:04
Comment donner des noms aux animaux ?
Voir l'originalRépondre0
GraphGuru
· 07-21 22:50
Le petit mouton a battu l'aigle, haha
Voir l'originalRépondre0
Lonely_Validator
· 07-21 22:49
Qui peut l'utiliser, l'utilise.
Voir l'originalRépondre0
NftBankruptcyClub
· 07-21 22:48
Rester là sans rien faire, c'est très bien, super double.
Voir l'originalRépondre0
RugpullSurvivor
· 07-21 22:43
Où ne peut-on que battre le vc
Voir l'originalRépondre0
SleepyValidator
· 07-21 22:35
C'est juste deux animaux qui se battent.
Voir l'originalRépondre0
ChainMaskedRider
· 07-21 22:28
Puissance de calcul si chère, jouer à l'IA coûte cher.
L'escalade de la guerre de l'IA : Falcon défie Llama dans une compétition acharnée de modèles Open Source.
L'industrie de l'IA connaît une "guerre des animaux", Falcon et Llama se disputent le statut de leader des modèles Open Source.
Le mois dernier, le domaine de l'IA a connu une "guerre des animaux". D'un côté se trouve le modèle Llama lancé par Meta, de l'autre le grand modèle nommé Falcon.
Llama, grâce à ses caractéristiques Open Source, a longtemps été prisé par la communauté des développeurs. Le Falcon-40B, lancé en mai, a immédiatement atteint la première place du "classement des LLM Open Source". Ce classement a été élaboré par la communauté Hugging Face et fournit des critères pour évaluer les capacités des grands modèles de langage. Par la suite, Llama et Falcon ont tour à tour renouvelé leur classement.
Il est intéressant de noter que les développeurs de Falcon ne sont pas une société technologique, mais plutôt l'Institut de recherche sur l'innovation technologique d'Abou Dhabi, la capitale des Émirats arabes unis. Les Émirats ont déclaré qu'ils participaient à la compétition AI pour "déclasser les acteurs clés".
Aujourd'hui, le domaine de l'IA est entré dans une phase de compétition acharnée. Des pays et des entreprises disposant de ressources financières importantes lancent chacun leur propre version de ChatGPT. Rien que dans la région du Golfe, plusieurs acteurs ont fait leur entrée. En août, l'Arabie saoudite a acheté plus de 3000 puces H100 pour les universités nationales, afin de former de grands modèles.
Un investisseur chevronné s'est exclamé : "Je pensais que le domaine des technologies avancées aurait un haut niveau d'entrée, mais je ne m'attendais pas à ce que l'entrepreneuriat autour des grands modèles se transforme en une bataille de centaines de modèles..."
Derrière cette "Guerre des Cent Modèles", se trouve l'émergence de l'algorithme Transformer. En 2017, huit scientifiques de Google ont publié l'algorithme Transformer dans un article, établissant ainsi les bases de cette vague actuelle d'IA. Aujourd'hui, de nombreux modèles, y compris la série GPT, sont construits sur la base de Transformer.
L'apparition des Transformers a ralenti la vitesse d'innovation des algorithmes de base dans le milieu académique. Les éléments d'ingénierie tels que l'ingénierie des données, l'échelle de calcul et l'architecture des modèles sont progressivement devenus clés dans la compétition en IA. Tant qu'une entreprise dispose d'une certaine capacité technique, elle peut développer de grands modèles.
Cela a également entraîné une explosion du nombre de grands modèles tant au niveau national qu'international. Des rapports montrent qu'à la fin du mois de juillet, il y avait déjà 130 grands modèles dans le pays, dépassant les 114 des États-Unis. En dehors de la Chine et des États-Unis, des pays comme le Japon, l'Inde et la Corée du Sud ont également lancé leurs propres grands modèles.
Cependant, le fait d'entrer sur le marché facilement ne signifie pas qu'on pourra devenir un géant de l'industrie. Prenons l'exemple de la lutte entre Falcon et Llama ; bien que Falcon soit temporairement en tête du classement, il est difficile de dire quel impact cela a eu sur Meta. Pour les modèles de grande échelle Open Source, une communauté de développeurs active est le véritable atout concurrentiel. Grâce à des années d'expérience dans la gestion des réseaux sociaux, Meta a un avantage dans la gestion de la communauté Open Source.
Actuellement, parmi les 10 premiers du classement de Hugging Face, 8 sont des modèles basés sur Llama 2. Rien que sur cette plateforme, il y a plus de 1500 grands modèles utilisant le protocole Open Source Llama 2.
En plus de la construction écologique, la capacité technique pure est également essentielle. Lors du récent test AgentBench, GPT-4 a obtenu un score de 4,41, loin devant, tandis que le deuxième, Claude, n'a obtenu que 2,77, et les autres modèles open source se situent autour de 1 point. Cela reflète l'avantage technique accumulé par l'équipe d'OpenAI au fil du temps.
Avec l'Open Source de plus en plus actif, les performances des grands modèles pourraient converger. À l'avenir, la principale compétitivité des grands modèles sera concentrée sur la construction d'écosystèmes ou sur la capacité de raisonnement pure.
Un autre problème plus réaliste est que, à part quelques cas isolés, la plupart des fournisseurs de grands modèles n'ont pas encore trouvé de modèle de rentabilité. Le coût élevé de la puissance de calcul est devenu un obstacle au développement de l'industrie. Certaines organisations prévoient que les entreprises technologiques du monde entier dépenseront chaque année 200 milliards de dollars sur l'infrastructure des grands modèles, tandis que les revenus des grands modèles atteindront au maximum 75 milliards de dollars, avec un déficit d'au moins 125 milliards de dollars.
Même des géants du logiciel comme Microsoft et Adobe font face à des difficultés en matière de tarification des services d'IA. Par exemple, GitHub Copilot coûte 10 dollars par mois, mais Microsoft perd en fait 20 dollars par utilisateur.
Dans l'ensemble, sans l'émergence d'OpenAI et de ChatGPT, cette révolution de l'IA n'aurait peut-être pas eu lieu. Mais à ce stade actuel, la valeur que peut créer la simple formation de grands modèles reste à observer. Avec l'intensification de la concurrence homogène et l'augmentation des modèles Open Source, les fournisseurs de grands modèles purement concentrés pourraient faire face à une pression plus importante. Tout comme le succès de l'iPhone 4 ne dépendait pas seulement du processeur, la valeur des grands modèles se manifestera davantage dans des scénarios d'application concrets.