La "bataille des cent modèles" dans l'industrie de l'IA : innovation technologique et dilemmes industriels coexistent
Le mois dernier, l'industrie de l'IA a été secouée par une "guerre des animaux". Cette compétition s'est principalement déroulée entre les grands modèles Llama (lama) et Falcon (faucon) de Meta. Llama est très apprécié des développeurs en raison de sa nature open source. Falcon, quant à lui, a été développé par l'Institut de recherche sur l'innovation technologique des Émirats, et a temporairement surpassé Llama dans le classement des LLM open source.
Cette compétition reflète la situation actuelle de "danse des démons" dans le domaine de l'IA. De nombreux pays et entreprises s'efforcent de créer leurs propres grands modèles de langage, et les pays du Golfe ne font pas exception. Cependant, cette apparente floraison de modèles a conduit certains professionnels du secteur à se lamenter que "l'entrepreneuriat dans les grands modèles de technologies avancées reste un combat de centaines de modèles".
La racine de cette situation remonte à l'article « Attention Is All You Need » publié par Google en 2017, qui a révélé l'algorithme Transformer. L'émergence du Transformer a transformé les grands modèles d'une recherche théorique en un problème d'ingénierie, abaissant considérablement la barrière à l'entrée. Tant qu'il y a suffisamment de fonds et de puissance de calcul, presque n'importe quelle entreprise peut entraîner son propre grand modèle.
Cependant, le fait d'entrer sur le marché facilement ne signifie pas que tout le monde peut devenir un leader à l'ère de l'IA. La véritable force concurrentielle réside dans une communauté de développeurs active ou des capacités de raisonnement exceptionnelles. La série Llama de Meta est devenue un indicateur de référence des LLM open source en grande partie grâce à sa stratégie open source à long terme et à son engagement communautaire.
En comparaison, le GPT-4, le plus performant, reste de loin en tête des autres modèles. Cet écart provient de la puissante équipe de recherche d'OpenAI et de l'expérience accumulée au fil du temps. On peut dire que la capacité fondamentale des grands modèles ne réside pas seulement dans l'échelle des paramètres, mais aussi dans la construction d'un écosystème ou la pure force technologique.
En plus des défis techniques, l'industrie des grands modèles fait également face à un grave déséquilibre entre coûts et revenus. Le coût élevé de la puissance de calcul est devenu un obstacle au développement de l'industrie. On estime que les entreprises technologiques mondiales investiront chaque année 200 milliards de dollars dans l'infrastructure des grands modèles, mais les revenus devraient atteindre seulement 75 milliards de dollars.
Actuellement, les principaux bénéficiaires du boom de l'IA sont des fabricants de puces comme Nvidia. Pour la plupart des entreprises de logiciels, la question de savoir comment transformer la technologie de l'IA en un modèle commercial durable reste un défi. Même des géants de la technologie comme Microsoft et Adobe se débattent avec la tarification et le contrôle des coûts des services d'IA.
Bien que l'émergence de ChatGPT ait déclenché cette révolution de l'IA, la valeur réelle apportée par l'entraînement de grands modèles reste à vérifier. Avec l'intensification de la concurrence et la popularité des modèles open source, l'espace commercial reposant uniquement sur la fourniture de services de grands modèles pourrait encore se réduire.
Dans le futur, la valeur de l'industrie de l'IA résidera probablement non pas dans le modèle lui-même, mais dans la manière de combiner les capacités de l'IA avec des scénarios d'application réels, afin de créer de véritables produits et services capables de répondre aux besoins des utilisateurs.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
16 J'aime
Récompense
16
5
Partager
Commentaire
0/400
TokenVelocity
· 08-03 03:29
Fleurs de mille variétés ? C'est juste un tas de plumes de poulet.
Voir l'originalRépondre0
SnapshotDayLaborer
· 08-03 03:28
Il y a trop d'enfants qui ne peuvent pas jouer.
Voir l'originalRépondre0
SchrodingerProfit
· 08-03 03:26
Ah ah, ça recommence.
Voir l'originalRépondre0
BoredRiceBall
· 08-03 03:22
Il vaut mieux regarder le monde animal.
Voir l'originalRépondre0
0xSleepDeprived
· 08-03 03:19
Une nouvelle bataille de modèles, impossible de mourir vraiment
Guerre des modèles d'IA : coexistence de l'innovation technologique et des difficultés industrielles
La "bataille des cent modèles" dans l'industrie de l'IA : innovation technologique et dilemmes industriels coexistent
Le mois dernier, l'industrie de l'IA a été secouée par une "guerre des animaux". Cette compétition s'est principalement déroulée entre les grands modèles Llama (lama) et Falcon (faucon) de Meta. Llama est très apprécié des développeurs en raison de sa nature open source. Falcon, quant à lui, a été développé par l'Institut de recherche sur l'innovation technologique des Émirats, et a temporairement surpassé Llama dans le classement des LLM open source.
Cette compétition reflète la situation actuelle de "danse des démons" dans le domaine de l'IA. De nombreux pays et entreprises s'efforcent de créer leurs propres grands modèles de langage, et les pays du Golfe ne font pas exception. Cependant, cette apparente floraison de modèles a conduit certains professionnels du secteur à se lamenter que "l'entrepreneuriat dans les grands modèles de technologies avancées reste un combat de centaines de modèles".
La racine de cette situation remonte à l'article « Attention Is All You Need » publié par Google en 2017, qui a révélé l'algorithme Transformer. L'émergence du Transformer a transformé les grands modèles d'une recherche théorique en un problème d'ingénierie, abaissant considérablement la barrière à l'entrée. Tant qu'il y a suffisamment de fonds et de puissance de calcul, presque n'importe quelle entreprise peut entraîner son propre grand modèle.
Cependant, le fait d'entrer sur le marché facilement ne signifie pas que tout le monde peut devenir un leader à l'ère de l'IA. La véritable force concurrentielle réside dans une communauté de développeurs active ou des capacités de raisonnement exceptionnelles. La série Llama de Meta est devenue un indicateur de référence des LLM open source en grande partie grâce à sa stratégie open source à long terme et à son engagement communautaire.
En comparaison, le GPT-4, le plus performant, reste de loin en tête des autres modèles. Cet écart provient de la puissante équipe de recherche d'OpenAI et de l'expérience accumulée au fil du temps. On peut dire que la capacité fondamentale des grands modèles ne réside pas seulement dans l'échelle des paramètres, mais aussi dans la construction d'un écosystème ou la pure force technologique.
En plus des défis techniques, l'industrie des grands modèles fait également face à un grave déséquilibre entre coûts et revenus. Le coût élevé de la puissance de calcul est devenu un obstacle au développement de l'industrie. On estime que les entreprises technologiques mondiales investiront chaque année 200 milliards de dollars dans l'infrastructure des grands modèles, mais les revenus devraient atteindre seulement 75 milliards de dollars.
Actuellement, les principaux bénéficiaires du boom de l'IA sont des fabricants de puces comme Nvidia. Pour la plupart des entreprises de logiciels, la question de savoir comment transformer la technologie de l'IA en un modèle commercial durable reste un défi. Même des géants de la technologie comme Microsoft et Adobe se débattent avec la tarification et le contrôle des coûts des services d'IA.
Bien que l'émergence de ChatGPT ait déclenché cette révolution de l'IA, la valeur réelle apportée par l'entraînement de grands modèles reste à vérifier. Avec l'intensification de la concurrence et la popularité des modèles open source, l'espace commercial reposant uniquement sur la fourniture de services de grands modèles pourrait encore se réduire.
Dans le futur, la valeur de l'industrie de l'IA résidera probablement non pas dans le modèle lui-même, mais dans la manière de combiner les capacités de l'IA avec des scénarios d'application réels, afin de créer de véritables produits et services capables de répondre aux besoins des utilisateurs.