La guerra de la IA se intensifica: Falcon desafía a Llama en la competencia de modelos de código abierto.

robot
Generación de resúmenes en curso

La industria de la IA estalla en "guerra de animales", Falcon y Llama compiten por el dominio de los modelos de Código abierto

El mes pasado, el campo de la IA fue testigo de una "guerra de animales". Por un lado, está el modelo Llama lanzado por Meta, y por el otro, el gran modelo llamado Falcon.

Llama, gracias a su Código abierto, ha sido durante mucho tiempo el favorito de la comunidad de desarrolladores. En mayo, el Falcon-40B se lanzó y alcanzó la cima de la "lista de clasificación de LLM de Código abierto". Esta lista fue elaborada por la comunidad de Hugging Face y proporciona estándares para evaluar las capacidades de los grandes modelos de lenguaje. Desde entonces, Llama y Falcon han estado renovando su posición en la lista.

Curiosamente, los desarrolladores de Falcon no son una empresa tecnológica, sino el Instituto de Innovación Tecnológica de Abu Dhabi, la capital de los Emiratos Árabes Unidos. Las autoridades de los Emiratos Árabes Unidos han declarado que participan en la competencia de IA para "desbancar a los jugadores clave".

Hoy en día, el campo de la IA ha entrado en una fase de competencia feroz. Países y empresas con grandes recursos financieros están lanzando versiones locales de ChatGPT. Solo en la región del Golfo, hay varios jugadores que han entrado en el mercado. En agosto, Arabia Saudita compró más de 3000 chips H100 para universidades locales, destinados a entrenar modelos grandes.

Un inversionista experimentado exclamó: "Pensé que el campo de la tecnología dura tendría una alta barrera de entrada, pero no esperaba que el emprendimiento de grandes modelos se convirtiera en una batalla de cientos de modelos..."

Detrás de esta "guerra de los cien modelos" está la aparición del algoritmo Transformer. En 2017, ocho científicos de Google publicaron el algoritmo Transformer en un artículo, sentando las bases para esta ola de entusiasmo por la IA. Hoy en día, los principales modelos, incluyendo la serie GPT, se basan en el Transformer.

La aparición del Transformer ha ralentizado la velocidad de innovación de los algoritmos de base en el ámbito académico. Elementos de ingeniería como la ingeniería de datos, la escala de computación y la arquitectura de modelos se han convertido gradualmente en claves para la competencia en IA. Con ciertas capacidades técnicas, cualquier empresa puede desarrollar grandes modelos.

Esto también ha llevado a un aumento explosivo en el número de modelos grandes tanto en el país como en el extranjero. Los informes indican que, hasta julio, el número de modelos grandes en el país ha alcanzado los 130, superando los 114 de Estados Unidos. Además de China y Estados Unidos, países como Japón, India y Corea del Sur también han lanzado sus propios modelos grandes.

Sin embargo, entrar en el mercado no significa que se pueda convertirse en un gigante de la industria. Tomando como ejemplo la disputa entre Falcon y Llama, aunque Falcon lidera temporalmente en el ranking, es difícil decir cuánto impacto ha tenido en Meta. Para los modelos de código abierto, una comunidad de desarrolladores activa es la verdadera ventaja competitiva. Meta, gracias a su experiencia acumulada durante años en la gestión de redes sociales, tiene una ventaja en la operación de la comunidad de código abierto.

Actualmente, en el top 10 de Hugging Face, 8 de los modelos están basados en Llama 2. Solo en esa plataforma, hay más de 1500 modelos grandes que utilizan el Código abierto de Llama 2.

Además de la construcción ecológica, la pura capacidad técnica también es clave. En la reciente prueba AgentBench, GPT-4 lideró con una puntuación de 4.41, mientras que el segundo lugar, Claude, solo obtuvo 2.77 puntos, y otros modelos de Código abierto rondaron cerca de 1 punto. Esto refleja la ventaja técnica acumulada a largo plazo por el equipo de OpenAI.

Con el aumento de la actividad de la comunidad de Código abierto, el rendimiento de los principales modelos podría converger. En el futuro, la competencia central de los grandes modelos se concentrará en la construcción de ecosistemas o en la pura capacidad de inferencia.

Otro problema más realista es que, aparte de unos pocos casos, la mayoría de los proveedores de grandes modelos aún no han encontrado un modelo de negocio rentable. Los altos costos de computación se han convertido en un obstáculo para el desarrollo de la industria. Se estima que el gasto de las empresas tecnológicas en infraestructura de grandes modelos alcanzará los 200 mil millones de dólares anuales, mientras que los ingresos de los grandes modelos serán de hasta 75 mil millones de dólares, lo que genera un déficit de al menos 125 mil millones de dólares.

Incluso gigantes del software como Microsoft y Adobe enfrentan dificultades en la fijación de precios de servicios de IA. Por ejemplo, GitHub Copilot cobra 10 dólares al mes, pero Microsoft pierde 20 dólares por cada usuario.

En general, si no fuera por la aparición de OpenAI y ChatGPT, esta revolución de la IA podría no haber ocurrido. Pero en esta etapa actual, el valor que se puede crear simplemente entrenando grandes modelos aún está por verse. Con la intensificación de la competencia homogénea y el aumento de modelos de Código abierto, los proveedores de grandes modelos puros pueden enfrentar una mayor presión. Así como el éxito del iPhone 4 no dependía únicamente del procesador, el valor de los grandes modelos también se reflejará más en escenarios de aplicación concretos.

GPT4.23%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 10
  • Compartir
Comentar
0/400
ContractCollectorvip
· 07-23 10:56
¡El zoológico se ha peleado, jaja!
Ver originalesResponder0
YieldChaservip
· 07-22 14:46
Conozcamos la guerra de quemar dinero
Ver originalesResponder0
ApeWithNoFearvip
· 07-22 06:05
¿La revolución de la IA aún se puede jugar? Al final, hay que gastar dinero.
Ver originalesResponder0
CryingOldWalletvip
· 07-22 00:04
¿Por qué todos nombran a los animales?
Ver originalesResponder0
GraphGuruvip
· 07-21 22:50
¡La ovejita venció al águila, ja ja!
Ver originalesResponder0
Lonely_Validatorvip
· 07-21 22:49
Quien pueda usarlo, que lo use.
Ver originalesResponder0
NftBankruptcyClubvip
· 07-21 22:48
Estar de pie y dejarlo estar está bien, súper doblado.
Ver originalesResponder0
RugpullSurvivorvip
· 07-21 22:43
¿Dónde solo se puede ganar vc?
Ver originalesResponder0
SleepyValidatorvip
· 07-21 22:35
Solo son dos animales peleando.
Ver originalesResponder0
ChainMaskedRidervip
· 07-21 22:28
La potencia computacional es tan cara, ¡jugar con IA quema dinero!
Ver originalesResponder0
Ver más
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)