OpenAI GPT-5 lanzado: las capacidades del modelo dominan por completo, el primer paso para construir una "superinteligencia"

2025-08-08 12:47:55

Autor: Zhang Yongyi

Después de innumerables «retrasos», GPT-5 finalmente ha llegado.

En Beijing, a la una de la madrugada del 8 de agosto, comenzó la conferencia de verano de OpenAI, que tiene un aire de "galas tecnológicas de nueva generación".

A diferencia de la anterior conferencia de lanzamiento rápida de OpenAI, esta vez OpenAI preparó una transmisión en vivo de más de una hora, con diferentes grupos de personas alternando en el escenario, mostrando el poderoso rendimiento de GPT-5 desde varios ángulos.

Hablemos de lo importante: GPT-5 ha tenido una mejora integral en múltiples áreas, ocupando el primer lugar en texto, desarrollo web y capacidades de percepción visual; en prompts rígidos, codificación, matemáticas, creatividad y consultas largas, GPT-5 también ocupa el primer lugar. Bajo la prueba conocida como "Cumbre", actualmente mantiene la puntuación más alta en Arena hasta la fecha, lo que se puede considerar como un "dominio absoluto" en sentido literal.

Sam Altman dijo que GPT-4o es como un estudiante de secundaria, mientras que GPT-5 es como un estudiante universitario, incluso describió a GPT-5 como el primer iPhone equipado con una pantalla de retina: "si le haces una pregunta, tal vez obtengas la respuesta correcta, tal vez obtengas algo loco. GPT-4 se siente como si estuvieras hablando con un estudiante universitario. Y GPT-5 es la primera vez que realmente me siento como si estuviera hablando con un experto a nivel de doctorado." Sam Altman presentó así la mejora en las capacidades de GPT-5.

A pesar de que los usuarios activos semanales de ChatGPT se acercan a los 700 millones, OpenAI en realidad no ha tenido un modelo de vanguardia líder en la industria durante algún tiempo. Ahora, OpenAI cree que GPT-5 lo llevará de nuevo a la cima de las listas.

Altman incluso afirmó directamente en la conferencia de prensa: "Este es el modelo con las habilidades de codificación más fuertes del mundo, el modelo con las habilidades de escritura más fuertes del mundo y el modelo más fuerte en el campo de la atención médica"

Al mismo tiempo, OpenAI también afirmó en la conferencia de prensa que, además de tener unas habilidades de codificación sobresalientes, la capacidad de escritura de GPT-5 y la precisión en la respuesta a preguntas relacionadas con la salud han mejorado considerablemente. Además, GPT-5 no solo ha logrado un "gran salto" en inteligencia, sino que también ha reducido drásticamente el problema de las "alucinaciones" que consistían en "decir tonterías con seriedad". Su desempeño en la comprensión y seguimiento de instrucciones es superior, y la tendencia a adular ha disminuido significativamente.

01 Adiós a las «ilusiones», la IA es más confiable ahora.

Primero, está la alineación del modelo de esta actualización, la serie GPT-5 incluye cuatro versiones: GPT-5, mini, nano y chat, donde la versión Chat está destinada a lograr una experiencia de respuesta más natural e inteligente; incluso puedes usarla para aprender un nuevo idioma.

Además, ahora cuando abres la página de ChatGPT, primero notarás que GPT-5 se presenta como un único modelo, en lugar de un modelo convencional más un modelo de inferencia independiente.

Detrás de esto hay un sistema de enrutamiento (router) desarrollado por OpenAI, que cambia automáticamente a versiones con mayor capacidad de razonamiento para consultas más complejas, o lo hará cuando le digas que se esfuerce en pensar. (Altman dijo que la interfaz de selección de modelos anterior era "un desastre muy confuso.")

"Las "alucinaciones" de la IA" siempre han sido un punto de queja para todos. La buena noticia es que GPT-5 ha hecho un gran esfuerzo en este aspecto, y la empresa afirma que la posibilidad de que genere alucinaciones "se ha reducido significativamente". En concreto:

Al buscar en línea, la probabilidad de que las respuestas de GPT-5 contengan errores de hecho es un 45% menor que la de GPT-4o.

Al pensar de manera independiente, la probabilidad de que su respuesta sea incorrecta es un 80% menor que la de OpenAI o3.

GPT-5 también se ha probado en el nuevo ARC-AGI-2. Aparte de Grok 4 (pensar), su rendimiento es superior al de todos los principales modelos.

Además, GPT-5 se ha convertido en un "hombre honesto". Ya no tiende a mentir a los usuarios ni a presumir de que puede realizar tareas imposibles. Cuando se enfrenta a tareas que no se pueden completar, que son poco claras o que carecen de herramientas clave, se comunica de manera más honesta sobre sus limitaciones.

Lo más interesante de esta actualización es la introducción de cuatro nuevos modos de "personalidad" que los usuarios pueden elegir libremente. Estos son:

Cínico (Cynic)

Robot (Robot)

Oyente (Listener)

Estudiante sobresaliente (Nerd)

Estos modos son opcionales, puedes establecer la forma en que ChatGPT interactúa y responde a tus preguntas según tus preferencias. ¿Quieres que te debata o que escuche como un amigo paciente? Ahora tú decides.

"Este modelo realmente da una buena 'sensación'," dijo Nick Turley, el responsable de ChatGPT, "Creo que la gente realmente sentirá esto, especialmente aquellos usuarios comunes que normalmente no investigan mucho sobre modelos."

Además, también puedes cambiar el tema de color para una sola ventana de chat, los amantes de los temas del editor de código están encantados.

02 ¿Está llegando la era de "software generado bajo demanda"? Capacidades de código sorprendentes

Con el avance de las capacidades de codificación, Altman predice que la poderosa capacidad de codificación de GPT-5 abrirá una era que él llama "generación de software bajo demanda".

En las pruebas de OpenAI, GPT-5 superó a cualquier otro modelo en múltiples pruebas de referencia de codificación como SWE-Bench, SWE-Lancer y Aider Polyglot. Obtuvo un 42% en la prueba final humana y un 75% en la prueba de referencia SWE.

Una pequeña anécdota es que los ejes de la gráfica en la conferencia de prensa tienen claramente varios puntos criticables, no solo hay errores tontos como 52.8 > 69.1, sino que también exagera la mejora en las capacidades de GPT-5, siendo objeto de burlas en las redes sociales por parte de los usuarios que comentaron "es mejor que esta presentación no haya sido hecha por GPT-5".

En la conferencia de prensa, Yann Dubois, responsable del entrenamiento posterior de OpenAI, realizó una demostración en vivo de GPT-5, pidiéndole que generara un sitio web para aprender francés, con un juego interactivo. En cuestión de segundos, GPT-5 escribió cientos de líneas de código y mostró directamente la interfaz frontal del sitio web. Compartió su pantalla en Zoom y realizó una simple operación de clic, todo parecía funcionar perfectamente.

En la conferencia de prensa, OpenAI también mostró directamente un juego 3D creado únicamente a partir de un prompt por GPT-5. La escena 3D creada no solo tiene gráficos elaborados, sino que los efectos físicos también reproducen con gran precisión los efectos correspondientes.

03 Más seguro, más "honesto"

Según Alex Beutel, responsable de la investigación de seguridad de modelos, OpenAI ha realizado más de "cinco mil horas" de pruebas en GPT-5 para comprender sus riesgos de seguridad. Uno de los enfoques es "asegurar que el modelo no mienta a los usuarios."

Aunque las alucinaciones de GPT-5 son menos que las del modelo de razonamiento o3 de OpenAI, el "mentir con confianza" sigue siendo un problema inherente a los grandes modelos de lenguaje. A medida que el modelo comienza a completar tareas como un agente, este problema se vuelve más complejo. Sin embargo, OpenAI afirma que GPT-5 se desempeña mejor en el manejo confiable de tareas de múltiples pasos. "En el pasado, hemos visto modelos que afirmaban haber completado una tarea, pero en realidad no lo habían hecho", dijo Beutel, "este es un problema."

Para las preguntas que anteriormente se rechazaban directamente, GPT-5 ofrecerá el llamado mecanismo de "completaciones seguras" de OpenAI. Beutel explicó: "Por ejemplo, si alguien pregunta '¿cuánta energía se necesita para encender un material específico?', esto podría ser una pregunta maliciosa que intenta eludir las protecciones de seguridad y causar daño, o podría ser un estudiante que quiere entender las características físicas del material. Esto presenta un verdadero desafío para cómo el modelo responde."

A través de "completar de manera segura", GPT-5 "intenta dar respuestas tan útiles como sea posible, manteniendo las restricciones de seguridad". El modelo generalmente solo cumple parcialmente y proporciona información de un nivel más macro que no puede ser utilizada realmente para causar daño.

04 Cómo usar GPT-5

Entonces, la pregunta que más les preocupa a todos es: ¿cómo se puede usar GPT-5?

La buena noticia es que todos los usuarios de ChatGPT pueden experimentar gratis GPT-5 de inmediato. Esta es también la primera vez que OpenAI abre un modelo de vanguardia gratuitamente a todos los usuarios. Por supuesto, los permisos de los usuarios varían según su nivel:

Los usuarios suscritos a Plus pueden tener más usos antes de alcanzar el límite de uso.

Los usuarios suscritos a Pro pueden acceder a la versión GPT-5 Pro, que tiene capacidades de razonamiento más fuertes.

Cuando los usuarios alcanzan el límite de uso, ChatGPT cambiará automáticamente a una versión "mini" de GPT-5 para manejar las solicitudes posteriores. Al mismo tiempo, con el lanzamiento de GPT-5, reemplazará oficialmente a una serie de modelos antiguos como GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 y GPT-4.5.

Además, en la parte de precios de Token, la versión estándar GPT-5 cuesta 1.25 dólares por cada millón de Token de entrada y 10 dólares por cada millón de Token de salida. Las versiones mini y Nano son mucho más baratas.

Los precios detallados se pueden consultar en la imagen a continuación, extraída de la información del sitio web oficial.

Además, OpenAI ha lanzado un nuevo parámetro llamado "Minimal" en la API, lo que te permite utilizar GPT-5 en todos los casos de uso, simplemente cambiando la intensidad de la inferencia.

Además de la plataforma de primera parte de OpenAI, el CEO de Microsoft, Satya Nadella, también anunció que GPT-5 ya está disponible en toda la gama de plataformas de Microsoft, incluyendo Microsoft 365 Copilot, Copilot, GitHub Copilot y Azure AI Foundry. Al mismo tiempo, todas estas mejoras se entrenan en Azure.

Finalmente, Altman dijo que la misión de OpenAI es desarrollar inteligencia artificial general (AGI). GPT-5 los acerca a este objetivo, aunque toda la industria ha comenzado a enfocarse en construir lo que se llama "superinteligencia".

"Me desagrada un poco la palabra AGI, porque ahora cada persona tiene una definición ligeramente diferente de ella", dijo Altman, "pero este es un paso importante hacia la creación de modelos verdaderamente poderosos. Esto claramente requiere un modelo que posea inteligencia general."

Sin embargo, también reconoció que en comparación con la verdadera AGI, GPT-5 todavía "carece de algunas cosas muy importantes".

"No es un modelo, es algo nativo que ha crecido a partir de las nuevas cosas que ha descubierto, y para mí, esa es la razón por la que puede convertirse en la "semilla" de la AGI". Así lo presentó Sam Altman.

GPT5.26%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Republicar
Compartir

Comentar

0/400

Sin comentarios

Tema
#Gate & WLFI USD1 Points Program
55k Popularidad
#Trump Allows 401(k) Crypto Investing
29k Popularidad
#Join Copy Trading Share to Win $2,000
24k Popularidad
#Show My Alpha Points
77k Popularidad
#SOL Futures Reach New High
22k Popularidad

Anclado