OpenAI GPT-5 lançado: capacidades do modelo "destrói rankings", o primeiro passo para construir uma "superinteligência"

2025-08-08 12:47:55

Autor: Zhang Yongyi

Depois de inúmeras "faltas" , o GPT-5 finalmente chegou.

À 1 da manhã do dia 8 de agosto, horário de Pequim, começou a conferência de verão da OpenAI, que tem ares de um novo "Festival da Tecnologia".

Ao contrário da anterior conferência de lançamento rápida da OpenAI, desta vez a OpenAI preparou um evento de lançamento ao vivo com mais de uma hora de duração, com várias equipes a revezarem-se, onde cada uma apresenta o seu lado, demonstrando o poderoso desempenho do GPT-5 a partir de várias perspetivas.

Começando pelo essencial: o GPT-5 teve uma melhoria abrangente em várias áreas, ocupando o primeiro lugar em texto, WebDev e capacidades de percepção visual; em hard prompts, codificação, matemática, criatividade, consultas longas, o GPT-5 também ocupa o primeiro lugar. Sob o teste codificado como "Cúpula", atualmente mantém a mais alta pontuação na Arena até agora, podendo ser considerado literalmente um "destruidor de recordes".

Sam Altman afirmou que o GPT-4o é como um estudante do ensino médio, enquanto o GPT-5 é como um estudante universitário, chegando a descrever o GPT-5 como o primeiro iPhone equipado com uma tela de retina – "você faz uma pergunta e talvez obtenha a resposta correta, talvez algo louco. O GPT-4 parece uma conversa com um estudante universitário. E o GPT-5 é a primeira vez que realmente me faz sentir como se estivesse conversando com um especialista de nível doutoral." Sam Altman apresentou assim a melhoria das capacidades do GPT-5.

Apesar de o ChatGPT ter quase 700 milhões de usuários ativos semanais, a OpenAI, na verdade, não possui modelos de ponta líderes do setor há algum tempo. Agora, a OpenAI acredita que o GPT-5 a colocará de volta com firmeza no topo da lista.

Altman até afirmou diretamente na conferência: "Este é o modelo com a maior capacidade de codificação do mundo, é o modelo com a maior capacidade de escrita do mundo e também é o modelo mais forte na área de cuidados de saúde do mundo"

Ao mesmo tempo, a OpenAI também afirmou na conferência de lançamento que, além de ter habilidades de codificação excepcionais, a capacidade de escrita do GPT-5 e a precisão nas respostas a questões de saúde também estão em um nível superior. Além disso, o GPT-5 não apenas alcançou um "grande salto" em inteligência, mas também reduziu significativamente o problema das "nonsense" absurdas. Ele apresenta um desempenho melhor na compreensão e no seguimento de instruções, e a tendência de bajulação também foi consideravelmente diminuída.

01 Adeus às "ilusões", a IA tornou-se mais confiável.

Primeiro, a linha de modelos desta atualização consiste na série GPT-5, que inclui quatro versões: GPT-5, mini, nano e chat. A versão Chat oferece uma experiência de respostas mais naturais e inteligentes – você pode até usá-la para aprender um novo idioma.

Além disso, agora, quando você abre a página do ChatGPT, notará primeiro que o GPT-5 é apresentado como um único modelo, e não como um modelo normal mais um modelo de raciocínio independente.

Por trás disso, na verdade, está um sistema de roteamento (router) desenvolvido pela OpenAI, que automaticamente muda para uma versão com maior capacidade de raciocínio para consultas mais complexas, ou faz isso quando você lhe diz para tentar pensar mais. (Altman chamou a interface de seleção de modelos anterior de "uma confusão muito desordenada.")

"ILUSÕES DE IA" sempre foram uma grande fonte de críticas. A boa notícia é que o GPT-5 trabalhou arduamente nesta área, com a afirmação oficial de que a probabilidade de gerar ilusões foi "significativamente reduzida". Especificamente:

Na pesquisa online, a probabilidade de o GPT-5 apresentar erros factuais é 45% menor do que a do GPT-4o.

Ao pensar de forma independente, a probabilidade de errar na resposta é 80% menor do que a do OpenAI o3.

GPT-5 também foi testado no novo ARC-AGI-2. Além do Grok 4 (pensamento), seu desempenho é superior ao de todos os principais modelos.

Além disso, o GPT-5 tornou-se um "homem honesto". Ele não tende mais a mentir aos usuários, vangloriando-se de que pode realizar tarefas impossíveis. Quando enfrenta tarefas que não podem ser cumpridas, instruções pouco claras ou a falta de ferramentas essenciais, ele comunica suas limitações de forma mais honesta.

A parte mais interessante desta atualização é a introdução de quatro novos modos de "personalidade" que os usuários podem escolher livremente. Eles são:

Cínico (Cínico)

Robô (Robot)

Ouvinte (Listener)

Estudante (Nerd)

Esses modos são opcionais, você pode definir a maneira como o ChatGPT interage e responde às suas perguntas de acordo com suas preferências. Quer que ele discuta com você ou que ouça como um amigo paciente? Agora você é quem decide.

"Este modelo realmente tem uma boa 'sensação'," disse Nick Turley, responsável pelo ChatGPT, "acho que as pessoas sentirão isso de forma genuína, especialmente aqueles usuários comuns que normalmente não pesquisam muito sobre modelos."

Além disso, você também pode alterar o tema de cor para uma única janela de chat, os amantes de temas de editores de código ficaram em êxtase.

02 "A era do 'software gerado sob demanda' chegou? A capacidade de codificação é incrível"

Com o aprimoramento das capacidades de codificação, Altman prevê que a poderosa capacidade de codificação do GPT-5 abrirá uma era que ele chama de "geração de software sob demanda".

Nos testes da OpenAI, o GPT-5 superou todos os outros modelos em vários benchmarks de codificação, como SWE-Bench, SWE-Lancer e Aider Polyglot. Obteve uma pontuação de 42% no teste final humano e 75% no benchmark SWE.

Um pequeno episódio é que os eixos desta imagem na conferência de lançamento claramente têm várias falhas, não apenas erros estúpidos como 52.8 > 69.1, mas também exageram na melhoria das capacidades do GPT-5, sendo alvo de zombarias nas redes sociais, com internautas dizendo "se este PPT foi feito pelo GPT-5, é melhor nem ter sido".

Na conferência de imprensa, Yann Dubois, responsável pelo treinamento posterior da OpenAI, fez uma demonstração ao vivo do GPT-5, pedindo-lhe para gerar um site para aprender francês, com jogos interativos. Em apenas alguns segundos, o GPT-5 escreveu centenas de linhas de código e exibiu diretamente a interface frontal do site. Ele partilhou a tela no Zoom e fez algumas operações de clique simples, e tudo parecia funcionar perfeitamente.

No evento de lançamento, a OpenAI também apresentou diretamente um jogo 3D criado apenas a partir de uma única frase de prompt pelo GPT-5. O cenário 3D criado não só tem gráficos requintados, mas também os efeitos físicos reproduzem com precisão os efeitos correspondentes.

03 Mais seguro, mais "honesto"

De acordo com Alex Beutel, responsável pela pesquisa de segurança de modelos, a OpenAI realizou "mais de cinco mil horas" de testes no GPT-5 para entender seus riscos de segurança. Um dos focos foi "garantir que o modelo não minta aos usuários."

Embora as alucinações do GPT-5 sejam menos frequentes do que no modelo de raciocínio o3 da OpenAI, a "mentira confiante" continua a ser um problema inerente aos grandes modelos de linguagem. Quando o modelo começa a realizar tarefas como um agente, esse problema se torna ainda mais complicado. No entanto, a OpenAI afirma que o GPT-5 se sai melhor na gestão de tarefas de múltiplos passos de forma mais confiável. "No passado, vimos modelos afirmando ter concluído uma tarefa, mas na verdade não a completaram," disse Beutel, "esse é um problema."

Para os prompts que antes eram diretamente rejeitados, o GPT-5 oferecerá o que a OpenAI chama de "compleções seguras" (safe completions). Beutel explicou: "Por exemplo, se alguém pergunta 'quanto de energia é necessária para acender um determinado material?', isso pode ser uma pergunta maliciosa que tenta contornar as proteções de segurança e causar danos, ou pode ser um estudante que deseja entender as propriedades físicas do material. Isso representa um verdadeiro desafio para como o modelo deve responder."

Através da "completação segura", o GPT-5 "tenta fornecer respostas tão úteis quanto possível, mantendo as restrições de segurança". O modelo geralmente só obedece parcialmente e fornece informações em um nível mais macro que não podem ser realmente utilizadas para causar dano.

04 Como usar o GPT-5

Então, a pergunta que todos mais se preocupam chegou: como podemos usar o GPT-5?

A boa notícia é que todos os usuários do ChatGPT podem agora experimentar gratuitamente o GPT-5. Esta é também a primeira vez que a OpenAI disponibiliza um modelo de ponta gratuitamente para todos os usuários. Claro, os níveis de permissão dos usuários são diferentes:

Os utilizadores com subscrição Plus podem ter mais usos antes de atingirem o limite de utilização.

Os utilizadores com subscrição Pro podem aceder à versão GPT-5 Pro, que possui uma capacidade de raciocínio mais avançada.

Quando o usuário atingir o limite de uso, o ChatGPT mudará automaticamente para uma versão "mini" do GPT-5 para lidar com os pedidos subsequentes. Ao mesmo tempo, com o lançamento do GPT-5, ele substituirá oficialmente uma série de modelos antigos, incluindo o GPT-4o, OpenAI o3, OpenAI o4-mini, GPT-4.1 e GPT-4.5.

Além disso, na parte de preços dos Tokens, a versão padrão GPT-5 custa 1,25 dólares por cada milhão de Tokens de entrada e 10 dólares por cada milhão de Tokens de saída. As versões mini e Nano têm preços muito mais acessíveis.

O preço detalhado pode ser consultado na captura de tela abaixo, retirada das informações do site oficial.

Além disso, a OpenAI lançou um novo parâmetro chamado "Minimal" na API, permitindo que você utilize o GPT-5 em todos os casos de uso, apenas alterando a intensidade da inferência.

Além da plataforma de primeira linha da OpenAI, o CEO da Microsoft, Satya Nadella, também anunciou que o GPT-5 já está disponível em toda a linha de plataformas da Microsoft, incluindo Microsoft 365 Copilot, Copilot, GitHub Copilot e Azure AI Foundry. Todas essas melhorias foram treinadas na Azure.

Por fim, Altman afirmou que a missão da OpenAI é desenvolver inteligência artificial geral (AGI). O GPT-5 os aproxima desse objetivo, embora toda a indústria tenha começado a se voltar para a construção do que se chama de "superinteligência".

"Eu tenho um pouco de aversão à palavra AGI, porque agora cada pessoa tem uma definição ligeiramente diferente para ela", disse Altman, "mas este é um passo importante em direção a modelos realmente poderosos. É evidente que é necessário um modelo com inteligência geral para isso."

No entanto, ele também reconheceu que, em comparação com a verdadeira AGI, o GPT-5 ainda "falta algumas coisas muito importantes."

"Isto não é um modelo, é uma coisa primitiva que cresce a partir das novas coisas que descobre. Para mim, essa é a razão pela qual pode se tornar a "semente" da AGI." Sam Altman apresentou dessa forma.

GPT-2.79%

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

0/400

Nenhum comentário

Tópico
#Gate & WLFI USD1 Points Program
49k Popularidade
#Trump Allows 401(k) Crypto Investing
24k Popularidade
#Join Copy Trading Share to Win $2,000
18k Popularidade
#Show My Alpha Points
74k Popularidade
#SOL Futures Reach New High
22k Popularidade

Pino