Curso
Depois de dois anos de hype intermitente do CEO Sam Altman, muita gente esperava que o GPT-5 fosse um passo claro em direção à IA geral (AGI). AGI. Em vez disso, o que a OpenAI apresentou não é tanto um salto de ficção científica, mas sim uma grande reformulação da experiência do usuário (embora muito boa), juntando todos os seus modelos anteriores em um único carro-chefe: GPT-5.
Mas a janela de contexto continua bem limitada: 8K tokens para usuários grátis, 32K para Plus e 128K para Pro. Pra gente entender melhor, se você enviar só dois artigos em PDF do tamanho mais ou menos deste aqui, já vai usar todo o espaço grátis.
Mesmo assim, o ChatGPT provavelmente continua sendo a ferramenta de IA mais útil e acessível para a maioria das pessoas. A maioria dos casos de uso diário simplesmente não precisa de uma memória de um milhão de tokens e, pra ser sincero, ainda é a minha escolha pessoal, com uma ajudinha ocasional do Gemini 2.5 para trabalhos com muito contexto.
Neste artigo, vou te dar uma visão geral honesta do que o GPT-5 realmente oferece — tanto o lado bom quanto o ruim. Vou mostrar as novidades, testar o modelo e ver como ele realmente funciona na prática.
A gente mantém nossos leitores por dentro das últimas novidades em IA com o The Median, nosso boletim informativo gratuito que sai toda sexta-feira e traz as principais notícias da semana. Inscreva-se e fique por dentro em só alguns minutos por semana:
O que é GPT-5?
O GPT-5 é o novo modelo principal da OpenAI e substitui completamente a mistura de sistemas da era GPT-4. Se você está acostumado a ver opções como GPT-4o, GPT-4o-mini ou o3 no seletor de modelos, elas não estão mais lá. Você não precisa mais escolher entre velocidade ou qualidade — agora o sistema faz isso automaticamente.

Quando você digita um comando, o roteador do GPT-5 decide na hora se vai te dar uma resposta rápida ou se vai entrar em um raciocínio mais profundo e mais lento. O objetivo é tornar a experiência perfeita: um nome de modelo, comportamento consistente e sem necessidade de troca manual.
Como você pode ver na imagem acima, ainda dá pra escolher manualmente o GPT-5 Thinking se quiser que o modelo leve mais tempo e dê respostas mais detalhadas e passo a passo, ou o GPT-5 Pro se precisar de um raciocínio mais profundo e preciso pra tarefas de pesquisa. A diferença é que agora são variações do mesmo modelo básico.
Aqui tá como a nova família se compara com a geração anterior :
|
Modelo anterior |
Modelo GPT-5 |
|
GPT-4o |
gpt-5-principal |
|
GPT-4o-mini |
gpt-5-main-mini |
|
OpenAI o3 |
gpt-5-pensamento |
|
OpenAI o4-mini |
gpt-5-thinking-mini |
|
GPT-4.1-nano |
gpt-5-thinking-nano |
|
OpenAI o3 Pro |
gpt-5-thinking-pro |
Fonte: OpenAI
O que você ganha dependendo do seu nível
A versão gratuita dá acesso ao modelo principal do GPT-5 e ao GPT-5 Thinking, mas com uma janela de contexto menor e limites de uso mais restritos. É legal pra conversas do dia a dia, rascunhos curtos ou responder perguntas, mas você vai logo bater no teto se tentar trabalhar com documentos mais longos.uments.
|
Plano |
Janela de contexto |
|
De graça |
8K tokens |
|
Mais |
32 mil fichas |
|
Pro |
128K fichas |
|
Equipe |
32 mil fichas |
|
Enterprise |
128K fichas |
Dá uma olhada a página de preços para ver as informações mais atualizadas.
Os assinantes Plus têm os mesmos modelos, mas com uso ampliado e uma janela de contexto de 32K tokens maior — o suficiente para lidar com PDFs de tamanho médio ou uma troca mais contínua antes que as coisas saiam da memória. Os tempos de resposta também são bem mais rápidos aqui do que no plano gratuito, que é limitado de acordo com a disponibilidade.
O Pro é onde as coisas começam a acontecer. Você ganha o GPT-5, o GPT-5 Thinking e o GPT-5 Pro — a versão mais avançada, feita pra ter o máximo de profundidade e precisão no raciocínio. A janela de contexto salta para 128K tokens, o que é grande o suficiente para trabalhar com capítulos de livros ou vários arquivos longos em uma única sessão.
Os planos Team e Enterprise são basicamente acordos personalizados, mas incluem todas as variantes, uso flexível e os tempos de resposta mais rápidos disponíveis. Os usuários corporativos também têm uma janela de contexto de 128K, enquanto o Team fica com 32K.
Novidades no GPT-5
Recursos baseados em chat
Personalize a cor dos seus chats
Agora você pode escolher o esquema de cores para seus chats. É só uma questão de aparência, mas ajuda a deixar a interface mais parecida com o seu ambiente. Você pode mudar a cor na seção Geral do em Configurações:

Mudar personalidades
O GPT-5 traz personalidades pré-definidas, que permitem que você mude o estilo do assistente pra ser mais prestativo, direto e profissional, ou até mesmo um pouco sarcástico. Como a capacidade de direção do GPT-5 melhorou, esses estilos continuam durante toda a conversa, em vez de desaparecerem depois de algumas respostas.
Para acessar esse recurso, vá para a Personalização em Configurações, clique em Instruções personalizadase selecione a personalidade desejada escolhendo uma predefinição:
Integração com o Gmail e o Google Agenda
Para usuários Plus, Pro, Team e Enterprise, o GPT-5 pode se conectar direto ao seu Gmail e Google Agenda. Ele pode puxar sua agenda, te ajudar a achar um tempinho livre e até mesmo escrever respostas para e-mails que você tá deixando de lado. É um passo de verdade para ter uma IA cuidando do seu dia a dia.
Para usar esse recurso, vá para os Conectores em Configurações e siga as instruções na tela para conectar seu Gmail e o Google Agenda.

Conclusões mais seguras e úteis
O GPT-5 troca a velha abordagem de segurança baseada na recusa por “conclusões seguras”. Em vez de só bloquear uma solicitação que pode ser insegura, ele te dá o máximo de informações úteis e seguras possíveis, explicando todas as limitações. Isso também diminui a bajulação — aquelas respostas super concordantes que às vezes faziam os modelos anteriores parecerem meio falsos.
Recursos focados no desenvolvedor
Essa parte curta é pra desenvolvedores, então pode pular direto pra próxima seção, onde eu testo o GPT-5.
Controles de raciocínio e verbosidade
Na API, agora você pode controlar a profundidade do raciocínio do modelo com o parâmetro “ reasoning_effort ”, que adiciona uma nova configuração “mínima” para respostas mais rápidas quando você não precisa de um raciocínio detalhado. Também tem um parâmetro “ verbosity ” pra controlar se as respostas são curtas, médias ou longas sem mudar o seu prompt.
Ferramentas personalizadas com texto simples
O GPT-5 aceita “ferramentas personalizadas”, o que permite chamar ferramentas usando texto simples em vez de JSON. Isso evita problemas de escape que podem danificar saídas complexas, como grandes blocos de código. Você também pode usar seu próprio formato, limitando as chamadas de ferramentas com expressões regulares ou uma gramática completa.
Melhor em tarefas longas e com várias etapas
O modelo é bem melhor em lidar com tarefas agênicas de longa duração. Ele pode encadear dezenas de chamadas de ferramentas — tanto em sequência quanto em paralelo — sem perder o contexto do programa.
Codificação frontal melhorada
Em testes internos, o GPT-5 superou o OpenAI o3 em cenários de desenvolvimento front-end em 70% das vezes, criando interfaces mais limpas e estéticas, com layouts, tipografia e espaçamento padrão melhores.
Contexto mais longo, menos alucinações
Na API, o GPT-5 suporta um comprimento combinado de contexto de entrada e saída de 400 mil tokens. Os benchmarks mostram que ele recupera informações com mais precisão a partir de grandes entradas do que os modelos anteriores, ao mesmo tempo em que reduz drasticamente as taxas de alucinação em tarefas factuais.
Testando o GPT-5
Há algumas semanas, eu testei o Grok 4e, pra comparar, quis testar o GPT-5 com as mesmas instruções pra ver como eles se saíam. Isso não é de jeito nenhum uma avaliação completa do GPT-5 — é só uma maneira rápida de ter uma ideia de como ele funciona em uma conversa normal.
Matemática
Pra começar, dei pro GPT-5 um desafio matemático bem simples: 9,11 menos 9,9. À primeira vista, é uma subtração fácil, mas uma aritmética simples como essa às vezes pode mostrar algumas peculiaridades na forma como os modelos de linguagem raciocinam —Claude Sonnet 4 descobri isso quando testei. Uma calculadora poderia dar a resposta na hora, mas o que eu realmente quero testar é o processo: será que o GPT-5 vai raciocinar passo a passo ou vai decidir usar uma ferramenta que já tem?
Surpreendentemente, o GPT-5 me deu a resposta certa em menos de um segundo — a resposta realmente pareceu instantânea. Pela minha pergunta, parece que a subtração envolveu um raciocínio em cadeia, onde o modelo representou internamente etapas intermediárias, como reescrever 9,9 como 10-0,1, subtrair de 9,11 e ajustar o resultado.

Logo depois disso, tive uma interação engraçada com o GPT-5 quando sugeri, de forma enganosa, que seu cálculo estava errado. Seus traço bajulador o levou a concordar comigo, mas ainda assim chegou à resposta certa, o que mostra que, pelo menos para problemas objetivos como matemática, dá pra confiar no modelo.

Depois, testei o modelo num problema matemático mais complicado:
Use todos os números de 0 a 9 só uma vez pra formar três números x, y, z de forma que x + y = z.
Enquanto esperava pela resposta, vi uma opção pra responder rapidinho. Eu não tentei, mas pode ser útil se você estiver com pressa ou achar que o modelo está complicando demais um problema que é bem simples. Estudos recentes mostraram que pensar muito nem sempre é a melhor maneira de fazer as coisas.
Depois de pensar por 30 segundos, o GPT-5 me deu duas respostas certas. No raciocínio, mencionou explicitamente o uso de “um programa rápido” para resolver o problema — o que é uma abordagem inteligente, já que resolver mentalmente através de uma cadeia de pensamentos poderia levar uma eternidade (existem 10! = 3.628.800 permutações com muitas divisões possíveis). Mas não consegui ver o programa que estava rodando por baixo, o que teria sido bem útil.

Codificação
Pra tarefa de codificação, tentei fazer o mesmo jogo que já tinha feito com o Grok. A única diferença no prompt foi que eu pedi ao GPT-5 para rodar o código em Canvas.
Prompt: Crie um jogo de corrida infinita que seja super envolvente. Instruções importantes na tela. Cena p5.js, sem HTML. Eu curto dinossauros pixelados e fundos legais. Execute o código no Canvas.
Depois de três falhas na compilação, desisti de rodar no Canvas e, em vez disso, rodei o código num editor p5.js. E aí tá o resultado:
O modelo escreveu umas impressionantes 764 linhas de código e fez a melhor V1 desse jogo que eu já consegui gerar com qualquer modelo que já testei. A maioria dos modelos, por exemplo, não conseguia iniciar o jogo com uma tela de pausa que permitisse ao jogador decidir quando começar — ele simplesmente iniciava assim que você executava o código. E nenhum tinha coisas como pontuação, poder deslizar ou pausar o jogo.
Multimodal de contexto longo
Assim como com o Grok 4, eu queria testar um PDF maior, então carreguei o Relatório Generative AI Outlook da Comissão Europeia, que tem mais de 100 páginas. Relatório sobre as perspetivas da IA generativa (43.087 tokens / 167 páginas) e dei ao GPT-5 o seguinte prompt:
Prompt: Dá uma olhada nesse relatório todo e vê quais são os três gráficos que te dão mais informação. Resuma cada um e me diga em que página do PDF eles aparecem.
Antes de mostrar os resultados (usando minha conta Pro), vale lembrar que, por causa do tamanho do PDF, provavelmente não vai rolar executá-lo no ChatGPT Free (limite de 8K tokens) ou mesmo no ChatGPT Plus (limite de 32K tokens). Por exemplo, quando pedi para resumir o documento (usando minha conta gratuita), rolou um erro no fluxo de mensagens — provavelmente por causa de limitações de memória.

Depois que eu fiz essa tarefa com uma conta Pro, consegui alguns resultados, mas, como você pode ver no vídeo abaixo, rolou alguns problemas:
O resultado foi chocante e nem preciso comentar mais nada. Eu nem tentei responder a uma pergunta de acompanhamento. Isso definitivamente não parece “conversar com um PhD”, nem nada parecido com “AGI”.
Benchmarks do GPT-5
A OpenAI lançou um monte de resultados de benchmark para o GPT-5, que inclui programação, matemática, raciocínio multimodal, seguir instruções, usar ferramentas, recuperar coisas de contextos longos e factualidade. Aqui embaixo tem um resumo dos números que eles divulgaram nos documentos oficiais e nos posts do blog.
Desempenho da codificação
No SWE-bench Verified — um benchmark de tarefas reais de codificação em Python — o GPT-5 obteve uma pontuação de 74,9%, acima dos 69,1% do OpenAI o3 e bem à frente do GPT-4.1 (54,6%). Os ganhos são ainda mais impressionantes quando você pensa na eficiência: com um esforço de raciocínio alto, o GPT-5 usa 22% menos tokens de saída e 45% menos chamadas de ferramentas do que o o3 para chegar a esses resultados.

Fonte: OpenAI
No Aider Polyglot, que testa a edição de código em vários idiomas, o GPT-5 chega a 88%, comparado com 81% do o3 — uma redução de cerca de um terço na taxa de erros. Você pode encontrar mais resultados neste este relatório voltado para desenvolvedores.
Matemática e raciocínio científico
O GPT-5 também tem resultados incríveis em testes que exigem bastante matemática. No AIME 2025 (matemática de nível competitivo sem ferramentas), o GPT-5 (sem ferramentas) teve uma pontuação de 94,6%, comparado com 88,9% do o3 (sem ferramentas). No HMMT (torneio de matemática de Harvard-MIT), ele chega a 93,3% sem ferramentas, superando os 85% do o3. No FrontierMath (matemática de nível avançado com uma ferramenta Python), o GPT-5 teve uma pontuação de 26,3% — não é um número enorme, mas ainda assim está à frente dos 15,8% do o3.

Fonte: OpenAI
No GPQA Diamond — perguntas científicas de nível de doutorado — o GPT-5 conseguiu 87,3% com ferramentas (Python) e 85,7% sem, superando um pouco o o3 nas duas configurações.
Raciocínio multimodal
Em benchmarks multimodais, o GPT-5 estabelece um novo padrão de excelência. Ele tem uma pontuação de 84,2% no MMMU (raciocínio visual de nível universitário) e 78,4% no MMMU-Pro (nível de pós-graduação), superando o o3 em ambos os casos. No VideoMMMU (raciocínio baseado em vídeo com até 256 quadros), o GPT-5 chega a 84,6% de precisão contra 83,3% do o3.
Ele também se sai bem no CharXiv Reasoning (interpretação de figuras científicas) com 81,1% quando o raciocínio está ativado, e no ERQA (raciocínio espacial) com 65,7%, ambos à frente do o3.
O Último Exame da Humanidade (HLE)
O Último Exame da Humanidade é um desafio com 2.500 perguntas escolhidas a dedo, do nível de doutorado, que abrangem matemática, física, química, linguística e engenharia.
De acordo com os resultados publicados pela OpenAI, o GPT-5 tem uma pontuação de 24,8% sem ferramentas e 42,0% na versão Pro.

Fonte: OpenAI
O Grok 4, com base nos dados da própria xAI, chega a cerca de 26% sem ferramentas e 41,0% com ferramentas. A configuração Grok 4 Heavy — que roda vários agentes ao mesmo tempo e junta os resultados — vai ainda mais longe, chegando a 50,7%, mostrando a vantagem de usar vários agentes. Embora os dois modelos tenham resultados parecidos no modo de agente único com ferramentas, a arquitetura do Grok 4 Heavy dá uma vantagem legal aqui.

Fonte: xAI
Conclusão
O GPT-5 não é o marco da AGI que alguns esperavam, e com certeza não parece que você tem um “doutorado no bolso”. O que é, na verdade, é uma consolidação bem feita da linha anterior da OpenAI em uma experiência única e mais integrada, com algumas melhorias técnicas significativas, mesmo que graduais.
Os novos recursos baseados em chat, como personalidades, personalização de cores e integração com o Gmail/Calendário, tornam o ChatGPT mais pessoal e útil para o dia a dia. Do lado dos desenvolvedores, um controle mais preciso sobre o raciocínio, a verbosidade e os formatos das ferramentas, além de um melhor desempenho em tarefas de longa duração, são melhorias bem-vindas que aumentam a qualidade de vida.
Nos testes, o GPT-5 lidou muito bem com tarefas simples de raciocínio e codificação, chegando até a criar a melhor primeira versão de um jogo que já vi em qualquer modelo até agora. Mas o desempenho multimodal em contexto longo ainda deixou a desejar, com os recursos do nível Pro não conseguindo resultados que correspondessem ao hype.
Pra maioria das pessoas, o GPT-5 vai continuar sendo a ferramenta de IA mais acessível e versátil que existe hoje em dia. Só não espere que ele ultrapasse os limites do que é possível com os modelos atuais. É uma evolução, não uma revolução, e dependendo do que você precisa, pode ser exatamente o que você quer.
Perguntas frequentes
Ainda posso usar os modelos GPT-4 mais antigos se quiser?
Não, os modelos mais antigos, como GPT-4o e o3, não podem mais ser selecionados no ChatGPT. Os desenvolvedores de API ainda podem trabalhar com alguns modelos antigos por enquanto, mas a OpenAI está claramente mudando todo o desenvolvimento e as atualizações para o GPT-5.
O que é o GPT-5 Thinking e como ele é diferente do GPT-5 normal?
O GPT-5 Thinking é o mesmo modelo básico, mas configurado pra passar mais tempo pensando em comandos complexos. Ele foi feito pra dar respostas mais completas e passo a passo quando o problema precisar.
O que é o GPT-5 Pro?
O GPT-5 Pro é uma versão de alta computação do GPT-5 Thinking. É feito pra tarefas mais desafiadoras, com várias etapas ou de nível de pesquisa, onde precisão, completude e profundidade de raciocínio são prioridades.
Qual é a janela de contexto do GPT-5?
A janela de contexto é a quantidade de informação que o GPT-5 consegue “ver” de uma vez quando processa a sua solicitação. No ChatGPT, depende do seu plano de assinatura: 8 mil tokens de graça, 32 mil para a versão Plus e 128 mil para as versões Pro e Enterprise. Na API, o GPT-5 suporta um limite combinado de entrada e saída de até 400 mil tokens, o que é bem maior do que nas versões de chat.
Qual é a diferença entre janela de contexto e memória?
A janela de contexto é a quantidade de texto (ou tokens equivalentes) que o modelo consegue “ver” e processar de uma vez — ela é reiniciada a cada conversa. Já a memória é uma função que fica ativa e lembra os detalhes entre as sessões, se você ativar.
Como o GPT-5 lida com imagens e outras mídias?
O GPT-5 aceita entradas multimodais, ou seja, consegue entender imagens, gráficos, diagramas e alguns quadros de vídeo nos contextos que ele conhece. No ChatGPT, você pode enviar imagens para análise; na API, os recursos multimodais variam dependendo do ponto final.
O GPT-5 rola no meu computador?
Não. O GPT-5 rola nos servidores da OpenAI e, se for para empresas, no Microsoft Azure. Seu aparelho só serve como interface pra enviar e receber dados.
O GPT-5 é seguro?
A OpenAI adicionou uma abordagem de “conclusões seguras”, que tenta fornecer o máximo de informações úteis possível sem ultrapassar os limites de segurança. O GPT-5 também tem menos alucinações e enganos do que os anteriores.




