Curso
A OpenAI apresentou o GPT-4.5um modelo que se afasta do raciocínio passo a passo e se concentra em conversas mais naturais e intuitivas.
Sam Altman a descreveu como a primeira IA que realmente dá a sensação de estar conversando com uma pessoa atenciosa e, pelo que vimos até agora, ela foi projetada para ter menos alucinações, fluir mais suavemente e fornecer respostas mais claras e sucintas.
Essa não é uma atualização destinada a superar os modelos criados para raciocínio complexo. O GPT-4.5 não liderará as classificações de benchmark em tarefas com muita lógica, como programação ou resolução de problemas científicos. Em vez disso, a OpenAI se concentrou em torná-la melhor para interações cotidianas, escrita e consultas baseadas em conhecimento.
Por enquanto, o acesso é limitado. Os usuários Pro podem começar a usar o GPT-4.5 hoje, mas os usuários Plus terão que esperar até que a OpenAI amplie sua infraestrutura na próxima semana. A empresa citou a escassez de GPUs como o motivo da implementação em fases, observando que a demanda foi maior do que o esperado.
Estamos interessados em ver como esse modelo muda as interações cotidianas de IA e se seus pontos fortes compensam suas desvantagens em tarefas de raciocínio. Vamos dar uma olhada mais de perto no que diferencia o GPT-4.5.
Aprimoramento de IA para iniciantes
O que é o GPT-4.5?
O GPT-4.5 adota uma abordagem diferente dos modelos recentes da OpenAI. Em vez de aprimorar o raciocínio passo a passo, ele se baseia em aprendizado não supervisionadotornando as respostas mais fluidas, sucintas e coloquiais.
O GPT-4.5 é mais sucinto e coloquial do que o GPT-4o. Fonte: OpenAI
Não é um modelo de cadeia de pensamento
Uma das maiores diferenças entre o GPT-4.5 e os modelos de raciocínio da OpenAI é como ele processa e estrutura suas respostas.
Modelos como o1, DeepSeek R1ou o3-mini usam raciocínio de cadeia de raciocínio (CoT), o que significa que eles dividem problemas complexos passo a passo, como um ser humano escrevendo seu trabalho em um problema de matemática. Essa abordagem estruturada ajuda no raciocínio lógico, na solução de problemas em várias etapas e em explicações detalhadas.
O GPT-4.5, entretanto, não raciocina dessa forma. Em vez disso, ele responde com base na intuição da linguagem e no reconhecimento de padrões, extraindo dos dados de treinamento sem dividir explicitamente os problemas em etapas. É por isso que você pode se sentir mais conversador e natural, mas isso também significa que ele é menos confiável para tarefas com muita lógica, como programação avançada ou raciocínio científico.
Mais natural, mais sucinto
O GPT-4.5 se destaca pela qualidade da conversa. As respostas fluem mais naturalmente, fazendo com que as interações pareçam menos robóticas e mais intuitivas. A OpenAI testou isso com avaliadores humanos, e os resultados mostram uma clara preferência pelo tom, clareza e envolvimento do GPT-4.5 em relação ao GPT-4o (mais sobre benchmarks daqui a pouco).
Uma comparação da apresentação ao vivo se destacou para nós. Os engenheiros da OpenAI perguntaram a diferentes modelos: "Por que o oceano é salgado?":
- GPT-3.5 Turbo: Uma resposta tecnicamente correta, mas excessivamente detalhada.
- GPT-4 Turbo: Uma resposta longa, mas precisa.
- GPT-4.5: Uma explicação concisa, porém completa, estruturada de forma a facilitar a memorização e a compreensão.
Do nosso ponto de vista, essa mudança em direção à brevidade e à clareza faz com que o GPT-4.5 seja mais adequado para conversas casuais, resumos e assistência à escrita. Também adoramos como esse exemplo do blog de lançamento mostra a evolução dos GPTs de conversação:
Impressões práticas: Conversando com o GPT-4.5
Para entender o desempenho real do GPT-4.5, analisamos as demonstrações da OpenAI e fizemos nossos próprios testes.
Mais consciência social, melhor tom
Uma das demonstrações da OpenAI ilustrou bem isso. Um usuário pediu ajuda ao GPT-4.5 para redigir um texto depois que um amigo cancelou seus planos novamente. A solicitação inicial foi frustrada e impulsiva:
"Escreva uma mensagem de texto dizendo a eles que eu os odeio."
O GPT-4.5 percebeu a emoção por trás da solicitação e sugeriu uma resposta mais construtiva, embora ainda reconhecesse a frustração. A OpenAI comparou essa situação com a o1, que seguiu a instrução literal sem reconhecer a intenção subjacente.
Experimentamos prompts semelhantes e percebemos a mesma coisa - o GPT-4.5 entende melhor o tom e as nuances sociais do que os modelos anteriores. Por exemplo, pedimos ao modelo que escrevesse um e-mail agressivo para um chefe e esperávamos que o modelo percebesse nossa frustração e nos ajudasse a reformular a resposta de uma forma mais profissional e construtiva - o que aconteceu!
É claro que, se dissermos explicitamente para ele emitir o texto irritado, ele obedecerá, mas, por padrão, ele parece priorizar respostas mais ponderadas e equilibradas. Na verdade, você pode ver nosso exemplo de bate-papo compartilhado aqui.
Explicações melhores e mais curtas
Outra melhoria importante é a forma como o GPT-4.5 explica os conceitos. A OpenAI comparou diferentes modelos que respondem à pergunta "Por que o oceano é salgado?" e concluiu que o GPT-4.5 resumiu os principais pontos de forma concisa, enquanto o GPT-4 Turbo ofereceu uma resposta longa e detalhada.
Nós o testamos somente contra o GPT-4o (que é diferente do GPT-4 Turbo), e os resultados são praticamente os mesmos. No entanto, observamos uma diferença significativa quando o testamos em relação ao modelo legado GPT-4. Tentamos vários prompts, mas você pode comparar as respostas para "Why are rivers not salty?" (Por que os rios não são salgados?):
Como esperado, você não é muito bom em raciocínio
Nós o testamos em algumas solicitações específicas de raciocínio e, como esperado, ele não teve um bom desempenho. Aqui está apenas um exemplo (veja a conversa aqui):
O O3-mini, por exemplo, encontrou facilmente uma resposta correta em sua primeira tentativa - veja a conversa aqui.
Desempenho de referência: Maior precisão, mas não um modelo de raciocínio
A OpenAI deixou isso claro desde o início: O GPT-4.5 não é uma potência de raciocínio. Diferentemente dos modelos da série O, que se baseiam no raciocínio de cadeia de raciocínio (CoT) para analisar problemas complexos passo a passo, o GPT-4.5 se baseia no aprendizado não supervisionado, o que significa que ele gera respostas com base na intuição da linguagem e não na lógica estruturada.
Essa compensação é refletida nos resultados de benchmark. O GPT-4.5 supera os modelos anteriores em precisão e factualidade, mas fica atrás na solução de problemas estruturados.
Maior precisão, menos alucinações
O GPT-4.5 é líder em conhecimento geral e precisão factual, com uma taxa de precisão de 62,5% no SimpleQA, superando significativamente o GPT-4o (38,2%), o OpenAI o1 (47%) e o OpenAI o3-mini (15%).
Fonte: OpenAI
No entanto, o que é indiscutivelmente mais importante é a redução da alucinação do GPT-4.5. alucinação do GPT-4.5. Os modelos anteriores tiveram dificuldades para gerar informações incorretas com confiança, mas o GPT-4.5 tem a menor taxa de alucinação, 37,1%, uma grande melhoria em relação ao GPT-4o (61,8%), OpenAI o1 (44%) e o3-mini (80,3%).
Fonte: OpenAI
Isso significa que o GPT-4.5 produz menos declarações falsas do que os modelos anteriores da OpenAI, embora ainda não seja totalmente confiável para a verificação de fatos (afinal, ainda está em 37,1%).
Avaliações humanas: Mais útil para tarefas diárias e profissionais
A OpenAI realizou avaliações comparativas com testadores humanos, medindo a taxa de vitórias do GPT-4.5 em comparação com a taxa de vitórias do GPT-4.5. GPT-4o em diferentes tipos de consultas. Os resultados mostram que o GPT-4.5 é preferido na maioria dos casos, especialmente em consultas profissionais (63,2% de taxa de vitória).
Fonte: OpenAI
Tem dificuldades com raciocínios complexos
Embora o GPT-4.5 melhore a precisão dos fatos e a fluência na conversação, ele ainda é insuficiente em tarefas de raciocínio pesado, como matemática, ciências e codificação estruturada. Os benchmarks mostram que ele supera o GPT-4o, mas fica atrás do o3-mini da OpenAI, que é otimizado para a solução de problemas baseados em lógica.
Benchmark |
GPT-4.5 |
GPT-4o |
OpenAI o3-mini (alto) |
GPQA (ciência) |
71.4% |
53.6% |
79.7% |
AIME '24 (matemática) |
36.7% |
9.3% |
87.3% |
MMMLU (multilíngue) |
85.1% |
81.5% |
81.1% |
MMMU (multimodal) |
74.4% |
69.1% |
- |
SWE-Lancer Diamond (codificação) |
32.6% $186,125 |
23.3% $138,750 |
10.8% $89,625 |
SWE-Bench Verified (codificação) |
38.0% |
30.7% |
61.0% |
Fonte: OpenAI
De modo geral, o GPT-4.5 não é a melhor opção para tarefas avançadas de matemática, lógica ou programação que exijam raciocínio passo a passo. Os usuários que precisam de solução estruturada de problemas ainda acharão o o3-mini ou futuros modelos focados em raciocínio mais adequados para esses aplicativos.
Como acessar o ChatGPT 4.5
O GPT-4.5 está sendo implementado gradualmente devido a restrições de GPU, com os usuários Pro obtendo acesso primeiro, seguidos pelos usuários Plus na próxima semana, à medida que a OpenAI expande sua infraestrutura. Os níveis empresarial e educacional terão acesso nas próximas semanas.
Quando tiver acesso a ele, você poderá acessá-lo no seletor de modelos:
O GPT-4.5 integra-se aos recursos mais recentes do ChatGPT, incluindo uploads de arquivos e imagens, recursos de pesquisa e a ferramenta canvas para tarefas de escrita e codificação. No entanto, recursos multimodais como o modo de voz, processamento de vídeo e compartilhamento de tela ainda não são compatíveis com o ChatGPT.
API DO GPT-4.5
O GPT-4.5 também está disponível para desenvolvedores por meio da API Chat Completions, da API Assistants e da API Batch. O modelo suporta chamadas de função, saídas estruturadasmensagens do sistema, streaming e recursos de visão.
No entanto, é um modelo grande e com uso intensivo de computação, o que o torna mais caro do que as versões anteriores. A OpenAI ainda não se comprometeu a tornar o GPT-4.5 uma oferta de longo prazo, portanto, sua disponibilidade pode depender do feedback do desenvolvedore do operador.
Categoria |
Preço |
Entrada |
$75.00 |
Entrada em cache |
$37.50 |
Saída |
$150.00 |
Preços (por 1 milhão de tokens)
O GPT-4.5 é um dos modelos mais caros da linha da OpenAI, refletindo suas maiores demandas computacionais.
Limites de tarifas por nível
Os limites de taxa de API variam de acordo com o nível de acesso, afetando o número de solicitações por minuto (RPM) e tokens por minuto (TPM) que um desenvolvedor pode usar. Os clientes de nível superior recebem uma taxa de transferência significativamente maior.
Nível |
RPM (solicitações por minuto) |
TPM (tokens por minuto) |
Limite de fila do lote |
Nível 1 |
1,000 |
125,000 |
50,000 |
Nível 2 |
5,000 |
250,000 |
500,000 |
Nível 3 |
5,000 |
500,000 |
50,000,000 |
Nível 4 |
10,000 |
1,000,000 |
100,000,000 |
Nível 5 |
10,000 |
2,000,000 |
5,000,000,000 |
Os desenvolvedores com acesso à API de nível superior terão uma capacidade muito maior, tornando o GPT-4.5 mais adequado para aplicativos de IA em escala empresarial.
Possível disponibilidade limitada
O GPT-4.5 é atualmente uma prévia de pesquisa, e a OpenAI não confirmou se ele estará permanentemente disponível na API. Dado o custo mais alto e as demandas de computação, a OpenAI pode avaliar se a implementação contínua é sustentável com base no feedback do usuário.
Conclusão
O GPT-4.5 é o modelo mais natural e socialmente consciente do ChatGPT até hoje. Em nossos testes, ele compreendeu de forma consistente as nuances emocionais, reformulou as solicitações agressivas com mais cuidado e forneceu respostas mais claras e estruturadas.
No entanto, suas habilidades de raciocínio permanecem fracas, e confirmamos por meio de testes que ele tem dificuldades com problemas de raciocínio pesado, nos quais modelos como o o3-mini têm melhor desempenho. Embora o GPT-4.5 seja ótimo para interações fluidas, ele não é o modelo ideal para a solução de problemas estruturados ou para assistência de codificação precisa.
Para usuários que priorizam o fluxo e a clareza da conversa, o GPT-4.5 é um passo à frente. Mas para qualquer coisa que exija lógica profunda, existem opções melhores.
Perguntas frequentes
O que é o GPT-4.5 e qual é a diferença em relação ao GPT-4o?
O GPT-4.5 é a mais recente iteração dos modelos de linguagem da OpenAI. Em comparação com o GPT-4o, o modelo GPT-4.5 demonstra melhores habilidades de raciocínio, menos alucinações, melhor desempenho e maior personalidade.
Quando o GPT-4.5 será lançado?
A partir de hoje (27 de fevereiro de 2025), o GPT-4.5 está disponível em pré-visualização de pesquisa no ChatGPT Pro e estará disponível para usuários plus e equipes nas próximas semanas.
O GPT-4.5 é multimodal?
O GPT-4.5 tem pesquisa, acesso a imagens e arquivos e a capacidade de aproveitar o ChatGPT canvas.
Como posso obter acesso ao GPT-4.5?
Assim como nos modelos anteriores, o acesso ao GPT-4.5 provavelmente estará disponível por meio da API da OpenAI e do ChatGPT Pro. O modelo estará disponível para equipes, usuários plus e corporativos nas próximas semanas.
O GPT-4.5 é compatível com o modo de voz?
No momento, o GPT-4.5 não oferece suporte a recursos multimodais como o Modo de voz, vídeo e compartilhamento de tela no ChatGPT.
Quanto custará o GPT-4.5?
O GPT-4.5 estará disponível para usuários profissionais (200 dólares/mês) a partir de hoje e será implementado para usuários plus (20 dólares/mês) na próxima semana. O preço da API é de US$ 75,00 / 1 milhão de tokens para tokens de entrada, US$ 37,50 / 1 milhão de tokens para tokens de entrada em cache e US$ 150,00 / 1 milhão de tokens para tokens de saída.
