Guia do OpenAI o1: Como funciona, casos de uso, API e muito mais

O OpenAI o1 é uma nova série de modelos da OpenAI que se destacam em tarefas de raciocínio complexas, usando o raciocínio de cadeia de pensamento para superar o GPT-4o em áreas como matemática, codificação e ciências.

Atualizado 12 de dez. de 2024 · 8 min lido

Enquanto esperávamos pelo GPT-5a OpenAI surpreendeu a todos no verão passado com o lançamento do modelo o1-preview. Agora, eles acabaram de anunciar que o o1 está totalmente disponível e não está mais em modo de visualização.

Em comparação com a versão de visualização, o o1 pode receber entradas multimodais, tem compreensão de imagens e é muito mais rápido para consultas simples. Anteriormente, você levava mais de dez segundos apenas para responder ao prompt "Hi".

A OpenAI também introduziu o modo o1 pro, que é um pouco mais avançado e confiável do que o o1. Embora tenhamos abordado brevemente o modo o1 pro neste artigo, vamos explorá-lo em mais detalhes neste artigo separado: O que é o modo O1 Pro da OpenAI? Recursos, ChatGPT Pro e mais.

OpenAI redefiniu o contador de volta para 1 e o nomeou OpenAI o1, enfatizando seu foco distinto no raciocínio em comparação com o tradicional tradicional do GPT. Isso marca o início de uma nova série o da OpenAI , semelhante à série GPT que todos nós conhecemos.

Os modelos O1 não foram projetados para substituir o GPT-4o em todos os casos. Para aplicações que exigem tempos de resposta consistentemente rápidos, os modelos GPT-4o e GPT-4o mini continuam sendo a escolha ideal.

Continue lendo para saber mais sobre os novos modelos O1!

Desenvolver aplicativos de IA

Aprenda a criar aplicativos de IA usando a API OpenAI.

Comece a treinar gratuitamente

Como o OpenAI o1 funciona

A primeira coisa que você notará ao interagir com o o1 é que ele leva visivelmente mais tempo para gerar respostas em comparação com o GPT-4o. Essa pausa deliberada reflete a ênfase do modelo no raciocínio. O O1 passa mais tempo "pensando" antes de responder, o que lhe permite enfrentar tarefas complexas e resolver problemas mais difíceis em lógica, matemática, codificação e ciências.

O OpenAI o1-preview está lidando com um problema de lógica

Aprendizagem por reforço e cadeia de raciocínio

O raciocínio superior do O1 é obtido por meio de uma combinação de aprendizado por reforço e raciocínio em cadeia.

Por meio da aprendizado por reforçoo modelo aprende a refinar seu processo de raciocínio, explorando diferentes estratégias, reconhecendo erros e adaptando sua abordagem para chegar à solução mais precisa e lógica.

Do outro lado, raciocínio de cadeia de pensamento é uma técnica para dividir problemas complexos em componentes menores e mais gerenciáveis. Essa abordagem permite que o1 "pense antes de responder", da mesma forma que planejar meticulosamente as etapas de uma receita complexa antes de começar a cozinhar.

Ao expor explicitamente seu processo de raciocínio, a o1 pode identificar possíveis erros logo no início e aumentar a probabilidade de chegar à solução correta, assim como nós, seres humanos, temos menos probabilidade de cometer erros quando descrevemos cuidadosamente nosso processo de pensamento.

O fato de o OpenAI o1 usar o raciocínio em cadeia torna-o especialmente eficaz em áreas como matemática, ciências e codificação, em que a obtenção de uma resposta correta geralmente requer várias etapas.

Um novo paradigma na alocação de computação

Um diferencial importante do OpenAI o1 está em sua realocação estratégica de recursos computacionais. Embora os LLMs tradicionais tenham se concentrado principalmente em conjuntos de dados maciços de pré-treinamento, o o1 muda a ênfase para as fases de treinamento e inferência.

Essa mudança mostra que a alocação de mais computação para esses estágios pode gerar ganhos significativos em recursos de raciocínio complexos.

Fonte: OpenAI

O gráfico acima mostra o impacto do aumento dos recursos computacionais no desempenho do modelo o1 da OpenAI ao enfrentar o desafiador AIME (American Invitational Mathematics Examination). Ele apresenta dois gráficos, cada um representando a precisão do modelo em relação à potência de computação dedicada ao treinamento ou ao teste (inferência).

Uma correlação positiva clara é evidente em ambos os gráficos: à medida que os recursos computacionais aumentam, também aumenta a precisão do modelo na solução de problemas AIME na primeira tentativa. Notavelmente, a relação é mais acentuada no gráfico de tempo de teste, sugerindo que dar ao modelo mais tempo para "pensar" durante a solução de problemas leva a um desempenho significativamente melhor.

Essa observação ressalta a natureza de computação intensiva de o1, destacando sua dependência de recursos computacionais substanciais. No entanto, as tendências de aumento em ambos os gráficos também indicam que é possível obter mais ganhos de precisão com ainda mais computação, oferecendo caminhos promissores para o desenvolvimento futuro dos recursos de raciocínio de IA.

Benchmarks do OpenAI O1: Melhor em tarefas de raciocínio pesado

Para demonstrar os recursos de raciocínio aprimorados do o1 em comparação com o GPT-4o, a OpenAI avaliou o modelo em uma variedade de benchmarks desafiadores de matemática, codificação e ciências.

Exames em humanos

O exame humano demonstra que o1 supera consistentemente o GPT-4o e o1-preview.

As barras sólidas mostram a precisão pass@1 e a região sombreada mostra o desempenho do voto majoritário (consenso) com 64 amostras. Fonte: OpenAI

Talvez a observação mais impressionante seja o salto gigantesco no desempenho entre o GPT-4o e o o1 (e até mesmo a visualização do o-1) nos benchmarks de matemática e codificação.

E, embora a melhoria no domínio da ciência seja menos pronunciada, é digno de nota que tanto o o1-preview quanto o modelo o1 totalmente otimizado superam os especialistas humanos em questões científicas de nível de doutorado. Isso mostra o potencial do o1 para lidar com problemas complexos do mundo real e até mesmo superar o desempenho em nível humano em determinados domínios.

A OpenAI o1 tem casos de uso potencial em genética.

Benchmarks de ML

Observando os resultados dos benchmarks de ML, os avanços da o1 no raciocínio são bastante óbvios. Tanto no MathVista (um benchmark de matemática) quanto no MMLU, o o1 apresenta ganhos substanciais de precisão em comparação com o GPT-4o.

Fonte: OpenAI

Uma versão especializada do o1, conhecida como o1-ioi, demonstrou habilidades superiores de codificação ao garantir uma classificação de 49º percentil na Olimpíada Internacional de Informática de 2024, mesmo sob condições rigorosas de competição.

Em competições simuladas (veja o gráfico abaixo), o desempenho do o1-ioi foi ainda maior, superando 93% dos concorrentes.

Fonte: OpenAI

Casos de uso do OpenAI o1

Os recursos de raciocínio do OpenAI o1 o tornam particularmente adequado para resolver problemas complexos em ciências, codificação e matemática.

Pesquisa científica

Os pesquisadores da área de saúde, por exemplo, poderiam usar o o1 para anotar dados complexos de sequenciamento de células, enquanto os físicos poderiam usá-lo para gerar as fórmulas matemáticas sofisticadas necessárias para a pesquisa de óptica quântica.

Física quântica e OpenAI o1

Codificação

Desde a sugestão de otimizações de código e a geração de casos de teste até a automação de revisões de código e a facilitação do compartilhamento de conhecimento, a o1 tem o potencial de aumentar significativamente a produtividade do desenvolvedor e simplificar os fluxos de trabalho.

Além disso, a capacidade da o1 de entender e gerar código estende sua utilidade para além da codificação. Ele pode auxiliar no planejamento de projetos, na análise de requisitos e no projeto de arquitetura de software, ajudando os desenvolvedores a criar soluções mais eficazes.

Embora todos os recursos da o1 ainda estejam sendo desenvolvidos, seus recursos atuais já são promissores. Como a OpenAI continua a refinar o modelo, é provável que a o1 se torne uma ferramenta valiosa para os desenvolvedores, promovendo a inovação e influenciando o futuro do desenvolvimento de software.

Conforme descrito na seção de benchmarks, o modelo o1 apresenta grande potencial no campo de codificação.

HTML Snake com OpenAI o1

Matemática com OpenAI o1

Escrevendo quebra-cabeças com o OpenAI o1

Como acessar o OpenAI o1

Se você tiver uma assinatura do ChatGPT Plus ou do ChatGPT Team, poderá acessar o modelo o1 diretamente na interface do ChatGPT. Selecione o1 no menu suspenso do seletor de modelos na parte superior da página .

Lembre-se de que, com uma conta ChatGPT Plus ou Team, você recebe 50 mensagens por semana com o OpenAI o1 e 50 mensagens por dia com o OpenAI o1-mini para começar.

API OpenAI o1

Embora a o1 esteja acessível no ChatGPT para assinantes Plus e Team, os desenvolvedores e pesquisadores que precisam de mais flexibilidade e opções de integração acharão a API OpenAI o1 mais adequada às suas necessidades.

Limitações da versão beta

Embora o modelo o1 esteja fora da visualização na interface de bate-papo, até o momento em que este artigo foi escrito (6 de dezembro de 2024), a API oferece acesso a apenas duas variantes do modelo o1:

o1-preview: Esta é a primeira prévia do modelo o1 completo, projetado para lidar com problemas complexos que exigem amplo conhecimento geral.
o1-mini: Uma versão mais rápida e econômica do o1, adequada para tarefas de codificação, matemática e ciências em que talvez não seja necessário um amplo conhecimento geral.

Tanto o o1-preview quanto o o1-mini podem ser acessados por meio do ponto de extremidade ponto de extremidade de conclusões de bate-papofacilitando a incorporação deles em projetos existentes. O processo envolve a seleção do modelo desejado (por exemplo, model="o1-preview") ao fazer chamadas de API. Para saber passo a passo como usar o o1 por meio da API, leia este tutorial: Tutorial da API OpenAI O1: Como se conectar à API da OpenAI.

Como a o1 está atualmente na versão beta, ainda não há suporte para determinados parâmetros e recursos da API. Isso inclui:

Modalidades: No momento, só há suporte para entrada e saída de texto; o tratamento de imagens ainda não está disponível.
Tipos de mensagens: Não há suporte para mensagens do sistema; somente mensagens do usuário e do assistente são permitidas.
Transmissão: O recurso de streaming ainda não está disponível para os modelos o1.
Ferramentas e chamadas de função: Esses recursos avançados não são suportados no momento.
Problemas de registro: As probabilidades de registro ainda não estão disponíveis.
Outros parâmetros: Parâmetros como temperature, top_p e n são fixados em 1, enquanto presence_penalty e frequency_penalty são fixados em 0.
Assistentes e API de loteSe você não tem acesso à API de assistentes ou à API de lote, os modelos o1 ainda não estão integrados.

A OpenAI planeja adicionar gradualmente suporte a alguns desses parâmetros e recursos à medida que o o1 sair da versão beta. Funcionalidades mais avançadas, como multimodalidade e uso de ferramentas, estão programadas para serem incluídas em futuras iterações da série o1.

Entendendo os tokens de raciocínio

Um aspecto importante dos modelos o1 é a introdução de "tokens de raciocínio". Esses tokens representam o processo de pensamento interno do modelo à medida que ele analisa o prompt, considera várias abordagens e formula uma resposta. Embora esses tokens de raciocínio não sejam visíveis por meio da API, eles consomem espaço na janela de contexto do modelo e contribuem para a contagem geral de tokens, afetando o faturamento.

Fonte: OpenAI

Janela de contexto e custos

Tanto o o1-preview quanto o o1-mini oferecem uma janela de contexto de 128.000 tokens. No entanto, cada conclusão tem um limite máximo para o número total de tokens de saída gerados, incluindo os tokens de raciocínio invisíveis e os tokens de conclusão visíveis. Para evitar custos inesperados e garantir que o modelo tenha espaço suficiente para "pensar", é fundamental gerenciar a janela de contexto de forma eficaz e definir limites apropriados usando o parâmetro max_completion_tokens.

Promovendo práticas recomendadas

Para obter os melhores resultados com os modelos o1, mantenha seus prompts simples e diretos. Evite técnicas como a solicitação de poucos disparos ou a instrução explícita ao modelo para "pensar passo a passo", pois elas podem prejudicar, em vez de melhorar, o desempenho. Utilize delimitadores para estruturar claramente sua entrada e, em cenários de geração aumentada por recuperação, forneça somente o contexto mais relevante para evitar que o modelo complique demais sua resposta.

O que é o OpenAI o1-mini?

Juntamente com o modelo o1-preview completo, a OpenAI também lançou o o1-mini, uma variante menor e mais rápida projetada para oferecer um ponto de entrada mais acessível para desenvolvedores e pesquisadores que exploram os recursos da série o1.

Embora o o1-mini possa não ter a mesma profundidade de conhecimento geral que sua contraparte maior, ele se destaca em tarefas que exigem habilidades de raciocínio focadas, especialmente nos domínios da codificação, matemática e ciências.

Seu tamanho reduzido se traduz em tempos de resposta mais rápidos e requisitos computacionais mais baixos, tornando-o uma opção prática para aplicações em que velocidade e eficiência são importantes.

Embora o o1-mini esteja atualmente na versão beta e tenha certas limitações, ele oferece um vislumbre do potencial da série o1 e seu foco no aprimoramento dos recursos de raciocínio de IA. Como a OpenAI continua a refinar e desenvolver os modelos o1, podemos esperar que o o1-mini evolua junto com seu irmão maior, fornecendo uma ferramenta cada vez mais avançada e versátil para uma ampla gama de aplicações.

O que é o O1 Pro Mode?

Além do modelo o1 padrão, a OpenAI também introduziu o modo o1 pro. Esse modelo foi projetado para usuários que precisam de recursos de raciocínio ainda mais avançados e estão dispostos a sacrificar um pouco da velocidade para obter maior precisão e capacidade de lidar com tarefas altamente complexas.

O modo o1 pro aproveita significativamente mais a capacidade de computação do que o modelo o1 padrão. Isso permite que ele "pense mais" e "pense mais" para gerar respostas mais confiáveis, especialmente para problemas desafiadores em áreas como ciência de dados, programação e análise de jurisprudência.

Para acessar o modo o1 pro, você precisará de uma assinatura do ChatGPT Pro. Essa assinatura concede a você o uso ilimitado do modo o1 e o1 pro, além de outros modelos e recursos avançados.

Abordamos o modo o1 pro em detalhes em um artigo separado: O que é o modo O1 Pro da OpenAI? Recursos, ChatGPT Pro e mais.

Limitações da OpenAI o1

Embora o OpenAI o1-preview ofereça recursos impressionantes, você deve estar ciente de algumas limitações. Essas restrições podem afetar sua utilidade em determinados contextos, portanto, vale a pena estar ciente dos seguintes aspectos.

Cadeia oculta de pensamento

Para garantir o potencial de futuros aprimoramentos de monitoramento e segurança, o processo bruto de raciocínio da cadeia de pensamento usado pela o1 não é diretamente visível para os usuários. Embora essa decisão tenha como objetivo permitir uma supervisão mais eficaz do modelo, ela limita a transparência e pode afetar a compreensão do usuário sobre o processo de tomada de decisão do modelo.

Ainda não navega na Web

O OpenAI o1-preview não pode navegar na Web, o que significa que as informações que ele fornece podem não estar sempre atualizadas. Se você estiver procurando dados de eventos atuais ou em tempo real, o modelo não poderá recuperá-los diretamente.

Tempos de resposta mais longos

Uma das limitações mais perceptíveis é que o modelo leva um tempo relativamente longo para processar consultas complexas. Embora esse tempo extra permita produzir respostas mais ponderadas, ele pode causar atrasos para os usuários que esperam respostas mais rápidas.

Inadequado para aplicativos de baixa latência

Devido a seus tempos de resposta mais lentos, o OpenAI o1 não é ideal para aplicativos que exigem interações rápidascomo chatbots em tempo real ou serviços de tradução. Nesses casos de uso, o atraso pode resultar em uma experiência ruim para o usuário, pois esperar vários segundos por uma resposta pode ser frustrante.

Se o modelo for aplicado em situações em que seus pontos fortes não estejam alinhados com a tarefa, isso pode resultar em uma experiência negativa para o usuário. Isso é especialmente verdadeiro para cenários que exigem respostas rápidas e imediatas, em que o tempo de processamento mais lento do modelo pode se tornar um obstáculo em vez de um benefício.

OpenAI o1 Segurança

Os novos modelos o1 apresentam uma abordagem de treinamento de segurança que usa suas habilidades de raciocínio para melhorar a segurança no contexto.

Uma medida de segurança importante é testar a resistência do modelo a "tentativas de "jailbreakem que os usuários tentam contornar as regras de segurança. Em um teste desafiador de jailbreak, o GPT-4o obteve 22 pontos em 100, enquanto o modelo o1-preview mais recente obteve 84, indicando uma melhoria substancial.

Os esforços de segurança foram reforçados por meio de testes rigorosos, governança interna governançae colaboração com o governo federal. Isso inclui o uso da Estrutura de preparaçãoe revisões em nível de diretoria pelo Comitê de Segurança e Proteção.

Além disso, as parcerias com os Estados Unidos e o Reino Unido são muito importantes. Os institutos de segurança de IA foram formalizados, concedendo-lhes acesso antecipado às versões de pesquisa dos modelos.

No entanto, é fundamental abordar esses resultados iniciais com otimismo cauteloso.

O futuro: OpenAI O-series

A introdução do OpenAI o1 marca não apenas um novo modelo, mas o início de uma nova série: a OpenAI O-series. Isso sinaliza uma mudança deliberada na direção estratégica da OpenAI, enfatizando recursos de raciocínio complexos como foco principal para o desenvolvimento futuro da IA.

Os impressionantes resultados iniciais do modo o1 e o1 pro, especialmente seu forte desempenho em benchmarks que exigem a resolução de problemas complexos, sugerem que essa nova série é bastante promissora.

Como a OpenAI continua a refinar e expandir os recursos dos modelos da série O, podemos prever um futuro em que a IA desempenhará uma função ainda mais ativa na descoberta científica, no desenvolvimento de software e em outros campos que exigem habilidades cognitivas avançadas.

No entanto, o caminho para a realização total do potencial da série O não é isento de desafios. A natureza intensiva de computação desses modelos e as restrições de escala exclusivas que eles apresentam exigem pesquisa e desenvolvimento contínuos.

Conclusão

Embora tenhamos esperado ansiosamente a chegada do GPT-5 este ano, a OpenAI nos surpreendeu com a introdução do o1, um modelo que prioriza recursos de raciocínio complexos.

Os sucessos iniciais do o1 em uma variedade de benchmarks demonstram seu potencial para enfrentar problemas desafiadores em campos como matemática, codificação e pesquisa científica.

Apesar de seus recursos promissores, a o1 ainda está em seus estágios iniciais e enfrenta desafios, incluindo sua natureza de computação intensiva e a necessidade de pesquisas contínuas sobre segurança e implementação ética.

O que é o OpenAI o1 e como ele difere de outros modelos?

Em quais tarefas os modelos o1 da OpenAI são particularmente bons?

Como posso acessar o OpenAI o1?

Qual é a diferença entre a OpenAI o1 e a o1-mini?

Quais recursos são esperados em futuras atualizações dos modelos o1 da OpenAI?

Qual é o preço para usar os modelos o1 da OpenAI?

O preço dos modelos o1 é baseado no uso e depende do modelo específico e do número de tokens processados.

Para o o1-preview, o custo é de US$ 15,00 por 1 milhão de tokens de entrada e US$ 60,00 por 1 milhão de tokens de saída.
Para o o1-mini, o custo é de US$ 3,00 por 1 milhão de tokens de entrada e US$ 12,00 por 1 milhão de tokens de saída.
É importante lembrar que a contagem total de tokens inclui tanto os tokens de conclusão visíveis quanto os tokens de raciocínio invisíveis, que contribuem para o custo total.

Author

Richie Cotton

Author

Josef Waples

Tópicos

Inteligência Artificial

Modelos de idiomas grandes

ChatGPT

Aprenda IA com o DataCamp

Programa

Fundamentos da IA

10 h

Descubra os fundamentos da IA, aprenda a usar a IA de forma eficaz no trabalho e mergulhe em modelos como o chatGPT para navegar pelo cenário dinâmico da IA.

Ver detalhes

Iniciar curso

Curso

Entendendo o ChatGPT

1 h

401.2K

Aprenda a usar o ChatGPT, com práticas recomendadas para criar prompts e casos de uso comercial comuns para a poderosa ferramenta de IA.

Ver detalhes

Iniciar curso

Curso

Estratégia de inteligência artificial (IA)

3 h

14.5K

Saiba como combinar negócios, dados e IA e definir metas para impulsionar o sucesso com uma estratégia de IA efetivamente dimensionável.

Ver detalhes

Iniciar curso

Ver mais

Relacionado

blog

A OpenAI anuncia o GPT-4 Turbo com visão: O que sabemos até o momento

Descubra a atualização mais recente da OpenAI, GPT-4 Turbo com visão, e seus principais recursos, incluindo o corte de conhecimento aprimorado, uma janela de contexto expandida, preço acessível e muito mais.

Richie Cotton

7 min

blog

O que é o Sora da Open AI? Como funciona, casos de uso, alternativas e muito mais

Descubra o Sora da OpenAI: uma IA inovadora de texto para vídeo que revolucionará a IA multimodal em 2024. Explore seus recursos, inovações e impacto potencial.

Richie Cotton

8 min

blog

12 Alternativas de código aberto ao GPT-4

GPT-4 alternativas de código aberto que podem oferecer desempenho semelhante e exigem menos recursos computacionais para serem executadas. Esses projetos vêm com instruções, fontes de código, pesos de modelos, conjuntos de dados e interface de usuário do chatbot.

Abid Ali Awan

9 min

Tutorial

Tutorial da API de assistentes da OpenAI

Uma visão geral abrangente da API Assistants com nosso artigo, que oferece uma análise aprofundada de seus recursos, usos no setor, orientação de configuração e práticas recomendadas para maximizar seu potencial em vários aplicativos de negócios.

Zoumana Keita

Tutorial

Guia para iniciantes no uso da API do ChatGPT

Este guia o orienta sobre os conceitos básicos da API ChatGPT, demonstrando seu potencial no processamento de linguagem natural e na comunicação orientada por IA.

Moez Ali

Ver mais Ver mais

Desenvolver aplicativos de IA

Como o OpenAI o1 funciona

Aprendizagem por reforço e cadeia de raciocínio

Um novo paradigma na alocação de computação

Benchmarks do OpenAI O1: Melhor em tarefas de raciocínio pesado

Exames em humanos

Benchmarks de ML

Casos de uso do OpenAI o1

Pesquisa científica

Codificação

Matemática

Casos de uso com muito raciocínio

Como acessar o OpenAI o1

API OpenAI o1

Limitações da versão beta

Entendendo os tokens de raciocínio

Janela de contexto e custos

Promovendo práticas recomendadas

O que é o OpenAI o1-mini?

O que é o O1 Pro Mode?

Limitações da OpenAI o1

Cadeia oculta de pensamento

Ainda não navega na Web

Tempos de resposta mais longos

Inadequado para aplicativos de baixa latência

OpenAI o1 Segurança

O futuro: OpenAI O-series

Conclusão

Perguntas frequentes

Como posso acessar o OpenAI o1?

Qual é a diferença entre a OpenAI o1 e a o1-mini?

Quais recursos são esperados em futuras atualizações dos modelos o1 da OpenAI?

Qual é o preço para usar os modelos o1 da OpenAI?

A OpenAI anuncia o GPT-4 Turbo com visão: O que sabemos até o momento

O que é o Sora da Open AI? Como funciona, casos de uso, alternativas e muito mais

12 Alternativas de código aberto ao GPT-4

Tutorial da API de assistentes da OpenAI

Guia para iniciantes no uso da API do ChatGPT

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Fundamentos da IA

Entendendo o ChatGPT

Estratégia de inteligência artificial (IA)

A OpenAI anuncia o GPT-4 Turbo com visão: O que sabemos até o momento

O que é o Sora da Open AI? Como funciona, casos de uso, alternativas e muito mais

12 Alternativas de código aberto ao GPT-4

Tutorial da API de assistentes da OpenAI

Guia para iniciantes no uso da API do ChatGPT

Fundamentos da IA