Futuras atualizações podem incluir tempos de resposta mais rápidos, navegação na Web e manipulação de arquivos.
Guia do OpenAI o1: Como funciona, casos de uso, API e muito mais
O OpenAI o1 é uma nova série de modelos da OpenAI que se destacam em tarefas de raciocínio complexas, usando o raciocínio de cadeia de pensamento para superar o GPT-4o em áreas como matemática, codificação e ciências.
Actualizado 13 de set. de 2024 · 8 min leer
Enquanto esperávamos pelo GPT-5a OpenAI surpreendeu a todos em 12 de setembro de 2024, com o lançamento do OpenAI o1.
OpenAI redefiniu o contador de volta para 1 e o nomeou OpenAI o1, enfatizando seu foco distinto no raciocínio em comparação com o tradicional tradicional do GPT. Isso marca o início de uma nova série o da OpenAI , semelhante à série GPT que todos nós conhecemos.
A versão inicial, o1-previewjá está apresentando resultados impressionantes em benchmarks padrão em uma ampla variedade de campos, como matemática, codificação e resolução de quebra-cabeças.
Além disso, o1 marca uma mudança nos grandes modelos de aprendizagem (LLMs) com maior ênfase nos recursos recursos computacionais dedicados às fases de treinamento e inferência.
Os modelos O1 não foram projetados para substituir o GPT-4o em todos os casos. Para aplicações que exigem entradas de imagem, chamadas de função ou tempos de resposta consistentemente rápidos, os modelos GPT-4o e GPT-4o mini continuam sendo a escolha ideal.
Continue lendo para saber mais sobre os novos modelos O1!
Como o OpenAI o1 funciona
A primeira coisa que você notará ao interagir com o o1 é que ele leva visivelmente mais tempo para gerar respostas em comparação com o GPT-4o. Essa pausa deliberada reflete a ênfase do modelo no raciocínio. O O1 passa mais tempo "pensando" antes de responder, o que lhe permite enfrentar tarefas complexas e resolver problemas mais difíceis em lógica, matemática, codificação e ciências.
O OpenAI o1-preview está lidando com o problema de Monty Hall
Aprendizagem por reforço e cadeia de raciocínio
O raciocínio superior do O1 é obtido por meio de uma combinação de aprendizado por reforço e raciocínio em cadeia.
Por meio da aprendizado por reforçoo modelo aprende a refinar seu processo de raciocínio, explorando diferentes estratégias, reconhecendo erros e adaptando sua abordagem para chegar à solução mais precisa e lógica.
Do outro lado, raciocínio de cadeia de pensamento é uma técnica para dividir problemas complexos em componentes menores e mais gerenciáveis. Essa abordagem permite que o1 "pense antes de responder", da mesma forma que planejar meticulosamente as etapas de uma receita complexa antes de começar a cozinhar.
Ao expor explicitamente seu processo de raciocínio, a o1 pode identificar possíveis erros logo no início e aumentar a probabilidade de chegar à solução correta, assim como nós, seres humanos, temos menos probabilidade de cometer erros quando descrevemos cuidadosamente nosso processo de pensamento.
O fato de o OpenAI o1 usar o raciocínio em cadeia torna-o especialmente eficaz em áreas como matemática, ciências e codificação, em que a obtenção de uma resposta correta geralmente requer várias etapas.
Um novo paradigma na alocação de computação
Um diferencial importante do OpenAI o1 está em sua realocação estratégica de recursos computacionais. Embora os LLMs tradicionais tenham se concentrado principalmente em conjuntos de dados maciços de pré-treinamento, o o1 muda a ênfase para as fases de treinamento e inferência.
Essa mudança mostra que a alocação de mais computação para esses estágios pode gerar ganhos significativos em recursos de raciocínio complexos.
Fonte: OpenAI
O gráfico acima mostra o impacto do aumento dos recursos computacionais no desempenho do modelo o1 da OpenAI ao enfrentar o desafiador AIME (American Invitational Mathematics Examination). Ele apresenta dois gráficos, cada um representando a precisão do modelo em relação à potência de computação dedicada ao treinamento ou ao teste (inferência).
Uma correlação positiva clara é evidente em ambos os gráficos: à medida que os recursos computacionais aumentam, também aumenta a precisão do modelo na solução de problemas AIME na primeira tentativa. Notavelmente, a relação é mais pronunciada no gráfico de tempo de teste, sugerindo que dar ao modelo mais tempo para "pensar" durante a solução de problemas leva a um desempenho significativamente melhor.
Essa observação ressalta a natureza de computação intensiva de o1, destacando sua dependência de recursos computacionais substanciais. No entanto, as tendências de aumento em ambos os gráficos também indicam que é possível obter mais ganhos de precisão com ainda mais computação, oferecendo caminhos promissores para o desenvolvimento futuro dos recursos de raciocínio de IA.
Benchmarks do OpenAI O1: Melhor em tarefas de raciocínio pesado
Para demonstrar os recursos de raciocínio aprimorados do o1 em comparação com o GPT-4o, a OpenAI avaliou o modelo em uma variedade de benchmarks desafiadores de matemática, codificação e ciências.
Exames em humanos
O exame humano demonstra que o1 supera consistentemente o GPT-4o.
As barras sólidas mostram a precisão pass@1 e a região sombreada mostra o desempenho do voto majoritário (consenso) com 64 amostras. Fonte: OpenAI
Talvez a observação mais impressionante seja o salto gigantesco no desempenho entre o GPT-4o e o o1 (e até mesmo a visualização do o-1) nos benchmarks de matemática e codificação.
E, embora a melhoria no domínio da ciência seja menos pronunciada, é digno de nota que tanto o o1-preview quanto o modelo o1 totalmente otimizado superam os especialistas humanos em questões científicas de nível de doutorado. Isso mostra o potencial do o1 para lidar com problemas complexos do mundo real e até mesmo superar o desempenho em nível humano em determinados domínios.
A OpenAI o1 tem casos de uso potencial em genética.
Além dos benchmarks acadêmicos, a OpenAI também buscou feedback humano para comparar o o1-preview e o GPT-4o em uma série de solicitações desafiadoras e abertas em diversos domínios. Os instrutores humanos receberam respostas anônimas de ambos os modelos e foram solicitados a escolher o preferido.
Fonte: OpenAI
Os resultados revelam uma clara preferência pela o1-preview em áreas que dependem muito do raciocínio, como análise de dados, codificação e matemática. No entanto, o GPT-4o manteve sua vantagem em determinadas tarefas de linguagem natural, o que sugere que o o1-preview, embora eficiente no raciocínio, pode não ser a escolha ideal para todos os aplicativos.
Benchmarks de ML
Observando os resultados dos benchmarks de ML, os avanços da o1 no raciocínio são bastante óbvios. Tanto no MathVista (um benchmark de matemática) quanto no MMLU, o o1 apresenta ganhos substanciais de precisão em comparação com o GPT-4o.
Fonte: OpenAI
Uma versão especializada do o1, conhecida como o1-ioi, demonstrou habilidades superiores de codificação ao garantir uma classificação de 49º percentil na Olimpíada Internacional de Informática de 2024, mesmo sob condições rigorosas de competição.
Em competições simuladas (veja o gráfico abaixo), o desempenho do o1-ioi foi ainda maior, superando 93% dos concorrentes.
Fonte: OpenAI
Casos de uso do OpenAI o1
Os recursos de raciocínio do OpenAI o1 o tornam particularmente adequado para resolver problemas complexos em ciências, codificação e matemática.
Pesquisa científica
Os pesquisadores da área de saúde, por exemplo, poderiam aproveitar o o1 para anotar dados complexos de sequenciamento de células, enquanto os físicos poderiam empregá-lo para gerar as fórmulas matemáticas sofisticadas necessárias para a pesquisa de óptica quântica.
Física quântica e OpenAI o1
Codificação
Desde a sugestão de otimizações de código e geração de casos de teste até a automatização de revisões de código e a facilitação do compartilhamento de conhecimento, a o1 tem o potencial de aumentar significativamente a produtividade do desenvolvedor e simplificar os fluxos de trabalho.
Além disso, a capacidade da o1 de entender e gerar código estende sua utilidade para além da codificação. Ele pode auxiliar no planejamento de projetos, na análise de requisitos e no projeto de arquitetura de software, ajudando os desenvolvedores a criar soluções mais eficazes.
Embora todos os recursos da o1 ainda estejam sendo desenvolvidos, seus recursos atuais já são promissores. Como a OpenAI continua a refinar o modelo, é provável que a o1 se torne uma ferramenta valiosa para os desenvolvedores, promovendo a inovação e influenciando o futuro do desenvolvimento de software.
Conforme descrito na seção de benchmarks, o modelo o1 apresenta grande potencial no campo de codificação.
HTML Snake com OpenAI o1
Matemática
O campo da matemática também pode se beneficiar significativamente dos recursos de raciocínio avançado da o1. Seu bom desempenho em benchmarks como o AIME sugere possíveis aplicações na solução de equações complexas, na comprovação de teoremas e na exploração de novos conceitos matemáticos, beneficiando tanto estudantes quanto pesquisadores.
Matemática com OpenAI o1
Casos de uso com muito raciocínio
Além de domínios específicos, o foco da o1 no raciocínio pode torná-la um recurso valioso para qualquer tarefa que exija pensamento crítico e dedução lógica. Desde a solução de quebra-cabeças e enigmas até a análise de argumentos complexos e a facilitação da tomada de decisões informadas, a o1 pode abrir novos caminhos para a solução de problemas.
Escrevendo quebra-cabeças com o OpenAI o1
Como acessar o OpenAI o1
Se você tiver uma assinatura do ChatGPT Plus ou do ChatGPT Team, poderá acessar o modelo o1-preview diretamente na interface do ChatGPT. Selecione o1-preview no menu suspenso do seletor de modelos na parte superior da página .
Lembre-se de que há limites iniciais de uso durante a fase de visualização, com acesso restrito a 30 mensagens por semana.
Além disso, no momento, o o1-preview no ChatGPT não oferece suporte a recursos como navegação, upload de arquivos e imagens.
API OpenAI o1
Embora o o1-preview esteja acessível no ChatGPT para assinantes Plus e Team, os desenvolvedores e pesquisadores que precisam de mais flexibilidade e opções de integração acharão a API o1 da OpenAI mais adequada às suas necessidades.
Limitações da versão beta
Atualmente, a API oferece acesso a duas variantes do modelo o1:
- o1-preview: Esta é a primeira prévia do modelo o1 completo, projetado para lidar com problemas complexos que exigem amplo conhecimento geral.
- o1-mini: Uma versão mais rápida e econômica do o1, adequada para tarefas de codificação, matemática e ciências em que talvez não seja necessário um amplo conhecimento geral.
Tanto o o1-preview quanto o o1-mini podem ser acessados por meio do ponto de extremidade ponto de extremidade de conclusões de bate-papofacilitando a incorporação deles em projetos existentes. O processo envolve a seleção do modelo desejado (por exemplo, model="o1-preview"
) ao fazer chamadas de API.
Como a o1 está atualmente na versão beta, ainda não há suporte para determinados parâmetros e recursos da API. Isso inclui:
- Modalidades: No momento, só há suporte para entrada e saída de texto; o tratamento de imagens ainda não está disponível.
- Tipos de mensagens: Não há suporte para mensagens do sistema; somente mensagens do usuário e do assistente são permitidas.
- Transmissão: O recurso de streaming ainda não está disponível para os modelos o1.
- Ferramentas e chamadas de função: Esses recursos avançados não são suportados no momento.
- Problemas de registro: As probabilidades de registro ainda não estão disponíveis.
- Outros parâmetros: Parâmetros como
temperature
,top_p
en
são fixados em 1, enquantopresence_penalty
efrequency_penalty
são fixados em 0. - Assistentes e API de loteVocê pode encontrar as seguintes informações: os modelos o1 ainda não estão integrados à API de assistentes ou à API de lote.
A OpenAI planeja adicionar gradualmente suporte a alguns desses parâmetros e recursos à medida que o o1 sair da versão beta. Funcionalidades mais avançadas, como multimodalidade e uso de ferramentas, estão programadas para serem incluídas em futuras iterações da série o1.
Entendendo os tokens de raciocínio
Um aspecto importante dos modelos o1 é a introdução de "tokens de raciocínio". Esses tokens representam o processo de pensamento interno do modelo à medida que ele analisa o prompt, considera várias abordagens e formula uma resposta. Embora esses tokens de raciocínio não sejam visíveis por meio da API, eles consomem espaço na janela de contexto do modelo e contribuem para a contagem geral de tokens, afetando o faturamento.
Fonte: OpenAI
Janela de contexto e custos
Tanto o o1-preview quanto o o1-mini oferecem uma janela de contexto de 128.000 tokens. No entanto, cada conclusão tem um limite máximo para o número total de tokens de saída gerados, incluindo os tokens de raciocínio invisíveis e os tokens de conclusão visíveis. Para evitar custos inesperados e garantir que o modelo tenha espaço suficiente para "pensar", é fundamental gerenciar a janela de contexto de forma eficaz e definir limites apropriados usando o parâmetro max_completion_tokens
.
Promovendo práticas recomendadas
Para obter os melhores resultados com os modelos o1, mantenha seus prompts simples e diretos. Evite técnicas como a solicitação de poucos disparos ou a instrução explícita ao modelo para "pensar passo a passo", pois elas podem prejudicar, em vez de melhorar, o desempenho. Utilize delimitadores para estruturar claramente sua entrada e, em cenários de geração aumentada por recuperação, forneça somente o contexto mais relevante para evitar que o modelo complique demais sua resposta.
O que é o OpenAI o1-mini?
Juntamente com o modelo o1-preview completo, a OpenAI também lançou o o1-mini, uma variante menor e mais rápida projetada para oferecer um ponto de entrada mais acessível para desenvolvedores e pesquisadores que exploram os recursos da série o1.
Embora o o1-mini possa não ter a mesma profundidade de conhecimento geral que sua contraparte maior, ele se destaca em tarefas que exigem habilidades de raciocínio focadas, principalmente nos domínios da codificação, matemática e ciências.
Seu tamanho reduzido se traduz em tempos de resposta mais rápidos e requisitos computacionais mais baixos, tornando-o uma opção prática para aplicações em que velocidade e eficiência são importantes.
Embora o o1-mini esteja atualmente em versão beta e tenha certas limitações, ele oferece um vislumbre do potencial da série o1 e seu foco no aprimoramento dos recursos de raciocínio de IA. Como a OpenAI continua a refinar e desenvolver os modelos o1, podemos esperar que o o1-mini evolua junto com seu irmão maior, fornecendo uma ferramenta cada vez mais avançada e versátil para uma ampla gama de aplicações.
Limitações da OpenAI o1
Embora o OpenAI o1-preview ofereça recursos impressionantes, você deve estar ciente de algumas limitações. Essas restrições podem afetar sua utilidade em determinados contextos, portanto, vale a pena estar ciente dos seguintes aspectos.
Cadeia oculta de pensamento
Para garantir o potencial de futuros aprimoramentos de monitoramento e segurança, o processo bruto de raciocínio da cadeia de pensamento usado pela o1 não é diretamente visível para os usuários. Embora essa decisão tenha como objetivo permitir uma supervisão mais eficaz do modelo, ela limita a transparência e pode afetar a compreensão do usuário sobre o processo de tomada de decisão do modelo.
Ainda não navega na Web
O OpenAI o1-preview não pode navegar na Web, o que significa que as informações que ele fornece podem não estar sempre atualizadas. Se você estiver procurando dados de eventos atuais ou em tempo real, o modelo não poderá recuperá-los diretamente.
Não há suporte para arquivos e imagens
No momento, o OpenAI o1-preview não oferece suporte a carregamentos de arquivos ou imagens. Isso limita sua capacidade de trabalhar com dados multimídia ou analisar documentos específicos carregados diretamente pelos usuários.
Tempos de resposta mais longos
Uma das limitações mais perceptíveis é que o modelo leva um tempo relativamente longo para processar consultas complexas. Embora esse tempo extra permita produzir respostas mais ponderadas, ele pode causar atrasos para os usuários que esperam respostas mais rápidas.
Inadequado para aplicativos de baixa latência
Devido a seus tempos de resposta mais lentos, o OpenAI o1-preview não é ideal para aplicativos que exigem interações rápidascomo chatbots em tempo real ou serviços de tradução. Nesses casos de uso, o atraso pode resultar em uma experiência ruim para o usuário, pois esperar vários segundos por uma resposta pode ser frustrante.
Possibilidade de experiência negativa para o usuário se for mal aplicado
Se o modelo for aplicado em situações em que seus pontos fortes não estejam alinhados com a tarefa, isso pode resultar em uma experiência negativa para o usuário. Isso é especialmente verdadeiro para cenários que exigem respostas rápidas e imediatas, em que o tempo de processamento mais lento do modelo pode se tornar um obstáculo em vez de um benefício.
OpenAI o1 Segurança
Os novos modelos o1 apresentam uma abordagem de treinamento de segurança que usa suas habilidades de raciocínio para melhorar a segurança no contexto.
Uma das principais medidas de segurança é testar a resistência do modelo a "tentativas de "jailbreakem que os usuários tentam contornar as regras de segurança. Em um teste desafiador de jailbreak, o GPT-4o obteve 22 pontos em 100, enquanto o modelo o1-preview mais recente obteve 84, indicando uma melhoria substancial.
Os esforços de segurança foram reforçados por meio de testes rigorosos, governança interna governançae colaboração com o governo federal. Isso inclui o uso da Estrutura de preparaçãoe revisões em nível de diretoria pelo seu Comitê de Segurança e Proteção.
Além disso, as parcerias com os Estados Unidos e o Reino Unido são muito importantes. Os institutos de segurança de IA foram formalizados, concedendo-lhes acesso antecipado às versões de pesquisa dos modelos.
No entanto, é fundamental abordar esses resultados iniciais com otimismo cauteloso.
O futuro: OpenAI O-series
A introdução do OpenAI o1 marca não apenas um novo modelo, mas o início de uma nova série: a OpenAI O-series. Isso sinaliza uma mudança deliberada na direção estratégica da OpenAI, enfatizando recursos de raciocínio complexos como foco principal para o desenvolvimento futuro da IA.
Os resultados iniciais impressionantes do o1-preview, especialmente seu bom desempenho em benchmarks que exigem a solução de problemas complexos, sugerem que essa nova série é bastante promissora.
Como a OpenAI continua a refinar e expandir os recursos dos modelos da série O, podemos prever um futuro em que a IA desempenhará uma função ainda mais ativa na descoberta científica, no desenvolvimento de software e em outros campos que exigem habilidades cognitivas avançadas.
No entanto, o caminho para a realização total do potencial da série O não é isento de desafios. A natureza intensiva de computação desses modelos e as restrições de escala exclusivas que eles apresentam exigem pesquisa e desenvolvimento contínuos.
Conclusão
Enquanto aguardávamos ansiosamente a chegada do GPT-5, a OpenAI nos surpreendeu com a introdução do o1, um modelo que prioriza recursos de raciocínio complexos.
Os primeiros sucessos do o1-preview em uma variedade de benchmarks demonstram seu potencial para resolver problemas desafiadores em campos como matemática, codificação e pesquisa científica.
Apesar de seus recursos promissores, a o1 ainda está em seus estágios iniciais e enfrenta desafios, incluindo sua natureza de computação intensiva e a necessidade de pesquisas contínuas sobre segurança e implementação ética.
Perguntas frequentes
O que é o OpenAI o1 e como ele difere de outros modelos?
O OpenAI o1 é um novo modelo de IA voltado para tarefas de raciocínio complexas, como matemática, codificação e quebra-cabeças. Ele usa o raciocínio de cadeia de pensamento para decompor os problemas, melhorando a precisão em comparação com modelos mais antigos, como o GPT-4.
Em quais tarefas os modelos o1 da OpenAI são particularmente bons?
O OpenAI o1 é excelente em problemas de matemática, desafios de codificação, análise de dados e tarefas científicas que exigem raciocínio em várias etapas.
Como posso acessar o OpenAI o1?
Você pode acessar o OpenAI o1 por meio do ChatGPT, e os desenvolvedores podem acessá-lo por meio da API do OpenAI.
Qual é a diferença entre o OpenAI o1 e o1-mini?
O o1-mini é uma versão menor do o1, mais adequada para tarefas mais leves, mas com menos potência para raciocínios complexos.
Quais recursos são esperados em futuras atualizações dos modelos o1 da OpenAI?
Qual é o preço para usar os modelos o1 da OpenAI?
O preço dos modelos o1 é baseado no uso e depende do modelo específico e do número de tokens processados.
- Para o o1-preview, o custo é de US$ 15,00 por 1 milhão de tokens de entrada e US$ 60,00 por 1 milhão de tokens de saída.
- Para o o1-mini, o custo é de US$ 3,00 por 1 milhão de tokens de entrada e US$ 12,00 por 1 milhão de tokens de saída.
- É importante lembrar que a contagem total de tokens inclui tanto os tokens de conclusão visíveis quanto os tokens de raciocínio invisíveis, que contribuem para o custo total.
Author
Richie ajuda indivíduos e organizações a melhorar o uso de dados e IA. Ele é cientista de dados desde antes de o termo ser chamado de ciência de dados, escreveu dois livros e criou muitos cursos DataCamp sobre o assunto. Ele é apresentador do podcast DataFramed e dirige o programa de webinars do DataCamp.
Author
Você é um especialista em Python, marketing e estratégia de conteúdo, SEO, edição e redação. Técnico - escrevi cursos sobre Python, estatística e probabilidade. Mas também publiquei um romance premiado. Edição de vídeo e gradação de cores no DaVinci.
Author
Josef Waples
Aprenda IA com o DataCamp
Certificação disponível
Course
Estratégia de Inteligência Artificial (IA)
3 hr
4.6K
Track
Fundamentos de IA
10 horas hr
Certificação disponível
Course
Introdução ao ChatGPT
1 hr
232.6K
Ver mais