curso
Prompting de disparo zero: Exemplos, teoria e casos de uso
Não é segredo para ninguém a rapidez com que a inteligência artificial evoluiu nos últimos anos, especialmente no campo de grandes modelos de linguagem (LLMs).
Tradicionalmente, para fazer com que os LLMs executem uma tarefa específica, você precisaria treiná-los com muitos exemplos. Esse processo pode ser demorado e exigir muitos recursos. No entanto, existem algumas técnicas que permitem que os LLMs lidem com uma grande variedade de tarefas sem treinamento específico.
Uma dessas técnicas é chamada de estímulo de disparo zero.
Neste tutorial, você verá:
- Saiba o que é um prompt de disparo zero.
- Explore os conceitos fundamentais por trás da solicitação de disparo zero.
- Examine como os LLMs permitem esse recurso.
- Saiba como criar avisos eficazes para várias tarefas.
- Descubra aplicativos e casos de uso do mundo real.
- Entenda as limitações e os desafios dessa abordagem.
Este tutorial faz parte do meu "Prompt Engineering": Série de postagens no blog "Do zero ao herói":
- Engenharia imediata para todos
- Prompting de disparo zero
- Prompting de poucos disparos
- Encadeamento de prompts
O que é Zero-Shot Prompting?
O prompting de disparo zero é uma técnica que usa os recursos de generalização dos LLMs para tentar novas tarefas sem treinamento ou exemplos específicos anteriores.
Ele usa o extenso pré-treinamento dos LLMs em conjuntos de dados grandes e diversificados, permitindo que eles apliquem seu amplo conhecimento a novas tarefas com base apenas em instruções claras e concisas. Embora essa técnica possa ser altamente eficaz, seu sucesso depende da complexidade da tarefa e da qualidade do prompt.
Em suma, você descreve a tarefa que deseja que o modelo execute sem fornecer exemplos. Em seguida, o modelo acessa seu amplo conhecimento pré-treinado para gerar uma resposta relevante.
Essa abordagem contrasta com o prompting de uma ou poucas tentativas, em que você dá ao modelo um ou alguns exemplos para orientar seu resultado.
A solicitação de disparo zero mostra a impressionante capacidade dos LLMs de generalizar sua compreensão em diversos domínios. Com apenas uma instrução clara, você pode aproveitar a base de conhecimento do modelo para gerar conteúdo criativo, informativo ou específico para a tarefa sem treinamento adicional.
Vamos ver um exemplo rápido:
Sugestão: Classifique o animal com base em suas características. Animal: Essa criatura tem oito patas, tece teias e costuma se alimentar de insetos.
Saída: Aranha.
Nesse exemplo, o prompt não fornece nenhum exemplo de como classificar os animais ou quais classificações você deve usar. Além disso, o prompt define claramente a tarefa (classificar o animal) com base nas características fornecidas.
O modelo de linguagem ampla usa seu amplo conhecimento sobre animais e suas características para fazer a classificação e identifica corretamente que a criatura descrita é uma aranha com base nas principais características fornecidas. Ele fornece exatamente a classificação solicitada, demonstrando sua capacidade de seguir instruções com precisão.
O prompt de disparo zero elimina a necessidade de ajuste fino específico da tarefa, expande drasticamente a variedade de tarefas que um modelo pode executar e torna os recursos avançados mais acessíveis a usuários não técnicos.
Como funciona o Zero-Shot Prompting
Para entender como funciona o prompt de disparo zero, dois aspectos importantes devem estar claros: o pré-treinamento dos LLMs e o conceito de design de prompt.
Pré-treinamento do modelo de idioma
Os LLMs são submetidos a um extenso pré-treinamento em conjuntos de dados maciços, o que forma a base de seus recursos de disparo zero. O processo de pré-treinamento é o seguinte:
- Coleta de dados: Os LLMs são treinados em diversos dados de texto de várias fontes. Esses dados podem chegar a centenas de bilhões de palavras.
- Tokenização: O texto é dividido em unidades menores chamadas tokens, que podem ser palavras, subpalavras ou caracteres.
- Arquitetura de rede neural: O modelo, normalmente baseado na arquitetura do transformador, processa esses tokens por meio de várias camadas de redes neurais.
- Treinamento preditivo: O modelo é treinado para prever o próximo token em uma sequência, considerando os tokens anteriores.
- Reconhecimento de padrões: Por meio desse processo, o modelo aprende a reconhecer padrões na linguagem, incluindo gramática, sintaxe e relações semânticas.
- Aquisição de conhecimento: O modelo cria uma ampla base de conhecimento que abrange vários tópicos e domínios.
- Compreensão contextual: O modelo aprende a entender o contexto e a gerar respostas contextualmente adequadas.
Isso proporciona aos LLMs o conhecimento, a compreensão e a adaptabilidade necessários para a solicitação de disparo zero. Esse extenso pré-treinamento permite que esses modelos executem tarefas para as quais não foram explicitamente treinados, simplesmente compreendendo e respondendo a solicitações de linguagem natural.
Design imediato
O design eficaz do prompt é crucial para o sucesso do prompt de disparo zero. Ele faz a ponte entre a intenção do usuário e os recursos do modelo. Mas como podemos ter certeza de que nossos prompts são eficazes? Vamos dar uma olhada nessas estratégias:
Instruções claras
Os prompts devem fornecer instruções explícitas e não ambíguas que comuniquem a tarefa desejada ao LLM.
Exemplo: "Traduza a seguinte frase em inglês para o francês:" Esse prompt indica claramente a tarefa (tradução) e especifica os idiomas de origem (inglês) e de destino (francês), não deixando espaço para interpretações errôneas.
Enquadramento de tarefas
Enquadre a tarefa de forma a aproveitar o conhecimento e os recursos pré-existentes do modelo.
Exemplo: "Classifique o sentimento dessa crítica de filme como positivo, negativo ou neutro:" Esse prompt enquadra a tarefa como um problema de classificação com categorias específicas, o que se alinha com o treinamento do modelo em tarefas de classificação de texto.
Fornecimento de contexto
Inclua informações relevantes sobre o contexto ou o histórico para ajudar o modelo a entender os requisitos e as restrições da tarefa.
Exemplo: "Considerando que 'Python', nesse contexto, se refere a uma linguagem de programação, você pode explicar o que é Python:" Esse prompt fornece um contexto crucial (Python como uma linguagem de programação, não uma cobra) para garantir que o modelo se concentre nas informações relevantes.
Especificação do formato de saída
Defina claramente o formato esperado da resposta.
Exemplo: "Liste três causas principais das mudanças climáticas, cada uma em um ponto separado." Esse prompt especifica o número de itens (três) e o formato (marcadores) da resposta, garantindo um resultado estruturado.
Evite ambiguidade
Use uma linguagem precisa e evite instruções vagas ou abertas que possam levar a interpretações errôneas por parte do modelo.
Exemplo: "Descreva as etapas específicas envolvidas no ciclo da água, começando pela evaporação." Esse prompt usa uma linguagem precisa ("etapas específicas", "ciclo da água") e fornece um ponto de partida, reduzindo a chance de má interpretação.
Usar linguagem natural
Formule os prompts de uma maneira que pareça natural e coloquial.
Exemplo: "Imagine que você é um consultor de carreira. Que conselho você daria a um recém-formado em busca de seu primeiro emprego?" Esse prompt usa um tom de conversa e cria um cenário relacionável, incentivando uma resposta mais natural e envolvente do modelo.
Refinamento iterativo
Se os resultados iniciais não forem satisfatórios, refine o prompt acrescentando mais especificidade ou ajustando a linguagem.
Exemplo: Solicitação inicial: "Fale-me sobre energia renovável". Prompt refinado: "Explique os três tipos mais comuns de fontes de energia renovável, seus benefícios e os desafios atuais de implementação." Isso mostra como uma solicitação inicial ampla pode ser refinada para produzir uma resposta mais focada e abrangente.
Vantagens do Zero-Shot Prompting
O prompting de disparo zero tem vantagens significativas em relação a outras técnicas existentes.
Uma delas é sua grande flexibilidade. Isso permite que os LLMs se adaptem a uma variedade de tarefas sem a necessidade de dados de treinamento específicos da tarefa. A flexibilidade é muito importante porque permite que um único modelo execute inúmeras tarefas em vários domínios, desde a tradução de idiomas até a análise de sentimentos e a geração de conteúdo. Ele permite a adaptação rápida e imediata a novas tarefas, sem a necessidade de retreinamento demorado ou processos de ajuste fino.
Além disso, os modelos de disparo zero podem lidar com novas situações ou tarefas que não foram explicitamente consideradas antes. Você também pode personalizar o comportamento do modelo para necessidades específicas simplesmente ajustando o prompt, sem modificar o modelo subjacente.
À medida que o conhecimento geral do modelo aumenta, sua capacidade de lidar com diversas tarefas melhora naturalmente, sem intervenções específicas da tarefa.
O prompting de disparo zero também oferece umaeficiênciasubstancial benefícios, especialmente em termos de economia de tempo e recursos. Ele elimina a necessidade de conjuntos de dados extensos específicos da tarefa, cuja coleta pode ser demorada e cara.
Também elimina a necessidade de dados de treinamento rotulados, reduzindo custos e possíveis vieses associados a anotadores humanos. Sem o ajuste fino específico da tarefa, as demandas computacionais são significativamente menores. Isso permite a implantação mais rápida de novos aplicativos, pois não há período de espera para a coleta de dados e o treinamento do modelo. Um único modelo pode lidar com muitas tarefas, reduzindo a necessidade de vários modelos especializados. Engenharia imediata permite iterações e melhorias rápidas sem a necessidade de retreinamento.
Vamos considerar o processo tradicional versus a solicitação de disparo zero para o desenvolvimento de uma ferramenta de análise de sentimentos:
Essa comparação mostra a economia significativa de tempo e recursos obtida com o prompting de disparo zero, permitindo o desenvolvimento e a implementação mais rápidos da IA. implantação de soluções de em vários campos.
Aplicações do Zero-Shot Prompting
O prompt de disparo zero levou a muitos novos usos em diferentes campos. Vamos dar uma olhada em algumas áreas importantes em que essa técnica faz a diferença.
Geração de texto
O prompt de disparo zero funciona muito bem em várias tarefas de geração de texto, permitindo que os modelos produzam diversos tipos de conteúdo sem treinamento específico. Alguns incluem resumo, redação criativa e tradução. Aqui estão alguns exemplos:
Classificação e análise de sentimentos
O prompting de disparo zero pode ser usado para várias tarefas de classificação, incluindo classificação de tópicos, análise de sentimentos e classificação de intenções, sem a necessidade de dados de treinamento rotulados.
Perguntas respondidas
O estímulo de disparo zero dá aos modelos a capacidade de responder a muitas perguntas diferentes, como perguntas factuais, explicativas e comparativas, com base em seu conhecimento geral e compreensão da linguagem.
Limitações do prompt de disparo zero
Embora o prompt de disparo zero tenha ótimos recursos, é importante entender suas limitações e desafios.
Precisão
A solicitação de disparo zero, embora forte, pode nem sempre ser tão precisa quanto os modelos especialmente treinados para tarefas específicas. Essa limitação decorre de vários fatores:
- Falta de otimização específica da tarefa: Os modelos ajustados se beneficiam do treinamento direcionado em dados específicos da tarefa, o que pode levar a uma maior precisão para essa tarefa específica.
- Variabilidade de interpretação: A interpretação do modelo do prompt pode nem sempre se alinhar perfeitamente com a intenção do usuário, o que pode levar a imprecisões.
- Manuseio de tarefas complexas: Tarefas altamente especializadas ou complexas podem exigir uma compreensão mais diferenciada do que o que é possível apenas com o prompt de disparo zero.
Sensibilidade imediata
O desempenho da solicitação de disparo zero pode ser altamente sensível ao texto da solicitação.
- Variações de redação: Pequenas mudanças no vocabulário ou na estrutura da frase podem alterar a interpretação da tarefa pelo modelo.
- Clareza das instruções: Instruções ambíguas ou imprecisas podem levar a resultados inesperados ou inconsistentes.
- Dependência de contexto: A eficácia de um prompt pode variar dependendo da entrada ou do contexto específico ao qual ele é aplicado.
Vamos examinar um exemplo específico com um texto de amostra e explicar os resultados de cada prompt. Isso ilustrará como pequenas mudanças no estímulo podem levar a respostas diferentes do modelo.
Usaremos o seguinte exemplo de texto:
Texto de amostra: "A Revolução Industrial, que ocorreu entre os séculos 18 e 19, foi um período durante o qual as sociedades predominantemente agrárias e rurais da Europa e da América se tornaram industriais e urbanas. Antes da Revolução Industrial, que começou na Grã-Bretanha no final dos anos 1700, a fabricação era geralmente feita nas casas das pessoas, usando ferramentas manuais ou máquinas básicas. A industrialização marcou uma mudança para maquinário motorizado e para fins especiais, fábricas e produção em massa. As indústrias de ferro e têxtil, juntamente com o desenvolvimento do motor a vapor, desempenharam papéis centrais na Revolução Industrial, que também viu sistemas aprimorados de transporte, comunicação e bancos."
Agora, vamos aplicar nossos três avisos:
Sugestão 1: "Resuma este texto em uma frase:"
Resultado 1: A Revolução Industrial foi um período transformador nos séculos 18 e 19 que mudou as sociedades europeias e americanas de agrárias para industriais, caracterizado pelo surgimento de fábricas, produção em massa e avanços tecnológicos em manufatura, transporte e comunicação.
Essa resposta fornece um resumo conciso, de uma frase, que capta a essência da Revolução Industrial, seu período, local e principais características.
Sugestão 2: "Forneça um breve resumo do seguinte:"
Resultado 2: A Revolução Industrial foi um período significativo de mudanças entre os séculos 18 e 19, afetando principalmente a Europa e a América. Ele marcou a transição de sociedades agrárias e rurais para sociedades industriais e urbanas. Antes dessa era, a fabricação era normalmente feita em casa usando ferramentas simples. A revolução trouxe máquinas elétricas, fábricas e métodos de produção em massa. Os principais setores, como o de ferro e o têxtil, desempenharam papéis cruciais, assim como a invenção do motor a vapor. Esse período também viu avanços nos sistemas de transporte, comunicação e bancário, alterando fundamentalmente o cenário econômico e social.
Esta resposta é mais longa e mais detalhada do que a primeira. Ele abrange mais aspectos da Revolução Industrial, incluindo seu impacto em setores específicos e mudanças sociais mais amplas. O modelo interpretou "breve resumo" como permitindo várias frases e uma cobertura mais abrangente.
Prompt 3: "Qual é a ideia principal dessa passagem?"
Resultado 3: A ideia principal dessa passagem é a mudança fundamental da sociedade agrária para a industrial durante a Revolução Industrial, destacando as principais mudanças nos métodos de fabricação, na tecnologia e no desenvolvimento urbano que ocorreram na Europa e na América entre os séculos 18 e 19.
Essa resposta se concentra no tema central ou no conceito central da passagem, em vez de tentar resumir todos os detalhes. Ele identifica a principal transformação (agrária para industrial) e menciona áreas amplas de mudança sem entrar em detalhes específicos, como as indústrias de ferro e têxtil ou o motor a vapor.
Preconceito
Os modelos pré-treinados usados para a solicitação de disparo zero podem apresentar vieses presentes em seus dados de treinamento, o que pode levar a resultados problemáticos:
- Vieses demográficos: Os modelos podem produzir resultados tendenciosos relacionados a raça, gênero, idade ou outros fatores demográficos.
- Preconceitos culturais: As respostas do modelo podem favorecer determinadas perspectivas culturais em detrimento de outras.
- Viés de recência: As informações mais predominantes nos dados de treinamento (geralmente mais recentes) podem estar super-representadas no conhecimento do modelo.
- Estereótipos: O modelo pode reforçar estereótipos prejudiciais presentes em seus dados de treinamento.
Compreender essas limitações e desafios é fundamental para que você possa usar com eficácia o prompt de disparo zero. É importante que você esteja ciente das possíveis imprecisões, da importância de um projeto cuidadoso e da necessidade de avaliar criticamente os resultados quanto a possíveis vieses.
Se você estiver interessado nesse tópico, confira este curso sobre ética em IA.
Conclusão
Neste tutorial, aprendemos que o prompting de disparo zero é uma técnica que oferece uma maneira eficiente e flexível de lidar com muitas tarefas de linguagem sem precisar de dados de treinamento especiais ou de ajuste fino do modelo.
O prompt de disparo zero permite que os LLMs executem várias tarefas, como geração de texto, classificação e resposta a perguntas, por meio de prompts cuidadosamente projetados.
Ele elimina a necessidade de coleta de dados específicos de tarefas e treinamento de modelos, reduzindo significativamente o tempo e os recursos necessários para implementar soluções de IA.
Esse método torna os recursos avançados de IA mais acessíveis a pessoas não técnicas, pois tarefas complexas podem ser executadas simplesmente descrevendo-as em linguagem natural.
No entanto, o estímulo de disparo zero tem limitações de precisão, sensibilidade do estímulo e possíveis vieses. Compreender esses desafios é fundamental para o uso responsável e eficaz.
E agora, é hora de você colocar esse conhecimento em prática! Gostaria de incentivá-lo a explorar a solicitação de disparo zero em seus próprios projetos e a fazer experiências com diferentes solicitações e tarefas. Portanto, divirta-se e descubra o potencial dessa técnica em seu próprio trabalho - divirta-se!
Perguntas frequentes
Como a solicitação de disparo zero se compara à solicitação de poucos disparos em termos de precisão e eficiência?
Em geral, a solicitação de zero disparo é mais eficiente, pois não requer exemplos, mas a solicitação de poucos disparos geralmente proporciona melhor precisão, especialmente em tarefas complexas. A escolha depende do caso de uso específico, dos recursos disponíveis e do equilíbrio de desempenho desejado.
Quais são as implicações éticas do uso de estímulos de disparo zero em processos de tomada de decisão ou sistemas automatizados?
As preocupações éticas incluem possíveis vieses nos dados de pré-treinamento do modelo, falta de salvaguardas específicas da tarefa e o risco de confiar demais na IA para tomar decisões críticas. O monitoramento cuidadoso e a supervisão humana são fundamentais ao implementar o prompt de disparo zero em áreas sensíveis.
O prompt de disparo zero pode ser combinado com outras técnicas de IA para aprimorar seus recursos e, em caso afirmativo, como?
Sim, o prompt de disparo zero pode ser combinado com técnicas como aprendizagem por transferência, aprendizagem multitarefa ou aprendizagem por reforço. Por exemplo, a combinação de estímulo de disparo zero com aprendizagem por transferência permite que os modelos se adaptem mais rapidamente a tarefas específicas do domínio, mantendo a capacidade de generalização.
Existem setores ou campos específicos em que o prompt de disparo zero apresentou resultados ou aplicações particularmente promissores?
O prompt de disparo zero tem sido bem-sucedido em áreas como atendimento ao cliente (para lidar com diversas consultas), criação de conteúdo (para gerar tipos de conteúdo variados) e pesquisa científica (para geração de hipóteses e revisão da literatura). Ele também está provando seu valor em aplicativos multilíngues e na prototipagem rápida de soluções de IA.
Como o prompt de disparo zero pode evoluir nos próximos 5 a 10 anos e quais são os possíveis avanços que podemos ver nessa área?
Poderemos ver uma compreensão mais sofisticada do contexto, uma melhor generalização entre domínios e a integração com sistemas de IA multimodais. Os possíveis avanços podem envolver a solicitação de disparo zero para tarefas de raciocínio complexas, a adaptação em tempo real ao feedback do usuário e a integração perfeita com bases de conhecimento externas para maior precisão e expansão de recursos.
Saiba mais sobre a IA!
curso