Pular para o conteúdo principal
InicioBlogInteligência Artificial (IA)

12 Alternativas de código aberto ao GPT-4

GPT-4 alternativas de código aberto que podem oferecer desempenho semelhante e exigem menos recursos computacionais para serem executadas. Esses projetos vêm com instruções, fontes de código, pesos de modelos, conjuntos de dados e interface de usuário do chatbot.
Actualizado jul. de 2024  · 9 min leer

Uma IA aviária sai de sua gaiola

O GPT-4 é a IA generativa mais avançada desenvolvida pela OpenAI. Isso está mudando o cenário de como trabalhamos. No entanto, o GPT-4 não é de código aberto, o que significa que não temos acesso ao código, à arquitetura do modelo, aos dados ou aos pesos do modelo para reproduzir os resultados. Não podemos criar nosso próprio GPT-4 como um chatbot. 

Para equilibrar a escala, as comunidades de código aberto começaram a trabalhar em alternativas ao GPT-4 que oferecem desempenho e funcionalidade quase semelhantes e exigem menos recursos computacionais.

Você pode aprender sobre GPT-1, GPT-2, GPT-3 e GPT-4 revisando: O que é GPT-4 e por que ele é importante?, ou você pode aprender a usar o ChatGPT For Data Science Projects e dominar a engenharia de prompt para melhorar a criação de projetos de ciência de dados de ponta a ponta. 

No artigo, apresentaremos 12 alternativas de GPT-4 com uma breve descrição e links para o artigo de pesquisa relevante, publicação de blog, demonstração de chatbot, código-fonte e cartão de modelo. 

Observação: Alguns dos modelos mencionados têm uma licença não comercial, que restringe seu uso apenas para fins acadêmicos e de pesquisa. Você precisa entender essas limitações antes de usá-las.

1. ColossalChat

O ColossalChat é um projeto de código aberto que permite que você clone modelos de IA usando um pipeline completo de RLHF (Reinforcement Learning from Human Feedback). 

É um projeto totalmente de código aberto que inclui o conjunto de dados bilíngue, o código de treinamento, a demonstração e a inferência quantizada de 4 bits. Todos os componentes ajudarão você a criar um chatbot personalizado de forma mais barata e rápida.

image10.png

Imagem do ColossalChat

2. Alpaca-LoRA

O Alpaca-LoRA é um modelo que foi criado usando o Stanford Alpaca e a adaptação de baixa classificação (LoRA). A adoção do low-rank nos permite executar um modelo Instruct de qualidade semelhante ao GPT-3.5 no Raspberry Pi 4 com 4 GB de RAM. 

O projeto fornece código-fonte, exemplos de ajuste fino, código de inferência, pesos do modelo, conjunto de dados e demonstração. A melhor parte é que podemos treinar nosso modelo em poucas horas com uma única RTX 4090.

image2.png

Imagem de Alpaca-LoRA

3. Vicuna

A Vicuna pode gerar textos coerentes e criativos para chatbots. Trata-se de uma arquitetura baseada em transformador que foi aperfeiçoada em um conjunto de dados de conversação coletado do ShareGPT.com.

A Vicuna fornece quase 90% do desempenho do ChatGPT. Ele faz parte do FastChat, uma plataforma aberta que permite que os usuários treinem, atendam e avaliem seus chatbots. O FastChat fornece todos os componentes e ferramentas necessários para você criar um modelo de chatbot personalizado.

image14.png

Imagem do FastChat (lmsys.org)

4. GPT4ALL

O GPT4ALL é um chatbot desenvolvido pela equipe de IA da Nomic com base em dados de interação assistida com curadoria massiva, como problemas de palavras, códigos, histórias, representações e diálogos de várias voltas. A arquitetura do modelo é baseada no LLaMa e usa aceleradores de aprendizado de máquina de baixa latência para uma inferência mais rápida na CPU.

Com o GPT4ALL, você obtém um cliente Python, interferência de GPU e CPU, ligações Typescript, uma interface de bate-papo e um backend Langchain.

image3.png

Imagem de gpt4all-ui

5. Raven RWKV

O Raven RWKV faz parte do ChatRWKV, que é um modelo de código aberto como o ChatGPT, mas alimentado pelo modelo de linguagem RWKV (100% RNN), não baseado em transformador.

Ao utilizar RNNs, o modelo atinge níveis comparáveis de qualidade e escalabilidade como transformadores, com os benefícios adicionais de maior velocidade de processamento e conservação de VRAM. O Raven foi ajustado para seguir instruções e foi ajustado no Stanford Alpaca, no code-alpaca e em outros conjuntos de dados. 

image6.png

Imagem do Raven RWKV 7B

6. OpenChatKit

O OpenChatKit é um kit de ferramentas abrangente que oferece uma alternativa de código aberto ao ChatGPT para o desenvolvimento do aplicativo de chatbot. 

O kit de ferramentas inclui instruções passo a passo para você treinar seu próprio modelo de linguagem grande ajustado por instruções, ajustar o modelo e um sistema de recuperação extensível para atualizar as respostas do bot. Além disso, ele inclui recursos de moderação que podem ajudar a filtrar perguntas inadequadas.

image11.png

Imagem do OpenChatKit

7. OPT

Os modelos de idioma OPT (Open Pre-trained Transformer) demonstraram habilidades notáveis no aprendizado de zero e poucos disparos, bem como na análise de viés estereotipado, apesar de não corresponderem à qualidade do ChatGPT. 

OPT é uma família de grandes modelos de linguagem que variam de 125M a 175B parâmetros. Os modelos são transformadores somente de decodificador, o que significa que eles geram texto autorregressivo da esquerda para a direita.

image4.png

Imagem de Uma marca d'água para LLMs

8. Flan-T5-XXL

O Flan-T5-XXL foi um modelo T5 ajustado que foi treinado em uma vasta coleção de conjuntos de dados apresentados na forma de instruções. Esse tipo de ajuste fino melhorou significativamente o desempenho em uma variedade de classes de modelos, como PaLM, T5 e U-PaLM. Além disso, o modelo Flan-T5-XXL foi ajustado em mais de 1.000 tarefas adicionais que abrangem vários idiomas. 

image1.png

Imagem de Chat Llm Streaming

9. Baize

O Baize apresenta um desempenho impressionante em diálogos de várias voltas graças às suas proteções que ajudam a reduzir os riscos potenciais. Isso foi alcançado por meio de um corpus de bate-papo de alta qualidade com várias voltas, que foi desenvolvido com o ChatGPT para facilitar as conversas com você mesmo.

O código-fonte, o modelo e o conjunto de dados do Baize são liberados sob uma licença não comercial (para fins de pesquisa). 

image7.pngImagemdo Baize 7B

10. Koala

O Koala é um chatbot treinado pelo ajuste fino do LLaMa em um conjunto de dados de diálogo extraído da Web. O Koala teve um desempenho melhor do que o Alpaca e é semelhante ao ChatGPT em muitos casos. 

O Koala fornece código de treinamento, pesos públicos e ajuste fino de diálogo, e foi avaliado por 100 humanos.  

image8.png

Imagem de FastChat/Koala

11. Dolly

Dolly é um modelo de linguagem grande que foi treinado pela máquina da Databricks para demonstrar que podemos usar o antigo modo de linguagem de código aberto e dar a eles a capacidade de seguir instruções mágicas do ChatGPT. O treinamento do modelo requer 30 minutos em uma máquina, usando dados de treinamento de alta qualidade. Você não precisa nem mesmo de modelos grandes para obter alta qualidade. A equipe usou o modelo de 6 bilhões de parâmetros, em comparação com 175 bilhões do GPT-3.

Confira o Dolly 2.0, um modelo de linguagem que segue instruções que pode ser usado comercialmente.

image12.png

Imagem de Hello Dolly

12. Assistente Aberto

O Open Assistant é um projeto verdadeiramente de código aberto, o que significa dar a todos acesso aos principais modelos de linguagem de grande porte baseados em bate-papo. Seu objetivo é criar uma revolução na inovação da linguagem, permitindo que as pessoas interajam com sistemas de terceiros, recuperem informações dinamicamente e criem novos aplicativos usando a linguagem. 

Você pode executar o chatbot de linguagem ampla em uma única GPU de consumo de ponta, e seu código, modelos e dados são licenciados sob licenças de código aberto.

image5.png

Imagem de open-assistant.io

Conclusão

Essas alternativas ao GPT-4 podem ajudar pesquisadores, desenvolvedores e pequenas empresas a criar sua tecnologia baseada em linguagem e competir com os gigantes do setor. O desempenho dos modelos não está acima do GPT-4, mas com o tempo e a contribuição da comunidade, alguns podem ter o potencial de superar o GPT-4.

Se você é novo no ChatGPT, experimente fazer nosso curso de Introdução ao ChatGPT e, se você conhece a IA generativa, pode melhorar sua capacidade de solicitação analisando a abrangente Folha de dicas do ChatGPT para ciência de dados ou conferindo os recursos abaixo.

Temas
Relacionado

blog

A OpenAI anuncia o GPT-4 Turbo com visão: O que sabemos até o momento

Descubra a atualização mais recente da OpenAI, GPT-4 Turbo com visão, e seus principais recursos, incluindo o corte de conhecimento aprimorado, uma janela de contexto expandida, preço acessível e muito mais.
Richie Cotton's photo

Richie Cotton

7 min

blog

Tudo o que sabemos sobre o GPT-5

Prever como será a próxima evolução da tecnologia de IA da OpenAI e quais avanços o modelo GPT-5 poderá ter.
Josep Ferrer's photo

Josep Ferrer

10 min

blog

Os 10 melhores GPTs personalizados na GPT Store

Explore os melhores GPTs personalizados que vimos até agora na loja GPT, desde ferramentas de ciência de dados até assistentes de SEO e geração de imagens.
Nisha Arya Ahmed's photo

Nisha Arya Ahmed

10 min

tutorial

Visão GPT-4: Um guia abrangente para iniciantes

Este tutorial apresentará tudo o que você precisa saber sobre o GPT-4 Vision, desde o acesso a ele, passando por exemplos práticos do mundo real, até suas limitações.
Arunn Thevapalan's photo

Arunn Thevapalan

12 min

tutorial

Como criar modelos personalizados do ChatGPT: 5 etapas fáceis para GPTs personalizados

Confira estas cinco etapas simples para liberar todo o potencial do ChatGPT com seus próprios GPTs personalizados.
Moez Ali's photo

Moez Ali

9 min

tutorial

Um guia para iniciantes na engenharia de prompts do ChatGPT

Descubra como fazer com que o ChatGPT forneça os resultados que você deseja, fornecendo a ele as entradas necessárias.
Matt Crabtree's photo

Matt Crabtree

6 min

See MoreSee More