Programa
Na quarta-feira, 24 de julho de 2024, a Mistral AI anunciou o Mistral Large 2, a última geração de seu principal modelo de linguagem grande.
Em comparação com seu antecessor, o Mistral Large 2 traz avanços significativos na geração de código, matemática, raciocínio e suporte multilíngue. Esse novo modelo visa preencher a lacuna entre LLMs de código aberto e de código fechado, oferecendo uma alternativa para vários aplicativos.
O que faz o Mistral Large 2 se destacar? Qual é o desempenho dele em relação a outros modelos líderes, como o GPT-4o, Llama 3.1e Claude 3 Opus? E quais são os novos recursos que ele traz para a tabela?
Continue lendo para descobrir os recursos, o desempenho e as possíveis aplicações do Mistral Large 2.
O que é o Mistral Large 2?
O Mistral Large 2 é o mais novo modelo de linguagem da Mistral AI, projetado para se destacar em várias áreas, como geração de código, matemática e tarefas multilíngues. Vamos dar uma olhada em seus principais recursos e capacidades.
123 bilhões de parâmetros
O Mistral Large 2 tem 123 bilhões de parâmetros, o que o torna incrivelmente poderoso para compreender e gerar tarefas de linguagem complexas com alta precisão.
Esse tamanho grande permite que o modelo lide com problemas complexos com maior precisão. O modelo também foi desenvolvido para inferência de nó único com aplicativos de contexto longo, o que torna eficiente a operação em um único nó.
Janela de contexto de 128k
Uma janela de contexto de 128k permite que o Mistral Large 2 mantenha a coerência e a relevância em longas conversas ou documentos, fornecendo resultados consistentes e significativos em interações prolongadas.
Suporte a vários idiomas e programação
O Mistral Large 2 oferece suporte a uma ampla variedade de idiomas, incluindo russo, chinês, japonês, coreano, espanhol, italiano e muitos outros.
Ele também se destaca em mais de 80 linguagens de codificação, como PythonJava, C, C++ e JavaScript, o que o torna uma ferramenta versátil para usuários de todo o mundo.
De código aberto e acessível
O Mistral Large 2 está disponível sob a Licença de Pesquisa Mistral, permitindo o uso e a modificação de código aberto para pesquisa e não comerciais não comerciais.
Isso o torna acessível para pesquisadores e desenvolvedores interessados em explorar e aprimorar seus recursos.
Licenciamento comercial
Para uso comercial, o Mistral Large 2 requer uma Licença Comercial Mistral. As partes interessadas podem entrar em contato com a Mistral para obter essa licença.

Como funciona o Mistral Large 2
Então, como funciona o Mistral Large 2? Ele usa uma arquitetura Transformer somente de decodificadorum projeto popular e eficaz para modelos de linguagem modernos. Essa configuração permite que o modelo lide com várias tarefas de linguagem de forma eficiente. Aqui você verá duas maneiras principais pelas quais o Mistral Large 2 se destaca no gerenciamento de uma ampla gama de tarefas de linguagem e codificação.
Treinamento em conjuntos de dados massivos
O Mistral Large 2 foi treinado em uma grande quantidade de texto e código em vários idiomas e assuntos. Esse treinamento extensivo ajuda o modelo a compreender uma ampla gama de tópicos e habilidades, desde documentos técnicos até conversas cotidianas e trechos de código.
O conjunto de dados diversificado também aumenta a capacidade do modelo de ajudar nas tarefas de programação, como geração e depuração de código.
Redução das alucinações
Um problema comum com modelos de linguagem grandes é que, às vezes, eles produzem informações que parecem corretas, mas não são precisas. Para resolver isso, a Mistral AI se concentrou em minimizar essas "alucinações" por meio de um ajuste fino o modelo.
Eles acrescentaram verificações de precisão mais rigorosas e sistemas de feedback para garantir que o modelo forneça informações confiáveis. O Mistral Large 2 também foi projetado para reconhecer quando não tem informações suficientes para fornecer uma resposta segura, reduzindo as chances de respostas enganosas ou incorretas. Esse foco na precisão torna o Mistral Large 2 uma ferramenta confiável para usuários que precisam de informações precisas e confiáveis.
Aplicações do Mistral Large 2
Como seu antecessor, o Mistral Large 2 é uma ferramenta versátil com uma ampla gama de usos. Ele é ótimo para tarefas de codificação, incluindo geração, conclusão e depuração de código.
Ele também aborda problemas matemáticos complexos e oferece explicações claras, o que o torna útil para estudantes e profissionais.
O raciocínio sólido e as habilidades lógicas do modelo são ideais para responder a perguntas e analisar textos, fornecendo insights profundos sobre o conteúdo escrito.
Por fim, o suporte multilíngue do Mistral Large 2 ajuda na tradução, no aprendizado de idiomas e na comunicação entre diferentes culturas.
Embora agora ele lide principalmente com texto, futuras atualizações poderão expandir seus recursos para trabalhar com imagens ou áudio.
Benchmarks e desempenho
O Mistral Large 2 está estabelecendo novos padrões de desempenho e eficiência de custo. Veja aqui o desempenho dele em vários benchmarks.
MMLU
No benchmark MMLU (Massive Multitask Language Understanding), o Mistral Large 2 obteve uma impressionante precisão de 84,0%.
Esse benchmark testa a capacidade do modelo de lidar com uma ampla variedade de tarefas, desde ciências e humanidades até desafios profissionais. Essa pontuação alta destaca o forte conhecimento geral e as habilidades de raciocínio do Mistral Large 2.
Geração de código e matemática
O Mistral Large 2 se destaca na geração de código e na matemática, obtendo as melhores pontuações nessas áreas e usando menos parâmetros do que você. modelos maiores, como o Llama 3.1 405B. Sua alta relação entre desempenho e tamanho faz com que ele se destaque, superando consistentemente os modelos maiores e menores do Llama 3.1.

Fonte: Mistral AI
Nos benchmarks de geração de código, o Mistral Large 2 fica atrás apenas do GPT-4o, com precisão impressionante no Human Eval e no Human Eval Plus. Embora seja o sexto no MBPP Base e no MBPP Plus, ele ainda tem um bom desempenho em comparação com outros modelos.

Fonte: Mistral AI
Para a geração de código multilíngue, o Mistral Large 2 está em segundo lugar, logo atrás do GPT-4o, e mostra uma melhoria significativa em relação ao seu antecessor. De modo geral, ele é altamente eficiente e versátil, particularmente forte no tratamento de tarefas matemáticas e de código.

Fonte: Mistral AI
O Mistral Large 2 tem um bom desempenho no GSM8K, ficando logo atrás do LLaMA 3.1 70B. No benchmark mais difícil do Math Instruct, o Mistral Large 2 ficou em segundo lugar, atrás apenas do GPT-4o, mostrando fortes habilidades de raciocínio matemático logo de cara. Essas melhorias, especialmente em tarefas de tiro zero, refletem suas habilidades matemáticas avançadas e seu sólido treinamento.

Fonte: Mistral AI
No geral, o Mistral Large 2 se destaca na geração de códigos e no raciocínio matemático, campos que exigem precisão e confiabilidade. Treinado em um corpus substancial de código, ele supera significativamente seu antecessor e é competitivo com os principais modelos, como o GPT-4o e o Llama 3.1 405B. Seu desempenho mostra que é uma ferramenta poderosa para desenvolvimento de software e pesquisa acadêmica.
Acompanhamento e alinhamento das instruções
Outro desempenho importante do Mistral Large 2 é o forte aprimoramento dos recursos de acompanhamento de instruções e de conversação, tornando-o melhor no acompanhamento de instruções e na condução de longas conversas.
O Mistral Large 2 tem um bom desempenho no Wild Bench, ficando atrás apenas do GPT-4o. No Arena Hard, ele está em terceiro lugar, atrás do GPT-4o e do Claude 3.5 Sonnet.

Fonte: Mistral AI
O desempenho do Mistral Large 2 no MT Bench também obteve alta pontuação com o juiz GPT-4o, ficando em terceiro lugar entre os modelos grandes, e ficou em segundo lugar em comprimento de geração, logo atrás do do Mistral Large original. Isso mostra que o Mistral Large 2 pode fornecer respostas detalhadas e de alta qualidade.

Fonte: Mistral AI
MMLU multilíngue
Um dos recursos de destaque do Mistral Large 2 são os recursos multilíngues. No benchmark multilíngue MMLU, que avalia o desempenho em vários idiomas, o Mistral Large 2 oferece resultados sólidos em todos os idiomas testados, ficando consistentemente em segundo lugar, atrás do modelo LLaMA 3.1 405B, muito maior. Isso demonstra o forte equilíbrio do Mistral Large 2 entre desempenho e eficiência.

Fonte: Mistral AI
Chamada de função
A chamada de função é crucial porque permite que o modelo execute tarefas ou comandos específicos com precisão, tornando-o altamente eficaz para aplicações práticas que exigem ações precisas com base na entrada do usuário.
O Mistral Large 2 superou todos os modelos maiores, como o GPT-4o e o Claude 3.5 Sonnet, em chamadas de função. Essa melhoria significativa demonstra os recursos avançados do Mistral Large 2 e o diferencia dos modelos e concorrentes anteriores.

Fonte: Mistral AI
Desempenho/eficiência de custo
O Mistral Large 2 estabelece uma nova referência na frente de Pareto de desempenho/custo, que avalia o equilíbrio entre o desempenho de um modelo e o custo de atendê-lo. Essencialmente, ele oferece excelente desempenho sem ser muito caro, o que o torna uma opção acessível para empresas e pesquisadores. Essa eficiência ajuda os usuários a obterem resultados impressionantes sem ultrapassar o orçamento.
Acesso aos modelos Mistral
Você pode acessar o Mistral Large 2 de duas maneiras principais: La Plateforme e Provedores de serviços em nuvem.
A plataforma
O Mistral Large 2 está disponível no La Plateforme com o nome mistral-large-2407, onde você também pode testá-lo usando o Chat. Os pesos dos modelos estão hospedados no HuggingFace. No geral, você pode acessar o Mistral Nemo, o Mistral Large, o Codestral e o Embed para diferentes necessidades no La Plateforme. As opções de ajuste fino também estão disponíveis para o Mistral Large, Mistral Nemo e Codestral.
Provedores de serviços em nuvem
Como alternativa, você também pode acessar o Mistral Large 2 por meio dos principais provedores de nuvem. Você pode encontrá-lo no Vertex AI do Google Cloud Platform, no Azure AI Studio, no Amazon Bedrock e no IBM watsonx.ai.
Segurança e responsabilidade: Uma prioridade máxima
A Mistral AI se dedica a garantir que seus modelos sejam usados eticamente e de forma responsável.
Fortes medidas de segurança
O Mistral Large 2 foi exaustivamente testado e ajustado para minimizar os riscos de resultados prejudiciais ou tendenciosos. Isso inclui o foco na redução de informações incorretas ou enganosas geradas pelo modelo.
Uso responsável
O uso responsável do Mistral Large 2 vai além das proteções técnicas. Também envolve as ações éticas de seus usuários. Para garantir que o modelo seja usado adequadamente, os usuários devem seguir a Licença de Pesquisa Mistral para pesquisas não comerciais ou obter uma Licença Comercial para fins comerciais. Incentivamos os usuários a aplicar o Mistral Large 2 de forma a beneficiar a sociedade e a evitar usos que possam ser prejudiciais ou espalhar desinformação.
Conclusão
O Mistral Large 2 representa um passo à frente para os modelos de linguagem de código aberto.
Seu excelente desempenho, a ampla variedade de suporte a idiomas e a ênfase na precisão e na segurança fazem dele uma ferramenta poderosa para desenvolvedores, pesquisadores e empresas.
Se você quiser saber mais sobre o conjunto de LLMs da Mistral, recomendo estas publicações no blog:
Perguntas frequentes
Como o Mistral Large 2 se compara ao seu antecessor, o Mistral Large?
O Mistral Large 2 oferece melhorias significativas em relação ao seu antecessor em áreas como geração de código, matemática, raciocínio e suporte multilíngue. Ele obtém pontuações mais altas em vários benchmarks e apresenta uma janela de contexto maior, o que lhe permite lidar com tarefas mais complexas e manter a coerência em textos mais longos.
O Mistral Large 2 pode ser usado para aplicações comerciais?
Sim, mas você precisa de uma licença comercial da Mistral. Para pesquisa e desenvolvimento não comerciais, ele está disponível sob a Mistral Research License.
O Mistral Large 2 oferece suporte ao processamento de imagem ou áudio?
Atualmente, o Mistral Large 2 se concentra principalmente em tarefas baseadas em texto. No entanto, a Mistral AI indicou planos para expandir seus recursos para lidar com imagens e áudio em futuras atualizações.
Como posso acessar e usar o Mistral Large 2?
Você pode acessar o Mistral Large 2 por meio da plataforma da Mistral AI, "la Plateforme", ou por meio de APIs gerenciadas nos principais provedores de serviços em nuvem, como o Vertex AI do Google Cloud Platform, o Azure AI Studio, o Amazon Bedrock e o IBM watsonx.ai. Para uso comercial e implantação própria, você precisa de uma Licença Comercial Mistral.



