IBM lança próxima geração de Granite LLMs


IBM lança próxima geração de Granite LLMsIBM lança próxima geração de Granite LLMs

IBM anunciou a terceira geração de seu código aberto Granito Família LLM, que apresenta diversos modelos diferentes, ideais para diversos casos de uso.

“Refletindo nosso foco no equilíbrio entre poderoso e prático, os novos modelos IBM Granite 3.0 oferecem desempenho de última geração em relação ao tamanho do modelo, ao mesmo tempo em que maximizam a segurança, a velocidade e a economia para casos de uso corporativo”, escreveu a IBM em um comunicado. postagem no weblog.

A família Granite 3.0 inclui modelos de uso geral, modelos mais focados em proteção e segurança e modelos mistos de especialistas.

O principal modelo desta família é o Granite 3.0 8B Instruct, um modelo somente decodificador denso e ajustado por instrução que oferece forte desempenho em RAG, classificação, resumo, extração de entidade e uso de ferramentas. Ele corresponde a modelos abertos de tamanhos semelhantes em benchmarks acadêmicos e os excede em tarefas empresariais e segurança, de acordo com a IBM.

“Treinado usando um novo método de duas fases em mais de 12 trilhões de tokens de dados cuidadosamente verificados em 12 linguagens naturais diferentes e 116 linguagens de programação diferentes, o Granite 3.0 8B Instruct, amigável ao desenvolvedor, é um modelo empresarial robusto destinado a servir como um bloco de construção primário para fluxos de trabalho sofisticados e casos de uso baseados em ferramentas”, escreveu a IBM.

Esta versão também inclui novos modelos Granite Guardian que protegem contra preconceito social, ódio, toxicidade, palavrões, violência e jailbreak, bem como realizam verificações específicas de RAG, como fundamentação, relevância ao contexto e relevância da resposta.

Existem também vários outros modelos da família Granite 3.0, incluindo:

  • Granite-3.0-8B-Base, Granite-3.0-2B-Instruct e Granite-3.0-2B-Base, que são LLMs de uso geral
  • Granite-3.0-3B-A800M-Instruct e Granite-3.0-1B-A400M-Instruct, que são modelos de mistura de especialistas que minimizam latência e custo
  • Granito-3.0-8B-Instruct-Accelerator, que são decodificadores especulativos que oferecem melhor velocidade e eficiência

Todos os modelos estão disponíveis sob a licença Apache 2.0 no Hugging Face, e Granite 3.0 8B e 2B e Granite Guardian 3.0 8B e 2B estão disponíveis para uso comercial no watsonx.

A empresa também revelou que, até o last de 2024, planeja expandir todas as janelas de contexto do modelo para tokens de 128 mil, melhorar ainda mais o suporte multilíngue e introduzir recursos multimodais de entrada e saída de texto.

E além de lançar esses novos modelos Granite, a empresa também revelou a próxima disponibilidade da versão mais recente do watsonx Code Assistant, bem como planos de lançar novas ferramentas para desenvolvedores que criam, personalizam e implantam IA por meio de watsonx.ai.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *