IBM lança próxima geração de Granite LLMs

outubro 22, 2024

IBM anunciou a terceira geração de seu código aberto Granito Família LLM, que apresenta diversos modelos diferentes, ideais para diversos casos de uso.

“Refletindo nosso foco no equilíbrio entre poderoso e prático, os novos modelos IBM Granite 3.0 oferecem desempenho de última geração em relação ao tamanho do modelo, ao mesmo tempo em que maximizam a segurança, a velocidade e a economia para casos de uso corporativo”, escreveu a IBM em um comunicado. postagem no weblog.

A família Granite 3.0 inclui modelos de uso geral, modelos mais focados em proteção e segurança e modelos mistos de especialistas.

O principal modelo desta família é o Granite 3.0 8B Instruct, um modelo somente decodificador denso e ajustado por instrução que oferece forte desempenho em RAG, classificação, resumo, extração de entidade e uso de ferramentas. Ele corresponde a modelos abertos de tamanhos semelhantes em benchmarks acadêmicos e os excede em tarefas empresariais e segurança, de acordo com a IBM.

“Treinado usando um novo método de duas fases em mais de 12 trilhões de tokens de dados cuidadosamente verificados em 12 linguagens naturais diferentes e 116 linguagens de programação diferentes, o Granite 3.0 8B Instruct, amigável ao desenvolvedor, é um modelo empresarial robusto destinado a servir como um bloco de construção primário para fluxos de trabalho sofisticados e casos de uso baseados em ferramentas”, escreveu a IBM.

Esta versão também inclui novos modelos Granite Guardian que protegem contra preconceito social, ódio, toxicidade, palavrões, violência e jailbreak, bem como realizam verificações específicas de RAG, como fundamentação, relevância ao contexto e relevância da resposta.

Existem também vários outros modelos da família Granite 3.0, incluindo:

Granite-3.0-8B-Base, Granite-3.0-2B-Instruct e Granite-3.0-2B-Base, que são LLMs de uso geral
Granite-3.0-3B-A800M-Instruct e Granite-3.0-1B-A400M-Instruct, que são modelos de mistura de especialistas que minimizam latência e custo
Granito-3.0-8B-Instruct-Accelerator, que são decodificadores especulativos que oferecem melhor velocidade e eficiência

Todos os modelos estão disponíveis sob a licença Apache 2.0 no Hugging Face, e Granite 3.0 8B e 2B e Granite Guardian 3.0 8B e 2B estão disponíveis para uso comercial no watsonx.

A empresa também revelou que, até o last de 2024, planeja expandir todas as janelas de contexto do modelo para tokens de 128 mil, melhorar ainda mais o suporte multilíngue e introduzir recursos multimodais de entrada e saída de texto.

E além de lançar esses novos modelos Granite, a empresa também revelou a próxima disponibilidade da versão mais recente do watsonx Code Assistant, bem como planos de lançar novas ferramentas para desenvolvedores que criam, personalizam e implantam IA por meio de watsonx.ai.

IBM lança próxima geração de Granite LLMs

Deixe um comentário Cancelar resposta

DJI tem aprovação da FCC para o Avata 360 (não, NÃO está proibido!)

Revisão: Equipment BetaFPV Aquila20 HD FPV – Melhor que a versão analógica?

Biossensor de ponto excepcional alcança detecção de molécula única de biomarcador de câncer de mama

Rota de preservação de simetria para isoladores de ordem superior – Physics World

Nanofibras ainda lutam pelo sucesso industrial após 25 anos

Sensor de dor autocurativo feito de gelatina pode dar aos robôs reflexos semelhantes aos humanos

CypressTel fala sobre SD-WAN, SASE e é a porta de entrada para a China

4G em todas as aldeias da Índia até junho de 2026: Jyotiraditya Scindia

Uma plataforma de IA pode substituir sua pilha de ferramentas criativas?

Por que o ‘chato’ VS Code continua vencendo

Uma plataforma de IA pode substituir sua pilha de ferramentas criativas?

Presidente da Xometry vende US$ 1,7 milhão em ações em transação pré-planejada – 3DPrint.com