Amazon Bedrock adiciona 18 modelos de peso aberto totalmente gerenciados, incluindo os novos modelos Mistral Giant 3 e Ministral 3


Amazon Bedrock adiciona 18 modelos de peso aberto totalmente gerenciados, incluindo os novos modelos Mistral Giant 3 e Ministral 3

Hoje, estamos anunciando a disponibilidade geral de mais 18 modelos de peso aberto totalmente gerenciados em Base Amazônica do Google, MiniMax AI, IA MistralMoonshot AI, NVIDIA, OpenAIe Qwenincluindo os novos modelos Mistral Giant 3 e Ministral 3 3B, 8B e 14B.

Com este lançamento, a Amazon Bedrock agora oferece quase 100 modelos sem servidor, oferecendo uma ampla e profunda gama de modelos de empresas líderes de IA, para que os clientes possam escolher os recursos precisos que melhor atendem às suas necessidades exclusivas. Ao monitorar de perto as necessidades dos clientes e os avanços tecnológicos, expandimos regularmente nossa seleção selecionada de modelos com base nas necessidades do cliente e nos avanços tecnológicos para incluir novos modelos promissores juntamente com os favoritos do setor.

Essa expansão contínua de ofertas de modelos diferenciados e de alto desempenho ajuda os clientes a permanecerem na vanguarda da inovação em IA. Você pode acessar esses modelos no Amazon Bedrock por meio da API unificada, avaliar, alternar e adotar novos modelos sem reescrever aplicativos ou alterar a infraestrutura.

Novos modelos de IA Mistral

Esses quatro modelos Mistral AI agora estão disponíveis primeiro no Amazon Bedrock, cada um otimizado para diferentes requisitos de desempenho e custo:

  • Mistral Grande 3 – Este modelo de peso aberto é otimizado para contexto longo, multimodal e confiabilidade de instrução. Ele se destaca na compreensão de documentos longos, fluxos de trabalho de uso de agentes e ferramentas, trabalho de conhecimento empresarial, assistência de codificação, cargas de trabalho avançadas, como tarefas de matemática e codificação, análise e processamento multilíngue e raciocínio multimodal com visão.
  • Ministério 3 3B – O menor da família Ministral 3 é otimizado para implantação de GPU única com fortes recursos de linguagem e visão. Ele mostra desempenho robusto em legendagem de imagens, classificação de texto, tradução em tempo actual, extração de dados, geração de conteúdo curto e aplicativos leves em tempo actual em dispositivos de ponta ou com poucos recursos.
  • Ministério 3 8B – O melhor modelo Ministral 3 para texto e visão é otimizado para implantação de GPU única com alto desempenho e pegada mínima. Este modelo é splendid para interfaces de bate-papo em ambientes restritos, descrição e compreensão de imagens e documentos, casos de uso de agentes especializados e desempenho balanceado para sistemas locais ou incorporados.
  • Ministério 3 14B – O modelo Ministral 3 de maior capacidade oferece texto de última geração e desempenho de visão otimizado para implantação de GPU única. Você pode usar casos de uso avançados de agentes locais e implantações privadas de IA onde recursos avançados atendem a restrições práticas de {hardware}.

Mais opções de modelos de peso aberto

Você pode usar esses modelos de peso aberto para uma ampla variedade de casos de uso em todos os setores:

Provedor de modeloNome do modeloDescriçãoCasos de uso
GoogleGema 3 4BModelo eficiente de texto e imagem executado localmente em laptops. Suporte multilíngue para aplicativos de IA no dispositivo.IA no dispositivo para aplicativos móveis e de borda, inferência native sensível à privacidade, assistentes de bate-papo multilíngue, legenda e descrição de imagens e geração leve de conteúdo.
Gema 3 12BModelo balanceado de texto e imagem para estações de trabalho. Compreensão multilíngue com implantação native para aplicativos sensíveis à privacidade.Aplicativos de IA baseados em estações de trabalho; implantação native para empresas; processamento de documentos multilíngues, análise de imagens e perguntas e respostas; e assistentes de IA compatíveis com privacidade.
Gema 3 27BModelo poderoso de texto e imagem para aplicativos corporativos. Suporte multilíngue com implantação native para privacidade e controle.Implantação native empresarial, aplicativos multimodais de alto desempenho, compreensão avançada de imagens, atendimento ao cliente multilíngue e fluxos de trabalho de IA sensíveis a dados.
IA do tiro lunarKimi K2 PensandoModelo de raciocínio profundo que pensa enquanto usa ferramentas. Lida com pesquisas, codificação e fluxos de trabalho complexos que exigem centenas de ações sequenciais.Projetos de codificação complexos que exigem planejamento, fluxos de trabalho em várias etapas, análise e computação de dados e criação de conteúdo extenso com pesquisa.
IA MiniMaxMiniMax M2Construído para agentes de codificação e automação. É excelente em edições de vários arquivos, operações de terminal e execução eficiente de longas cadeias de chamada de ferramentas.Integração de agentes de codificação e ambiente de desenvolvimento integrado (IDE), edição de código de vários arquivos, automação de terminal e DevOps, orquestração de ferramentas de cadeia longa e desenvolvimento de software program de agente.
IA MistralMagistral Pequeno 1.2Excelente em matemática, codificação, tarefas multilíngues e raciocínio multimodal com recursos de visão para implantação native eficiente.Tarefas matemáticas e de codificação, análise e processamento multilíngue e raciocínio multimodal com visão.
Voxtral Mini 1.0Modelo avançado de compreensão de áudio com transcrição, suporte multilíngue, perguntas e respostas e resumo.Aplicativos controlados por voz, conversão rápida de fala em texto e assistentes de voz offline.
Voxtral Pequeno 1.0Possui entrada de áudio de última geração com o melhor desempenho de texto da categoria; é excelente na transcrição, tradução e compreensão da fala.Transcrição de fala empresarial, atendimento ao cliente multilíngue e resumo de conteúdo de áudio.
NVIDIANVIDIA Nemotron Nano 2 9BLLM de alta eficiência com design de transformador híbrido Mamba, destacando-se em raciocínio e tarefas de agente.Raciocínio, chamada de ferramentas, matemática, codificação e acompanhamento de instruções.
NVIDIA Nemotron Nano 2 VL 12BModelo avançado de raciocínio multimodal para compreensão de vídeo e inteligência de documentos, potencializando a Geração Aumentada de Recuperação (RAG) e aplicações de agentes multimodais.Compreensão de múltiplas imagens e vídeos, perguntas e respostas visuais e resumo.
OpenAIgpt-oss-safeguard-20bModelo de segurança de conteúdo que aplica suas políticas personalizadas. Classifica conteúdo prejudicial com explicações para fluxos de trabalho de confiança e segurança.Moderação de conteúdo e classificação de segurança, aplicação de políticas personalizadas, filtragem de conteúdo gerado pelo usuário, fluxos de trabalho de confiança e segurança e triagem automatizada de conteúdo.
gpt-oss-safeguard-120bModelo maior de segurança de conteúdo para moderação complexa. Aplica políticas personalizadas com raciocínio detalhado para equipes empresariais de confiança e segurança.Moderação de conteúdo empresarial em escala, interpretação complexa de políticas, classificação de segurança em várias camadas, verificação de conformidade regulatória, revisão de conteúdo de alto risco.
QwenQwen3-Subsequent-80B-A3BInferência rápida com atenção híbrida para documentos ultralongos. Otimizado para pipelines RAG, uso de ferramentas e fluxos de trabalho de agentes com respostas rápidas.Pipelines RAG com documentos longos, fluxos de trabalho de agentes com chamada de ferramentas, geração de código e desenvolvimento de software program, conversas multiturno com contexto estendido, geração de conteúdo multilíngue.
Qwen3-VL-235B-A22BCompreende imagens e vídeos. Extrai texto de documentos, converte capturas de tela em código funcional e automatiza cliques nas interfaces.Extração de texto de imagens e PDFs, conversão de designs de UI ou capturas de tela em código funcional, automatização de cliques e navegação em aplicativos, análise e compreensão de vídeos, leitura de gráficos e diagramas.

Ao implementar modelos disponíveis publicamente, considere cuidadosamente os requisitos de privacidade de dados em seus ambientes de produção, verifique se há distorções na saída e monitore seus resultados quanto à segurança dos dados. IA responsávele avaliação do modelo.

Você pode acessar o recursos de segurança de nível empresarial do Amazon Bedrock e implemente proteções personalizadas de acordo com os requisitos da sua aplicação e políticas de IA responsáveis ​​com Guarda-corpos de rocha amazônica. Você também pode avaliar e comparar modelos para identificar os modelos ideais para seus casos de uso usando Ferramentas de avaliação de modelo Amazon Bedrock.

Para começar, você pode testar rapidamente esses modelos com algumas instruções no playground do Console Amazon Bedrock ou use qualquer SDKs da AWS para incluir acesso ao Bedrock InvocarModelo e Conversar APIs. Você também pode usar esses modelos com qualquer estrutura de agente que ofereça suporte ao Amazon Bedrock e implantar os agentes usando Amazon Bedrock AgentCore e Agentes de Fios. Para saber mais, visite Exemplos de código para Amazon Bedrock usando AWS SDKs no Guia do usuário do Amazon Bedrock.

Agora disponível

Verifique o lista completa de regiões para disponibilidade e atualizações futuras de novos modelos ou pesquise o nome do seu modelo no AWS CloudFormation guia de recursos de Capacidades da AWS por região. Para saber mais, confira o Página do produto Amazon Bedrock e o Página de preços do Amazon Bedrock.

Experimente estes modelos no Console Amazon Bedrock hoje e envie suggestions para AWS re:Submit para Amazon Bedrock ou por meio de seus contatos habituais do AWS Assist.

Channy

Atualizado em 4 de dezembro — Amazon Bedrock agora oferece suporte à API Responses em novos endpoints de serviço compatíveis com API OpenAI para modelos GPT OSS 20B e 120B. Para saber mais, visite Gere respostas usando APIs OpenAI.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *