Anunciando novos modelos e técnicas de ajuste fino na Azure AI Foundry


Hoje, estamos empolgados em anunciar dois principais aprimoramentos para modelar o ajuste fino na Fundição do Azure AI-reforço de ajuste fino (RFT) com O4-mini, em breve, e supervisionou o ajuste fino (SFT) para o modelo 4.1-nano, disponível agora.

Hoje, estamos empolgados em anunciar três grandes aprimoramentos para modelar o ajuste fino na Fundição do Azure AI-Reforço Tuneamento fino (RFT) com O4-mini (em breve), ajuste fino supervisionado (SFT) para o GPT-4.1-Nano e Modelo de Scout Lhama 4 (disponível agora). Essas atualizações refletem nosso compromisso contínuo em capacitar as organizações com ferramentas para criar sistemas de IA altamente personalizados e adaptados ao domínio para impacto no mundo actual.

Com esses novos modelos, estamos desbloqueando duas grandes avenidas da personalização LLM: GPT-4.1-Nano é um modelo pequeno e poderoso, excellent para destilação, enquanto o O4-mini é o primeiro modelo de raciocínio que você pode ajustar, e o LLAMA 4 Scout é o melhor modelo de código aberto.

Reforço fino com o4-mini

O ajuste fino de reforço introduz um novo nível de controle para alinhar o comportamento do modelo com a lógica de negócios complexa. Ao recompensar o raciocínio preciso e penalizar resultados indesejáveis, a RFT melhora a tomada de decisões do modelo em ambientes dinâmicos ou de alto risco.

Em breve para o O4-mini Modelo, a RFT desbloqueia novas possibilidades para casos de uso que requerem raciocínio adaptativo, consciência contextual e lógica específica de domínio-tudo ao mesmo tempo em que mantém o rápido desempenho da inferência.

Impacto do mundo actual: Draftwise

O DraftWise, uma startup de tecnologia jurídica, usou o ajuste fino de reforço (RFT) nos modelos de fundição do Azure AI para aprimorar o desempenho dos modelos de raciocínio adaptados para geração e revisão de contratos. Diante do desafio de entregar sugestões altamente contextuais e legalmente sólidas para advogados, Draftwise Tuned Azure Openai Modelos usando dados legais proprietários para melhorar a precisão da resposta e se adaptar aos avisos de usuário diferenciados. Isso levou a uma melhoria de 30% na qualidade dos resultados da pesquisa, permitindo que os advogados elaborassem contratos mais rapidamente e se concentrem no trabalho de consultoria de alto valor.

O ajuste fino de reforço nos modelos de raciocínio é um potencial divisor de águas para nós. Está ajudando nossos modelos a entender a nuance da linguagem authorized e a responder de maneira mais inteligente a instruções complexas de desenho, o que promete tornar nosso produto significativamente mais útil para os advogados em tempo actual.

– James Ding, fundador e CEO da DraftWise.

Quando você deve usar o ajuste fino de reforço?

O ajuste fino de reforço é mais adequado para casos de uso em que a adaptabilidade, o aprendizado iterativo e o comportamento específico do domínio são essenciais. Você deve considerar a RFT se seu cenário envolver:

  1. Implementação de regras personalizadas: A RFT prospera em ambientes em que a lógica de decisão é altamente específica para sua organização e não pode ser facilmente capturada por meio de instruções estáticas ou dados de treinamento tradicionais. Ele permite que os modelos aprendam regras flexíveis e em evolução que refletem a complexidade do mundo actual.
  1. Padrões operacionais específicos de domínio: Supreme para cenários em que os procedimentos internos divergem das normas da indústria – e onde o sucesso depende de aderir a esses padrões sob medida. A RFT pode efetivamente codificar variações processuais, como linhas de tempo estendidas ou limiares de conformidade modificados, no comportamento do modelo.
  1. Alta complexidade de tomada de decisão: A RFT se destaca em domínios com lógica em camadas e árvores de decisão ricas em variáveis. Quando os resultados dependem da navegação de inúmeras subcases ou da pesagem dinamicamente de várias entradas, a RFT ajuda os modelos a generalizarem através da complexidade e a oferecer decisões mais consistentes e precisas.

Exemplo: Aviso de riqueza no Contoso Wellness

Para mostrar o potencial da RFT, considere o Contoso Wellness, uma empresa consultiva de riqueza fictícia. Usando a RFT, o modelo O4-mini aprendeu a se adaptar a regras de negócios exclusivas, como identificar interações ideais de clientes com base em padrões diferenciados, como a proporção do patrimônio líquido de um cliente e os fundos disponíveis. Isso permitiu que o Contoso otimizasse seus processos de integração e tomasse decisões mais informadas mais rapidamente.

Tuneamento fino supervisionado agora disponível para GPT-4.1-Nano

Também estamos trazendo Ajuste fino supervisionado (SFT) para o GPT-4.1-Nano Modelo-Um modelo de fundação pequeno, mas poderoso, otimizado para cargas de trabalho sensíveis a custos de alto rendimento. Com a SFT, você pode incutir seu modelo com tom específico da empresa, terminologia, fluxos de trabalho e saídas estruturadas-todas adaptadas ao seu domínio. Este modelo estará disponível para ajuste fino nos próximos dias.

Por que tune tune gpt-4.1-nano?

  • Precisão em escala: Adapte as respostas do modelo, mantendo a velocidade e a eficiência.
  • Saída de grau corporativo: Garanta o alinhamento com os processos de negócios e o tom de voz.
  • Leve e implantável: Perfeito para cenários em que a latência e o custo são importantes-como bots de atendimento ao cliente, processamento no dispositivo ou análise de documentos de alto quantity.

Comparado a modelos maiores, 4.1-Nano oferece inferência mais rápida e custos de computação mais baixos, tornando-o adequado para cargas de trabalho em larga escala como:

  • Automação de suporte ao cliente, onde os modelos devem lidar com milhares de ingressos por hora com tom e precisão consistentes.
  • Assistentes de conhecimento interno que seguem o estilo e o protocolo da empresa em resumir a documentação ou responder às perguntas frequentes.

Como um modelo pequeno, rápido, mas altamente capaz, o GPT-4.1-Nano também faz um ótimo candidato à destilação. Você pode usar modelos como GPT-4.1 ou O4 para gerar dados de treinamento-ou capturar o tráfego de produção com conclusões armazenadas-E ensine 4.1-nano a ser igualmente inteligente!

Anunciando novos modelos e técnicas de ajuste fino na Azure AI Foundry

Lhama 4 tunzing fino agora disponível

Também estamos empolgados em anunciar o suporte para o Llama 4 Scout da Meta, um modelo de parâmetro ativo de ponta, de 17 bilhões, que oferece uma janela de contexto líder do setor de 10 milhões de tokens enquanto se encaixa em uma única GPU H100 para o inferno. É um modelo de melhor da categoria e mais poderoso do que todos os modelos de llama de geração anterior.

LLAMA 4 Tuneamento fino está disponível em nosso Oferta de computação gerenciadapermitindo que você ajuste e inferência usando sua própria cota de GPU. Disponível na Fundição do Azure AI e, como componentes do Azure Machine Studying, você tem acesso a hiperparâmetros adicionais para uma personalização mais profunda em comparação com nossa experiência sem servidor.

Comece com o Azure AI Foundry hoje

A Azure AI Foundry é sua base para a ajuste da IA ​​de nível corporativo. Esses aprimoramentos de ajuste fino desbloqueiam novas fronteiras na personalização do modelo, ajudando você a criar sistemas inteligentes que pensam e respondem de maneiras que refletem seu DNA de negócios.

  • Usar Reforço fino com o4-mini Para construir motores de raciocínio que aprendam com a experiência e evoluam com o tempo. Em breve, na Azure AI Foundry, com disponibilidade regional para o leste US2 e a Suécia Central.
  • Usar Tuneamento fino supervisionado com 4.1-nano Escalar comportamentos de modelo confiáveis, econômicos e altamente personalizados em toda a sua organização. Disponível agora na Azure AI Foundry, no norte dos EUA e na Suécia Central.
  • Tentar LLAMA 4 Scout Wonderful Tuning Para personalizar o melhor modelo de código aberto da categoria. Disponível agora no Azure AI Foundry Mannequin Catalog e no Azure Machine Studying.

Com o Azure AI Foundry, o ajuste fino não é apenas sobre precisão-é sobre confiança, eficiência e adaptabilidade Em todas as camadas da sua pilha.

Discover mais:

Estamos apenas começando. Fique atento para mais suporte ao modelo, técnicas avançadas de ajuste e ferramentas para ajudá -lo a criar IA mais inteligente, mais segura e exclusivamente sua.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *