Estamos anunciando a versão prévia pública do Fireworks AI no Microsoft Foundry, trazendo inferência de modelo aberto de alto desempenho para o Azure. Esta integração reflete a direção mais ampla do Microsoft Foundry: fornecer um native único onde os desenvolvedores possam não apenas executar modelos abertos com eficiência, mas também personalizá-los e operacionalizá-los como parte de um ciclo de vida completo de IA pronto para empresas.
Em todos os setores, as organizações estão cada vez mais padronizando modelos abertos para obter maior controle sobre desempenho, custo, personalização e segurança e conformidade necessárias para implantação empresarial. Os modelos abertos oferecem às equipes a flexibilidade de escolher a arquitetura certa para cada carga de trabalho e evitar a dependência de um único fornecedor de modelo à medida que suas necessidades evoluem.
À medida que a adoção cresce, porém, o desempenho por si só não é mais suficiente. As equipes precisam de uma maneira consistente de avaliar modelos rapidamente, operá-los com segurança na produção e aprimorá-los ao longo do tempo, sem reconstruir a infraestrutura ou fragmentar suas ferramentas. Muitas vezes, as organizações são forçadas a montar pilhas de serviços sob medida, retardando a inovação e dificultando a escalabilidade e o progresso.
O Microsoft Foundry foi projetado para enfrentar esse desafio. Ele serve como um sistema unificado de registro e plano de controle empresarial para IA, reunindo modelos, agentes, avaliação, implantação e governança em uma única experiência. Com o Microsoft Foundry, as equipes podem passar da experimentação à produção com confiança, usando os modelos e estruturas que melhor atendem aos seus requisitos, ao mesmo tempo em que contam com uma base operacional consistente.
Hoje, estamos anunciando a prévia pública do Fireworks AI no Fundição Microsofttrazendo inferência de modelo aberto de alto desempenho para o Azure. Esta integração reflete a direção mais ampla do Microsoft Foundry: fornecer um native único onde os desenvolvedores possam não apenas executar modelos abertos com eficiência, mas também personalizá-los e operacionalizá-los como parte de um ciclo de vida completo de IA pronto para empresas.
Modelos de IA do Fireworks no Microsoft Foundry: um lugar único para modelos abertos
O Fireworks AI oferece inferência líder do setor para modelos abertos, e o Microsoft Foundry é o que torna esse desempenho utilizável em escala empresarial. Acessar a IA do Fireworks por meio do Microsoft Foundry oferece às equipes um plano de controle único e confiável para avaliar, implantar, personalizar e operar modelos abertos juntamente com o restante de sua pilha de IA.
À medida que os modelos abertos amadurecem, a personalização vai cada vez mais além do treinamento. As equipes precisam de maneiras consistentes de configurar, implantar, otimizar, governar e iterar modelos em produção sem fragmentar ferramentas ou infraestrutura. O Microsoft Foundry fornece o ambiente onde esses fluxos de trabalho operacionais e de personalização são padronizados, enquanto o Fireworks AI fornece o desempenho e a eficiência necessários para executar modelos abertos em escala. Isso significa que as equipes podem passar da experimentação à produção usando modelos abertos sem unir ferramentas, contratos e caminhos de implantação separados.
Juntos, o Fireworks AI e o Microsoft Foundry permitem uma abordagem mais completa e sustentável para trabalhar com modelos abertos, combinando inferência rápida e eficiente com uma plataforma projetada para dar suporte a operações empresariais de modelos abertos ao longo do tempo.
Com o Fireworks AI no Foundry, os desenvolvedores podem obtenha acesso à melhor inferência para modelos abertosincluindo implantações otimizadas para modelos de peso personalizados. O Fireworks AI é líder de mercado em inferência de alto desempenho para modelos abertos. Seu mecanismo já funciona em escala de Web, processando mais de 13T tokens diariamente, sustentando cerca de 180 mil solicitações por segundo e gerando mais de 1.000 tokens por segundo em modelos grandes, comprovado pelo desempenho líder de benchmark em Análise Synthetic. Esta efficiency já está disponível no Foundry.
Os desenvolvedores podem fazer login no Foundry e acessar estes modelos abertos com o Fireworks AI hoje mesmo:
- DeepSeek V3.2
- OpenAI gpt-oss-120b
- Kimi K2.5
- MiniMax M2.5 (novo)
Isso traz um novo modelo aberto (MiniMax M2.5) para o Foundry com suporte sem servidor e oferece inferência otimizada para modelos abertos já populares.

Com o Fireworks AI no Microsoft Foundry, os desenvolvedores podem:
- Avalie modelos mais rapidamente com acesso e suporte do dia zero: Comece a construir imediatamente com acesso a modelos abertos de última geração do Fireworks AI por meio de um único endpoint do Azure by way of Foundry.
- Otimizar inferência: As solicitações para abrir modelos são atendidas pela pilha de inferência de alto rendimento do Fireworks para desempenho rápido com governança de nível Azure.
- Execute os modelos em que você já confia: Com traga seus próprios pesos (BYOW), você pode carregar e registrar pesos quantizados ou ajustados treinados em outro lugar sem alterar a pilha de porções.

- Escolha o modelo de preços certo para sua carga de trabalho: Use inferência sem servidor e pagamento por token para experimentar com segurança e rapidez Padrão de zona de dados ou escolha unidades de rendimento provisionadas (PTUs) para desempenho previsível e estável com modelos básicos ou personalizados. Quer esteja otimizando para agilidade ou eficiência, você obtém flexibilidade sem gerenciar a infraestrutura.
- Opere com confiança e escala corporativa: Temos o compromisso de permitir que os clientes criem rapidamente aplicativos de IA prontos para produção, mantendo os mais altos níveis de segurança e proteção. O Foundry fornece um espaço de trabalho completo para desenvolvimento, avaliação e implantação de agentes, incluindo governança unificada, observabilidade e ferramentas prontas para agentes.
O futuro dos casos de uso do Fireworks e da IA
O Microsoft Foundry está evoluindo para dar suporte a todo o ciclo de vida dos modelos abertos, desde a avaliação inicial até a operação de produção e otimização contínua. À medida que as equipes ampliam o uso de modelos abertos, ter uma base consistente e pronta para a empresa torna-se cada vez mais importante.
Ao integrar o Fireworks AI ao Microsoft Foundry, os desenvolvedores obtêm acesso a inferências de alto desempenho hoje, ao mesmo tempo em que desenvolvem uma plataforma projetada para suportar personalização mais profunda e operações empresariais ao longo do tempo. Esta abordagem dá às equipas a confiança necessária para adotarem modelos abertos não apenas para o que podem fazer agora, mas também para como podem crescer, adaptar-se e operar de forma fiável à medida que as suas ambições de IA se expandem. Estamos ansiosos para ver como os desenvolvedores e as empresas usam a IA do Fireworks no Microsoft Foundry para potencializar a próxima geração de aplicativos inteligentes.
Para começar:
- Vá para Fundição Microsoft modelos e selecione modelos abertos do Fireworks AI na coleção do catálogo de modelos.
- Selecione o modelo aberto hospedado pelo Fireworks.
- Veja o cartão do modelo.
- Selecione sua opção de implantação (sem servidor ou PTU) e implante.
Saiba mais sobre o Fireworks no Microsoft Foundry