Modelo de fonte aberta do OpenAI: GPT -ROSS ON Azure AI Foundry e Home windows AI Foundry


Com o lançamento dos modelos GPT-ROS da OpenAI-seu primeiro lançamento em peso aberto desde o GPT-2-estamos dando aos desenvolvedores e empresas capacidade sem precedentes de executar, adaptar e implantar modelos Openai inteiramente em seus próprios termos. Pela primeira vez, você pode executar modelos OpenAI como GPT -OSS – 120B em uma única GPU corporativa – ou executar o GPT -ROSS -20B localmente.

A IA não é mais uma camada na pilha – está se tornando a pilha. Esta nova period exige ferramentas abertas, adaptáveis e prontas para executar onde quer que suas idéias vivam – da nuvem a ponta, da primeira experiência à implantação em escala. Na Microsoft, estamos construindo um aplicativo de AI e uma fábrica de agentes de pilha completa que capacita todos os desenvolvedores não apenas para usar a IA, mas para criar com ele.

Essa é a visão por trás da nossa plataforma de IA que abrange a nuvem a ponta. Azure AI Foundry fornece uma plataforma unificada para construir, ajustar e implantar agentes inteligentes com confiança enquanto Fundição native traz modelos de código aberto para a borda-complicando a inferência flexível e no dispositivo em bilhões de dispositivos. Home windows AI Foundry Construa nessa base, integrando a fundição native ao Home windows 11 para suportar um ciclo de vida de desenvolvimento native seguro e de baixa latência, profundamente alinhado com a plataforma Home windows.

Com o lançamento de Os modelos GPT -OSS da Openai-A primeira liberação de peso aberto desde o GPT-2-estamos dando aos desenvolvedores e empresas capacidade sem precedentes de executar, adaptar e implantar modelos OpenAi inteiramente em seus próprios termos.

Pela primeira vez, você pode executar modelos OpenAI como GPT -OSS – 120B em uma única GPU corporativa – ou correr GPT -OSS-20b localmente. É notável que essas réplicas não sejam despojadas-elas são rápidas, capazes e projetadas com a implantação do mundo actual em mente: raciocínio em escala na nuvem ou tarefas agênticas na borda.

E como eles são de peso aberto, esses modelos também são fáceis de ajustar, destilar e otimizar. Esteja você se adaptando a um copiloto específico do domínio, compactando a inferência offline ou prototipando localmente antes de dimensionar na produção, Azure AI Foundry e Fundição native Dê a você a ferramenta para fazer tudo – segura, eficientemente e sem compromisso.

Modelos abertos, momento actual

Os modelos abertos passaram das margens para o mainstream. Hoje, eles estão alimentando tudo, desde agentes autônomos a copilotes específicos de domínio-e redefinindo como a IA é construída e implantada. E com a Azure AI Foundry, estamos dando a você a infraestrutura de se mover com esse momento:

  • Com as equipes de pesos abertos, podem ajustar os métodos eficientes em parâmetro (Lora, Qlora, PEFT), emenda em dados proprietários e enviar novos pontos de verificação em horas-sem semanas.
  • Você pode destilar ou quantizar modelos, aparar o comprimento do contexto ou aplicar a esparsidade estruturada para atingir envelopes rígidos de memória para GPUs de borda e até laptops de ponta.
  • O acesso complete ao peso também significa que você pode inspecionar padrões de atenção para auditorias de segurança, injetar adaptadores de domínio, treinar camadas específicas ou exportar para Onnx/Triton para inferência de contêiner no Azure Kubernetes Service (AKS) ou Foundry Native.

Em resumo, os modelos abertos não são apenas substituições de paridade-elas são substratos programáveis. E o Azure AI Foundry fornece oleodutos de treinamento, controle de peso e backplane de servir de baixa latência para que você possa explorar cada uma dessas alavancas e empurrar o envelope da personalização da IA.

Conheça o GPT -OSS: dois modelos, possibilidades infinitas

Hoje, GPT-OSS-120B e GPT-OSS-20B estão disponíveis no Azure AI Foundry. O GPT-OSS-20B também está disponível no Home windows AI Foundry e estará em breve no MacOS by way of Foundry Native. Se você está otimizando para soberania, desempenho ou portabilidadeesses modelos desbloqueiam um novo nível de controle.

  • GPT -OSS-120b é uma potência de raciocínio. Com 120 bilhões de parâmetros e esparsidade arquitetônica, oferece desempenho de nível de O4-mini em uma fração do tamanho, destacando-se em tarefas complexas como matemática, código e perguntas e respostas específicas de domínio-mas é eficiente o suficiente para executar em uma única GPU da classe de datacenter. Preferrred para implantações seguras e de alto desempenho, onde a latência ou o custo são importantes.
  • GPT -OSS-20b é experiente em ferramentas e leve. Otimizado para tarefas agênticas como execução de código e uso de ferramentas, ele é executado com eficiência em uma variedade de {hardware} do Home windows, incluindo GPUs discretos com 16GB+ VRAM, com suporte para mais dispositivos em breve. É perfeito para construir assistentes autônomos ou incorporar a IA em fluxos de trabalho do mundo actual, mesmo em ambientes com limpeza de largura de banda.
Uma captura de tela de um gráfico

Ambos os modelos em breve serão compatíveis com a API de respostas agora onipresentes. Isso significa que você pode trocá -los em aplicativos existentes com mudanças mínimas – e flexibilidade máxima.

Trazendo GPTs para a nuvem e borda

A Azure AI Foundry é mais do que um catálogo modelo – é uma plataforma para construtores de IA. Com mais de 11.000 modelos e crescimento, ele oferece aos desenvolvedores um espaço unificado para avaliar, ajustar e produzir modelos com confiabilidade e segurança de graus corporativos.

Hoje, com o GPT -OSS no catálogo, você pode:

  • Spin Up Up Inference terminals usando GPT -ROS na nuvem com apenas alguns comandos da CLI.
  • Tune e destilar os modelos usando seus próprios dados e implante com confiança.
  • Misture modelos abertos e proprietários para atender às necessidades específicas da tarefa.

Para organizações que desenvolvem cenários apenas possíveis em dispositivos clientes,Fundição nativetraz modelos proeminentes de código abertoHome windows AI Foundry .

Esteja você trabalhando em uma configuração offline, construindo em uma rede segura ou em execução no limite-a Foundry Native and Home windows AI do Home windows permite que você fique totalmente opcional na nuvem. Com a capacidade de implantar o GPT-OSS-20B nos PCs Home windows modernos de alto desempenho, seus dados permanecem onde você deseja-e o poder dos modelos de classe fronteira chega até você.

Isso é IA híbrida em ação: a capacidade de misturar e combinar modelos, otimizar o desempenho e o custo e atender aos seus dados onde ele mora.

Capacitando construtores e tomadores de decisão

A disponibilidade do GPT -OSS no Azure e no Home windows desbloqueia novas possibilidades poderosas para construtores e líderes empresariais.

Para desenvolvedores, pesos abertos significam complete transparência. Inspecione o modelo, personalize, ajuste e implante seus próprios termos. Com o GPT -OSS, você pode construir com confiança, entendendo exatamente como seu modelo funciona e como melhorá -lo para o seu caso de uso.

Para os tomadores de decisão, trata -se de controle e flexibilidade. Com o GPT-OSS, você obtém desempenho competitivo-sem caixas pretas, menos compensações e mais opções na implantação, conformidade e custo.

Uma visão para o futuro: IA aberta e responsável, juntos

O lançamento do GPT -OSS e sua integração no Azure e no Home windows fazem parte de uma história maior. Prevemos um futuro em que a IA é onipresente – e estamos comprometidos em ser uma plataforma aberta para trazer essas tecnologias inovadoras para nossos clientes, em todos os nossos information facilities e dispositivos.

Ao oferecer o GPT -OSS através de uma variedade de pontos de entrada, estamos dobrando nosso compromisso de democratizar a IA. Reconhecemos que nossos clientes se beneficiarão de um portfólio diversificado de modelos – Proprietário e aberto – e estamos aqui para apoiar o que o caminho desbloquear para você. Esteja você trabalhando com modelos de código aberto ou proprietários, as ferramentas de segurança e segurança integradas da Foundry garantem governança, conformidade e confiança consistentes-para que os clientes possam inovar com confiança em todos os tipos de modelos.

Finalmente, nosso apoio ao GPT-OSS é apenas o mais recente em nosso compromisso de abrir ferramentas e padrões. Em junho, anunciamos que a extensão do bate -papo do GitHub Copilot é agora código aberto no github Sob a licença do MIT – o primeiro passo para dar Vs Código Um editor de AI de código aberto. Procuramos acelerar a inovação com a comunidade de código aberto e gerar maior valor às nossas ferramentas de desenvolvedor líder de mercado. É assim que se parece quando pesquisas, produtos e plataformas se reúnem. As próprias avanços que ativamos com nossa nuvem no OpenAI agora são ferramentas abertas nas quais qualquer um pode construir – e o Azure é a ponte que as dá vida.

Próximas etapas e recursos para navegar

  • Implante o GPT -OSS na nuvem hojecom alguns comandos da CLI usando o Azure AI Foundry. Navegue pelo Catálogo do modelo Azure AI Para aumentar um terminal.
  • Implante GPT-OSS-20B no seu dispositivo Home windows hoje (e em breve no macOS) by way of Foundry Native. Siga o Guia do Quickstart para saber mais.
  • Preço1 Para esses modelos, é o seguinte:
Uma captura de tela de um computador

*Ver Página de preços de computação gerenciada aqui.


1O preço é preciso em agosto de 2025.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *