Acelere a escala com a oferta Azure OpenAI Service Provisioned


Com as novas melhorias na oferta do Azure OpenAI Service Provisioned, estamos dando um grande passo em direção a tornar a IA acessível e pronta para empresas.

No atual cenário digital em rápida evolução, as empresas precisam de mais do que apenas modelos de IA poderosos: elas precisam de soluções de IA que sejam adaptáveis, confiáveis ​​e escaláveis. Com a disponibilidade futura de Zonas de Dados e novos aprimoramentos na oferta Provisionada em Serviço OpenAI do Azureestamos dando um grande passo em direção a tornar a IA amplamente disponível e também pronta para empresas. Esses recursos representam uma mudança elementary na forma como as organizações podem implantar, gerenciar e otimizar modelos generativos de IA.

Com o lançamento das zonas de dados do serviço Azure OpenAI na União Europeia e nos Estados Unidos, as empresas podem agora dimensionar as suas cargas de trabalho de IA com ainda maior facilidade, mantendo a conformidade com os requisitos regionais de residência de dados. Historicamente, as variações na disponibilidade da região do modelo forçavam os clientes a gerenciar vários recursos, muitas vezes retardando o desenvolvimento e complicando as operações. As zonas de dados do serviço Azure OpenAI podem eliminar esse atrito, oferecendo processamento de dados flexível e multirregional, garantindo ao mesmo tempo que os dados sejam processados ​​e armazenados dentro do limite de dados selecionado.

Esta é uma conquista de conformidade que também permite que as empresas escalem perfeitamente suas operações de IA entre regiões, otimizando o desempenho e a confiabilidade sem ter que navegar pelas complexidades do gerenciamento de tráfego em sistemas distintos.

Leya, uma startup de tecnologia que constrói plataforma genAI para profissionais jurídicos, tem explorado a opção de implantação de zonas de dados.

“A opção de implantação de zonas de dados de serviço Azure OpenAI oferece à Leya uma maneira econômica de dimensionar com segurança aplicações de IA para milhares de advogados, garantindo conformidade e desempenho superior. Ajuda-nos a obter melhor qualidade e controlo do cliente, com acesso rápido às mais recentes inovações do Azure OpenAI.—Sigge Labor, CTO, Leya

As zonas de dados estarão disponíveis para ofertas padrão (PayGo) e provisionadas, a partir desta semana, em 1º de novembro de 2024.

interface gráfica do usuário, texto, aplicativo, bate-papo ou mensagem de texto

Desempenho líder da indústria

As empresas dependem da previsibilidade, especialmente ao implementar aplicações de missão crítica. É por isso que estamos introduzindo um acordo de nível de serviço com latência de 99% para geração de tokens. Este SLA de latência garante que os tokens sejam gerados em velocidades mais rápidas e consistentes, especialmente em grandes volumes

A oferta Provisionada oferece desempenho previsível para seu aplicativo. Quer você atue no comércio eletrônico, na saúde ou em serviços financeiros, a capacidade de depender de uma infraestrutura de IA de baixa latência e alta confiabilidade se traduz diretamente em melhores experiências do cliente e operações mais eficientes.

Reduzindo o custo de começar

Para facilitar o teste, o dimensionamento e o gerenciamento, estamos reduzindo o preço por hora para implantações globais provisionadas e de zona de dados provisionada a partir de 1º de novembro de 2024. Essa redução no custo garante que nossos clientes possam se beneficiar desses novos recursos sem o fardo de altos custos. despesas. A oferta provisionada continua oferecendo descontos para compromissos mensais e anuais.

Opção de implantaçãoPTU por horaReserva de um mês por PTUReserva de um ano por PTU
World provisionadoAtual: US$ 2,00 por hora
1º de novembro de 2024: US$ 1,00 por hora
$ 260 por mês$ 221 por mês
Zona de dados provisionadaNovo 1º de novembro de 2024: US$ 1,10 por hora$ 260 por mês$ 221 por mês

Também estamos reduzindo os pontos de entrada mínimos de implantação para implantação international provisionada em 70% e aumentando os incrementos em até 90%, reduzindo a barreira para as empresas começarem a usar a oferta provisionada mais cedo em seu ciclo de vida de desenvolvimento.

Quantidade mínima de implantação e incrementos para oferta provisionada

ModeloWorldZona de dados NovoRegional
GPT-4oMínimo: 50 15
Incremento 50 5
Mínimo: 15
Incremento 5
Mínimo: 50
Incremento 50
GPT-4o-miniMínimo: 25 15
Incremento: 25 5
Mínimo: 15
Incremento 5
Mínimo: 25
Incremento: 25

Para desenvolvedores e equipes de TI, isso significa tempo de implantação mais rápido e menos atrito na transição da oferta padrão para a oferta provisionada. À medida que as empresas crescem, estas transições simples tornam-se vitais para manter a agilidade e, ao mesmo tempo, dimensionar as aplicações de IA a nível international.

Eficiência por meio do cache: uma virada de jogo para aplicativos de alto quantity

Outro novo recurso é o Immediate Caching, que oferece inferência mais barata e rápida para solicitações repetitivas de API. Os tokens armazenados em cache têm 50% de desconto para o Padrão. Para aplicativos que enviam frequentemente os mesmos prompts e instruções do sistema, essa melhoria oferece uma vantagem significativa em termos de custo e desempenho.

Ao armazenar prompts em cache, as organizações podem maximizar seu rendimento sem precisar reprocessar solicitações idênticas repetidamente, ao mesmo tempo em que reduzem custos. Isto é particularmente benéfico para ambientes de tráfego intenso, onde mesmo pequenos aumentos de desempenho podem se traduzir em ganhos comerciais tangíveis.

Uma nova period de flexibilidade e desempenho de modelos

Um dos principais benefícios da oferta Provisionada é que ela é flexível, com um preço simples por hora, mês e ano que se aplica a todos os modelos disponíveis. Também ouvimos seus comentários de que é difícil entender quantos tokens por minuto (TPM) você obtém para cada modelo em implantações provisionadas. Agora fornecemos uma visão simplificada do número de tokens de entrada e saída por minuto para cada implantação provisionada. Os clientes não precisam mais depender de tabelas de conversão ou calculadoras detalhadas.

Mantemos a flexibilidade que os clientes adoram com a oferta Provisionada. Com compromissos mensais e anuais você ainda pode alterar o modelo e a versão – como GPT-4o e GPT-4o-mini – dentro do período de reserva sem perder nenhum desconto. Essa agilidade permite que as empresas experimentem, iterem e evoluam suas implantações de IA sem incorrer em custos desnecessários ou precisar reestruturar sua infraestrutura.

Preparação empresarial em ação

As inovações contínuas do Azure OpenAI não são apenas teóricas; eles já estão entregando resultados em vários setores. Por exemplo, empresas como AT&T, Bloco de RH, Mercedese mais estão usando Serviço OpenAI do Azure não apenas como uma ferramenta, mas como um ativo transformacional que remodela a forma como operam e se relacionam com os clientes.

Além dos modelos: a promessa de nível empresarial

Está claro que o futuro da IA ​​envolve muito mais do que apenas oferecer os modelos mais recentes. Embora modelos poderosos como GPT-4o e GPT-4o-mini forneçam a base, é a infraestrutura de suporte — como oferta provisionada, opção de implantação de zonas de dados, SLAs, cache e fluxos de implantação simplificados — que realmente tornam o Azure OpenAI Service pronto para empresas .

A visão da Microsoft é fornecer não apenas modelos de IA de ponta, mas também ferramentas e suporte de nível empresarial que permitam às empresas dimensionar esses modelos com confiança, segurança e economia. Desde permitir implantações de baixa latência e alta confiabilidade até oferecer infraestrutura flexível e simplificada, o Azure OpenAI Service capacita as empresas a abraçar totalmente o futuro da inovação orientada por IA.

Comece hoje

À medida que o cenário da IA ​​continua a evoluir, a necessidade de soluções de IA escaláveis, flexíveis e confiáveis ​​torna-se ainda mais crítica para o sucesso empresarial. Com os mais recentes aprimoramentos do Azure OpenAI Service, a Microsoft está cumprindo essa promessa, oferecendo aos clientes não apenas acesso a modelos de IA de classe mundial, mas também as ferramentas e a infraestrutura para operacionalizá-los em escala.

Agora é a hora de as empresas desbloquearem todo o potencial da IA ​​generativa com o Azure, indo além da experimentação para aplicações de nível empresarial do mundo actual que geram resultados mensuráveis. Quer esteja a dimensionar um assistente digital, a desenvolver aplicações de voz em tempo actual ou a transformar o atendimento ao cliente com IA, o Azure OpenAI Service fornece a plataforma empresarial de que necessita para inovar e crescer.



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *