Eleve suas implantações de IA de forma mais eficiente com novas soluções de implantação e gerenciamento de custos para o Azure OpenAI Service, incluindo provisionamento de autoatendimento


Estamos felizes em anunciar atualizações significativas para o Azure OpenAI Service, projetado para ajudar nossos mais de 60.000 clientes a gerenciar implantações de IA de forma mais eficiente e econômica além dos preços atuais. Com a introdução de implantações Provisionadas de autoatendimento, pretendemos ajudar a tornar seus processos de cota e implantação mais ágeis, mais rápidos para o mercado e mais econômicos.

Estamos felizes em anunciar atualizações significativas para Serviço OpenAI do Azureprojetado para ajudar nossos mais de 60.000 clientes a gerenciar implantações de IA de forma mais eficiente e econômica além dos preços atuais. Com a introdução de implantações Provisionadas de autoatendimento, pretendemos ajudar a tornar seus processos de cota e implantação mais ágeis, mais rápidos para o mercado e mais econômicos. A proposta de valor técnico permanece inalterada — as implantações Provisionadas continuam a ser a melhor opção para aplicativos sensíveis à latência e de alto rendimento. O anúncio de hoje inclui provisionamento de autoatendimento, visibilidade da capacidade e disponibilidade do serviço e a introdução de preços e reservas por hora Provisionadas (PTU) para ajudar no gerenciamento de custos e economia.

Passo a passo das soluções de implantação e gerenciamento de custos do Azure OpenAI Service

O que há de novo?

Provisionamento de autoatendimento e solicitações de cota independentes de modelo

Estamos introduzindo o provisionamento de autoatendimento junto com tokens padrão, permitindo que você solicite Provisioned Throughput Items (PTUs) de forma mais flexível e eficiente. Esse novo recurso permite que você gerencie suas implantações quata do Azure OpenAI Service de forma independente, sem depender do suporte da sua equipe de conta. Ao desacoplar solicitações de cota de modelos específicos, agora você pode alocar recursos com base em suas necessidades imediatas e ajustar conforme seus requisitos evoluem. Essa alteração simplifica o processo e acelera sua capacidade de implantar e dimensionar seus aplicativos.

diagrama

Visibilidade da capacidade e disponibilidade do serviço

Obtenha melhor visibilidade da capacidade e disponibilidade do serviço, ajudando você a tomar decisões informadas sobre suas implantações. Com esse novo recurso, você pode acessar informações em tempo actual sobre a capacidade do serviço em diferentes regiões, garantindo que você possa planejar e gerenciar suas implantações de forma mais eficaz. Essa transparência permite que você evite potenciais problemas de capacidade e otimize a distribuição de suas cargas de trabalho entre os recursos disponíveis, levando a melhor desempenho e confiabilidade para seus aplicativos.

Preços e reservas por hora provisionados

Estamos felizes em apresentar duas novas opções de compra de autoatendimento para PTUs:

  1. Compras sem compromisso por hora
    • Agora você pode criar uma implantação Provisionada por apenas uma hora, com uma taxa horária fixa de US$ 2 por unidade por hora. Esse preço independente de modelo facilita a implantação e a desmontagem de implantações conforme necessário, oferecendo flexibilidade máxima. Isso é preferrred para testar cenários ou períodos de transição sem nenhum compromisso de longo prazo.
  1. Reservas mensais e anuais do Azure para implantações provisionadas
    • Para ambientes de produção com volumes de solicitação estáveis, as Reservas Provisionadas do Azure OpenAI Service oferecem economias de custo significativas. Ao se comprometer com uma reserva mensal ou anual, você pode economizar até 82% ou 85%, respectivamente, sobre taxas horárias. As reservas agora são dissociadas de modelos e implantações específicas, fornecendo flexibilidade inigualável. Essa abordagem permite que as empresas otimizem custos, mantendo a capacidade de alternar modelos e ajustar implantações conforme necessário. Leia nosso weblog técnico sobre reservas aqui.

Benefícios para os tomadores de decisão

Essas atualizações foram projetadas para fornecer flexibilidade, eficiência de custos e facilidade de uso, tornando mais simples para os tomadores de decisão gerenciarem as implantações de IA.

  • Flexibilidade: Com provisionamento de autoatendimento e preços por hora, você pode aumentar ou diminuir suas implantações com base nas necessidades imediatas, sem compromissos de longo prazo.
  • Eficiência de custos: As Reservas do Azure oferecem economias substanciais para uso a longo prazo, permitindo melhor planejamento de orçamento e gerenciamento de custos.
  • Facilidade de uso: Visibilidade aprimorada e processos de provisionamento simplificados reduzem os encargos administrativos, permitindo que sua equipe se concentre em iniciativas estratégicas em vez de detalhes operacionais.

Histórias de sucesso de clientes

Antes de disponibilizarmos o autoatendimento, clientes selecionados começaram a obter benefícios dessas opções.

  • Soluções Visier: Ao alavancar Provisioned Throughput Items (PTUs) com o Azure OpenAI Service, a Visier Options aprimorou significativamente sua ferramenta de análise de pessoas com tecnologia de IA, Vee. Com PTUs, a Visier garante tempos de resposta rápidos e consistentes, cruciais para lidar com o alto quantity de consultas de sua extensa base de clientes. Essa poderosa sinergia entre as soluções inovadoras da Visier e a infraestrutura robusta do Azure não apenas aumenta a satisfação do cliente ao fornecer insights rápidos e precisos, mas também ressalta o compromisso da Visier em usar tecnologia de ponta para impulsionar mudanças transformacionais na análise da força de trabalho. Leia o estudo de caso da Microsoft.
  • Uma empresa de análise e insights: Mudou de implantações padrão para GPT-4 Turbo PTUs e experimentou uma redução significativa nos tempos de resposta, de 10 a 20 segundos para apenas 2 a 3 segundos.
  • Uma empresa de serviços de chatbot: Relatou estabilidade aprimorada e menor latência com PTUs do Azure, melhorando o desempenho de seus serviços.
  • Uma empresa de entretenimento visible:Observou-se uma melhora drástica na latência, de 12–13 segundos para 2–3 segundos, aumentando o envolvimento do usuário.

Capacitando todos os clientes a criar com o Azure OpenAI Service

Essas novas atualizações não alteram a excelência técnica das implantações Provisionadas, que continuam a fornecer latência baixa e previsível. Em vez disso, elas introduzem um modelo de aquisição mais flexível e econômico, tornando o Azure OpenAI Service mais acessível do que nunca. Com unidades Provisionadas de autoatendimento, independentes de modelo e opções de preços por hora e reservadas, as barreiras de entrada foram drasticamente reduzidas.

Para saber mais sobre como melhorar a confiabilidade, a segurança e o desempenho dos seus investimentos em nuvem e IA, discover os recursos adicionais abaixo.


Recursos adicionais



Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *