Vibe Loop: Engenharia de confiabilidade nativa de AI para o mundo actual


Vibe Loop: Engenharia de confiabilidade nativa de AI para o mundo actualVibe Loop: Engenharia de confiabilidade nativa de AI para o mundo actual

Estive de plantão durante interrupções que arruinaram os fins de semana, sentou-se nos post-mortems que pareciam terapia e vi casos em que uma única linha de madeira teria economizado seis horas de depuração. Essas experiências não são casos de borda; Eles são a norma nos sistemas de produção modernos.

Percorremos um longo caminho desde o Google Engenharia de confiabilidade do native Reserve o tempo de atividade reformulado como uma disciplina de engenharia. Orçamentos de erros, observabilidade e automação tornaram a construção e a execução do software program muito mais sã.

Mas aqui está a verdade desconfortável: A maioria dos sistemas de produção ainda é fundamentalmente reativa. Detectamos depois do fato. Nós respondemos muito lentamente. Espalhamos o contexto entre ferramentas e pessoas.

Estamos atrasados ​​para um turno.

Os sistemas de produção devem:

  • Diga -nos quando algo está errado
  • Explique isso
  • Aprenda com isso
  • E nos ajude conserte.

A próxima period da engenharia de confiabilidade é o que eu chamo “Vibe Loop.” É um ciclo de suggestions rígido e rígido, observando-o na produção, aprendendo com ele e melhorando-o rapidamente.

Os desenvolvedores já estão “codificantes de vibração” ou recrutando um copiloto para ajudar a moldar o código colaborativamente. “Vibe Ops” estende o mesmo conceito ao DevOps.

Vibe Loop também estende o mesmo conceito à engenharia de confiabilidade da produção para fechar o loop de incidentes para insights e melhorias sem a necessidade de cinco painéis.

Não é uma ferramenta, mas um novo modelo para trabalhar com sistemas de produção, um onde:

  • A instrumentação é gerada com código
  • A observabilidade melhora à medida que os incidentes acontecem
  • Os pontos cegos são surgidos e resolvidos automaticamente
  • A telemetria se torna adaptativa, com foco no sinal, não no ruído
  • Publish -mortems não são artefatos, mas entradas para sistemas de aprendizagem

Etapa 1: Promova sua ferramenta de código de código AI para instrumentar

Com ferramentas como Cursor e Copilot, o código não precisa nascer cego. Você pode – e deve – solicitar seu copiloto a instrumentar enquanto você constrói. Por exemplo:

  • “Escreva este manipulador e inclua a abertura do OpenElemetria para cada etapa principal.”
  • “Rastreia as tentativas e os códigos de standing da API externa.”
  • “Os contadores emitis para hits de cache e fallbacks de banco de dados”.

O objetivo é a observabilidade por falta.

Opentelemetria torna isso possível. É o padrão de fato para instrumentação estruturada e agnóstica do fornecedor. Se você não estiver usando, comece agora. Você deseja alimentar seus futuros loops de depuração com dados ricos e padronizados.

Etapa 2: adicione a camada de contexto do modelo

A telemetria bruta não é suficiente. As ferramentas de IA precisam contexto, não apenas dados. É aí que o Modelo Protocolo de Contexto (MCP) vem. É um padrão proposto para compartilhar informações nos modelos de IA para melhorar o desempenho e a consistência em diferentes aplicativos.

Pense no MCP como a cola entre seu código, infraestrutura e observabilidade. Use -o para responder a perguntas como:

  • Quais serviços existem?
  • O que mudou recentemente?
  • Quem é o que o quê?
  • O que está alertando?
  • O que falhou antes e como foi corrigido?

O servidor MCP apresenta isso de maneira estruturada e consultável.

Quando algo quebra, você pode perguntar:

  • “Por que a latência do checkout é?”
  • “Esse padrão de falha já aconteceu antes?”
  • “O que aprendemos com o incidente 112?”

Você receberá mais do que apenas gráficos; Você receberá um raciocínio envolvendo incidentes passados, vãos correlacionados e diferenciais recentes de implantação. É o tipo de contexto que seus melhores engenheiros traria, mas instantaneamente disponíveis.

Espera -se que a maioria dos sistemas em breve ofereça suporte ao MCP, tornando -o semelhante a uma API. Seu agente de IA pode usá -lo para reunir contexto em várias ferramentas e raciocínio sobre o que eles aprendem.

Etapa 3: feche o loop de suggestions de observabilidade

Aqui é onde o Vibe Loop fica poderoso: a IA não apenas ajuda a entender a produção; Ajuda você a evoluir.

Pode alertá -lo sobre pontos cegos e oferecer ações corretivas:

  • “Você está pegando e repetindo 502s aqui, mas não registrando a resposta.”
  • “Esse período está faltando atributos -chave. Deseja anotá -lo?”
  • “Este caminho de erro nunca foi rastreado – quer que eu adicione instrumentação?”

Ajuda você a aparar a gordura:

  • “Esta linha de toras foi emitida 5m vezes este mês, nunca consultou. Largue?”
  • “Esses traços são amostrados, mas não utilizados. Reduza a cardinalidade?”
  • “Esses alertas disparam com frequência, mas nunca são acionáveis. Quer suprimir?”

Você não está mais perseguindo todos os vestígios; Você está curadoria de telemetria com intenção.

A observabilidade não é mais reacionária, mas adaptativa.

Do incidente ao perception e mudança de código

O que torna o vibe loop diferente dos fluxos de trabalho tradicionais da SRE é velocidade e continuidade. Você não é apenas combate a incêndios e depois escrevendo um documento. Você está apertando o loop:

  1. Um incidente acontece
  2. A IA investiga, correlaciona e superfície as possíveis causas de raiz
  3. Ele lembra eventos semelhantes passados ​​e suas resoluções
  4. Propõe alterações de instrumentação ou mitigação
  5. Ajuda você a implementar essas alterações no código imediatamente

O sistema realmente ajuda a investigar incidentes e escrever um código melhor após cada falha.

Como isso parece dia-a-dia

Se você é um desenvolvedor, eis como isso pode ser:

  • Você solicita a IA a escrever um serviço e um instrumento.
  • Uma semana depois, um aumento na latência atinge a produção.
  • Você solicitou: “Por que a latência do 95º percentil saltou na UE após as 10h”?
  • Ai responde: “Implante às 09:45, adicionou um loop de tentativa. O serviço a jusante B é limitado de taxas.”
  • Você concorda com a hipótese e age.
  • AI sugere que você feche o loop: “Quer registrar cabeçalhos e reduzir as tentativas?”
  • Você diz que sim. Ele gera a solicitação de tração.
  • Você mescla, implanta e resolve.

Sem ingresso Jira. Sem transferência. Sem esquecimento.

Isso é vibração.

Pensamento last: a confiabilidade do website nos ensinou o que buscar. Vibe Loop chega lá.

O Vibe Loop não é um único agente de IA, mas uma rede de agentes que realizam tarefas específicas e repetíveis. Eles sugerem hipóteses com maior precisão ao longo do tempo. Eles não substituem os engenheiros, mas capacitarão o engenheiro médio a operar em um nível de especialista.

Não é perfeito, mas, pela primeira vez, nossas ferramentas estão alcançando a complexidade dos sistemas que executamos.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *