

Estive de plantão durante interrupções que arruinaram os fins de semana, sentou-se nos post-mortems que pareciam terapia e vi casos em que uma única linha de madeira teria economizado seis horas de depuração. Essas experiências não são casos de borda; Eles são a norma nos sistemas de produção modernos.
Percorremos um longo caminho desde o Google Engenharia de confiabilidade do native Reserve o tempo de atividade reformulado como uma disciplina de engenharia. Orçamentos de erros, observabilidade e automação tornaram a construção e a execução do software program muito mais sã.
Mas aqui está a verdade desconfortável: A maioria dos sistemas de produção ainda é fundamentalmente reativa. Detectamos depois do fato. Nós respondemos muito lentamente. Espalhamos o contexto entre ferramentas e pessoas.
Estamos atrasados para um turno.
Os sistemas de produção devem:
- Diga -nos quando algo está errado
- Explique isso
- Aprenda com isso
- E nos ajude conserte.
A próxima period da engenharia de confiabilidade é o que eu chamo “Vibe Loop.” É um ciclo de suggestions rígido e rígido, observando-o na produção, aprendendo com ele e melhorando-o rapidamente.
Os desenvolvedores já estão “codificantes de vibração” ou recrutando um copiloto para ajudar a moldar o código colaborativamente. “Vibe Ops” estende o mesmo conceito ao DevOps.
Vibe Loop também estende o mesmo conceito à engenharia de confiabilidade da produção para fechar o loop de incidentes para insights e melhorias sem a necessidade de cinco painéis.
Não é uma ferramenta, mas um novo modelo para trabalhar com sistemas de produção, um onde:
- A instrumentação é gerada com código
- A observabilidade melhora à medida que os incidentes acontecem
- Os pontos cegos são surgidos e resolvidos automaticamente
- A telemetria se torna adaptativa, com foco no sinal, não no ruído
- Publish -mortems não são artefatos, mas entradas para sistemas de aprendizagem
Etapa 1: Promova sua ferramenta de código de código AI para instrumentar
Com ferramentas como Cursor e Copilot, o código não precisa nascer cego. Você pode – e deve – solicitar seu copiloto a instrumentar enquanto você constrói. Por exemplo:
- “Escreva este manipulador e inclua a abertura do OpenElemetria para cada etapa principal.”
- “Rastreia as tentativas e os códigos de standing da API externa.”
- “Os contadores emitis para hits de cache e fallbacks de banco de dados”.
O objetivo é a observabilidade por falta.
Opentelemetria torna isso possível. É o padrão de fato para instrumentação estruturada e agnóstica do fornecedor. Se você não estiver usando, comece agora. Você deseja alimentar seus futuros loops de depuração com dados ricos e padronizados.
Etapa 2: adicione a camada de contexto do modelo
A telemetria bruta não é suficiente. As ferramentas de IA precisam contexto, não apenas dados. É aí que o Modelo Protocolo de Contexto (MCP) vem. É um padrão proposto para compartilhar informações nos modelos de IA para melhorar o desempenho e a consistência em diferentes aplicativos.
Pense no MCP como a cola entre seu código, infraestrutura e observabilidade. Use -o para responder a perguntas como:
- Quais serviços existem?
- O que mudou recentemente?
- Quem é o que o quê?
- O que está alertando?
- O que falhou antes e como foi corrigido?
O servidor MCP apresenta isso de maneira estruturada e consultável.
Quando algo quebra, você pode perguntar:
- “Por que a latência do checkout é?”
- “Esse padrão de falha já aconteceu antes?”
- “O que aprendemos com o incidente 112?”
Você receberá mais do que apenas gráficos; Você receberá um raciocínio envolvendo incidentes passados, vãos correlacionados e diferenciais recentes de implantação. É o tipo de contexto que seus melhores engenheiros traria, mas instantaneamente disponíveis.
Espera -se que a maioria dos sistemas em breve ofereça suporte ao MCP, tornando -o semelhante a uma API. Seu agente de IA pode usá -lo para reunir contexto em várias ferramentas e raciocínio sobre o que eles aprendem.
Etapa 3: feche o loop de suggestions de observabilidade
Aqui é onde o Vibe Loop fica poderoso: a IA não apenas ajuda a entender a produção; Ajuda você a evoluir.
Pode alertá -lo sobre pontos cegos e oferecer ações corretivas:
- “Você está pegando e repetindo 502s aqui, mas não registrando a resposta.”
- “Esse período está faltando atributos -chave. Deseja anotá -lo?”
- “Este caminho de erro nunca foi rastreado – quer que eu adicione instrumentação?”
Ajuda você a aparar a gordura:
- “Esta linha de toras foi emitida 5m vezes este mês, nunca consultou. Largue?”
- “Esses traços são amostrados, mas não utilizados. Reduza a cardinalidade?”
- “Esses alertas disparam com frequência, mas nunca são acionáveis. Quer suprimir?”
Você não está mais perseguindo todos os vestígios; Você está curadoria de telemetria com intenção.
A observabilidade não é mais reacionária, mas adaptativa.
Do incidente ao perception e mudança de código
O que torna o vibe loop diferente dos fluxos de trabalho tradicionais da SRE é velocidade e continuidade. Você não é apenas combate a incêndios e depois escrevendo um documento. Você está apertando o loop:
- Um incidente acontece
- A IA investiga, correlaciona e superfície as possíveis causas de raiz
- Ele lembra eventos semelhantes passados e suas resoluções
- Propõe alterações de instrumentação ou mitigação
- Ajuda você a implementar essas alterações no código imediatamente
O sistema realmente ajuda a investigar incidentes e escrever um código melhor após cada falha.
Como isso parece dia-a-dia
Se você é um desenvolvedor, eis como isso pode ser:
- Você solicita a IA a escrever um serviço e um instrumento.
- Uma semana depois, um aumento na latência atinge a produção.
- Você solicitou: “Por que a latência do 95º percentil saltou na UE após as 10h”?
- Ai responde: “Implante às 09:45, adicionou um loop de tentativa. O serviço a jusante B é limitado de taxas.”
- Você concorda com a hipótese e age.
- AI sugere que você feche o loop: “Quer registrar cabeçalhos e reduzir as tentativas?”
- Você diz que sim. Ele gera a solicitação de tração.
- Você mescla, implanta e resolve.
Sem ingresso Jira. Sem transferência. Sem esquecimento.
Isso é vibração.
Pensamento last: a confiabilidade do website nos ensinou o que buscar. Vibe Loop chega lá.
O Vibe Loop não é um único agente de IA, mas uma rede de agentes que realizam tarefas específicas e repetíveis. Eles sugerem hipóteses com maior precisão ao longo do tempo. Eles não substituem os engenheiros, mas capacitarão o engenheiro médio a operar em um nível de especialista.
Não é perfeito, mas, pela primeira vez, nossas ferramentas estão alcançando a complexidade dos sistemas que executamos.