Serviço Amazon OpenSearch Os clusters oferecem diversas métricas operacionais acessíveis por meio do CloudWatch e do console do Amazon OpenSearch Service para oferecer suporte ao monitoramento eficaz do desempenho e à criação de alertas. No entanto, identificar os desafios de resiliência e desempenho em seu cluster pode ser assustador. O processo de identificação de consultas que consomem muitos recursos ou de compreensão das tendências de degradação do desempenho pode ser demorado.
Para enfrentar esses desafios, lançamos Insights de clusterque apresenta um painel unificado que fornece insights selecionados junto com etapas de mitigação acionáveis. O painel exibe métricas detalhadas nos níveis de nó, índice e fragmento, juntamente com um resumo conciso das práticas recomendadas de segurança e resiliência para manter o pico de resiliência e disponibilidade.
Este weblog irá guiá-lo na configuração e uso do Cluster Insights, incluindo os principais recursos e métricas. Ao concluir, você entenderá como usar insights de cluster para reconhecer e resolver problemas de desempenho e resiliência em seus clusters do OpenSearch Service.
Primeiros passos com insights de cluster
Os insights de cluster estão disponíveis sem custo adicional para usuários do OpenSearch Service que executam o OpenSearch versão 2.17 ou posterior. O acesso aos insights do Cluster requer permissões de nível de administrador para seu domínio OpenSearch. Os insights do cluster estão disponíveis somente por meio do IU do OpenSearch. A IU do OpenSearch oferece suporte para várias fontes de dados, atualizações sem tempo de inatividade para sua experiência de painel e espaços de trabalho selecionados para colaborações de equipe eficazes. Primeiro, você precisa associar uma fonte de dados (seus clusters) a um aplicativo OpenSearch UI. As etapas detalhadas estão descritas no guia do usuário. Sua experiência no console OpenSearch UI será semelhante às capturas de tela a seguir.
Para acessar insights do Cluster usando o aplicativo OpenSearch UI:
- No console do Amazon OpenSearch Service, navegue até OpenSearch UI (Dashboards) e escolha o URL do aplicativo para acessar seu aplicativo OpenSearch UI.

- Aplicativo OpenSearch UI, escolha o ícone de configurações no canto inferior esquerdo e escolha Administração de dados.

- No Visão geral da administração de dados página ou abaixo Gerenciar dados na navegação esquerda, selecione Insights de cluster.

Visão geral dos insights do cluster
O Insights de cluster – Visão geral atua como uma página inicial para mostrar saúde e insights para todos os domínios OpenSearch conectados. Está organizado em cinco seções:

- Standing atual do cluster – Exibe o standing de integridade do cluster (verde, amarelo e vermelho) em um gráfico de rosca.
- Tendência de insights – Rastreia padrões de problemas nos últimos 30 dias, ajudando você a identificar problemas emergentes e acompanhar o progresso da resolução. Esta análise de tendências torna-se particularmente valiosa ao monitorar o impacto de mudanças operacionais ou solucionar problemas recorrentes.
- Insights abertos atuais – Mostra a contagem e o detalhamento da gravidade dos insights atualmente ativos em seus clusters.
- Clusters de serviço OpenSearch – Lista todos os domínios com suas estatísticas vitais, como standing de integridade, contagem de insights, nós, fragmentos e consultas ativas.
- Principais insights por gravidade – Prioriza questões que precisam de atenção imediata. Cada perception vem com uma descrição clara e recomendações específicas, transformando dados de monitoramento complexos em tarefas acionáveis. Essa visão priorizada ajuda as equipes a se concentrarem primeiro em questões críticas, sejam elas abordando problemas de tamanho de fragmentos, problemas de espaço em disco ou gargalos de desempenho.
Juntas, essas seções fornecem uma visão abrangente da infraestrutura do OpenSearch Service para que você possa avaliar a integridade do cluster, identificar tendências e tomar medidas em relação a problemas críticos em um único painel.
Integridade do cluster
Quando você escolhe um cluster específico dos domínios OpenSearch no Insights de cluster – Visão geral página, você verá detalhes específicos do cluster, incluindo standing de integridade, insights ativos e métricas de desempenho. A seção de visão geral exibe a integridade do cluster junto com métricas essenciais, incluindo contagem de fragmentos, nós, índices e tamanho whole do documento. Você também pode revisar as práticas recomendadas de configuração seguidas pelo domínio nas áreas de resiliência e segurança.
A seção inferior contém uma tabela de insights acionáveis que apresenta uma visão detalhada dos problemas atuais. Esta tabela reflete os insights da página inicial, mas concentra-se especificamente nos problemas que afetam o cluster selecionado. Você pode observar problemas de alta gravidade, como pouco espaço em disco e problemas de contagem de fragmentos, bem como problemas de gravidade média que podem afetar o desempenho do cluster.
Cada entrada de perception serve como um elemento interativo – a seleção de qualquer problema revela uma análise aprofundada completa com identificação da causa raiz e etapas específicas de correção. A tabela inclui metadados importantes, como carimbos de knowledge/hora de geração, níveis de gravidade, contagens de recomendações e standing atual, para que os usuários possam priorizar e resolver problemas de maneira eficaz.

Detalhes do perception
Cada perception oferece análises detalhadas e recomendações práticas. Pegue o Contagem de fragmentos perception como exemplo: selecioná-lo revela uma análise abrangente do problema. Você verá que seu cluster OpenSearch violou o número de fragmentos permitidos nos nós com base no tamanho de heap da JVM, juntamente com uma lista detalhada de recursos afetados.

A visualização detalhada inclui um mapa de recursos que identifica com precisão cada nó e índice afetado, exibindo informações críticas, como IDs de nós, contagens de fragmentos e os índices que contribuem para o problema.
As recomendações são organizadas em dois níveis: as recomendações em nível de cluster abordam melhorias gerais na arquitetura, como dimensionar seu cluster ou ajustar as configurações globais de alocação de fragmentos. As recomendações em nível de índice fornecem ações específicas para índices individuais. Por exemplo, você pode ver sugestões para mover fragmentos ociosos para o armazenamento UltraWarm. Esses são fragmentos sem nenhuma operação de pesquisa ou indexação nos últimos 10 dias e com pelo menos 5 dias, o que os torna candidatos ideais para armazenamento quente para reduzir a contagem de fragmentos ativos. Todas essas orientações estão disponíveis diretamente na interface do Cluster Insights, eliminando a necessidade de alternar entre diferentes ferramentas ou consoles.
Visualização de nó, índice, fragmento e consulta
Ao lado da integridade do cluster, você pode revisar os detalhes do nó, do índice, do fragmento e da consulta de um cluster específico. Essas visualizações apresentam métricas críticas, como utilização de recursos (CPU, memória, disco), pesquisa e latência de índice.
Visualização do nó
O Visualização do nó fornece uma visão abrangente do desempenho de nós individuais em seu cluster. Esta tabela exibe métricas críticas para cada nó, incluindo pontuação de calor que indica a integridade geral do nó, utilização de recursos (CPU, memória, disco), latência e taxas de pesquisa e indexação, juntamente com hyperlinks rápidos para visualizar os N principais fragmentos e consultas em execução em cada nó.
Essa visualização ajuda a identificar nós que apresentam alta utilização de recursos ou degradação de desempenho. Você pode se aprofundar em cada nó clicando no ID do nó para visualizar métricas detalhadas baseadas no tempo, mostrando tendências de uso de recursos ao longo do tempo. Além disso, você pode clicar no hyperlink N principais fragmentos para navegar diretamente para a visualização de fragmentos, filtrada automaticamente para mostrar apenas os fragmentos em execução no nó selecionado, permitindo identificar quais fragmentos específicos estão contribuindo para problemas de desempenho.

Visualização de índice
O Visualização de índice mostra métricas de desempenho agregadas no nível do índice. Para cada índice, você pode monitorar a contagem de documentos e o tamanho do armazenamento, a latência e a taxa de pesquisa, a latência e a taxa de indexação e acessar as N principais consultas que afetam o índice. Essa perspectiva é valiosa para entender quais índices estão impulsionando a carga do cluster e identificar oportunidades de otimização no nível de configuração do índice.

Visualização de fragmentos
O Visualização de fragmentos oferece a visão mais granular do desempenho do cluster, exibindo métricas para fragmentos individuais. Cada linha mostra o ID do fragmento e seu nó atribuído, associação de índice e métricas de pressão de recursos (CPU, memória), juntamente com a latência de pesquisa e indexação por fragmento. Essa visualização detalhada permite identificar fragmentos específicos que causam problemas de desempenho, identificar desequilíbrios no posicionamento dos fragmentos e tomar ações de correção direcionadas.

Visualização de consulta
O Visualização de consulta na página Cluster insights resolve apresenta painéis ao vivo que detalham estatísticas de execução, uso de CPU e memória e progresso de conclusão para cada consulta. Isso ajuda a monitorar quais consultas estão gerando o maior consumo de recursos (as consultas High-N). Com gráficos de rosca e painéis de avaliação intuitivos que mostram a distribuição por nó, índice e usuário, essa interface ajuda os operadores a identificar rapidamente gargalos de desempenho e cargas de trabalho pesadas, apoiando a otimização direcionada e decisões de escalabilidade confiáveis.

Informações de consulta
Além dos insights de cluster, você também pode obter insights de consulta para visualizar as consultas exatas em execução e as latências nas fases de expansão, consulta e busca, que fornecem insights valiosos para os desenvolvedores de pesquisa ajustarem ainda mais suas consultas.

Conclusão
Os insights de cluster transformam o gerenciamento de cluster do OpenSearch Service, da solução de problemas reativa à otimização proativa. Ao fornecer painéis unificados com pontuação de desempenho e práticas recomendadas em pilares de estabilidade, resiliência e segurança, ele oferece visibilidade da sua infraestrutura de pesquisa no nível da conta.
As recomendações práticas e as orientações de correção passo a passo ajudam usuários de todos os níveis de experiência a resolver com eficácia problemas complexos, como desequilíbrios de fragmentos e gargalos de recursos.
A integração com o Question Insights oferece visibilidade em tempo actual dos padrões de consumo de recursos para que as equipes possam identificar e otimizar consultas críticas de desempenho por meio de perfis detalhados e análise de latência.
Para obter mais informações, consulte o Guia do usuário do serviço AWS OpenSearch para obter detalhes adicionais.


