Pesquisa aprimorada com destaques de correspondência e explicações no Amazon SageMaker


O Amazon SageMaker agora aprimora os resultados da pesquisa em Estúdio unificado Amazon SageMaker com contexto adicional que melhora a transparência e a interpretabilidade. Os usuários podem ver quais campos de metadados correspondem à sua consulta e entender por que cada resultado aparece, aumentando a clareza e a confiança na descoberta de dados. O recurso introduz destaque em linha para termos correspondentes e um painel de explicação que detalha onde e como cada correspondência ocorreu em campos de metadados, como nome, descrição, glossário e esquema. Os resultados de pesquisa aprimorados reduzem o tempo gasto na avaliação de ativos irrelevantes, apresentando evidências de correspondência diretamente nos resultados da pesquisa. Os usuários podem validar rapidamente a relevância sem analisar ativos individuais.

Nesta postagem, demonstramos como usar a pesquisa aprimorada no Amazon SageMaker.

Resultados da pesquisa com contexto

As correspondências de texto incluem correspondência de palavras-chave, começa com, sinônimos e texto semanticamente relacionado. A pesquisa avançada exibe correspondências de texto dos resultados da pesquisa nestes locais:

  • Resultado da pesquisa: as correspondências de texto em cada nome, descrição e termos do glossário de cada resultado da pesquisa são destacadas.
  • Sobre este painel de resultados: Um novo Sobre este resultado O painel é exibido à direita do resultado da pesquisa destacado. O painel exibe as correspondências de texto para o conteúdo pesquisável do merchandise de resultado, incluindo nome, descrição, termos do glossário, metadados, nomes comerciais e esquema de tabela. A lista de valores exclusivos de correspondência de texto é exibida na parte superior do painel para referência rápida.

Os catálogos de dados contêm milhares de conjuntos de dados, modelos e projetos. Sem transparência, os usuários não podem dizer por que determinados resultados aparecem ou confiar na ordem. Os usuários precisam de evidências da relevância e compreensão da pesquisa.

A pesquisa aprimorada com explicações de correspondência melhora a pesquisa no catálogo de quatro maneiras principais:
1) a transparência aumenta porque os usuários podem ver por que um resultado apareceu e ganhar confiança,
2) a eficiência melhora, pois os destaques e as explicações reduzem o tempo gasto na abertura de ativos irrelevantes,
3) a governança é apoiada mostrando onde e como os termos são correspondidos, auxiliando nos processos de auditoria e conformidade, e
4) a consistência é reforçada pela revelação do glossário e das relações semânticas, o que reduz mal-entendidos e melhora a colaboração entre as equipes.

Como funciona a pesquisa aprimorada

Quando um usuário insere uma consulta, o sistema pesquisa vários campos como nome, descrição, termos do glossário, metadados, nomes comerciais e esquema de tabela. Com transparência de pesquisa aprimorada, cada resultado da pesquisa inclui a lista de correspondências de texto que serviu de base para a inclusão do resultado, incluindo o campo que continha a correspondência de texto e uma parte do valor de texto do campo antes e depois da correspondência de texto, para fornecer contexto. A IU usa essas informações para exibir o texto retornado com a correspondência de texto destacada.

Por exemplo, um administrador pesquisa “previsão de receita” e um ativo é retornado com o nome “Conjunto de dados de previsão de vendas Q2” e uma descrição que contém “valores de vendas projetados”. A palavra vendas é destacado no nome e na descrição, tanto no resultado da pesquisa quanto no painel de correspondências de texto, porque vendas é sinônimo de receita. O painel Sobre este resultado também mostra que a previsão foi correspondida no nome do campo do esquema previsão_de vendas_q2.

Visão geral da solução

Nesta seção demonstramos como usar os recursos de pesquisa aprimorados. Neste exemplo, demonstraremos o uso em uma campanha de advertising and marketing onde precisamos de dados de preferência do usuário. Embora tenhamos vários conjuntos de dados sobre usuários, demonstraremos como a pesquisa aprimorada simplifica a experiência de descoberta.

Pré-requisitos

Para testar esta solução você deve ter um Estúdio unificado Amazon SageMaker domínio configurado com privilégios de proprietário de domínio ou proprietário de unidade de domínio. Você também deve ter um projeto existente para publicar ativos e catalogar ativos. Para obter instruções sobre como criar esses ativos, consulte o Começando guia.

Neste exemplo, criamos um projeto chamado Data_publish e carregamos dados do Amazon Redshift banco de dados de amostra. Para ingerir os dados de amostra no Catálogo SageMaker e gerar metadados de negócios, consulte Crie uma fonte de dados do Amazon SageMaker Unified Studio para o Amazon Redshift no catálogo de projetos.

Descoberta de ativos com pesquisa explicável

Para encontrar ativos com pesquisa explicável:

  1. Faça login no SageMaker Unified Studio.
    Pesquisa aprimorada com destaques de correspondência e explicações no Amazon SageMaker
  2. Digite o texto de pesquisa user-data. Embora obtenhamos os resultados da pesquisa nesta visualização, queremos obter mais detalhes sobre cada um desses conjuntos de dados. Pressione Enter para ir para a pesquisa completa.
  3. Na pesquisa completa, os resultados da pesquisa são retornados quando há correspondências de texto com base na pesquisa por palavra-chave, início com, sinônimo e pesquisa semântica. As correspondências de texto são destacadas no conteúdo pesquisável mostrado para cada resultado: no nome, na descrição e nos termos do glossário.
  4. Para aprimorar ainda mais a experiência de descoberta e encontrar o ativo certo, você pode consultar o Sobre este resultado painel à direita e veja as outras correspondências de texto, por exemplo, no resumo, nome da tabela, nome do banco de dados da fonte de dados ou nome comercial da coluna, para entender melhor por que o resultado foi incluído.
  5. Depois de examinar os resultados da pesquisa e as explicações de correspondência de texto, identificamos o ativo denominado Media Viewers Preferences and Engagement como o ativo certo para a campanha e o selecionou para análise.

Conclusão

A transparência aprimorada da pesquisa no Amazon SageMaker Unified Studio transforma a descoberta de dados, fornecendo visibilidade clara sobre por que os ativos aparecem nos resultados da pesquisa. O destaque in-line e as explicações detalhadas de correspondência ajudam os usuários a identificar rapidamente conjuntos de dados relevantes, ao mesmo tempo que criam confiança no catálogo de dados. Ao mostrar exatamente quais campos de metadados correspondem às suas consultas, os usuários gastam menos tempo avaliando ativos irrelevantes e mais tempo analisando os dados certos para seus projetos.

A pesquisa aprimorada agora está disponível nas regiões da AWS onde o Amazon SageMaker é compatível.

Para saber mais sobre o Amazon SageMaker, consulte Amazon SageMaker documentação.


Sobre os autores

Ramesh H Singh

Ramesh H Singh

Ramesh é gerente técnico sênior de produtos (serviços externos) na AWS em Seattle, Washington, atualmente na equipe Amazon DataZone. Ele é apaixonado por criar produtos de análise e ML/IA de alto desempenho que permitem que os clientes corporativos atinjam seus objetivos críticos usando tecnologia de ponta.

Pradeep Misra

Pradeep Misra

Pradeep é arquiteto principal de soluções de análise e IA aplicada na AWS. Ele é apaixonado por resolver os desafios dos clientes usando dados, análises e IA/ML. Fora do trabalho, Pradeep gosta de explorar novos lugares, experimentar novas culinárias e jogar jogos de tabuleiro com a família. Ele também gosta de fazer experimentos científicos, construir LEGOs e assistir animes com as filhas.

Ron Kyker

Ron Kyker

Rony é engenheiro principal do Amazon DataZone na AWS, onde ajuda a impulsionar a inovação, resolver problemas complexos e definir o padrão de excelência em engenharia para sua equipe. Fora do trabalho, ele gosta de jogos de tabuleiro com amigos e familiares, filmes e degustação de vinhos.

Rajat Mathur

Rajat Mathur

Rajata é gerente de desenvolvimento de software program na AWS, liderando as equipes de engenharia Amazon DataZone e SageMaker Unified Studio. Sua equipe projeta, cria e opera serviços que tornam mais rápido e simples para os clientes catalogar, descobrir, compartilhar e controlar dados. Com profundo conhecimento na construção de sistemas de dados distribuídos em escala, Rajat desempenha um papel basic no avanço da análise de dados e dos recursos de IA/ML da AWS.

Kyle Wong

Kyle Wong

Kyle é engenheiro de software program na AWS baseado em São Francisco, onde trabalha na equipe Amazon DataZone e SageMaker Unified Studio. Seu trabalho tem sido principalmente na interseção de dados, análises e inteligência synthetic, e ele é apaixonado por desenvolver soluções baseadas em IA que atendam aos desafios reais dos clientes.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *