Aproveite o compartilhamento de dados Zero Copy do Salesforce Information Cloud para o Amazon Redshift para análise unificada – Parte 1


Esta postagem foi coautorada por Rajkumar Irudayaraj, Diretor Sênior de Produto, Salesforce Information Cloud.

No cenário de negócios em constante evolução de hoje, as organizações devem aproveitar e agir com base em dados para alimentar análises, gerar insights e tomar decisões informadas para oferecer experiências excepcionais ao cliente. A Salesforce e a Amazon colaboraram para ajudar os clientes a desbloquear valor de dados unificados e acelerar o tempo para insights com bidirecional Cópia Zero compartilhamento de dados entre Nuvem de dados do Salesforce e Amazon Redshift.

Em um put up anterior, mostramos como Federação de dados Zero Copy capacita empresas a acessar dados do Amazon Redshift dentro do Salesforce Information Cloud para enriquecer dados do cliente 360 ​​com dados operacionais. Esta série de duas partes explora como equipes de análise podem acessar dados do cliente 360 ​​do Salesforce Information Cloud dentro do Amazon Redshift para gerar insights sobre dados unificados sem a sobrecarga de pipelines de extração, transformação e carga (ETL). Nesta publicação, abordamos o compartilhamento de dados entre o Salesforce Information Cloud e as contas AWS dos clientes na mesma região AWS. A parte 2 aborda o compartilhamento de dados entre regiões entre o Salesforce Information Cloud e as contas AWS dos clientes.

O que é o Salesforce Information Cloud?

Nuvem de dados do Salesforce é uma plataforma de dados que unifica todos os dados da sua empresa no Salesforce Plataforma Einstein 1dando a cada equipe uma visão de 360 ​​graus do cliente para impulsionar a automação, criar análises, personalizar o engajamento e potencializar a inteligência synthetic (IA) confiável. O Salesforce Information Cloud cria uma visão holística do cliente ao transformar volumes de dados desconectados em um perfil de cliente unificado que é simples de acessar e entender. Essa visão unificada ajuda suas equipes de vendas, serviços e advertising and marketing a criar experiências personalizadas para o cliente, invocar ações e fluxos de trabalho baseados em dados e conduzir a IA com segurança em todos os aplicativos do Salesforce.

O que é o Amazon Redshift?

O Amazon Redshift é um serviço de knowledge warehouse rápido, totalmente gerenciado e em escala de petabytes que torna simples e econômico analisar com eficiência todos os seus dados usando suas ferramentas de enterprise intelligence (BI) existentes. Ele é otimizado para conjuntos de dados que variam de algumas centenas de gigabytes a petabytes e oferece melhor preço-desempenho em comparação com outras soluções de knowledge warehouse. Com uma arquitetura de processamento massivamente paralelo (MPP) totalmente gerenciada e alimentada por IA, o Amazon Redshift torna a tomada de decisões de negócios rápida e econômica. Espectro Redshift da Amazon permite consultar dados estruturados e semiestruturados em Serviço de armazenamento simples da Amazon (Amazon S3) sem ter que carregar os dados nas tabelas do Redshift. Integração do Redshift Spectrum com Formação do Lago AWS permite a consulta montada automaticamente Catálogo de dados do AWS Glue mesas com Gerenciamento de identidade e acesso da AWS (IAM) credenciais e aproveitamento da Lake Formation para concessões de permissão e políticas de controle de acesso em Visualizações do Catálogo de Dados. O compartilhamento de dados do Salesforce Information Cloud com o Amazon Redshift aproveita o suporte do AWS Glue Information Catalog para visualizações multi-motor e Integração do espectro Redshift com Lake Formation.

O que é compartilhamento de dados Zero Copy?

O compartilhamento de dados Zero Copy permite que os clientes do Amazon Redshift consultem dados do cliente 360 ​​armazenados no Salesforce Information Cloud sem a necessidade de ETL tradicional para mover ou copiar os dados. Em vez disso, você simplesmente conecta e usa os dados no native, desbloqueando seu valor imediatamente com acesso sob demanda aos dados mais recentes. O compartilhamento de dados é suportado com ambos Amazon Redshift sem servidor e clusters RA3 provisionados. Os dados podem ser compartilhados com um cluster Redshift Serverless ou provisionado na mesma região ou com um cluster Redshift Serverless em uma região diferente. Para obter uma visão geral da integração do Salesforce Zero Copy com o Amazon Redshift, consulte este Weblog do Salesforce.

Visão geral da solução

O Salesforce Information Cloud fornece uma experiência de apontar e clicar para compartilhar dados com a conta AWS de um cliente. No console do Lake Formation, você pode aceitar o compartilhamento de dados, criar o hyperlink de recurso, montar objetos do Salesforce Information Cloud como visualizações de catálogo de dados e conceder permissões para consultar os dados ativos e unificados no Amazon Redshift.

O diagrama a seguir descreve o processo de ponta a ponta envolvido para compartilhar dados do Salesforce Information Cloud com o Amazon Redshift na mesma região usando uma arquitetura Zero Copy. Essa arquitetura segue o padrão documentado em Melhores práticas e considerações sobre compartilhamento de dados entre contas.

Aproveite o compartilhamento de dados Zero Copy do Salesforce Information Cloud para o Amazon Redshift para análise unificada – Parte 1

A configuração do compartilhamento de dados consiste nas seguintes etapas de alto nível:

  1. O administrador do Salesforce Information Cloud cria o destino de compartilhamento de dados com a conta de destino para o compartilhamento de dados.
  2. O administrador do Salesforce Information Cloud seleciona os objetos da nuvem de dados a serem compartilhados com o Amazon Redshift e cria um compartilhamento de dados.
  3. O administrador do Salesforce Information Cloud vincula o compartilhamento de dados ao destino de compartilhamento de dados, o que invoca as seguintes operações para criar um compartilhamento de recursos entre contas:
    1. Crie uma exibição do Catálogo de Dados para as tabelas do Salesforce Information Cloud Apache Iceberg invocando o API de catálogo.
    2. Use o compartilhamento do Lake Formation para criar um compartilhamento de catálogo de dados entre contas.
  4. Na conta do cliente da AWS, o administrador do Lake Formation efetua login no console do Lake Formation para aceitar o compartilhamento de recursos, criar um hyperlink de recurso e conceder permissões de acesso à função do Redshift.
  5. O analista de dados inicia o Amazon Redshift Question Editor com a função apropriada para consultar o compartilhamento de dados e unir-se às tabelas nativas do Redshift.

Pré-requisitos

A seguir estão os pré-requisitos para habilitar o compartilhamento de dados:

  • Uma conta do Salesforce Information Cloud.
  • Uma conta AWS com Cola AWS e a formação de lagos foi ativada.
  • Ou um Redshift sem servidor ou um Cluster provisionado Redshift com tipos de instância RA3 (ra3.16xlarge, ra3.4xlarge, ra3.xlplus). O compartilhamento de dados não é suportado para outros tipos de instância provisionados como DC2 ou DS2 e deve ser configurado antes de acessar o compartilhamento de dados. Se você não tiver um cluster Redshift RA3 provisionado existente, recomendamos usar um namespace Redshift Serverless para facilitar as operações e a manutenção.
  • O serviço Amazon Redshift deve estar em execução na mesma região em que o Salesforce Information Cloud está em execução.
  • Funções de administrador da AWS para Lake Formation e Amazon Redshift:

Crie o destino de compartilhamento de dados

Conclua as seguintes etapas para criar o destino de compartilhamento de dados:

  1. No Salesforce Information Cloud, escolha Iniciador de aplicativos e escolher Metas de compartilhamento de dados.
  1. Escolher Novo e escolher Amazon Redshiftentão escolha Próximo.
  1. Insira os detalhes para Rótulo, API Nomee Conta para a meta de compartilhamento de dados.
  2. Escolher Salvar.

Depois de salvar essas configurações, o Pasta de locatário S3 valor é preenchido.

  1. Escolha o Pasta de locatário S3 hyperlink e copie o token de verificação.

Se você não estiver conectado ao Console de gerenciamento da AWSvocê será redirecionado para a página de login.

  1. Insira o token de verificação e escolha Salvar.

O destino de compartilhamento de dados passa para o standing ativo.

Criar um compartilhamento de dados

Conclua as seguintes etapas para criar um compartilhamento de dados:

  1. Navegue até o Compartilhamento de dados guia na sua organização Salesforce.
  2. Escolher Iniciador de aplicativos e escolher Compartilhamento de dados.

Alternativamente, você pode navegar até o Compartilhamento de dados guia na página inicial da sua organização.

  1. Escolher Novoentão escolha Próximo.
  1. Forneça um rótulo, nome, espaço de dados e descrição e escolha Próximo.
  1. Selecione os objetos a serem incluídos no compartilhamento e escolha Salvar.

Vincule o destino do compartilhamento de dados ao compartilhamento de dados

Para vincular o destino de compartilhamento de dados ao compartilhamento de dados, conclua as seguintes etapas:

  1. Na página inicial do registro de compartilhamento de dados, escolha Vincular/Desvincular Alvo de Compartilhamento de Dados.
  2. Selecione o destino de compartilhamento de dados que você deseja vincular ao compartilhamento de dados e escolha Salvar.

O compartilhamento de dados deve estar ativo antes que você possa aceitar o compartilhamento de recursos no console do Lake Formation.

Aceitar o compartilhamento de dados na Lake Formation

Esta seção fornece as etapas detalhadas para aceitar o convite de compartilhamento de dados e as etapas de configuração para montar o compartilhamento de dados com o Amazon Redshift.

  1. Depois que o compartilhamento de dados for vinculado com sucesso ao destino de compartilhamento de dados, navegue até o console do Lake Formation.

O banner de convite para compartilhamento de dados é exibido.

  1. Escolher Aceitar e criar.

O Aceitar e criar A página mostra um hyperlink de recurso e fornece a opção de configurar permissões do IAM.

  1. No Diretores seção, escolha os usuários e funções do IAM para conceder as permissões padrão (descreva e selecione) para o hyperlink de recurso de compartilhamento de dados.
  1. Escolher Criar.

O hyperlink de recurso criado na etapa anterior aparece ao lado do compartilhamento de recursos do banco de dados do AWS Glue no console do Lake Formation.

Consultar o compartilhamento de dados do Redshift Serverless

Inicie o editor de consultas do Redshift Serverless e efetue login como um usuário federado com a função que possui permissões de descrição e seleção para o hyperlink de recurso.

As tabelas de compartilhamento de dados são montadas automaticamente e aparecem em awsdatacataloge pode ser consultado conforme mostrado na captura de tela a seguir.

Consultar o compartilhamento de dados do cluster provisionado do Redshift

Para consultar o compartilhamento de dados do cluster provisionado do Redshift, efetue login no cluster provisionado como superusuário.

Em uma guia do editor, execute a seguinte instrução SQL para conceder a um usuário do IAM acesso ao Catálogo de Dados:

GRANT USAGE ON DATABASE awsdatacatalog to "IAM:myIAMUser"

IAM:meuUsuárioIAM é um usuário do IAM ao qual você deseja conceder privilégio de uso ao Catálogo de Dados. Como alternativa, você pode conceder privilégio de uso a IAMR:meuIAMRole para uma função IAM. Para mais detalhes, consulte Consultando o catálogo de dados do AWS Glue.

Efetue login como o usuário com a função da etapa anterior usando credenciais temporárias.

Você deve ser capaz de expandir awsdatacatalog e consulte as tabelas de compartilhamento de dados, conforme mostrado na captura de tela a seguir.

Conclusão

O compartilhamento de dados Zero Copy entre o Salesforce Information Cloud e o Amazon Redshift representa um avanço significativo em como as organizações podem usar seus dados 360 do cliente. Ao eliminar a necessidade de movimentação de dados, essa abordagem oferece insights em tempo actual, custos reduzidos e segurança aprimorada. À medida que as empresas continuam a priorizar a tomada de decisões orientada por dados, o compartilhamento de dados Zero Copy desempenhará um papel essential no desbloqueio de todo o potencial dos dados do cliente em todas as plataformas.

Essa integração capacita as organizações a quebrar silos de dados, acelerar análises e impulsionar estratégias mais ágeis centradas no cliente. Para saber mais, consulte os seguintes recursos:


Sobre os autores

Rajkumar Irudayaraj é Diretor Sênior de Produtos na Salesforce, com mais de 20 anos de experiência em plataformas e serviços de dados, apaixonado por oferecer experiências baseadas em dados aos clientes.

Jason Berkowitz é um gerente sênior de produtos na AWS Lake Formation. Ele vem de uma experiência em aprendizado de máquina e arquiteturas de knowledge lake. Ele ajuda os clientes a se tornarem orientados por dados.

Ravi Bhattiprolu é um Senior Associate Options Architect na AWS. Ravi trabalha com parceiros ISV estratégicos, Salesforce e Tableau, para entregar produtos e soluções inovadores e bem arquitetados que ajudam clientes conjuntos a atingir seus objetivos comerciais e técnicos.

Avijit Goswami é um Arquiteto de Soluções Principal na AWS especializado em dados e análises. Ele oferece suporte a clientes estratégicos da AWS na construção de soluções de knowledge lake de alto desempenho, seguras e escaláveis ​​na AWS usando serviços gerenciados da AWS e soluções de código aberto. Fora do trabalho, Avijit gosta de viajar, fazer caminhadas, assistir esportes e ouvir música.

Ife Stewart é Arquiteta de Soluções Principal no segmento ISV Estratégico da AWS. Ela está envolvida com a Salesforce Information Cloud nos últimos 2 anos para ajudar a construir experiências integradas para o cliente na Salesforce e na AWS. Ife tem mais de 10 anos de experiência em tecnologia. Ela é uma defensora da diversidade e inclusão no campo da tecnologia.

Michael Xadrez é um gerente técnico de produtos na AWS Lake Formation. Ele se concentra em melhorar as permissões de dados no knowledge lake. Ele é apaixonado por garantir que os clientes possam construir e otimizar seus knowledge lakes para atender aos rigorosos requisitos de segurança.

Mike Patterson é um gerente sênior de soluções para clientes no segmento de ISV estratégico na AWS. Ele fez uma parceria com a Salesforce Information Cloud para alinhar objetivos de negócios com soluções inovadoras da AWS para alcançar experiências impactantes para o cliente. Em seu tempo livre, ele gosta de passar tempo com sua família, esportes e atividades ao ar livre.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *