
(Funtap/Shutterstock)
Cloudera, uma plataforma híbrida para dados, análises e IA, anunciou uma integração com Snowflake, uma plataforma de dados em nuvem alimentada por IA, com o objetivo de fornecer às empresas um information lakehouse híbrido aberto e unificado.
No centro deste novo lakehouse está o Iceberg REST Catalog, que aproveita o Apache Iceberg, um formato de tabela aberta projetado para gerenciamento de dados em grande escala, para facilitar o gerenciamento de dados mais fácil e eficiente em diferentes mecanismos de dados e ambientes de computação.
A colaboração permite que usuários conjuntos combinem os recursos de gerenciamento de dados da Cloudera com a arquitetura de nuvem da Snowflake, melhorando potencialmente a agilidade dos dados e facilitando insights mais profundos entre as organizações.
Cloudera compartilhou as descobertas de um estudo de 2022 que revelou que 80% das empresas pesquisadas relatam aumento de receita devido à análise de dados em tempo actualenquanto 98% observaram uma melhoria na satisfação do cliente como resultado do aproveitamento de dados. No entanto, Cloudera enfatiza que, para aproveitar plenamente o potencial dos dados, as empresas necessitam de uma plataforma única e unificada para armazenar, gerir e governar todos os seus dados.
Com a nova integração Cloudera e Snowflake, as organizações podem combinar dados estruturados e não estruturados em um information lakehouse unificado, eliminando as complexidades associadas à transferência de dados entre diferentes sistemas.
Os usuários do Snowflake agora podem acessar diretamente os dados armazenados em Ozônio de Clouderauma solução de armazenamento de objetos native compatível com AWS S3. Essa integração permite que os clientes utilizem diversas opções de implantação, incluindo soluções locais, de plataforma como serviço (PaaS) e de software program como serviço (SaaS), aprimorando seus recursos de gerenciamento de dados.
“Ao estender nossos recursos de open information lakehouse através do Apache Iceberg para o Snowflake, estamos permitindo que nossos clientes não apenas otimizem seus fluxos de trabalho de dados, mas também liberem novas oportunidades de inovação, eficiência e crescimento”, disse Abhas Ricky, diretor de estratégia da Cloudera. .
“Isso ajudará os clientes a simplificar sua arquitetura de dados, minimizar pipelines de dados e reduzir o custo complete de propriedade de seu patrimônio de dados, ao mesmo tempo que reduz os riscos de segurança. Juntas, Snowflake e Cloudera estão trazendo a próxima period de tomada de decisão baseada em dados para todas as organizações modernas.”
À medida que o Apache Iceberg take away os dados das restrições proprietárias, as organizações podem acessar seus dados de maneira mais uniforme em diferentes plataformas, simplificando o processo de gerenciamento e permitindo uma análise mais abrangente de seus ativos de dados.
Um aspecto importante da colaboração é que os usuários da Cloudera podem acessar dados no Open Information Lakehouse da Cloudera por meio do mecanismo de Enterprise Intelligence da Snowflake sem a necessidade de transferência ou duplicação de dados. Esta configuração simplifica o acesso aos dados enquanto preserva a integridade. A integração também visa reduzir o custo complete de propriedade para empresas que utilizam a pilha combinada, eliminando silos de dados e metadados e racionalizando pipelines de dados.
A colaboração apresenta Tabelas Iceberg Gerenciadas, que visam aprimorar o desempenho e a confiabilidade dos dados por meio de uma organização aprimorada e execução mais rápida de consultas. Novos “mecanismos best-of-breed” também foram introduzidos para suportar cargas de trabalho de IA e enterprise intelligence.
Cloudera relata que os clientes que utilizam esta integração alcançaram um uso mais eficiente de recursos e reduziram os encargos de manutenção. Além disso, os clientes aproveitaram essa integração para aplicar vários casos de uso, como treinamento, relatórios e análises de IA, a um único conjunto de dados, permitindo-lhes obter mais insights e valor de seus dados.
“Através desta colaboração, os clientes obtêm acesso a uma plataforma de gestão de dados robusta e unificada que fornece uma única fonte de verdade para todos os seus dados, seja na nuvem ou no native”, disse Sanjeev Mohan, analista da SanjMo.
“Isso permite que eles simplifiquem e protejam suas operações de dados, ao mesmo tempo em que analisam e extraem insights de maneira eficiente em todo o ciclo de vida dos dados – desde a ingestão até a IA e a análise. É uma mudança estratégica de dois gigantes da indústria para se associarem de uma forma que irá agregar valor imediato às empresas.”
Junto com a integração, Cloudera anunciou uma prévia técnica do Lakehouse Optimizer, projetado para otimizar de forma autônoma as tabelas Iceberg. O objetivo é reduzir o custo complete de propriedade (TCO), diminuir os esforços de gerenciamento de dados e melhorar o desempenho do Lakehouse.
Itens Relacionados
Snorkel AI expande plataforma com novas ferramentas para IA centrada em dados
GenAI é um dos principais impulsionadores da modernização de dados na nuvem, afirma Hakkoda