O Google Cloud aumenta a análise no próximo 2025


O Google Cloud aumenta a análise no próximo 2025

(Michael VI/Shutterstock)

O Google Cloud fez uma série de anúncios relacionados à análise em sua próxima conferência 2025 nesta semana, incluindo uma série de aprimoramentos ao BigQuery, seu principal banco de dados para análises. Bigdatawire Apanhou a Yasmeen Ahmad, diretora administrativa de análise de dados, para obter a colher.

Solicitado a identificar três áreas principais de inovação em produtos relacionados e BigQuery, Ahmad apontou para os novos agentes que automatizavam o trabalho de ciência, engenharia e análise automatizados de dados; os novos mecanismos de processamento de dados em BigQuery; e avanços na Fundação de Dados do Google Cloud e em seu tecido de dados.

Embora o trabalho seja realizado por equipes separadas, há muitas funcionalidades que atravessam outras áreas, acrescentou Ahmad. “Temos muitas equipes de engenharia talentosas trabalhando em coisas incríveis em paralelo”, disse ela. “Acabamos de ter tantas inovações incríveis nos últimos 12 meses em que trabalhamos culminando com a próxima”.

Novos agentes da IA

Como Relatamos anteriormenteO Google Cloud está dedicando recursos significativamente para ajudar seus clientes a criar e gerenciar agentes de IA. Isso inclui a construção de um novo package de desenvolvimento de agentes (ADK), criação de um novo protocolo de comunicação agente para agente (A2A) que completa o protocolo de contexto de modelo do Antrópico (MCP) e a criação de um jardim de agentes, entre (muitas) outras inovações.

A empresa também está incorporando agentes de IA pré-criados em seus próprios serviços de software program, incluindo o BigQuery. Existem novos agentes especializados para engenharia de dados e tarefas de ciência de dados; novos agentes para a construção de pipelines de dados; e novos agentes para executar tarefas de preparação de dados, como transformação de dados, enriquecimento de dados e detecção de anomalia.

O Google Cloud está infundindo seus produtos com agentes de IA e IA (Anggalih Prasetya/Shutterstock)

“Isso é um divisor de águas para as pessoas de dados humanos que estão trabalhando em dados”, disse Ahmad. “Nós realmente acreditamos que esses agentes vão transformar a maneira como trabalham com dados”.

Os agentes são alimentados por Gêmeos, o modelo de fundação principal do Google. Os agentes estão fazendo sugestões aos analistas de dados humanos, cientistas de dados e engenheiros de dados baseados em parte nas informações coletadas por meio de um novo mecanismo de conhecimento do BigQuery que o Google Cloud construiu, que está atualmente em visualização.

“O mecanismo de conhecimento usa metadados, semântica, registros de uso e informações do catálogo para entender o contexto dos negócios, para entender como os itens de dados estão relacionados”, disse Ahmad. “Como as pessoas que usam os dados? Como os diferentes mecanismos estão sendo usados ​​com esses dados? E o conhecimento que eles constroem é o que então alimenta esses agentes de dados”.

O Google Cloud também apresentou uma nova funcionalidade do agente de análise de análise de conversação em Looker, seu BI e Analytics. Esse novo agente permitirá que os usuários do Looker interajam com os dados usando a linguagem pure. As novas funções de linguagem pure movidas a IA no Looker também melhorarão a precisão da linguagem de modelagem do LookML, que funciona como camada semântica do Google, em até dois terços, diz a empresa.

“Como os usuários referenciam termos de negócios como ‘receita’ ou ‘segmentos’, o agente sabe exatamente o que você quer dizer e pode calcular métricas em tempo actual, garantindo que entregue resultados precisos, relevantes e confiáveis”, escreveu Ahmad em uma postagem no weblog.

Novos motores BigQuery

Além do novo mecanismo de conhecimento, o Google Cloud anunciou que está desenvolvendo um novo mecanismo de consulta de IA para o BigQuery. O mecanismo de consulta da BigQuery AI permitirá que consultas para modelos de fundação como Gêmeos ocorram simultaneamente com consultas tradicionais do SQL no information warehouse.

A consulta estruturada e não estruturada ao mesmo tempo abrirá uma série de novos casos de uso analítico e de ciência de dados, diz o Google Cloud, incluindo a criação de recursos mais ricos para modelos, a realização de segmentação diferenciada e a descoberta de idéias difíceis de alcançar.

“Um cientista de dados agora pode fazer perguntas como: ‘Quais produtos em nosso inventário são fabricados principalmente em países com economias emergentes?’ O modelo da fundação sabe inerentemente quais países são considerados economias emergentes ”, escreveu Ahmad.

O BigQuery Pocket book, um caderno de ciência de dados alternativo a Jupyter, também foi aprimorado com a IA. O Google Cloud está introduzindo “células SQL inteligentes” que entendem o contexto dos dados dos clientes e oferecem as sugestões dos cientistas de dados enquanto eles escrevem código. Também está alavancando a IA para permitir novos recursos de análise e visualização exploratórios.

O Google Cloud também introduziu um novo mecanismo Apache Spark sem servidor em BigQuery. O Google Cloud suporta ambientes de faísca tradicionais há anos como parte do DataProc, que também inclui Hadoop, Flink, Presto e muitos outros motores. Atualmente em pré -visualização e sendo testado pelos clientes, a oferta de faísca sem servidor está melhorando, disse Ahmad.

“Anunciamos nesta semana que fizemos uma melhoria de desempenho tríplice em nossa oferta de faísca sem servidor”, disse ela. “Então, estamos realmente ansiosos para colocar isso agora em disponibilidade geral, porque acreditamos que o desempenho será um desempenho líder de mercado”.

E, embora não seja um anúncio de BigQuery, o Google Cloud também anunciou a disponibilidade geral do Google Cloud para Apache Kafka. Enquanto a empresa também oferece seu serviço PubSub para streaming de dados, alguns clientes querem apenas Kafka, disse Ahmad.

“Temos muitos usuários usando os serviços de primeira parte do Google, mas, novamente, queremos essa escolha e opcionalidade, dependendo de onde nosso cliente também vem”, disse ela. “Como também abraçamos todos os clientes que migram para o Google, queremos abraçar o que eles já construíram com investimentos existentes e construídos e assim por diante.”

Aprimoramentos da Fundação de Dados

Assim como as duas primeiras áreas, a terceira grande área de melhoria no ambiente do Google Cloud Analytics – aprimoramentos para a Fundação de Dados (The Information Cloth) e a governança de dados – também em outras áreas.

Por exemplo, assim como o mecanismo de consulta de IA em BigQuery permite que os usuários usem Gemini contra seus dados, eles também podem gerenciar dados não estruturados em BigQuery através do novo suporte para tabelas multimodais (dados estruturados e não estruturados).

O Google Cloud está lançando uma prévia de um novo recurso chamado Governança BigQuery que fornecerá uma visão única e unificada para que os administradores de dados e profissionais lidem com descoberta, classificação, curadoria, qualidade, uso e compartilhamento. Inclui catalogação de dados automatizada (GA), bem como novos recursos experimentais, geração automática de metadados.

“Temos uma visão maior sobre a governança”, disse Ahmad na entrevista. “Muito do trabalho em torno de catálogos, metadados, semântica and so on. tem sido muito humano e guide historicamente.

O Google Cloud está fazendo uma grande aposta que a IA pode ajudar a automatizar grande parte desse trabalho de governança de dados em seu tecido de dados. “Mostramos demos da geração semântica automatizada em escala, catalogando sobre dados objetivos ou sobre não estruturados”, disse Ahmad. “Então, na verdade, vemos isso como uma coisa inteligente, viva e respiratória que é dinâmica e realmente alimentando todo o ecossistema de IA em torno dos agentes e qualquer tipo de capacidade agêntica”.

Como se isso não bastasse, o Google Cloud também está avançando com sua arquitetura Information Lakehouse. A empresa anunciou uma prévia das tabelas BigQuery para o Apache Iceberg, que dará aos clientes os benefícios do formato da tabela aberta, como permitir uma variedade de mecanismos de consulta para acessar a mesma tabela sem medo de conflitos ou contaminação por dados.

Desde que o Google Cloud trouxe Iceberg ao seu ambiente há seis meses, a adoção triplicou, disse Ahmad. De fato, ela acrescentou, o suporte do Google Cloud para o Iceberg é líder no mercado em termos de desempenho e capacidades.

Por exemplo, os clientes podem confiar no Google para governar suas mesas de iceberg, disse ela. Eles podem transmitir dados diretamente para o iceberg ou extrair informações a partir de dados de iceberg. O Google pode fazer backup de ambientes de berg de gelo dos clientes,

“De fato, muitos clientes, quando eles realmente olharam para o nosso serviço gerenciado pelo iceberg, eles estão dizendo: ‘Ei, você não está apenas apoiando. Você está acelerando o iceberg de uma maneira que isso é apenas um sonho twister realidade”, disse Ahmad. “Então, na verdade, a Deutsche Telekom no painel que fiz ontem com eles disse que o iceberg tem sido mágico para nós no Google Cloud porque realmente o estamos abraçando, porque achamos que é muito importante para os clientes essa escolha e flexibilidade que estão procurando”.

Itens relacionados:

Google Cloud Preps for Agentic AI Period com ‘Ironwood’ TPU, novos modelos e software program

O Google Cloud calcula seus bancos de dados no próximo 2025, com um olho na IA

Os bancos de dados do Google Revs Cloud, adiciona mais genai ao combine

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *