O que o Collibra ganha de Deasy Labs na corrida para governar os dados da IA


O que o Collibra ganha de Deasy Labs na corrida para governar os dados da IA

(Imagem do Shutterstock AI)

Dados não estruturados compõem Mais de 90% da propriedade de dados corporativosmas a maior parte é inexplorada. Ele está em PDFs, contratos, emails e transcrições de reunião, travados em formatos que as ferramentas de dados tradicionais não podem processar ou governar facilmente. Durante anos, as empresas se concentraram em gerenciar o mundo limpo e tabular dos dados estruturados, deixando as coisas bagunçadas e não marcadas no escuro.

A Collibra diz que planeja mudar isso com a aquisição da Deasy Labs, uma startup focada em automatizar a classificação e o enriquecimento do conteúdo não estruturado. De acordo com a Collibra, o acordo permitirá que ele estenda sua plataforma de governança além das fontes de dados estruturadas, permitindo que as organizações tragam documentos, transcrições e e -mails para a mesma estrutura de supervisão usada para bancos de dados e planilhas.

A aquisição ocorre à medida que mais empresas vão além das experiências de IA e começam a incorporar grandes modelos de idiomas (LLMS) em fluxos de trabalho diários. Esses sistemas são tão bons quanto os dados por trás deles, e é aí que muitas organizações estão atingindo uma parede. Os registros estruturados podem mostrar o que aconteceu, mas raramente explicam o porquê. O contexto é frequentemente enterrado em documentos internos que as plataformas de dados tradicionais não foram construídas para lidar.

Essa é a lacuna Collibra diz que espera fechar. “À medida que as organizações escalam o uso da IA, a capacidade de desbloquear o valor dos dados não estruturados se torna crítica”, disse Felix van de Maele, co-fundador e CEO da empresa. “A Deasy Labs nos oferece a capacidade de marcar, filtrar e enriquecer esses dados escuros em escala – automaticamente transformando arquivos não estruturados em ativos de dados estruturados, significativos e confiáveis, prontos para a IA. Este é um salto adiante para o setor e para a visão de Collibra de dados unificados e governança de IA.”

Essa missão agora pega a Deasy Labs, uma empresa jovem construída especificamente para resolver esse problema. A startup foi fundada em 2023 por engenheiros e leads de produtos que haviam trabalhado na qualidade dos dados e nos sistemas de IA na McKinsey, Quantumblack e Amazon. Apoiado por Y Combinador e uma rodada de sementes de US $ 3 milhões Do Geral Catalyst e RTP World, a equipe se concentrou em uma meta: ajudar as empresas a desbloquear o valor de conteúdo não estruturado sem depender de processos manuais caros e dispendiosos.

Sua plataforma usa uma mistura de aprendizado de máquina e LLMs para digitalizar documentos, transcrições e relatórios e gerar automaticamente metadados – tudo a partir de versões de documentos e sinalizadores de acesso a resumos e tags de tópicos. Ele foi projetado para se encaixar nos pipelines modernos de IA, incluindo sistemas de geração de recuperação de recuperação (RAG), dando às empresas uma maneira de tornar os dados não estruturados mais pesquisáveis, mais seguros e utilizáveis sem reconstruir sua pilha.

“Começamos Deasy para ajudar as organizações a entender o quantity maciço de conteúdo não estruturado com o qual lidam todos os dias”, disse Reece Griffiths, co-fundador da empresa. “Agora, ao ingressar na Collibra, conseguimos escalar esse trabalho mais rápido – e trazê -lo para uma plataforma que já é confiável por algumas das equipes de dados mais avançadas do mundo”.

Para os usuários do Collibra, o benefício imediato é a clareza. As equipes que antes tiveram que confiar em ferramentas externas ou processos manuais tediosos para gerenciar documentos agora podem superfície de estrutura e significado diretamente na plataforma Collibra. Isso significa integração mais rápida de novos dados, melhor visibilidade do que é armazenado onde e menos pontos cegos ao criar fluxos de trabalho da IA.

A Collibra planeja trazer gradualmente a tecnologia de Deasy em sua plataforma, começando com recursos automatizados de marcação e classificação para grandes volumes de documentos. Em vez de exigir que as equipes rotulem arquivos manualmente ou confiassem em ferramentas externas, os usuários poderão surgir o significado e o contexto diretamente dentro do Collibra. Que os metadados possam ser usados para aplicar regras, rastrear o uso ou as ferramentas de pesquisa e descoberta, assim como já fazem com dados estruturados.

(Jirsak/Shutterstock)

Em termos práticos, isso dá a Collibra uma posição mais forte na maneira como os projetos de IA são gerenciados desde o início. Em vez de tratar a governança como algo que acontece após o fato, a empresa está se posicionando como parte do processo de preparação de dados, certificando-se de que o que flui para o LLMS é bem organizado e confiável. É uma mudança de ser apenas um sistema de registro para se tornar uma parte ativa de como as decisões de IA são tomadas.

Essa visão mais ampla está obtendo validação de analistas do setor. “Unificar a governança em todos os dados estruturados e não estruturados em ativos de dados regulados e confiáveis não são mais opcionais”, disse Sanjeev Mohan, diretor da Sanjmo e ex -analista do Gartner.

“A automação orientada a metadados é essencial para desbloquear o valor oculto em documentos, e-mails e transcrições, pois traz visibilidade e controle necessários para as partes menos governadas da propriedade de dados. Ao trazer dados não estruturados para a dobra de governança unificada, a Collibra está dando um passo crítico para operacionalizar a IA em escala com confiança”

Olhando para o futuro, a Collibra diz que se concentrará em adicionar mais automação para ajudar os clientes a gerenciar dados e IA com mais facilidade. Especialistas do setor veem potencial para ainda mais. Mohan observou que a tecnologia de Deasy poderia ajudar a criar ferramentas de IA adaptadas a indústrias específicas, seja analisando registros bancários ou extraindo insights das transcrições de name middle.

Itens relacionados

Espiando o abismo de dados não estruturado

Tocando nos dados não estruturados Goldmine for Enterprise em 2025

Anomalo expande a plataforma de qualidade de dados para monitoramento de dados não estruturado aprimorado

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *