A coleta concentra -se na prontidão de metadados com financiamento de US $ 10 milhões da Série A


A coleta concentra -se na prontidão de metadados com financiamento de US $ 10 milhões da Série A

(Imagem do Shutterstock AI)

Colete, a startup por trás do projeto de código aberto OpenMetadatalevantou US $ 10 milhões em financiamento da série A para enfrentar um desafio crescente nos dados corporativos: gerenciar metadados em uma pilha cada vez mais complexa.

Embora grande parte da atenção do setor esteja no treinamento de modelos de IA maiores, o CONLATE está focado na infraestrutura subjacente: a criação de ferramentas que ajudam as equipes de dados a governar, documentar e entender os sistemas em que esses modelos dependem.

Sua abordagem aponta para uma mudança mais ampla na maneira como as empresas estão repensando a prontidão dos dados, não apenas em termos de acesso e armazenamento, mas em estrutura, contexto e usabilidade. A coleta pretende ajudar as equipes a ir além da documentação fragmentada e dos processos manuais, oferecendo ferramentas que promovem governança mais consistente e insights mais rápidos nos departamentos.

A empresa posiciona sua plataforma como uma ponte entre os ambientes de dados desconectados de hoje e as necessidades operacionais dos sistemas de IA, com um foco specific no suporte a fluxos de trabalho no que chama de “velocidade agêntica”, que se refere ao ritmo no qual as decisões são cada vez mais tomadas por sistemas autônomos.

Na sua essência, o Product da Collate se concentra na redução da carga operacional que vem com o gerenciamento de metadados em dezenas de ferramentas. Em vez de confiar nos engenheiros para atualizar manualmente a documentação ou aplicar regras de acesso, a plataforma captura metadados automaticamente à medida que os pipelines executam e os esquemas evoluem. As políticas são armazenadas como código, portanto, os controles de acesso e as classificações de dados são verificados e aplicados antes da execução da consulta, seja de uma pessoa ou máquina.

A empresa diz que esse modelo ajuda as organizações a manter seus sistemas de dados mais confiáveis e transparentes sem diminuir o desenvolvimento. Tudo, desde rastreamento de linhagem até verificações de qualidade de dados, ocorre em segundo plano, dando às equipes uma visão em tempo actual sobre como os dados estão fluindo, quem o está usando e se está em conformidade com as regras internas.

O código aberto é central para esse esforço. A Collate é construída no OpenMetadata, um projeto de rápido crescimento com uma comunidade ativa e um amplo suporte de integração. Em vez de substituir a infraestrutura existente, a plataforma se conecta aos armazéns de dados, lagos, painéis e ferramentas de aprendizado de máquina existentes. Isso permite que as equipes enriquecem o que já usam com documentação em nível de campo, insights de uso e controles de governança.

A equipe por trás da Collate trabalha em sistemas de dados em larga escala há mais de uma década. Antes de lançar a empresa, os fundadores lideraram os esforços de infraestrutura no Yahoo, Hortonworks e Uber. Eles estavam envolvidos na construção de algumas das ferramentas de código aberto mais usadas no espaço, incluindo Hadoop, Kafka e Storm. Esse plano de fundo moldou como eles pensam sobre escala, flexibilidade e automação.

A Collate diz que essa experiência os ajudou a projetar uma plataforma que suporta o que eles chamam de um ciclo virtuoso. A ideia é simples. Metadados melhores ajuda as equipes a obter mais a IA, e a IA pode ser usada para melhorar os metadados em troca.

Esse loop de suggestions é uma parte central de como o colar vê seu papel. A empresa acredita que pode dar às equipes de dados um sistema que melhora com o tempo, sem depender de trabalhos manuais constantes.

“A Série A da Colle não poderia chegar em um momento mais crítico”, disse Suresh Srinivas, CEO da Collate. “Estamos no meio de uma corrida de IA, não apenas para preparar os dados para a IA, mas como a própria IA ajuda a preparar esses dados. Os vencedores serão organizações com equipes de dados altamente funcionais aumentadas pela IA.

“Nossa abordagem agêntica é alimentada exclusivamente pelo contexto de metadados mais rico do nosso gráfico de conhecimento e núcleo de código aberto”, continuou Srinibas. “Isso está mudando o jogo para nossos clientes corporativos, resolvendo a última milha de desafios de dados, ajudando -os a inovar mais rapidamente com a IA e os dados”.

(Nicoelnino/.shutterstock)

Essa mensagem está aterrissando com os clientes trabalhando para modernizar suas práticas de dados sem diminuir as operações. Na Fundcraft, uma plataforma de serviços financeiros, a Colate agora faz parte dos principais fluxos de trabalho de dados da empresa. “A Collate tem sido um divisor de águas para fortalecer nossa cultura de dados”, disse Victor Martin, CTO da Fundcraft. “O maior impacto que vimos é a velocidade de desenvolvimento acelerada e os tempos de ciclo aprimorados, já que nossas equipes agora podem se concentrar rapidamente no que mais importa.”

A Mango, a varejista world de moda, também está usando a plataforma em sua organização de dados. Segundo a Collate, a empresa viu 3 × integração mais rápida e um aumento de 20% na produtividade da equipe de dados. As melhorias na qualidade dos dados também contribuíram para um melhor desempenho nos modelos de preços orientados por ML da empresa. “A Collate provou ser a pedra angular de nossa estratégia de dados”, disse Jordi Orriols Torras, chefe de governança de dados da Mango.

Com o novo financiamento no native e uma crescente base de clientes, o Collate está voltando sua atenção para escalar a adoção e expandir a automação dentro da camada de metadados. Atualizações recentes incluem Alexo AutoPilotum conjunto crescente de agentes de IA que ajudam na documentação, camada de dados, monitoramento de qualidade e ingestão.

A plataforma agora também suporta Suporte de contexto de modelo de grau de qualidade corporativa (MCP)que permite que os metadados fluam em ambas as direções. Isso significa que os sistemas podem não apenas ler metadados, mas também escrever mudanças de volta, fechando o loop entre perception e ação.

Itens relacionados

Cloudera aprimora o catálogo de dados e gerenciamento de metadados com aquisição de polopai

Metadados ativos – o novo herói desconhecido de projetos de IA generativos bem -sucedidos

Knowledge Warehousing para a vitória (ai)

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *