O problema de um trilhão de dólares – O’Reilly



O problema de um trilhão de dólares – O’Reilly

Think about o seguinte: você é um analista de dados desde o primeiro dia em uma empresa de SaaS de médio porte. Você tem o início de um information warehouse – alguns dados estruturados e utilizáveis ​​e muitos dados brutos com os quais ainda não tem certeza do que fazer. Mas esse não é o verdadeiro problema. O verdadeiro problema é que diferentes equipes estão fazendo suas próprias coisas: o Finance tem modelos do Energy BI carregados com conexões personalizadas do DAX e do Excel. As vendas usam o Tableau conectado ao information lake central. O advertising tem uma solução sob medida que você ainda não descobriu. Se você trabalha com dados há vários anos, essa cena provavelmente parece acquainted.

Em seguida, um diretor financeiro envia um e-mail: Por que o ARR aparece como US$ 250 milhões em meu painel quando o departamento de vendas acaba de informar US$ 275 milhões em sua ligação?

Não tem problema, você pensa. Você é um analista de dados; isso é o que você faz. Você começa a cavar. O que você encontra não é um simples erro de cálculo. Finanças e vendas usam dimensões de datas diferentes, portanto medem períodos de tempo diferentes. As suas definições do que é considerado “receita” não coincidem. As hierarquias de suas unidades de negócios são construídas em uma lógica completamente diferente: uma embutida em um modelo do Energy BI, a outra codificada em um cálculo do Tableau. Você rastreia o problema por meio de camadas de blocos de anotações personalizados, fórmulas de painel e pastas de trabalho do Excel e percebe que criar uma versão única da verdade que seja governável, estável e sustentável não será fácil. Talvez isso nem fosse possível sem a reconstrução de metade da infraestrutura de dados da empresa e a obtenção de um nível de conformidade por parte de outros usuários de dados que já seria um trabalho de tempo integral por si só.

É aqui que entra a camada semântica – o que VentureBeat chamou o “Problema de IA de US$ 1 trilhão.” Pense nele como um tradutor common para seus dados: é um lugar único onde você outline o que significam suas métricas, como são calculadas e quem pode acessá-las. A camada semântica é um software program que fica entre suas fontes de dados e suas ferramentas de análise, extraindo dados de onde quer que estejam, adicionando contexto comercial crítico (relacionamentos, cálculos, descrições) e servindo-os a qualquer ferramenta downstream em um formato consistente. O resultado? Acesso seguro e de alto desempenho que permite análises de autoatendimento genuinamente práticas.

Por que isso importa agora? Como veremos quando voltarmos ao problema do ARR, uma força impulsiona a urgência: a IA.

As ferramentas legadas de BI nunca foram desenvolvidas com a IA em mente, criando duas lacunas críticas. Primeiro, toda a lógica e os cálculos espalhados pelos modelos do Energy BI, pastas de trabalho do Tableau e planilhas do Excel não são acessíveis às ferramentas de IA de maneira significativa. Em segundo lugar, os dados em si não possuem o contexto de negócios que a IA precisa para usá-los com precisão. Um LLM que analisa tabelas brutas de banco de dados não sabe que “receita” significa coisas diferentes para finanças e vendas, ou por que certos registros devem ser excluídos dos cálculos de ARR.

A camada semântica resolve ambos os problemas. Isso torna os dados mais confiáveis ​​em ferramentas de BI tradicionais, como Tableau, Energy BI e Excel, ao mesmo tempo que fornece às ferramentas de IA o contexto de que precisam para funcionar com precisão. Inicial pesquisar mostra quase 100% de precisão em uma ampla variedade de consultas ao emparelhar uma camada semântica com um LLM, em comparação com um desempenho muito inferior ao conectar a IA diretamente a um information warehouse.

Então, como isso realmente funciona? Voltemos ao dilema ARR.

O problema central: múltiplas versões da verdade. Vendas tem uma definição de ARR; finanças tem outro. Os analistas apanhados no meio passam dias a investigar, apenas para acabarem com “depende” como resposta. A tomada de decisões é interrompida porque ninguém sabe em qual número confiar.

É aqui que a camada semântica entrega seu maior valor: uma fonte única para definir e armazenar métricas. Pense nele como um dicionário confiável para os dados da sua empresa. ARR obtém uma definição, um cálculo, uma fonte de verdade, tudo armazenado na camada semântica e acessível a todos que precisam.

Você pode estar pensando: “Não posso fazer isso em meu information warehouse ou ferramenta de BI?” Tecnicamente, sim. Mas aqui está o que diferencia as camadas semânticas: modularidade e contexto.

Depois de definir o ARR na camada semântica, ele se torna um objeto modular e reutilizável – qualquer ferramenta que se conecte a ele pode usar essa métrica: Tableau, Energy BI, Excel, seu novo chatbot de IA, o que for. A métrica carrega consigo seu contexto de negócios: o que significa, como é calculada, quem pode acessá-la e por que determinados registros são incluídos ou excluídos. Você não está reconstruindo a lógica de cada ferramenta; você está fazendo referência a uma definição única e governada.

Isso cria três vitórias imediatas:

  • Versão única da verdade: todos usam o mesmo cálculo de ARR, seja no setor financeiro ou de vendas, ou no modelo de aprendizado de máquina.
  • Linhagem sem esforço: você pode rastrear exatamente onde o ARR é usado em sua organização e ver o caminho de cálculo completo.
  • Gestão de mudanças que realmente funciona: quando seu CFO decidir no próximo trimestre que o ARR deve excluir clientes de avaliação, você atualiza a definição uma vez na camada semântica. Cada painel, relatório e ferramenta de IA que usa ARR obtém a atualização automaticamente. Não é preciso procurar dezenas de pastas de trabalho do Tableau, modelos do Energy BI e notebooks Python para encontrar todos os cálculos codificados.

O que nos leva à segunda função-chave de uma camada semântica: interoperabilidade.

Voltando ao nosso diretor financeiro e à questão do ARR. Com uma camada semântica implementada, eis o que muda. Ela abre o Excel e extrai o ARR diretamente da camada semântica: US$ 265 milhões. O vice-presidente de vendas abre seu painel do Tableau, conecta-se à mesma camada semântica e vê US$ 265 milhões. O novo chatbot de IA da sua empresa? Alguém pergunta: “Qual é o nosso ARR do terceiro trimestre?” e consulta a camada semântica: US$ 265 milhões. A mesma métrica, o mesmo cálculo, a mesma resposta, independentemente da ferramenta.

É isso que torna as camadas semânticas transformadoras. Eles ficam entre suas fontes de dados e todas as ferramentas que precisam consumir esses dados. Energy BI, Tableau, Excel, notebooks Python, LLMs, a camada semântica não importa. Você outline a métrica uma vez e cada ferramenta pode acessá-la por meio de APIs ou protocolos padrão. Não há necessidade de reconstruir a lógica no DAX para Energy BI, depois novamente na linguagem de cálculo do Tableau, depois novamente nas fórmulas do Excel e novamente para o seu chatbot de IA.

Antes das camadas semânticas, interoperabilidade significava compromisso. Você escolheria uma ferramenta como “fonte da verdade” e forçaria todos a usá-la, ou aceitaria que equipes diferentes tivessem números ligeiramente diferentes. Nenhuma das opções é escalável. Com uma camada semântica, sua equipe financeira mantém o Excel, sua equipe de vendas mantém o Tableau, seus cientistas de dados mantêm o Python e seus executivos podem fazer perguntas em inglês simples para um assistente de IA. Todos eles obtêm a mesma resposta porque todos baseiam-se na mesma definição governada.

De volta ao primeiro dia. Você ainda é analista de dados naquela empresa de SaaS, mas desta vez há uma camada semântica em vigor.

O diretor financeiro envia um e-mail, mas a pergunta é diferente: “Podemos atualizar o ARR para incluir nossa nova unidade de negócios?”

Sem uma camada semântica, essa solicitação significa dias de trabalho: atualização de modelos do Energy BI, painéis do Tableau, relatórios do Excel e integrações de IA, um por um. Coordenar com outros analistas para entender suas implementações. Testando tudo. Esperando que nada quebre.

Com uma camada semântica? Você faz login em seu software program de camada semântica e vê a definição de ARR: o cálculo, as tabelas de origem, todas as ferramentas que o utilizam. Você atualiza a lógica uma vez para incluir a nova unidade de negócios. Teste. Implante-o. Cada ferramenta downstream (Energy BI, Tableau, Excel, chatbot de IA) reflete instantaneamente a mudança.

O que costumava levar dias agora leva horas. O que antes exigia uma coordenação cuidadosa entre equipes agora acontece em um só lugar. O diretor financeiro recebe a resposta, Vendas vê o mesmo número e ninguém concilia planilhas às 17h de sexta-feira.

Isto é o que a análise pode ser: consistente, flexível e realmente autoatendida. A camada semântica não resolve apenas o problema de ARR – ela resolve o desafio basic de transformar dados em insights confiáveis. Uma definição, qualquer ferramenta, sempre.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *