Como construir gêmeos digitais para eficiência operacional


Em todas as operações de manufatura e industriais, as organizações estão adotando Gêmeos Digitais para melhorar a eficiência, prever falhas de equipamentos e otimizar a produção em tempo actual.

Este novo Acelerador de Soluções Gêmeas Digitais fornece uma estrutura completa para construir, visualizar e analisar esses sistemas usando IA e análises em tempo actual, ajudando as equipes a reduzir o tempo de inatividade, melhorar a qualidade do produto e conduzir tomadas de decisão mais inteligentes. Você pode implantar soluções escaláveis ​​Digital Twin em Databricks usando Ingestão Zerobusparte de Conexão Lakeflowum serviço gerenciado que envia dados de eventos diretamente para o lakehouse, você pode implantar sua própria solução Digital Twin em escala com Databricks.

O que são gêmeos digitais?

Na nossa implementação, um Digital Twin combina dois ingredientes principais:

  1. Uma representação digital de um ativo físico, sistema ou processo
  2. Dados contextuais em tempo actual de sensores e outras fontes

Com esta réplica digital ao vivo, podemos monitorar equipamentos físicos ou processos abstratos em tempo actual, simular e validar alterações e realizar manutenção preditiva avançada sem alterar o próprio sistema.

No contexto da indústria transformadora, os Gémeos Digitais são fundamentais para impulsionar a revolução da Indústria 4.0. Ao integrar IoT, IA e análises em tempo actual, eles não apenas reduzem o tempo de inatividade e aumentam a produtividade, mas também permitem segurança contínua.

Esses conceitos também se mostram muito promissores em outras áreas, como modelagem de dinâmica organizacional e compreender os processos que orientam a tomada de decisões. Neste weblog, vamos nos concentrar na aplicação de manufatura de Digital Twins.

Cenário de exemplo: Fabricação de rolamentos de esferas

Nosso cenário de exemplo é um processo simplificado de fabricação de rolamentos de esferas.

Rolamentos de esferas são componentes mecânicos que minimizam o atrito entre peças móveis por meio de esferas de aço ou cerâmica posicionadas entre dois anéis (externo e interno). Eles são essenciais para a operação eficiente de motores e máquinas industriais e, portanto, são fundamentais para grande parte da tecnologia que usamos todos os dias.

O processo de fabricação (veja o vídeo) começa moldando e tratando termicamente os anéis internos e externos, moldando-os e polindo-os para maior resistência e precisão e montando-os com um retentor que mantém espaçamento uniforme. Cada etapa, usinagem, tratamento térmico e montagem, conta com equipamentos ajustados com precisão e monitoramento contínuo para atender a rígidos padrões de qualidade.

Em indústrias de alto quantity e baixas margens, como a fabricação de rolamentos de esferas, é essencial otimizar continuamente o desempenho da máquina, prever as necessidades de manutenção e garantir uma qualidade consistente. Os Gêmeos Digitais, alimentados por dados de sensores em tempo actual de diversas máquinas e linhas de produção, são um facilitador essencial para esses objetivos.

Como construir gêmeos digitais para eficiência operacional

Este Digital Twin irá capturar os detalhes de todas essas etapas de uma forma estruturada, porém flexível.

Uma solução Databricks ponta a ponta

O Digital Twin tem dois componentes principais:

  1. O modelo gêmeoque especifica as entidades no sistema e como elas se relacionam entre si
  2. O gráfico gêmeoque hidrata o modelo adicionando dados em tempo actual relacionados às entidades (por exemplo, dados de sensores ou previsões relevantes de modelos de ML)

O modelo gêmeo é criado usando RDFum padrão aberto e amplamente adotado para definir ontologias e gráficos de conhecimento. Fornecemos uma seleção de predicados integrados que você pode estender para descrever os relacionamentos e dependências entre diferentes partes do sistema. Cada entidade no modelo gêmeo tem um IRIum identificador com namespace que identifica exclusivamente a entidade e a conecta aos dados de telemetria no gráfico gêmeo.

Captura de tela do acelerador de soluções Digital Twins
Acelerador de soluções de gêmeos digitais

Embora este Answer Accelerator se concentre em um cenário de fabricação específico, nossa abordagem é flexível e pode modelar praticamente qualquer tipo de sistema. Os principais blocos de construção são representados no diagrama abaixo:

  1. Ingestão de dados
  2. Mapeamento de dados
  3. Serviço de dados
  4. Aplicativo gêmeo digital

Diagrama arquitetônico do Digital Twins Solution Accelerator
Diagrama arquitetônico do Digital Twins Answer Accelerator

As seções subsequentes fornecerão uma explicação detalhada dessas etapas.

Etapa 1: ingestão de dados

Para preencher o gráfico duplo com dados em tempo actual, começamos ingerindo dados por meio de Ingestão Zerobusuma abordagem inovadora para enviar dados de eventos diretamente para o lakehouse sem um barramento de mensagens de coletor único como o Kafka. Zerobus Ingest fornece gravações diretas de alto rendimento com baixa latência. Ele oferece suporte à ingestão registro por registro em qualquer escala e opera em um ambiente sem servidor.

Antes e depois de implementar a API Zerobus Ingest em nossa arquitetura.

Isso garante um fluxo eficiente e escalável de dados de fabricação, suportando experimentação, análises robustas e implantação em operações em tempo actual antes de migrar para {hardware} conectado.

Em nosso cenário, os dados de telemetria são gerados continuamente para simular a ingestão de dados dos sensores da linha de produção. Os dados brutos são então armazenados como uma tabela no lakehouse no formato Delta usando Zerobus Ingest.

Etapa 2: mapeamento de dados

Depois de colocarmos os dados brutos do sensor na camada de bronze, ainda teremos duas tarefas a concluir antes que estejam prontos para uso no gráfico duplo.

Primeiro, precisamos garantir que as medidas sejam rotuladas com o IRI da entidade que representam no modelo gêmeo. Em nosso exemplo, usamos o identificador da máquina e adicionamos um namespace para formar o IRI, mas qualquer opção é válida desde que esteja alinhada com os IRIs no modelo gêmeo.

Em seguida, precisamos transformar as colunas dos dados tabulares ou chaves dos dados aninhados na estrutura tripla common usada pelo RDF. Uma descrição completa do RDF está fora do escopo deste weblog, portanto os leitores interessados ​​devem conferir o cartilha oficial para uma introdução abrangente. Nesse caso, o resultado possui três componentes: o IRI da entidade (sujeito), a coluna a que se refere (predicado) e o valor actual (objeto).

Componentes RDF

Para ambas as tarefas, podemos usar o faísca-r2r biblioteca, uma DSL simples para descrever o processo de mapeamento no Spark que segue a abordagem usada no R2RML padrão. Graças ao modo Spark Actual-Time, o resultado é um pipeline alimentado por Pipelines declarativos Lakeflow Spark que pode lidar com grandes volumes de dados de maneira econômica e com baixa latência.

Exemplo de mapeamento relacional ao RDF

Mapeamento de um formato baseado em linha para um triplo RDF com carimbo de information/hora. Nota: o triplo resultante é uma estrutura consistente independente da estrutura da tabela de origem.

Crucialmente, também adicionamos um carimbo de information/hora a cada triplo com base em quando a medição foi realizada. Isso nos permite visualizar o estado do sistema em um determinado momento, permitindo assim uma ampla variedade de análises que examinam o estado do sistema ao longo do tempo.

Etapa 3: sincronização de dados

Para fornecer acesso de baixa latência aos dados do sensor no gráfico gêmeo digital, usamos o Recurso de tabela sincronizada do Lakebase. Lakebase é um mecanismo Postgres OLTP totalmente gerenciado que faz parte da plataforma Databricks e projetado para integração perfeita com o lakehouse. Usando tabelas sincronizadas, mantemos automaticamente uma cópia somente leitura do Postgres sincronizada com os dados mais recentes em uma tabela Delta Lake do Unity Catalog. Este fluxo é normalmente chamado de ETL reversoque é o processo de tornar acionáveis ​​os dados curados do lakehouse, disponibilizando-os para aplicativos, painéis e outros sistemas.

Fluxo de dados entre aplicativos Lakebase e Databricks

Depois que os dados são armazenados no Lakebase, os aplicativos podem executar consultas de baixa latência em leituras de sensores ao vivo, enquanto as versões históricas permanecem armazenadas como registros com carimbo de information e hora no formato Delta Lake para análises ou auditorias.

Ao combinar Lakebase com o formato Delta Lake, obtemos desempenho em tempo actual e histórico econômico, sem o incômodo de ETL complexo ou manutenção de bancos de dados duplicados.

Etapa 4: Aplicativo Digital Twin

Para tornar o gêmeo digital acessível para as operações diárias, construímos um aplicativo usando Aplicativos de blocos de dados que permite a criação, visualização e análise completas e completas de modelos de gêmeos digitais. O backend do aplicativo é desenvolvido em Python, enquanto o frontend é implementado usando React.js. Graças aos recursos de implantação sem servidor do Databricks Apps, o processo de lançamento foi fácil. O fluxo de trabalho começa com a definição do modelo, seguido pela visualização de seu estado e pela execução de consultas avançadas para identificar a propagação de falhas no sistema.

Criando o modelo de gêmeo digital com RDF

O aplicativo inclui um editor visible de modelo RDF para construir e editar modelos RDF com facilidade. Os modelos podem ser salvos, recuperados e gerenciados para oferecer suporte a vários gêmeos digitais.

Captura de tela do aplicativo Digital Twins: RDF

Aplicação de gêmeos digitais: RDF

Visualização de gêmeos digitais

Um Digital Twin Visualizer dedicado permite que os usuários explorem o sistema que seu gêmeo digital representa. Ele permite a inspeção dos estados da linha de montagem em momentos diferentes para identificar problemas ou analisar como as falhas se propagam.

Captura de tela da aplicação Digital Twins: Linha de produção do anel externo

Aplicação de gêmeos digitais: linha de produção do anel externo

Análise e Consulta

Além disso, oferecemos aos usuários a opção de consultar o gráfico duplo com o poderoso SPARQL linguagem, um padrão aberto para consulta de gráficos de conhecimento. Isso permite análises advert hoc na UI, mas também torna os dados acessíveis a outras ferramentas que queiram trabalhar com o gráfico duplo para fornecer simulações ou outras análises. Isso contrasta com outras ferramentas que geralmente oferecem apenas uma linguagem de consulta proprietária limitada ou uma extensão incompleta do SQL para acessar o gráfico duplo.

Desenvolvimento Adicional

Após a implantação inicial, o acelerador pode servir como base para aplicações Digital Twin mais avançadas:

O Digital Twin Answer Accelerator é altamente adaptável, permitindo a personalização em uma ampla variedade de cenários industriais e analíticos. O diagrama abaixo ilustra alguns exemplos onde esta estrutura pode ser estendida e aplicada.

Mapa mental de aplicativos Digital Twin em casos de uso de fabricação

Esteja você otimizando sistemas de fabricação, monitorando ativos industriais ou desenvolvendo análises em tempo actual para dispositivos conectados, este acelerador fornece um ponto de partida robusto para experimentação e escala.

Experimente o acelerador de soluções Digital Twins

Pronto para começar? Baixe o acelerador de solução Databricks para gêmeos digitais na fabricação. Siga as instruções passo a passo fornecidas para criar seus próprios gêmeos digitais de ponta a ponta, escalonáveis ​​e de alto desempenho.

Você está interessado em construir seu próprio Digital Twin e gostaria de saber mais? Entre em contato com seu representante de conta do Databricks para que possamos ajudá-lo a adaptar esta solução às suas necessidades exatas.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *