Conversei com Teresa Tung para aprender mais sobre a natureza mutável dos dados e seu valor para uma estratégia de IA.
O sucesso da IA depende de múltiplos fatores, mas a chave para a inovação é a qualidade e a acessibilidade dos dados proprietários de uma organização.
Sentei-me com Teresa Tung para discutir as oportunidades dos dados proprietários e por que é tão importante criar valor com IA. Tung é um pesquisador cujo trabalho abrange tecnologias inovadoras de nuvem, incluindo a convergência de IA, dados e capacidade computacional. Ela é uma inventora prolífica, detentora de mais de 225 patentes e aplicações. E como líder international de capacidade de dados da Accenture, Tung lidera a visão e a estratégia que garantem que a empresa esteja preparada para os avanços de dados em constante mudança.
Discutimos uma série de tópicos, incluindo os seis insights de Teresa.
Por fim, concluímos com a Teresa Conselhos para líderes empresariais que usam ou estão interessados em IA
Susan Etlinger (SE): Em seu artigo recente, “Os novos dados essenciais”, você expôs a noção de que dados proprietários são uma vantagem competitiva de uma organização. Você poderia elaborar?
TEresa Tunguento (TT): Até agora, os dados foram tratados como um projeto. Quando novos insights são necessários, pode levar meses para obter os dados, acessá-los, analisá-los e publicá-los. Se esses insights gerarem novas questões, esse processo deverá ser repetido. E se a equipe de dados tiver limitações de largura de banda ou restrições orçamentárias, será necessário ainda mais tempo.
“Em vez de tratá-los como um projeto – uma reflexão tardia – os dados proprietários devem ser tratados como uma vantagem competitiva central.”
Os modelos generativos de IA são pré-treinados em um corpus existente de dados em escala da Web, o que facilita o início desde o primeiro dia. Mas eles não conhecem seu negócio, pessoas, produtos ou processos e, sem esses dados proprietários, os modelos fornecerão os mesmos resultados que seus concorrentes.
As empresas investem todos os dias em produtos baseados unicamente na sua oportunidade. Conhecemos a oportunidade dos dados e da IA – melhor tomada de decisões, redução de riscos, novos caminhos para a monetização – então não deveríamos pensar em investir em dados da mesma forma?
SE: Como grande parte do conhecimento proprietário de uma empresa está contido em dados não estruturados, você pode falar sobre sua importância?
TT: Sim, a maioria das empresas funciona com base em dados estruturados – dados em formato tabular. Mas a maioria dos dados não é estruturada. De mensagens de voz a imagens e vídeos, os dados não estruturados são de alta fidelidade. Ele captura nuances. Aqui está um exemplo: se um cliente ligar para o suporte ao cliente e deixar uma avaliação do produto, esses dados poderão ser extraídos por seus componentes e transferidos para uma tabela. Mas sem informações diferenciadas, como o tom de voz do cliente ou até mesmo palavrões, não há uma imagem completa e precisa dessa transação.
Historicamente, tem sido difícil trabalhar com dados não estruturados, mas a IA generativa é excelente nisso. Na verdade precisa rico contexto de dados não estruturados a serem treinados. É muito importante na period da IA generativa.
SE: Ouvimos muito sobre dados sintéticos atualmente. Como você pensa sobre isso?
TT: Dados sintéticos são necessários para preencher lacunas de dados. Ele permite que as empresas explorem vários cenários sem os grandes custos ou riscos associados à coleta de dados reais.
As agências de publicidade podem veicular diversas imagens de campanha para prever as reações do público, por exemplo. Para os fabricantes de automóveis que treinam carros autônomos, colocar os carros em situações perigosas não é uma opção. Os dados sintéticos ensinam à IA – e, portanto, ao carro – o que fazer em situações extremas, incluindo chuva forte ou uma travessia surpresa de pedestres.
Depois, há a ideia de destilação do conhecimento. Se você estiver usando a técnica para criar dados com um modelo de linguagem maior – digamos, um modelo de 13 bilhões de parâmetros – esses dados podem ser usados para ajustar um modelo menor, tornando o modelo menor mais eficiente, econômico ou implantável em um dispositivo menor.
A IA está com tanta fome. Ele precisa de conjuntos de dados representativos de bons cenários, condições extremas e tudo mais para ser relevante. Esse é o potencial dos dados sintéticos.
SE: Dados não estruturados geralmente são dados gerados por seres humanos, por isso geralmente são específicos de cada caso. Você pode compartilhar mais sobre por que o contexto é tão importante?
TT: O contexto é elementary. Podemos capturá-lo em uma camada semântica ou em um gráfico de conhecimento de domínio. É o significado por trás dos dados.
Pense em cada especialista de domínio em um native de trabalho. Se uma empresa executa um relatório de dados de clientes de 360 graus que abrange domínios ou até mesmo sistemas, um especialista de domínio irá analisá-lo para clientes em potencial, outro para atendimento e suporte ao cliente e outro para faturamento do cliente. Cada um desses especialistas deseja ver todos os dados, mas para seus próprios fins. Conhecer as tendências no suporte ao cliente pode influenciar a abordagem de uma campanha de advertising, por exemplo.
As palavras também costumam ter significados diferentes. Se eu disser “está quente para o verão”, o contexto determinará se eu estava insinuando temperatura ou tendência.
A IA generativa ajuda a trazer as informações certas, no momento certo, para o especialista no domínio certo.
SE: Dado o ritmo e o poder das tecnologias inteligentes, dos dados e da IA governança e segurança são os mais lembrados. Que tendências você está percebendo ou prevendo?
TT: Novas oportunidades trazem novos riscos. A IA generativa é tão fácil de usar que torna todos trabalhadores de dados. Essa é a oportunidade e o risco.
Por ser fácil, a IA generativa incorporada em aplicativos pode levar ao vazamento de dados não intencional. Por esse motivo, é elementary pensar em todas as implicações dos aplicativos generativos de IA para reduzir o risco de revelarem inadvertidamente informações confidenciais.
Precisamos repensar a governança e a segurança dos dados. Todos em uma organização precisam estar cientes dos riscos e do que estão fazendo. Também precisamos pensar em novas ferramentas, como marca d’água e computação confidencial, onde algoritmos de IA generativos possam ser executados em um enclave seguro.
SE: Você disse que a IA generativa pode impulsionar a prontidão dos dados. Você pode explicar isso?
TT: Claro. IA generativa precisa seus dados, mas também pode ajuda seus dados.
Ao aplicá-la aos seus dados e processos existentes, a IA generativa pode construir uma cadeia de fornecimento de dados mais dinâmica, desde a captura e curadoria até o consumo. Ele pode classificar e marcar metadados e gerar documentos de design e scripts de implantação.
Também pode apoiar a engenharia reversa de um sistema existente antes da migração e modernização. É comum pensar que os dados não podem ser usados porque estão em um sistema antigo que ainda não está habilitado para nuvem. Mas a IA generativa pode impulsionar o processo; pode ajudá-lo a compreender os dados, mapear relacionamentos entre dados e conceitos e até mesmo escrever o programa, incluindo testes e documentação.
A IA generativa muda o que fazemos com os dados. Ele pode simplificar e acelerar o processo, substituindo painéis únicos por interatividade, como uma interface de chat. Deveríamos gastar menos tempo organizando dados em formatos estruturados, fazendo mais com dados não estruturados.
SE: Por fim, que conselho você daria aos líderes empresariais e de tecnologia que desejam construir vantagem competitiva com dados?
TT: Comece agora ou fique para trás.
Acordamos para o potencial que a IA pode trazer, mas seu potencial só pode ser alcançado com os dados proprietários da sua organização. Sem essa informação, seu resultado será igual ao de todos os outros ou, pior, impreciso.
Encorajo as organizações a se concentrarem em preparar seu núcleo digital para IA. UM núcleo digital moderno é a capacidade da tecnologia para impulsionar dados na reinvenção liderada pela IA. É a combinação de infraestrutura em nuvem, recursos de dados e IA, além de aplicativos e plataformas da sua organização, com segurança projetada em todos os níveis. Sua base de dados — como parte de seu núcleo digital — é essencial para armazenar, limpar e proteger seus dados, garantindo que sejam de alta qualidade, governados e prontos para IA.
Sem um núcleo digital forte, você não tem os proverbiais olhos para ver, o cérebro para pensar ou as mãos para agir.
Seus dados são seu diferencial competitivo na period da IA generativa.
Teresa Tung, Ph.D. é líder international de capacidade de dados na Accenture. Inventor prolífico com mais de 225 patentes, Tung é especialista em atender às necessidades empresariais com tecnologias inovadoras.
Saiba mais sobre como preparar seus dados para IA:
- Aprenda como desenvolver uma estratégia de dados inteligente que perdure na period da IA com o e-book para obtain.
- Assista a este webinar sob demanda ouvir Susan e Teresa se aprofundarem em como extrair o máximo valor dos dados para se diferenciar da concorrência. Aprenda sobre novas maneiras de definir dados que ajudarão a impulsionar sua estratégia de IA, a importância de preparar seu “núcleo digital” antes da IA e como repensar a governança e a segurança de dados na period da IA.
Visita Informações de inovação do Azure para obter mais perspectiva executiva e orientação sobre como transformar seus negócios com a nuvem.