Danielle Belgrave sobre IA generativa em farmacêuticos e medicina – O’Reilly


Danielle Belgrave sobre IA generativa em farmacêuticos e medicina – O’Reilly

IA generativa no mundo actual

IA generativa no mundo actual: Danielle Belgrave sobre IA generativa em farmacêutica e medicina



Carregando





/

Junte -se a Danielle Belgrave e Ben Lorica para uma discussão sobre IA em saúde. Danielle é vice -presidente de IA e aprendizado de máquina na GSK (anteriormente GlaxoSmithKline). Ela e Ben discutem o uso de IA e aprendizado de máquina para obter melhores diagnósticos que refletem as diferenças entre os pacientes. Ouça para aprender sobre os desafios de trabalhar com dados de saúde – um campo onde há muitos dados e muito pouco, e onde as alucinações têm sérias conseqüências. E se você estiver empolgado com a assistência médica, também descobrirá como os desenvolvedores de IA podem entrar em campo.

Confira Outros episódios deste podcast na plataforma de aprendizado de O’Reilly.

Sobre o IA generativa no mundo actual podcast: Em 2023, o Chatgpt colocou a IA na agenda de todos. Em 2025, o desafio será transformar essas agendas em realidade. Em IA generativa no mundo actualBen Lorica entrevista líderes que estão construindo com a IA. Aprenda com a experiência deles para ajudar a colocar a IA para trabalhar em sua empresa.

Pontos de interesse

  • 0:00: Introdução a Danielle Belgrave, vice -presidente de IA e aprendizado de máquina na GSK. Danielle é nossa primeira convidada representando a Large Pharma. Será interessante ver como as pessoas na Pharma estão usando tecnologias de IA.
  • 0:49: Meu interesse em aprendizado de máquina para a saúde começou há 15 anos. Meu doutorado period entender a heterogeneidade do paciente em doenças relacionadas à asma. Isso foi antes dos registros eletrônicos de saúde. Ao alavancar diferentes tipos de dados, dados genômicos e biomarcadores de crianças e vendo como elas desenvolveram asma e doenças alérgicas, desenvolvi estruturas de modelagem causal e modelos gráficos para ver se poderíamos identificar quem responderia a quais tratamentos. Isso foi bastante novo na época. Identificamos cinco tipos diferentes de asma. Se conseguirmos entender a heterogeneidade na asma, um desafio maior é entender a heterogeneidade na saúde psychological. A idéia estava tentando entender a heterogeneidade ao longo do tempo em pacientes com ansiedade.
  • 4:12: Quando fui para o DeepMind, trabalhei no portfólio de saúde. Fiquei muito curioso sobre como entender coisas como Mimic, que tinham registros eletrônicos de saúde e dados de imagem. A idéia period aproveitar as ferramentas como o aprendizado ativo para minimizar a quantidade de dados que você recebe dos pacientes. Também publicamos trabalhos sobre como melhorar a diversidade de conjuntos de dados.
  • 5:19: Quando cheguei à GSK, foi uma oportunidade emocionante de fazer tecnologia e saúde. A saúde é uma das paisagens mais desafiadoras em que podemos trabalhar. A biologia humana é muito complicada. Há tanta variação aleatória. Compreender a biologia, a genômica, a progressão da doença e ter um impacto em como os medicamentos são dados aos pacientes é incrível.
  • 6:15: Meu papel está liderando a IA/ml para o desenvolvimento clínico. Como podemos entender a heterogeneidade nos pacientes para otimizar o recrutamento de ensaios clínicos e garantir que os pacientes certos tenham o tratamento certo?
  • 6:56: Onde a IA cria mais valor em GSK hoje? Isso pode ser a IA tradicional e a IA generativa.
  • 7:23: Eu uso tudo de forma intercambiável, embora haja distinções. O verdadeiro importante é focar no problema que estamos tentando resolver e focar nos dados. Como geramos dados significativos? Como pensamos em implantação?
  • 8:07: E todas as perguntas e respostas e a equipe vermelha.
  • 8:20: É difícil colocar meu dedo no caso de uso mais impactante. Quando penso nos problemas que me preocupo, penso em oncologia, doença pulmonar, hepatite – esses são problemas muito impactantes, e eles são problemas em que trabalhamos ativamente. Se eu destacar uma coisa, é a interação entre quando estamos analisando dados de sequenciamento de genoma inteiro e analisar dados moleculares e tentar traduzir isso em patologia computacional. Ao analisar esses tipos de dados e entender a heterogeneidade nesse nível, obtemos uma representação biológica mais profunda de diferentes subgrupos e entendemos mecanismos de ação para resposta aos medicamentos.
  • 9:35: Não é escalável fazer isso para os indivíduos, por isso estou interessado em como traduzirmos em diferentes tipos ou modalidades de dados. Tomando uma biópsia – é onde estamos entrando no campo da inteligência synthetic. Como traduzimos entre genômica e olhamos para uma amostra de tecido?
  • 10:25: Se pensarmos no impacto do pipeline clínico, o segundo exemplo seria usar a IA generativa para descobrir medicamentos, identificação de alvo. Esses geralmente estão em experimentos de silico. Temos modelos de perturbação. Podemos perturbar as células? Podemos criar incorporações que nos darão representações da resposta do paciente?
  • 11:13: Estamos gerando dados em escala. Queremos identificar metas mais rapidamente para experimentação, classificando a probabilidade de sucesso.
  • 11:36: Você mencionou muito a multimodalidade. Isso inclui visão computacional, imagens. Que outras modalidades?
  • 11:53: Dados de texto, registros de saúde, respostas ao longo do tempo, biomarcadores de sangue, dados de RNA-seq. A quantidade de dados gerados é bastante incrível. Todas essas são modalidades de dados diferentes com diferentes estruturas, diferentes maneiras de corrigir o ruído, os efeitos do lote e a compreensão dos sistemas humanos.
  • 12:51: Quando você encontra seus ex -colegas da DeepMind, que tipos de solicitações você lhes dá?
  • 13:14: Esqueça os chatbots. Muito do trabalho que está acontecendo em grandes modelos de idiomas – pensamento de LLMs como ferramentas de produtividade que podem ajudar. Mas também houve muita exploração em torno da construção de estruturas maiores, onde podemos fazer inferência. O desafio é em torno dos dados. Os dados de saúde são muito escassos. Esse é um dos desafios. Como ajustamos os modelos para soluções específicas ou áreas de doenças específicas ou modalidades específicas de dados? Houve muito trabalho em modelos de fundação para patologia computacional ou fundações para a estrutura celular única. Se eu tivesse um desejo, ele estaria olhando para pequenos dados e como você tem representações robustas de pacientes quando possui pequenos conjuntos de dados? Estamos gerando grandes quantidades de dados sobre um pequeno número de pacientes. Este é um grande desafio metodológico. Essa é a estrela do norte.
  • 15:12: Quando você descreve o uso desses modelos de fundação para gerar dados sintéticos, quais corrimãos você coloca para evitar a alucinação?
  • 15:30: Tivemos uma equipe de IA responsável desde 2019. É importante pensar naqueles corrimãos, especialmente na saúde, onde as recompensas são altas, mas também são as apostas. Uma das coisas que a equipe implementou são os princípios da IA, mas também usamos cartões de modelo. Temos os formuladores de políticas que entendem as consequências do trabalho; Também temos equipes de engenharia. Há uma equipe que analisa precisamente o entendimento de alucinações com o modelo de idioma que construímos internamente, chamado Jules.1 Há muito trabalho analisando as métricas de alucinação e precisão para esses modelos. Também colaboramos em coisas como interpretabilidade e construção de oleodutos reutilizáveis ​​para a IA responsável. Como podemos identificar os pontos cegos em nossa análise?
  • 17:42: No ano passado, muitas pessoas começaram a fazer ajustes finos, trapos e graphrag; Presumo que você faça tudo isso?
  • 18:05: RAG acontece muito na equipe de IA responsável. Nós construímos um gráfico de conhecimento. Esse foi um dos primeiros gráficos de conhecimento – antes de eu entrar. É mantido por outra equipe no momento. Temos uma equipe de plataformas que lida com toda a escala e implantação em toda a empresa. Ferramentas como o Data Graph não são apenas ai/ml. Jules também – é mantido fora da IA/ML. É emocionante quando você vê essas soluções.
  • 20:02: O termo buzzy deste ano é agente e até multi-agentes. Qual é o estado da IA ​​agêntica dentro da GSK?
  • 20:18: Estamos trabalhando nisso há um bom tempo, especialmente no contexto de grandes modelos de idiomas. Ele nos permite aproveitar muitos dos dados que temos internamente, como dados clínicos. Os agentes são construídos em torno desses dados de dados e as diferentes modalidades das perguntas que temos. Construímos agentes para dados genéticos ou dados experimentais de laboratório. Um agente orquestral em Jules pode combinar esses diferentes agentes para desenhar inferências. Esse cenário de agentes é realmente importante e relevante. Isso nos dá modelos refinados sobre questões e tipos individuais de modalidades.
  • 21:28: Você aludiu ao medicamento personalizado. Estamos conversando sobre isso há muito tempo. Você pode nos dar uma atualização? Como a IA acelerará isso?
  • 21:54: Este é um campo sobre o qual estou realmente otimista. Tivemos muito impacto; Às vezes, quando você tem o nariz no vidro, não o vê. Mas percorremos um longo caminho. Primeiro, através dos dados: temos exponencialmente mais dados do que há 15 anos atrás. Segundo, Compute Energy: Quando comecei meu doutorado, o fato de ter uma GPU foi incrível. A escala de computação acelerou. E também houve muita influência da ciência. Houve um Prêmio Nobel de dobragem de proteínas. A compreensão da biologia humana é algo em que empurramos a agulha. Muitos dos prêmios Nobel eram sobre a compreensão dos mecanismos biológicos, a compreensão da ciência básica. Atualmente, estamos em blocos de construção em direção a isso. Levou anos para entender o ribossomo e entender o mecanismo do HIV.
  • 23:55: Na IA para a saúde, vimos impactos mais imediatos. Apenas o fato de entender algo heterogêneo: se ambos obtivermos um diagnóstico de asma, isso terá manifestações diferentes, gatilhos diferentes. Essa compreensão da heterogeneidade em coisas como saúde psychological: somos diferentes; As coisas precisam ser tratadas de maneira diferente. Também temos o ecossistema, onde podemos ter um impacto. Podemos impactar ensaios clínicos. Estamos no pipeline para drogas.
  • 25:39: Uma das partes do trabalho que publicamos tem sido a compreensão das diferenças em resposta ao medicamento para a hepatite B.
  • 26:01: Você está no Reino Unido, você tem o NHS. Nos EUA, ainda temos o problema do silo de dados: você vai à sua atenção primária e, em seguida, um especialista e eles precisam se comunicar usando registros e fax. Como posso ser otimista quando os sistemas nem sequer falam um com o outro?
  • 26:36: Essa é uma área onde a IA pode ajudar. Não é um problema em que trabalho, mas como podemos otimizar o fluxo de trabalho? É um problema de sistemas.
  • 26:59: Todos nós associamos a privacidade de dados à saúde. Quando as pessoas falam sobre privacidade de dados, elas recebem ficção científica, com criptografia homomórfica e aprendizado federado. O que é realidade? O que há na sua caixa de ferramentas diária?
  • 27:34: Essas ferramentas não estão necessariamente na minha caixa de ferramentas diárias. A farmacêutica é fortemente regulamentada; Há muita transparência em torno dos dados que coletamos, os modelos que construímos. Existem plataformas e sistemas e maneiras de ingerir dados. Se você tem uma colaboração, geralmente trabalha com um ambiente de pesquisa confiável. Os dados não saem necessariamente. Fazemos uma análise dos dados em seu ambiente de pesquisa confiável, garantimos que tudo esteja preservando a privacidade e respeitemos os corrimãos.
  • 29:11: Nossos ouvintes são principalmente desenvolvedores de software program. Eles podem se perguntar como entram nesse campo sem nenhum histórico de ciências. Eles podem apenas usar o LLMS para acelerar o aprendizado? Se você estava tentando vender um desenvolvedor de ML para ingressar na sua equipe, que tipo de fundo eles precisam?
  • 29:51: Você precisa de uma paixão pelos problemas que está resolvendo. Essa é uma das coisas que eu gosto no GSK. Não sabemos tudo sobre biologia, mas temos colaboradores muito bons.
  • 30:20: Nossos ouvintes precisam tomar bioquímica? Química orgânica?
  • 30:24: Não, você só precisa conversar com os cientistas. Conheça os cientistas, ouça seus problemas. Não trabalhamos em silos como pesquisadores de IA. Trabalhamos com os cientistas. Muitos de nossos colaboradores são médicos e se juntaram à GSK porque querem ter um impacto maior.

Notas de rodapé

  1. Não deve ser confundido com o recente anúncio de codificação Agentic do Google.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *