Stefania Drua para projetar para a próxima geração – O’Reilly


Stefania Drua para projetar para a próxima geração – O’Reilly

O’Reilly Media

IA generativa no mundo actual: Stefania Druga sobre o design da próxima geração



Carregando





/

Como você ensina as crianças a usar e construir com IA? É nisso que Stefania Druena trabalha. É importante ser sensível à sua criatividade, senso de diversão e desejo de aprender. Ao projetar para crianças, é importante projetar com elas, não apenas para elas. Essa é uma lição que também tem implicações importantes para os adultos. Junte -se a Stefania Druga e Ben Lorica para ouvir sobre a IA para crianças e o que isso tem a dizer sobre a IA para adultos.

Sobre o IA generativa no mundo actual podcast: Em 2023, o Chatgpt colocou a IA na agenda de todos. Em 2025, o desafio será transformar essas agendas em realidade. Em IA generativa no mundo actualBen Lorica entrevista líderes que estão construindo com a IA. Aprenda com a experiência deles para ajudar a colocar a IA para trabalhar em sua empresa.

Confira Outros episódios deste podcast na plataforma de aprendizado de O’Reilly.

TIMESTAMPS

  • 0:00: Introdução a Stefania Druga, pesquisador independente e, mais recentemente, um cientista de pesquisa da DeepMind.
  • 0:27: Você construiu ferramentas educacionais de IA para jovens e, depois disso, trabalhou na IA multimodal na DeepMind. O que as crianças te ensinaram sobre o design da IA?
  • 0:48: Tem sido uma jornada e tanto. Comecei a trabalhar na educação da IA ​​em 2015. Eu estava na equipe de Scratch no MIT Media Lab. Eu trabalhei em cognimates para que as crianças pudessem treinar modelos personalizados com imagens e textos. As crianças faria as coisas que eu nunca teria pensado, como construir um modelo para identificar os fios estranhos ou para reconhecer e dar elogios de again -thamandos. Eles fizeram coisas estranhas, peculiares e divertidas e não necessariamente utilitárias.
  • 2:05: Para os jovens, dirigir um carro é divertido. Ter um carro autônomo não é divertido. Eles têm muitas idéias que podem inspirar adultos.
  • 2:25: Você notou que muitos usuários da IA ​​são Gen Z, mas a maioria das ferramentas não foi projetada com eles em mente. Qual é a maior desconexão?
  • 2:47: Não temos um botão para a agência controlar o quanto delegarmos para as ferramentas. A maior parte da geração Z usa produtos de IA prontos para uso, como ChatGPT, Gêmeos e Claude. Essas ferramentas têm uma suposição de que precisam fazer o trabalho, em vez de fazer perguntas para ajudá-lo a fazer o trabalho. Eu gosto de uma abordagem muito mais socrática. Uma grande parte do aprendizado é fazer e fazer boas perguntas. Um papel enorme para a IA generativa é usá -lo como uma ferramenta que pode ensinar coisas, fazer perguntas; (É) algo para debater, não uma ferramenta para a qual você delega trabalho.
  • 4:25: Existe esse grande elefante na sala onde não temos conversas ou práticas recomendadas para usar a IA.
  • 4:42: Você mencionou a abordagem socrática. Como você implementa a abordagem socrática no mundo das interfaces de texto?
  • 4:57: Nos cognimates, eu criei um co-piloto para codificação de crianças. Este copiloto não faz a codificação. Ele faz perguntas. Se uma criança pergunta: “Como faço o cara se mover?” O copiloto fará perguntas em vez de dizer: “Use este bloco e depois esse bloco”.
  • 6:40: Quando eu projetei isso, começamos com uma pessoa nos bastidores, como o Mágico de Oz. Em seguida, construímos a ferramenta e percebemos que as crianças realmente querem um sistema que possa ajudá -las a esclarecer seus pensamentos. Como você divide um evento complexo em etapas que são boas unidades computacionais?
  • 8:06: A terceira descoberta foram as afirmações – sempre que fizeram algo authorized, o copiloto diz algo como “isso é incrível”. As crianças gastavam o dobro do tempo codificando porque tinham um copiloto infinitamente paciente que fazia perguntas, ajudaria -as a depurar e dar -lhes afirmações que reforçariam sua identidade criativa.
  • 8:46: Com essas instruções de design, construí a ferramenta. Estou apresentando um artigo na conferência ACM IDC (Design de Interação para Crianças) que apresenta este trabalho com mais detalhes. Espero que este exemplo seja replicado.
  • 9:26: Como essas interações e interfaces estão evoluindo muito rápido, é importante entender o que os jovens querem, como funcionam e como pensam e projetam com eles, não apenas para eles.
  • 9:44: O desenvolvedor típico agora, quando eles interagem com essas coisas, especifica demais o immediate. Eles descrevem tão precisamente. Mas o que você está descrevendo é interessante porque está aprendendo, está construindo de forma incremental. Nós nos afastamos disso como adultos.
  • 10:28: É tudo sobre mexerabilidade e ter o nível certo de abstração. Quais são os blocos LEGO certos? Um immediate não é tinker o suficiente. Não permite expressividade suficiente. Ele precisa ser composto e permitir que o usuário esteja no controle.
  • 11:17: O que é muito emocionante para mim é multimodal (modelos) e coisas que podem funcionar no telefone. Os jovens passam muito tempo em seus telefones, e são apenas mais acessíveis em todo o mundo. Temos modelos de código aberto multimodais e podem ser executados em dispositivos, para que você não exact enviar seus dados para a nuvem.
  • 11:59: Trabalhei recentemente em dois projetos multimodais para celular. O primeiro foi em matemática. Criamos uma referência dos equívocos primeiro. Quais são os erros que os alunos do ensino médio podem cometer ao aprender álgebra? Testamos para ver se os LLMs multimodais podem obter conceitos errôneos com base em fotos de exercícios manuscritos para crianças. Executamos os resultados dos professores para ver se eles concordaram. Confirmamos que os professores concordaram. Então eu criei um aplicativo chamado MathMind que faz perguntas ao resolver problemas. Se detectar conceitos errôneos; propõe exercícios adicionais.
  • 14:41: Para os professores, é útil ver quantas pessoas não entenderam um conceito antes de seguir em frente.
  • 15:17: Quem está construindo os modelos de pesos abertos que você está usando como ponto de partida?
  • 15:26: Eu usei muitos modelos Gemma 3. O modelo mais recente, 3N, é multilíngue e pequeno o suficiente para ser executado em um telefone ou laptop computer. A LLAMA tem bons modelos pequenos. Mistral é outro bom.
  • 16:11: E quanto à latência e ao consumo de bateria?
  • 16:22: Não fiz testes extensos para o consumo de bateria, mas não vi nada flagrante.
  • 16:35: A matemática é a porta de teste perfeita de várias maneiras, certo? Há uma resposta certa e errada.
  • 16:47: O futuro da IA ​​multimodal será neurossimbólico. Há uma parte que o LLM faz. O LLM é bom em lógica difusa. Mas há uma parte formal do sistema, que está realmente tendo especificações concretas. A matemática é boa para isso, porque conhecemos a verdade do fundamento. A questão é como criar especificações formais em outros domínios. Os resultados mais promissores são provenientes dessa interseção de métodos formais e modelos de idiomas grandes. Um exemplo é a alfagometria de DeepMind, porque eles estavam usando uma gramática para restringir o espaço das soluções.
  • 18:16: Você pode nos dar uma sensação para o tamanho da comunidade que trabalha nessas coisas? É principalmente acadêmico? Existem startups? Existem subsídios de pesquisa?
  • 18:52: A primeira comunidade quando comecei foi AI para K12. Há uma comunidade ativa de pesquisadores e educadores. Foi apoiado pela NSF. É bastante diverso, com pessoas de todo o mundo. E também há uma comunidade de aprendizado e ferramentas com foco no aprendizado de matemática. A Renaissance Philanthropy também financia muitas iniciativas.
  • 20:18: E a Khan Academy?
  • 20:20: Khan Academy é um ótimo exemplo. Eles queriam que Khanmigo fosse sobre motivação intrínseca e entender o incentivo positivo para as crianças. Mas o que eu descobri foi que a matemática estava errada – os primeiros LLMs tiveram problemas com a matemática.
  • 22:28: Digamos daqui a um mês um modelo de fundação fica muito bom em matemática avançada. Quanto tempo até que possamos destilar um modelo pequeno para que você se beneficie pelo telefone?
  • 23:04: Havia um projeto, Minerva, que period um LLM especificamente para matemática. Um modelo muito bom que está sempre correto em matemática não será um transformador sob o capô. Será um transformador juntamente com o uso da ferramenta e um provérbio automático do teorema. Precisamos ter uma parte do sistema verificável. Com que rapidez podemos fazê -lo funcionar em um telefone? Isso é factível agora. Existem sistemas de código aberto como a UNSLOTH que destilarem um modelo assim que estiver disponível. Além disso, as APIs estão se tornando mais acessíveis. Podemos construir essas ferramentas agora e fazê -las funcionar em dispositivos de ponta.
  • 25:05: Humano In The Loop for Training significa pais em circuito. Que etapas extras você deve fazer para se sentir confortável para que tudo o que você construa esteja pronto para ser implantado e ser examinado pelos pais.
  • 25:34: A pergunta mais comum que recebo é “O que devo fazer com meu filho?” Recebo essa pergunta com tanta frequência que me sentei e escrevi um longo guide para os pais. Durante a pandemia, trabalhei com a mesma comunidade de famílias por dois anos e meio. Vi como os pais estavam mediando o uso da IA ​​na casa. Eles aprenderam através dos jogos como os sistemas de aprendizado de máquina funcionavam, sobre preconceitos. Há muito trabalho a ser feito para as famílias. Os pais estão sobrecarregados. Há uma sensação constante de não querer que seu filho seja deixado para trás, mas também não os querendo em dispositivos o tempo todo. É importante fazer um plano para ter conversas sobre como eles estão usando a IA, como pensam sobre a IA, vindo de um lugar de curiosidade.
  • 28:12: Conversamos sobre a implementação do método socrático. Uma das coisas que as pessoas estão falando são os multi-agentes. Em algum momento, alguma criança usará uma ferramenta que orquestra um monte de agentes. Que tipos de inovações no UX você está vendo que nos preparará para este mundo?
  • 28:53: A parte multi-agente é interessante. Quando eu estava fazendo este estudo sobre o Scratch Copilot, tivemos uma sessão de design no closing com as crianças. Esse tema de agentes e vários agentes surgiu. Muitos deles queriam isso e queriam executar simulações. Conversamos sobre a comunidade Scratch porque é o aprendizado social, então perguntei a eles o que acontece se alguns dos jogos são feitos pelos agentes. Você gostaria de saber disso? É algo que eles querem e algo sobre o qual eles querem ser transparentes.
  • 30:41: Uma comunidade on -line híbrida que inclui crianças e agentes não é ficção científica. A tecnologia já existe.
  • 30:54: Estou colaborando com as pessoas que criaram uma tecnologia chamada Infinibranch Isso permite criar muitos ambientes virtuais, onde você pode testar agentes e ver agentes em ação. Nós claramente teremos agentes que podem tomar ações. Eu disse a eles o que as crianças queriam e disseram: “Vamos fazer isso acontecer”. Definitivamente, será uma área de simulações e ferramentas para o pensamento. Eu acho que é uma das áreas mais emocionantes. Você pode executar 10 experimentos de uma só vez, ou 100.
  • 32:23: Na empresa, muitas pessoas da empresa se adiantam. Vamos fazer com que um agente funcione bem primeiro. Muitos dos fornecedores estão se adiantando.
  • 32:49: Absolutamente. Uma coisa é fazer uma demonstração; Outra coisa é fazer com que funcione de maneira confiável.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *