
/
Ben Lorica e Gabriela de Queiroz, diretora da IA da Microsoft, falam sobre startups: especificamente, a IA Startups. Como você é notado? Como você gera tração actual? O que as startups estão fazendo com agentes e com protocolos como MCP e A2A? E quais problemas de segurança devem procurar as startups, especialmente se elas estão usando modelos de pesos abertos?
Confira Outros episódios deste podcast na plataforma de aprendizado de O’Reilly.
Sobre o IA generativa no mundo actual podcast: Em 2023, o Chatgpt colocou a IA na agenda de todos. Em 2025, o desafio será transformar essas agendas em realidade. Em IA generativa no mundo actualBen Lorica entrevista líderes que estão construindo com a IA. Aprenda com a experiência deles para ajudar a colocar a IA para trabalhar em sua empresa.
Pontos de interesse
- 0:00: Introdução à Gabriela de Queiroz, diretora da IA da Microsoft.
- 0:30: Você trabalha com muitas startups e fundadores. Como as oportunidades de startups na IA generativa mudaram? As oportunidades estão se expandindo?
- 0:56: Absolutamente. A barreira de entrada para fundadores e desenvolvedores é muito menor. As startups estão explodindo – não apenas a quantidade, mas também as coisas interessantes que estão fazendo.
- 1:19: Você pega startups quando ainda estão explorando, tentando construir o MVP. Portanto, as startups precisam ser mais persistentes ao tentar encontrar diferenciação. Se alguém pode construir um MVP, como você se distinguir?
- 1:46: Na Microsoft, dirijo várias iniciativas estratégicas para ajudar as startups em estágio de crescimento. Eu também os guio na solução de pontos de dor reais usando nossas pilhas. Eu projetei programas para destacar os fundadores.
- 3:08: Eu faço muito engajamento, onde ajuda as startups a partir do protótipo ou MVP para impactar. Um MVP não é suficiente. Preciso ver um caso de uso actual e preciso ver alguma tração. Quando eles têm clientes reais, vemos se o MVP está funcionando.
- 3:49: Você está começando a ver padrões para ganhar tração? Eles estão se concentrando em um domínio específico? Ou eles têm um bom conjunto de dados?
- 4:02: Se eles estão resolvendo um caso de uso actual em um domínio ou nicho específico, é aqui que os vemos ter sucesso. Eles estão resolvendo uma dor actual, não construindo algo genérico.
- 4:27: Estamos em São Francisco e resolvendo uma dor específica ou encontrar um domínio específico significa algo diferente. Os fundadores da Techie podem construir algo usado por seus amigos, mas não há receita.
- 5:03: Isso acontece em todos os lugares, mas há uma cultura maior por aqui. Eu digo aos fundadores: “Você precisa me mostrar tração”. Temos várias empresas que começaram como código aberto, então construíram uma camada paga no topo do projeto de código aberto.
- 5:34: Você trabalha com o pessoal do Azure, então presumivelmente sabe o que as empresas reais estão fazendo com a IA generativa. Você pode nos dar uma idéia de quais empresas estão começando a implantar? Qual é o nível de conforto da empresa com essas tecnologias?
- 6:06: As empresas estão um pouco atrás das startups. As startups são agentes de construção. As empresas ainda não estão lá. Há muito levantamento pesado na infraestrutura de dados que eles precisam ter em vigor. E seus casos de uso são complexos. É semelhante ao Huge Information, onde a empresa levou mais tempo para otimizar sua pilha.
- 7:19: Você pode descrever por que as empresas precisam modernizar sua pilha de dados?
- 7:42: A realidade não é mágica. Há muita complexidade nos dados e como os dados são tratados. Há muita segurança e privacidade de dados que as startups não estão cientes, mas são importantes para as empresas. Mesmo os tipos de dados – os dados não estão bem organizados, existem diferentes equipes usando diferentes fontes de dados.
- 8:28: Rag agora é um padrão bem estabelecido na empresa?
- 8:44: Isso é. Rag faz parte do fluxo de trabalho de todos.
- 8:51: Os casos de uso comum que parecem estar mais adiante são o suporte ao cliente, a codificação – que outros baldes você pode adicionar?
- 9:07: O suporte ao cliente e os ingressos estão entre os principais casos de dores e uso. E eles são muito caros. Portanto, é uma vitória fácil para as empresas quando elas se mudam para agentes da Genai ou da IA.
- 9:48: Você está dizendo que os construtores de ferramentas estão à frente dos compradores de ferramentas?
- 10:05: Você tem razão. Eu falo muito com startups de agentes de construção. Discutimos para onde a indústria está indo e quais são os desafios. Se você acha que estamos perto da AGI, tente construir um agente e você verá até onde estamos da AGI. Quando você deseja escalar, há outro nível de dificuldade. Quando peço exemplos e clientes reais, a maioria ainda não está lá.
- 11:01: Parte disso é a terminologia. As pessoas usam o termo “agente”, mesmo para um chatbot. Há muita confusão. E as startups estão exaltando a noção de multiagentes. Vamos chegar lá, mas vamos começar com agentes únicos primeiro. E você ainda precisa de um humano no loop.
- 11:40: Sim, conversamos sobre o humano no circuito o tempo todo. Até as pessoas que estão se gabando, quando você pede que elas mostrem, elas ainda não estão lá.
- 12:00: Na frente do agente, se eu lhe pedisse uma breve apresentação com três slides de exemplos que chamaram sua atenção, o que eles seriam?
- 12:30: Há uma empresa fazendo um agente de IA com e -mails e seu calendário. Todo mundo usa e -mail e calendário o dia inteiro. Se quisermos agendar o jantar com um grupo de amigos, mas temos pessoas com restrições alimentares, levaria uma eternidade para encontrar um restaurante que verifique todas as caixas. Há uma empresa tentando tornar isso automático.
- 14:22: Nos últimos meses, os desenvolvedores se uniram ao MCP e agora A2A. Alguém me pediu uma lista de servidores MCP examinados. Se o servidor vier da empresa que desenvolveu o aplicativo, tudo bem. Mas existem milhares de servidores, e eu sou cauteloso. Já temos problemas da cadeia de suprimentos de software program. O MCP está decolando ou é uma correção temporária?
- 15:48: É muito cedo para dizer que é isso. Há também o protocolo do Google (A2A); A IBM criou um protocolo; Esta é uma discussão em andamento e, como está evoluindo tão rápido, algo provavelmente virá nos próximos meses.
- 16:31: É muito parecido com a Web e os padrões que surgiram a partir daí. Você pode torná -lo formal, ou simplesmente construí -lo, cultivá -lo e, de alguma forma, ele se torna um padrão aberto empírico.
- 17:15: Estamos falando implicitamente sobre texto. Você começou a ver casos de uso de quase produção envolvendo modelos multimodais?
- 17:37: Vimos alguns casos de uso com multimodalidade, que são mais complexos.
- 17:48: Agora você precisa expandir sua estratégia de dados para todos esses diferentes tipos de dados.
- 18:07: Voltando aos slides: se eu tivesse três slides, tentaria colocar todos na mesma página sobre o que é um agente de IA. Todas as grandes empresas têm suas próprias definições. Eu prepararia o cenário com minha definição: um sistema que pode agir na sua metade. Então eu diria que, se você acha que estamos perto da AGI, tente construir um agente. E o terceiro slide seria construir um agente, em vez de um multiagente. Comece pequeno e depois você pode escalar, não o contrário.
- 19:44: Orquestração de um agente é uma coisa. Muitas pessoas jogam pelo termo orquestração. Para engenharia de dados, a orquestração significa algo específico e muita coisa entra nela, mesmo para um único agente. Para multiagentes, é muito mais complexo. Há orquestração e também há comunicação. Um agente pode reter, ignorar ou entender mal informações. Então fique com um agente. Faça isso e siga em frente.
- 20:33: A grande coisa no espaço do modelo elementary é o raciocínio. O que o raciocínio se abriu para algumas dessas startups? Quais aplicativos dependem de um modelo aprimorado de raciocínio? Que modelo devo usar e posso sobreviver com um modelo que não raciocina?
- 21:15: Ainda não vi nenhuma startup usando o raciocínio. Provavelmente por causa do que você está falando. É caro, é mais lento e as startups precisam ver as vitórias rapidamente.
- 21:46: Eles apenas pedem mais créditos gratuitos.
- 21:51: Créditos gratuitos não são para sempre. Mas nem é o custo – também é o processo e a espera. Quais são as compensações? Não vi startups conversando comigo sobre o uso do raciocínio.
- 22:22: O som dos bons conselhos para quem construir qualquer coisa é ser modelo agnóstico. Projete o que você está fazendo para que você possa usar vários modelos ou mudar de modelos. Agora temos modelos de pesos abertos que estão se tornando mais competitivos. No ano passado, tivemos lhama; Agora também temos Qwen e Deepseek, com uma incrível cadência de lançamento. Você está vendo mais startups optando por pesos abertos?
- 23:19: Definitivamente. Mas eles precisam ter muito cuidado quando usam modelos abertos devido à segurança. Eu vejo muitas empresas usando o DeepSeek. Eu pergunto a eles sobre segurança.
- 23:43: No mundo dos pesos abertos, você pode ter modelos derivados. Quem examina os derivados? Os modelos proprietários têm muito mais controle. E há riscos da cadeia de suprimentos, embora eles não sejam exclusivos dos modelos de pesos abertos. Todos dependemos das bibliotecas Python e Python.
- 25:17: E com pessoas bifurcam modelos derivados. . . Também vimos isso com produtos; Pessoas construindo produtos e são lucrativos além dos projetos de código aberto. Pessoas construídas em um garfo de um projeto Python ou no topo das bibliotecas Python e (se tornaram) lucrativas.
- 25:55: Com os modelos chineses de pesos abertos, conversei com pessoas de segurança e não há nada inerentemente inseguro em usar os pesos. Pode haver diferenças arquitetônicas. Mas se você estiver usando um dos modelos chineses em sua API aberta, eles podem precisar entregar dados. Geralmente, o acesso aos pesos não é um vetor de ataque comum.
- 27:03: Ou você pode usar empresas como a Microsoft. Temos Deepseek R1 disponível no Azure. Mas passou por uma rigorosa avaliação de instances vermelhas e segurança para mitigar os riscos.
- 27:39: Existem diferenças em termos de alinhamento e tendência vermelha entre as empresas ocidentais e chinesas.
- 28:26: Para encerrar, existem paralelos entre o que você está vendo agora e o que vimos na ciência de dados?
- 28:40: É semelhante, mas a escala e a velocidade são diferentes. Existem mais recursos e acessibilidade. A barreira à entrada é menor.
- 29:06: O ciclo do hype é o mesmo. Você se lembra de todas as histórias sobre “a ciência de dados é o novo trabalho attractive”. Mas a tecnologia agora é muito mais acessível e há muito mais histórias e mais emoção.
- 29:29: Naquela época, tínhamos apenas algumas opções: Hadoop, Spark. . . Não é como 100 modelos diferentes. E eles não eram acessíveis ao público em geral.
- 30:03: Naquela época, as pessoas não precisavam do Hadoop ou MapReduce ou Spark se não tivessem muitos dados. E agora, você não precisa usar o LLM mais brilhante ou mais bem parado; Você pode usar um pequeno modelo de idioma.