Eric Landau, cofundador e CEO da Encord – Série de entrevistas


Eric Landau é o CEO e cofundador da Acordeuma plataforma de aprendizado ativo para visão computacional. Eric foi o pesquisador quantitativo líder em uma mesa delta-one de ações globais, colocando milhares de modelos em produção. Antes da Encord, ele passou quase uma década em negociações de alta frequência na DRW. Ele possui um SM em Física Aplicada pela Universidade de Harvard, MS em Engenharia Elétrica e BS em Física pela Universidade de Stanford.

Nas horas vagas, Eric gosta de brincar com ChatGPT e grandes modelos de linguagem, além de preparar coquetéis artesanais.

O que o inspirou a cofundar a Encord e como sua experiência em física de partículas e finanças quantitativas moldou sua abordagem para resolver o “problema de dados” em IA?

Comecei a pensar em aprendizado de máquina enquanto trabalhava em física de partículas e lidava com conjuntos de dados muito grandes durante meu tempo no Stanford Linear Accelerator Heart (SLAC). Eu estava usando um software program projetado para físicos por físicos, o que quer dizer que havia muito a desejar em termos de uma experiência de usuário agradável. Com ferramentas mais fáceis, eu teria conseguido executar análises muito mais rápido.

Mais tarde, trabalhando em finanças quantitativas na DRW, fui responsável por criar milhares de modelos que foram implantados na produção. Semelhante à minha experiência em física, descobri que dados de alta qualidade eram essenciais para fazer modelos precisos e que gerenciar dados complexos e em larga escala é difícil. Ulrik teve uma experiência semelhante visualizando grandes conjuntos de dados de imagens para visão computacional.

Quando ouvi sobre sua ideia inicial para o Encord, embarquei imediatamente e entendi a importância. Juntos, Ulrik e eu vimos uma grande oportunidade de construir uma plataforma para automatizar e agilizar o processo de desenvolvimento de dados de IA, tornando mais fácil para as equipes obter os melhores dados em modelos e construir sistemas de IA confiáveis.

Você pode falar mais sobre a visão por trás do Encord e como ele se compara aos primeiros dias da computação ou da web em termos de potencial e desafios?

A visão da Encord é ser a plataforma elementary na qual as empresas confiam para transformar seus dados em modelos de IA funcionais. Somos a camada entre os dados de uma empresa e sua IA.

De muitas maneiras, a IA reflete mudanças de paradigma anteriores, como a computação pessoal e a Web, pois se tornará parte integrante dos fluxos de trabalho de cada indivíduo, empresa, nação e indústria. Ao contrário das revoluções tecnológicas anteriores, que foram amplamente obstruídas por Lei de Moore de crescimento computacional composto de 30x a cada 10 anos, o desenvolvimento de IA se beneficiou de inovações simultâneas. Portanto, está se movendo em um ritmo muito mais rápido. Nas palavras de Jensen Huang da NVIDIA: “Pela primeira vez, estamos vendo exponenciais compostos… Estamos nos compondo em um milhão de vezes a cada dez anos. Não cem vezes, não mil vezes, um milhão de vezes.” Sem hipérbole, estamos testemunhando a tecnologia de movimento mais rápido da história humana.

O potencial aqui é vasto: ao automatizar e dimensionar o gerenciamento de dados de alta qualidade para IA, estamos abordando um gargalo que impede uma adoção mais ampla de IA. Os desafios lembram os obstáculos iniciais em eras tecnológicas anteriores: silos, falta de melhores práticas, limitações para usuários não técnicos e uma escassez de abstrações bem definidas.

O Encord Index está posicionado como uma ferramenta essencial para gerenciar e curar dados de IA. Como ele se diferencia de outras plataformas de gerenciamento de dados disponíveis atualmente?

Existem algumas maneiras pelas quais o Encord Index se destaca:

O índice é escalável: Permite que os usuários gerenciem bilhões, não milhões, de pontos de dados. Outras ferramentas enfrentam problemas de escalabilidade para dados não estruturados e são limitadas na consolidação de todos os dados relevantes em uma organização.

O índice é flexível: Integra-se diretamente com provedores de armazenamento de dados privados e de armazenamento em nuvem, como AWS, GCP e Azure. Ao contrário de outras ferramentas que são limitadas a um único provedor de nuvem ou sistema de armazenamento interno, o Index é agnóstico em relação a onde os dados estão localizados. Ele permite que você gerencie dados de muitas fontes com governança e controles de acesso apropriados que permitem que eles desenvolvam aplicativos de IA seguros e compatíveis.

O índice é multimodal: Suporta IA multimodal, gerenciando dados na forma de imagens, vídeos, áudio, texto, documentos e muito mais. O Index não se limita a uma única forma de dados como muitas ferramentas LLM hoje. A cognição humana é multimodal, e acreditamos que a IA multimodal estará no centro da próxima onda de avanços em IA, que suplantará chatbots e LLMs.

De que maneiras o Encord Index aprimora o processo de seleção dos dados certos para modelos de IA e que impacto isso tem no desempenho do modelo?

O Encord Index aprimora a seleção de dados ao automatizar a curadoria de grandes conjuntos de dados, ajudando as equipes a identificar e reter apenas os dados mais relevantes, removendo dados não informativos ou tendenciosos. Esse processo não apenas reduz o tamanho dos conjuntos de dados, mas também melhora significativamente a qualidade dos dados usados ​​para treinar modelos de IA. Nossos clientes viram uma melhoria de até 20% em seus modelos, ao mesmo tempo em que alcançaram uma redução de 35% no tamanho do conjunto de dados e economizaram centenas de milhares de dólares em custos de computação e anotação humana.

Com a rápida integração de tecnologias de ponta, como o Phase Something Mannequin da Meta, como a Encord se mantém à frente no cenário de IA em rápida evolução?

Nós construímos intencionalmente a plataforma para sermos capazes de nos adaptar rapidamente a novas tecnologias. Nós nos concentramos em fornecer uma abordagem escalável, software-first, que incorpora facilmente avanços como SAM, garantindo que nossos usuários estejam sempre equipados com as ferramentas mais recentes para permanecerem competitivos.

Planejamos ficar à frente focando em IA multimodal. A plataforma Encord já pode gerenciar tipos de dados complexos, como imagens, vídeos e texto, então, conforme mais avanços em IA multimodal surgirem, estaremos prontos.

Quais são os desafios mais comuns que as empresas enfrentam ao gerenciar dados de IA e como a Encord ajuda a lidar com eles?

Existem 3 principais desafios que as empresas enfrentam:

  • Má organização e controlos de dados: À medida que as empresas se preparam para implementar soluções de IA, elas frequentemente se deparam com a realidade de dados isolados e desorganizados que não estão prontos para IA. Esses dados frequentemente carecem de uma governança forte em torno deles, limitando grande parte deles de serem usados ​​em sistemas de IA.
  • Falta de especialistas humanos: À medida que os modelos de IA enfrentam problemas cada vez mais complexos, em breve haverá uma escassez de especialistas em domínio humano para preparar e validar dados. À medida que as demandas de IA de uma empresa aumentam, dimensionar essa força de trabalho humana é desafiador e custoso.
  • Ferramentas não escaláveis: Modelos de IA de alto desempenho são muito famintos por dados em termos de dados necessários para ajuste fino, validação, RAG e outros fluxos de trabalho. A geração anterior de ferramentas não está equipada para gerenciar a quantidade de dados e os tipos de dados necessários para os modelos de nível de produção atuais.

A Encord corrige esses problemas automatizando o processo de curadoria de dados em escala, facilitando a identificação de dados impactantes a partir de dados problemáticos e garantindo a criação de conjuntos de dados de treinamento e validação eficazes. Ela usa uma abordagem de software program em primeiro lugar que é fácil de aumentar ou diminuir conforme as necessidades de gerenciamento de dados mudam. Nossas ferramentas de anotação assistidas por IA capacitam especialistas de domínio humanos no loop para maximizar a eficiência do fluxo de trabalho. Esse processo é particularmente essential em setores como serviços financeiros e saúde, onde os treinadores de IA são caros. Facilitamos o gerenciamento e a compreensão de todos os dados não estruturados de uma organização, reduzindo a necessidade de trabalho handbook.

Como a Encord aborda a questão do viés de dados e áreas sub-representadas em conjuntos de dados para garantir modelos de IA justos e equilibrados?

Lidar com o viés de dados é um foco crítico para nós na Encord. Nossa plataforma identifica e expõe automaticamente áreas onde os dados podem ser tendenciosos, permitindo que as equipes de IA abordem esses problemas antes que eles afetem o desempenho do modelo. Também garantimos que áreas sub-representadas dentro dos conjuntos de dados sejam incluídas adequadamente, o que ajuda no desenvolvimento de modelos de IA mais justos e equilibrados. Ao usar nossas ferramentas de curadoria, as equipes podem ter certeza de que seus modelos são treinados em dados diversos e representativos.

A Encord garantiu recentemente US$ 30 milhões em financiamento da Série B. Como esse financiamento acelerará seu roteiro de produtos e planos de expansão?

Os US$ 30 milhões em financiamento da Série B serão usados ​​para aumentar drasticamente o tamanho de nossas equipes de pesquisa de produtos, engenharia e IA nos próximos seis meses e acelerar o desenvolvimento do Encord Index e outros novos recursos. Também estamos expandindo nossa presença em São Francisco com um novo escritório, e esse financiamento nos ajudará a dimensionar nossas operações para dar suporte à nossa crescente base de clientes.

Como a mais jovem empresa de IA da Y Combinator a levantar uma Série B, o que você atribui ao rápido crescimento e sucesso da Encord?

Uma das razões pelas quais conseguimos crescer rapidamente é que adotamos um foco extremamente centrado no cliente em todas as áreas da empresa. Estamos constantemente nos comunicando com os clientes, ouvindo atentamente seus problemas e os “abraçando com força” para chegar a soluções. Ao hiperfocar nas necessidades do cliente em vez de exageros, criamos uma plataforma que ressoa com as principais equipes de IA em vários setores. Nossos clientes foram fundamentais para nos levar aonde estamos hoje. Nossa capacidade de escalar rapidamente e gerenciar efetivamente a complexidade dos dados de IA nos tornou uma solução atraente para as empresas.

Também devemos muito do nosso sucesso aos nossos colegas de equipe, parceiros e investidores, que trabalharam incansavelmente para defender a Encord. Trabalhar com equipes de produtos, engenharia e go-to-market de classe mundial tem sido extremamente impactante em nosso crescimento.

Dada a crescente importância dos dados na IA, como você vê a evolução do papel das plataformas de dados de IA como a Encord nos próximos cinco anos?

À medida que os aplicativos de IA crescem em complexidade, a necessidade de soluções de gerenciamento de dados eficientes e escaláveis ​​só aumentará. Acredito que toda empresa eventualmente terá um departamento de IA, muito parecido com o que os departamentos de TI existem hoje. O Encord será a única plataforma de que eles precisam para gerenciar as vastas quantidades de dados necessárias para IA e colocar os modelos em produção rapidamente.

Obrigado pela ótima entrevista, leitores que desejam saber mais devem visitar Acorde.

Eric Landau, cofundador e CEO da Encord – Série de entrevistas

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *