Como marcamos na última rodada? Nosso quatro tendências importantes a serem observadas em 2024 incluiu o que chamamos de chatbots personalizados – aplicativos auxiliares interativos alimentados por modelos multimodais de linguagem grande (verifique: ainda não sabíamos disso, mas estávamos falando sobre o que todo mundo agora chama agentesa coisa mais quente em IA no momento); vídeo generativo (verificar: poucas tecnologias melhoraram tão rapidamente nos últimos 12 mesescom OpenAI e Google DeepMind lançando seus principais modelos de geração de vídeo, Sora e Veo, com uma diferença de uma semana em dezembro); e mais robôs de uso geral que podem realizar uma gama mais ampla de tarefas (verifique: as recompensas de grandes modelos de linguagem continuam a chegar até outras partes da indústria de tecnologiae robótica está no topo da lista).
Também dissemos que a desinformação eleitoral gerada pela IA estaria em todo o lado, mas aqui – felizmente – erramos. Houve muitas coisas pelas quais nos preocuparmos este ano, mas deepfakes políticos eram escassos.
Então, o que está por vir em 2025? Vamos ignorar o óbvio aqui: você pode apostar que agentes e modelos de linguagem menores e mais eficientes continuará a moldar a indústria. Em vez disso, aqui estão cinco opções alternativas de nossa equipe de IA.
1. Playgrounds virtuais generativos
Se 2023 fosse o ano de imagens generativas e 2024 foi o ano de vídeo generativo– o que vem a seguir? Se você adivinhou mundos virtuais generativos (também conhecidos como videogames), cumprimentos para todos.

Tivemos um pequeno vislumbre dessa tecnologia em fevereiro, quando o Google DeepMind revelou um modelo generativo chamado Genie que poderia pegar uma imagem estática e transformá-la em um jogo de plataforma 2D de rolagem lateral com o qual os jogadores poderiam interagir. Em dezembro, a empresa revelou Gênio 2um modelo que pode transformar uma imagem inicial em um mundo digital inteiro.
Outras empresas estão construindo tecnologia semelhante. Em outubro, as startups de IA Decart e Etched revelaram um hack não oficial do Minecraft no qual cada quadro do jogo fica gerado instantaneamente enquanto você joga. E o World Labs, uma startup cofundada por Fei-Fei Li – criador do ImageNet, o vasto conjunto de dados de fotos que deu início ao increase do aprendizado profundo – está construindo o que chama de grandes modelos mundiais, ou LWMs.
Uma aplicação óbvia são os videogames. Há um tom lúdico nessas primeiras experiências, e simulações 3D generativas poderiam ser usadas para explorar conceitos de design para novos jogos, transformando um esboço em um ambiente jogável em tempo actual. Isto poderia levar a tipos de jogos inteiramente novos.
Mas eles também poderiam ser usados para treinar robôs. O World Labs quer desenvolver a chamada inteligência espacial – a capacidade das máquinas de interpretar e interagir com o mundo quotidiano. Mas os pesquisadores de robótica carecem de bons dados sobre cenários do mundo actual para treinar essa tecnologia. Girando incontáveis mundos virtuais e caindo robôs virtuais aprender por tentativa e erro pode ajudar a compensar isso.