
Quando se trata de inteligência synthetic, o MIT e a IBM estavam lá desde o início: lançando o trabalho basic e criando alguns dos primeiros programas – predecessores da IA – e teorizando como a “inteligência” da máquina poderia vir a ser.
Hoje, colaborações como o MIT-IBM Watson AI Lab, lançado há oito anos, continuam a fornecer conhecimentos para a promessa da tecnologia de IA do futuro. Isto é basic para as indústrias e a força de trabalho que poderão beneficiar, especialmente a curto prazo: desde 3 a 4 biliões de dólares em benefícios económicos globais previstos e ganhos de produtividade de 80% para trabalhadores do conhecimento e tarefas criativas, até incorporações significativas de IA generativa em processos empresariais (80%) e aplicações de software program (70%) nos próximos três anos.
Embora a indústria tenha visto um growth em modelos notáveis, principalmente no ano passado, a academia continua a impulsionar a inovaçãocontribuindo com a maior parte das pesquisas altamente citadas. No MIT-IBM Watson AI Lab, o sucesso assume a forma de 54 divulgações de patentes, um excesso de 128.000 citações com um índice h de 162 e mais de 50 casos de uso orientados pela indústria. Algumas das muitas conquistas do laboratório incluem melhor posicionamento do stent com técnicas de imagem de IA, redução da sobrecarga computacional, redução de modelos enquanto mantém o desempenho e modelagem do potencial interatômico para a química do silicato.
“O laboratório está numa posição única para identificar os problemas ‘certos’ a resolver, diferenciando-nos de outras entidades”, afirma Aude Oliva, diretora do laboratório do MIT e diretora de envolvimento estratégico da indústria no MIT Schwarzman School of Computing. “Além disso, a experiência que os nossos alunos ganham ao trabalhar nestes desafios para a IA empresarial traduz-se na sua competitividade no mercado de trabalho e na promoção de uma indústria competitiva.”
“O laboratório de IA do MIT-IBM Watson AI teve um impacto tremendo ao reunir um rico conjunto de colaborações entre a IBM e os pesquisadores e estudantes do MIT”, disse a reitora Anantha Chandrakasan, que é copresidente do laboratório no MIT e professora de Engenharia Elétrica e Ciência da Computação Vannevar Bush. “Ao apoiar a investigação transversal na intersecção da IA e de muitas outras disciplinas, o laboratório está a avançar no trabalho basic e a acelerar o desenvolvimento de soluções transformadoras para a nossa nação e para o mundo.”
Trabalho de longo horizonte
À medida que a IA continua a atrair interesse, muitas organizações lutam para canalizar a tecnologia para resultados significativos. UM Estudo Gartner de 2024 conclui que “pelo menos 30% dos projetos de IA generativa serão abandonados após prova de conceito até ao ultimate de 2025”, demonstrando ambição e fome generalizada de IA, mas uma falta de conhecimento sobre como desenvolvê-la e aplicá-la para criar valor imediato.
Aqui, o laboratório brilha, unindo pesquisa e implantação. A maior parte do portfólio de pesquisa do laboratório no ano atual está alinhada para usar e desenvolver novos recursos, capacidades ou produtos para a IBM, os membros corporativos do laboratório ou aplicativos do mundo actual. O último deles compreende grandes modelos de linguagem, {hardware} de IA e modelos básicos, incluindo modelos multimodais, biomédicos e geoespaciais. Estudantes e estagiários orientados para a investigação são inestimáveis nesta busca, oferecendo entusiasmo e novas perspectivas ao mesmo tempo em que acumulam conhecimento de domínio para ajudar a derivar e projetar avanços no campo, bem como abrir novas fronteiras para exploração com IA como ferramenta.
Descobertas do Painel presidencial AAAI 2025 sobre o futuro da pesquisa em IA apoiam a necessidade de contribuições de colaborações entre o meio académico e a indústria, como o laboratório na área da IA: “Os académicos têm um papel a desempenhar no fornecimento de aconselhamento e interpretações independentes destes resultados (da indústria) e das suas consequências. O sector privado concentra-se mais no curto prazo, e as universidades e a sociedade mais numa perspectiva de longo prazo.”
Reunir estes pontos fortes, juntamente com o impulso para o código aberto e a ciência aberta, pode desencadear uma inovação que nenhum dos dois conseguiria alcançar sozinho. A história mostra que abraçar estes princípios, partilhar códigos e tornar a investigação acessível traz benefícios a longo prazo tanto para o sector como para a sociedade. Em linha com as missões da IBM e do MIT, o laboratório contribui com tecnologias, descobertas, governança e padrões para a esfera pública através desta colaboração, aumentando assim a transparência, acelerando a reprodutibilidade e garantindo avanços confiáveis.
O laboratório foi criado para fundir a profunda experiência em pesquisa do MIT com a capacidade de P&D industrial da IBM, visando avanços nos principais métodos e {hardware} de IA, bem como novas aplicações em áreas como saúde, química, finanças, segurança cibernética e planejamento robusto e tomada de decisões para negócios.
Maior nem sempre é melhor
Hoje, grandes modelos de base estão dando lugar a modelos menores e mais específicos para tarefas, produzindo melhor desempenho. Contribuições de membros do laboratório como Music Han, professor associado do Departamento de Engenharia Elétrica e Ciência da Computação (EECS) do MIT, e Chuang Gan da IBM Analysis ajudam a tornar isso possível, por meio de trabalhos como de uma vez por todas e AWQ. Inovações como essas melhoram a eficiência com arquiteturas melhores, redução de algoritmos e quantização de peso com reconhecimento de ativação, permitindo que modelos como processamento de linguagem sejam executados em dispositivos de ponta em velocidades mais rápidas e latência reduzida.
Consequentemente, modelos de base, visão, multimodais e de linguagem grande obtiveram benefícios, permitindo que os grupos de pesquisa de laboratório de Oliva, o professor associado do MIT EECS Yoon Kim e os membros da IBM Analysis Rameswar Panda, Yang Zhang e Rogerio Feris desenvolvessem o trabalho. Isto inclui técnicas para imbuir modelos com conhecimento externo e o desenvolvimento de métodos de transformadores de atenção linear para maior rendimento, em comparação com outros sistemas de última geração.
A compreensão e o raciocínio em sistemas de visão e multimodais também foram benéficos. Funciona como “Tarefa2Sim” e “Ada Fuse” demonstram melhor desempenho do modelo de visão se o pré-treinamento ocorrer em dados sintéticos e como o reconhecimento de ação de vídeo pode ser aumentado pela fusão de canais de mapas de recursos anteriores e atuais.
Como parte de um compromisso com uma IA mais enxuta, as equipes de laboratório de Gregory Wornell, professor de engenharia da Sumitomo Electrical Industries do MIT EECS, Chuang Gan da IBM Analysis, e David Cox, vice-presidente de IA basic da IBM Analysis e diretor da IBM do laboratório, mostraram que a adaptabilidade do modelo e a eficiência dos dados podem andar de mãos dadas. Duas abordagens, Escala Evo e Raciocínio de cadeia de ação-pensamento (COAT), permitem que os modelos de linguagem aproveitem ao máximo dados e computação limitados, melhorando as tentativas da geração anterior por meio de iteração estruturada, restringindo-se a uma resposta melhor. O COAT usa uma estrutura de meta-ação e aprendizado por reforço para lidar com tarefas de raciocínio intensivo por meio de autocorreção, enquanto o EvoScale traz uma filosofia semelhante para a geração de código, desenvolvendo soluções candidatas de alta qualidade. Essas técnicas ajudam a permitir uma implantação no mundo actual, consciente dos recursos e direcionada.
“O impacto da pesquisa do MIT-IBM em nossos grandes esforços de desenvolvimento de modelos de linguagem não pode ser exagerado”, diz Cox. “Estamos vendo que modelos e ferramentas menores e mais especializados estão tendo um impacto descomunal, especialmente quando combinados. As inovações do MIT-IBM Watson AI Lab ajudam a moldar essas direções técnicas e a influenciar a estratégia que estamos adotando no mercado por meio de plataformas como o watsonx.”
Por exemplo, vários projetos de laboratório contribuíram com recursos, capacidades e usos para o Visão Granitoque fornece uma visão computacional impressionante projetada para a compreensão de documentos, apesar de seu tamanho compacto. Isso ocorre em um momento em que há uma necessidade crescente de extração, interpretação e resumo confiável de informações e dados contidos em formatos longos para fins empresariais.
Outras conquistas que vão além da investigação direta sobre IA e entre disciplinas não são apenas benéficas, mas também necessárias para o avanço da tecnologia e a elevação da sociedade, conclui o painel 2025 da AAAI.
O trabalho de Caroline Uhler e Devavrat Shah do laboratório – ambos professores Andrew (1956) e Erna Viterbi no EECS e no Instituto de Dados, Sistemas e Sociedade (IDSS) – junto com Kristjan Greenewald da IBM Analysis, transcende as especializações. Estão a desenvolver métodos de descoberta causal para descobrir como as intervenções afectam os resultados e identificar quais delas alcançam os resultados desejados. Os estudos incluem o desenvolvimento de uma estrutura que pode elucidar como podem funcionar os “tratamentos” para diferentes subpopulações, como numa plataforma de comércio eletrónico ou restrições de mobilidade nos resultados de morbilidade. As descobertas deste corpo de trabalho podem influenciar as áreas de advertising and marketing e medicina, educação e gestão de riscos.
“Os avanços na IA e em outras áreas da computação estão influenciando a forma como as pessoas formulam e enfrentam desafios em quase todas as disciplinas. No MIT-IBM Watson AI Lab, os pesquisadores reconhecem essa natureza transversal de seu trabalho e seu impacto, interrogando problemas de vários pontos de vista e trazendo problemas do mundo actual da indústria, a fim de desenvolver novas soluções”, afirma Dan Huttenlocher, co-presidente do laboratório do MIT, reitor do MIT Schwarzman School of Computing, e Henry Ellis Warren. (1894) Professor de Engenharia Elétrica e Ciência da Computação.
Uma parte significativa do que faz este ecossistema de pesquisa prosperar é o fluxo constante de talentos estudantis e suas contribuições por meio do Programa de Oportunidades de Pesquisa de Graduação do MIT (UROP), Programa MIT EECS 6Ae o novo programa de estágio do MIT-IBM Watson AI Lab. No whole, mais de 70 jovens investigadores não só aceleraram o desenvolvimento das suas competências técnicas, como também, através da orientação e do apoio dos mentores do laboratório, adquiriram conhecimentos em domínios da IA para se tornarem eles próprios profissionais emergentes. É por isso que o laboratório procura continuamente identificar estudantes promissores em todas as fases da exploração do potencial da IA.
“Para desbloquear todo o potencial econômico e social da IA, precisamos promover ‘inteligência útil e eficiente’”, afirma Sriram Raghavan, vice-presidente de pesquisa de IA da IBM e presidente do laboratório da IBM. “Para traduzir a promessa da IA em progresso, é essential que continuemos a nos concentrar em inovações para desenvolver modelos eficientes, otimizados e adequados à finalidade que possam ser facilmente adaptados a domínios e casos de uso específicos. Colaborações entre o setor acadêmico e o setor acadêmico, como o MIT-IBM Watson AI Lab, ajudam a impulsionar os avanços que tornam isso possível.”