Participe de nossos boletins informativos diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais
Nvidia lançou um poderoso modelo de inteligência synthetic de código aberto que compete com sistemas proprietários de líderes do setor como OpenAI e Google.
O novo da empresa NVLM 1.0 família de grandes modelos de linguagem multimodais, liderada pelo parâmetro 72 bilhões NVLM-D-72Bdemonstra desempenho excepcional em tarefas de visão e linguagem, ao mesmo tempo que aprimora os recursos somente de texto.
“Apresentamos o NVLM 1.0, uma família de modelos de linguagem multimodais de classe de fronteira que alcançam resultados de última geração em tarefas de linguagem de visão, rivalizando com os principais modelos proprietários (por exemplo, GPT-4o) e modelos de acesso aberto, ” explicam os pesquisadores em o papel deles.
Ao fazer os pesos do modelo disponível publicamente e prometendo liberar o código de treinamentoa Nvidia rompe com a tendência de manter fechados os sistemas avançados de IA. Esta decisão concede aos investigadores e desenvolvedores um acesso sem precedentes a tecnologia de ponta.

NVLM-D-72B: Um executor versátil em tarefas visuais e textuais
O modelo NVLM-D-72B apresenta adaptabilidade impressionante no processamento de entradas visuais e textuais complexas. Os pesquisadores forneceram exemplos que destacam a capacidade do modelo de interpretar memes, analisar imagens e resolver problemas matemáticos passo a passo.
Notavelmente, o NVLM-D-72B melhora seu desempenho em tarefas somente de texto após treinamento multimodal. Embora muitos modelos semelhantes registrem um declínio no desempenho do texto, o NVLM-D-72B aumentou sua precisão em uma média de 4,3 pontos nos principais benchmarks de texto.
“Nosso NVLM-D-1.0-72B demonstra melhorias significativas em relação ao seu spine de texto em benchmarks de matemática e codificação somente de texto”, observam os pesquisadores, enfatizando uma vantagem importante de sua abordagem.

Pesquisadores de IA respondem à iniciativa de código aberto da Nvidia
A comunidade de IA reagiu positivamente ao lançamento. Um pesquisador de IA comentando nas redes sociais observou: “Uau! A Nvidia acaba de publicar um modelo 72B que está no mesmo nível do lhama 3.1 405B em avaliações matemáticas e de codificação e também tem visão?
A decisão da Nvidia de disponibilizar abertamente um modelo tão poderoso poderia acelerar a pesquisa e o desenvolvimento de IA em todo o campo. Ao fornecer acesso a um modelo que rivaliza com sistemas proprietários de empresas de tecnologia bem financiadas, a Nvidia pode permitir que organizações menores e pesquisadores independentes contribuam de forma mais significativa para os avanços da IA.
O projeto NVLM também introduz projetos arquitetônicos inovadores, incluindo uma abordagem híbrida que combina diferentes técnicas de processamento multimodal. Este desenvolvimento pode moldar a direção de futuras pesquisas na área.
NVLM 1.0: Um novo capítulo no desenvolvimento de IA de código aberto
O lançamento do NVLM 1.0 pela Nvidia marca um momento essential no desenvolvimento de IA. Ao abrir o código-fonte de um modelo que rivaliza com gigantes proprietários, a Nvidia não está apenas compartilhando código – ela está desafiando a própria estrutura da indústria de IA.
Este movimento pode desencadear uma reação em cadeia. Outros líderes tecnológicos podem sentir-se pressionados a abrir as suas pesquisas, acelerando potencialmente o progresso da IA em todos os níveis. Também nivela o campo de jogo, permitindo que equipes e pesquisadores menores inovem com ferramentas antes reservadas aos gigantes da tecnologia.
No entanto, o lançamento do NVLM 1.0 apresenta riscos. À medida que a IA poderosa se torna mais acessível, as preocupações sobre o uso indevido e as implicações éticas provavelmente aumentarão. A comunidade de IA enfrenta agora a complexa tarefa de promover a inovação e, ao mesmo tempo, estabelecer barreiras de proteção para uma utilização responsável.
A decisão da Nvidia também levanta questões sobre o futuro dos modelos de negócios de IA. Se modelos de última geração se tornarem disponíveis gratuitamente, as empresas poderão ter de repensar a forma como criam valor e mantêm vantagens competitivas na IA.
O verdadeiro impacto do NVLM 1.0 se revelará nos próximos meses e anos. Poderia inaugurar uma period de colaboração e inovação sem precedentes em IA. Ou pode forçar um acerto de contas com as consequências não intencionais da IA avançada e amplamente disponível.
Uma coisa é certa: a Nvidia disparou um tiro na proa da indústria de IA. A questão agora não é se o cenário mudará, mas quão dramaticamente – e quem se adaptará com rapidez suficiente para prosperar neste novo mundo de IA aberta.