A Nvidia acaba de lançar uma bomba: seu novo modelo de IA é aberto, massivo e pronto para rivalizar com o GPT-4 -itstec.com.br. All rights reserved.

Participe de nossos boletins informativos diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais

Nvidia lançou um poderoso modelo de inteligência synthetic de código aberto que compete com sistemas proprietários de líderes do setor como OpenAI e Google.

O novo da empresa NVLM 1.0 família de grandes modelos de linguagem multimodais, liderada pelo parâmetro 72 bilhões NVLM-D-72Bdemonstra desempenho excepcional em tarefas de visão e linguagem, ao mesmo tempo que aprimora os recursos somente de texto.

“Apresentamos o NVLM 1.0, uma família de modelos de linguagem multimodais de classe de fronteira que alcançam resultados de última geração em tarefas de linguagem de visão, rivalizando com os principais modelos proprietários (por exemplo, GPT-4o) e modelos de acesso aberto, ” explicam os pesquisadores em o papel deles.

Ao fazer os pesos do modelo disponível publicamente e prometendo liberar o código de treinamentoa Nvidia rompe com a tendência de manter fechados os sistemas avançados de IA. Esta decisão concede aos investigadores e desenvolvedores um acesso sem precedentes a tecnologia de ponta.

A Nvidia acaba de lançar uma bomba: seu novo modelo de IA é aberto, massivo e pronto para rivalizar com o GPT-4 — Resultados de benchmark comparando o modelo NVLM-D da NVIDIA com gigantes de IA como GPT-4, Claude 3.5 e Llama 3-V, mostrando o desempenho competitivo do NVLM-D em várias tarefas visuais e de linguagem. (Crédito: arxiv.org)

NVLM-D-72B: Um executor versátil em tarefas visuais e textuais

O modelo NVLM-D-72B apresenta adaptabilidade impressionante no processamento de entradas visuais e textuais complexas. Os pesquisadores forneceram exemplos que destacam a capacidade do modelo de interpretar memes, analisar imagens e resolver problemas matemáticos passo a passo.

Notavelmente, o NVLM-D-72B melhora seu desempenho em tarefas somente de texto após treinamento multimodal. Embora muitos modelos semelhantes registrem um declínio no desempenho do texto, o NVLM-D-72B aumentou sua precisão em uma média de 4,3 pontos nos principais benchmarks de texto.

“Nosso NVLM-D-1.0-72B demonstra melhorias significativas em relação ao seu spine de texto em benchmarks de matemática e codificação somente de texto”, observam os pesquisadores, enfatizando uma vantagem importante de sua abordagem.

O novo modelo de IA da NVIDIA analisa um meme comparando resumos acadêmicos com artigos completos, demonstrando sua capacidade de interpretar o humor visible e conceitos acadêmicos. (Crédito: arxiv.org)

Pesquisadores de IA respondem à iniciativa de código aberto da Nvidia

A comunidade de IA reagiu positivamente ao lançamento. Um pesquisador de IA comentando nas redes sociais observou: “Uau! A Nvidia acaba de publicar um modelo 72B que está no mesmo nível do lhama 3.1 405B em avaliações matemáticas e de codificação e também tem visão?

A decisão da Nvidia de disponibilizar abertamente um modelo tão poderoso poderia acelerar a pesquisa e o desenvolvimento de IA em todo o campo. Ao fornecer acesso a um modelo que rivaliza com sistemas proprietários de empresas de tecnologia bem financiadas, a Nvidia pode permitir que organizações menores e pesquisadores independentes contribuam de forma mais significativa para os avanços da IA.

O projeto NVLM também introduz projetos arquitetônicos inovadores, incluindo uma abordagem híbrida que combina diferentes técnicas de processamento multimodal. Este desenvolvimento pode moldar a direção de futuras pesquisas na área.

NVLM 1.0: Um novo capítulo no desenvolvimento de IA de código aberto

O lançamento do NVLM 1.0 pela Nvidia marca um momento essential no desenvolvimento de IA. Ao abrir o código-fonte de um modelo que rivaliza com gigantes proprietários, a Nvidia não está apenas compartilhando código – ela está desafiando a própria estrutura da indústria de IA.

Este movimento pode desencadear uma reação em cadeia. Outros líderes tecnológicos podem sentir-se pressionados a abrir as suas pesquisas, acelerando potencialmente o progresso da IA em todos os níveis. Também nivela o campo de jogo, permitindo que equipes e pesquisadores menores inovem com ferramentas antes reservadas aos gigantes da tecnologia.

No entanto, o lançamento do NVLM 1.0 apresenta riscos. À medida que a IA poderosa se torna mais acessível, as preocupações sobre o uso indevido e as implicações éticas provavelmente aumentarão. A comunidade de IA enfrenta agora a complexa tarefa de promover a inovação e, ao mesmo tempo, estabelecer barreiras de proteção para uma utilização responsável.

A decisão da Nvidia também levanta questões sobre o futuro dos modelos de negócios de IA. Se modelos de última geração se tornarem disponíveis gratuitamente, as empresas poderão ter de repensar a forma como criam valor e mantêm vantagens competitivas na IA.

O verdadeiro impacto do NVLM 1.0 se revelará nos próximos meses e anos. Poderia inaugurar uma period de colaboração e inovação sem precedentes em IA. Ou pode forçar um acerto de contas com as consequências não intencionais da IA avançada e amplamente disponível.

Uma coisa é certa: a Nvidia disparou um tiro na proa da indústria de IA. A questão agora não é se o cenário mudará, mas quão dramaticamente – e quem se adaptará com rapidez suficiente para prosperar neste novo mundo de IA aberta.

VB diário

Fique por dentro! Receba as últimas notícias em sua caixa de entrada diariamente

Ao se inscrever, você concorda com os termos da VentureBeat Termos de serviço.

Obrigado por se inscrever. Confira mais Boletins informativos VB aqui.

Ocorreu um erro.

A Nvidia acaba de lançar uma bomba: seu novo modelo de IA é aberto, massivo e pronto para rivalizar com o GPT-4

NVLM-D-72B: Um executor versátil em tarefas visuais e textuais

Pesquisadores de IA respondem à iniciativa de código aberto da Nvidia

NVLM 1.0: Um novo capítulo no desenvolvimento de IA de código aberto

Deixe um comentário Cancelar resposta

Desembalagem do Antigravity A1 Infinity Bundle: o que você ganha por US $ 1.999

Apresentando DJI FlyCart 100 | Obtenha mais entregas – The Drone Information

Caracterizando estados quânticos de muitos corpos – Physics World

Melhorando a eficácia antimicrobiana do EPI com nanopartículas de ZnO

Comportamento anti-ambipolar modulado por composição habilitado por heteroestruturas bidimensionais GeSxSe1−x/SnS2 van der Waals para inversores lógicos de alto desempenho

Estudando o papel do ambiente quântico na ciência do attosegundo – Physics World

A assinatura do Google One de banda larga da Airtel House chega por 6 meses

Mercado europeu de largura de banda: panorama atual

As atualizações da Veeam e HPE visam agilizar a recuperação da nuvem híbrida

Estreia a linguagem funcional Unison ‘futurista’

O acelerador está no chão para veículos autônomos

A assinatura do Google One de banda larga da Airtel House chega por 6 meses