O Fundação Linux mover para pegar o Iniciativa de Modelo Aberto (OMI) sob sua asa poderia abrir caminho para uma “cultura mais ética” grandes modelos de linguagem (LLMs)dizem analistas.
“Um dos principais objetivos do OMI e sua integração na Linux Basis é propagar um uso ético de dados (texto/imagens) para treinar modelos de IA generativos”, disse Abhigyan Malik, diretor de prática de dados, análises e IA no Grupo Everest.
No entanto, Malik alertou que a prática de treinar modelos com dados éticos se tornará cada vez mais difícil, dada a compreensão mais ampla da proteção de dados e com fontes populares mudando suas políticas de privacidade e uso.
Vários provedores proprietários de LLM, como IA aberta e Estabilidade IAestão atualmente enfrentando processos que alegam que essas empresas violaram direitos autorais ao treinar seus modelos.
O que é a Open Mannequin Initiative?
A Open Mannequin Initiative (OMI), fundada em junho por três startups — Invoke, Civitai e Comfortable Org, tem como objetivo reunir desenvolvedores, pesquisadores e empresas para colaborar no avanço de modelos abertos e licenciado permissivamente Tecnologias de modelos relacionadas à IA.
Licenças permissivas, de acordo com a Linux Basis, tendem a facilitar a participação e o compartilhamento de contribuições por parte dos membros da comunidade sem obrigações posteriores.
“Isso favorece particularmente os segmentos de software program que exigem que os produtores de software program possam distribuir software program proprietário com base na base de código aberto sem revelar suas alterações”, explicou a Fundação em seu guia para software program de código aberto.
O objetivo principal do OMI é reunir profunda experiência em treinamento e inferência de modelos para desenvolver modelos de qualidade igual ou superior aos modelos proprietários, como LLMs dos estábulos de IA aberta, Googlee AWSmas livre de termos de licenciamento restritivos que limitam o uso desses modelos.
Para atingir esse objetivo, o OMI, que será governado por um comitê diretor liderado pela comunidade, estabelecerá uma estrutura de governança e grupos de trabalho para o desenvolvimento comunitário colaborativo.
A Linux Basis também realizará uma pesquisa para coletar suggestions sobre futuras pesquisas e treinamentos de modelos da comunidade de código aberto, disse a Linux Basis em um comunicado, acrescentando que criará ainda mais padrões compartilhados para aprimorar a interoperabilidade do modelo e as práticas de metadados.
Além disso, o OMI desenvolverá um conjunto de dados transparente para treinamento e criará um modelo de teste alfa para equipe vermelha.
O objetivo closing da iniciativa, de acordo com a Fundação, será lançar uma versão alfa do modelo, com scripts de ajuste fino, para a comunidade até o closing do ano.
Por que isso é importante para as empresas?
A importância desta mudança para as empresas reside na indisponibilidade do código-fonte e nas restrições de licença dos provedores de LLM, como Meta, Mistral e Antrópicoque colocam ressalvas nas políticas de uso de seus modelos de “código aberto”.
A Meta, por exemplo, de acordo com Suseel Menon, outra líder de prática de IA do Everest Group, fornece os direitos de uso dos modelos Llama sem royalties e sem nenhuma licença, mas não fornece o código-fonte.
“A Meta também acrescenta uma cláusula: ‘Se, por Meta Lhama 3usuários ativos mensais dos produtos ou serviços for maior que 700 milhões de usuários ativos mensais, você deve solicitar uma licença da Meta.’ Esta cláusula, combinada com a indisponibilidade do código-fonte, levanta a questão se o termo código-fonte aberto deve ser aplicado à família de modelos da Llama”, explicou Menon.
Em contraste, o objetivo da OMI, de acordo com analistas, é criar modelos que não apresentem ressalvas às empresas e sejam mais livremente acessíveis.
A OMI resistirá ao poder da Meta e dos maiores provedores de LLM?
Os objetivos e a visão da OMI receberam reações mistas dos analistas.
Enquanto o analista chefe da Amalgam Insights, Hyoun Park, acredita que o OMI levará ao desenvolvimento de padrões mais previsíveis e consistentes para modelos de código aberto, para que esses modelos possam potencialmente trabalhar uns com os outros mais facilmente, Malik, do Everest Group, acredita que o OMI pode não ser capaz de resistir ao poder de fornecedores como Meta e Anthropic.
“O desenvolvimento de LLMs exige muita computação e custou bilhões em despesas de capital para grandes gigantes da tecnologia e startups para atingir a escala que eles têm atualmente com seus LLMs de código aberto e proprietários”, disse Malik, acrescentando que isso pode ser um grande desafio para LLMs baseados na comunidade.
O líder da prática de IA também destacou que tentativas anteriores de um LLM baseado na comunidade também não obtiveram muita adoção, já que modelos desenvolvidos por entidades maiores tendem a ter melhor desempenho na maioria das métricas.
“Um excelente exemplo de um LLM aberto é o BLOOM, que criou com sucesso um modelo de comunidade, mas ainda não conseguiu criar adoção devido a ineficiências e certas escolhas de design (ele foi projetado para não ser uma interface de bate-papo)”, explicou Malik.
No entanto, o líder da prática de IA disse que a OMI pode encontrar nichos apropriados dentro do espaço de desenvolvimento de conteúdo (geração de imagens 2D/3D, adaptação, design visible, edição, and so forth.) à medida que começa a construir seus modelos.
“Esses nichos estão alinhados a vários casos de uso (ex: geração de imagens 3D) ou aplicações em verticais (ex: geração/edição de imagens de catálogo para varejo) onde seus modelos podem executar tarefas de forma eficaz”, disse Malik.
A teoria de Malik pode ser válida, já que a Invoke é uma plataforma de IA generativa para estúdios profissionais e a Civitai é um centro de IA generativa para criadores.
Um dos outros casos de uso para os LLMs comunitários da OMI é ver seu uso como pequenos modelos de linguagem (SLMs)que pode oferecer funcionalidade específica com alta eficácia ou funcionalidade restrita a aplicações ou casos de uso exclusivos, disseram analistas.
Atualmente, o GitHub da OMI página tem três repositórios, todos sob licença Apache 2.0.