
Grandes modelos de linguagem (LLMs) chamaram a atenção do mundo por sua capacidade aparentemente mágica de filtrar instantaneamente dados infinitos, gerar respostas e até mesmo criar conteúdo visible a partir de instruções simples. Mas os seus “pequenos” homólogos não ficam muito atrás. E à medida que surgem dúvidas sobre se a IA pode realmente gerar retornos significativos (ROI), as organizações devem prestar atenção. Porque, como acontecemodelos de linguagem pequena (SLMs), que usam muito menos parâmetros, recursos computacionais e energia do que modelos de linguagem grande para executar tarefas específicas, demonstraram ser tão eficazes quanto seus equivalentes muito maiores.
Num mundo onde as empresas investiram quantias absurdas de dinheiro em IA e questionou os retornosos SLMs estão provando ser um salvador do ROI. Em última análise, a IA de agência habilitada para SLM oferece o melhor de SLMs e LLMs juntos – incluindo maior satisfação e retenção dos funcionários, maior produtividade e custos mais baixos. E dado um relatório do Gartner que dizia 40% dos projetos de IA agente serão cancelados até o ultimate de 2027 devido às complexidades e às rápidas evoluções que muitas vezes levam as empresas ao caminho errado, os SLMs podem ser uma ferramenta importante no peito de qualquer CIO.
Tomemos como exemplo as funções de tecnologia da informação (TI) e recursos humanos (RH). Na TI, os SLMs podem gerar resoluções autônomas e precisas, orquestração de fluxo de trabalho e acesso ao conhecimento. E para o RH, eles estão permitindo suporte personalizado aos funcionários, simplificando a integração e lidando com consultas de rotina com privacidade e precisão. Em ambos os casos, os SLMs permitem que os usuários “conversem” com sistemas empresariais complexos da mesma forma que fariam com um representante humano.
Com um SLM bem treinado, os usuários podem simplesmente escrever uma mensagem do Slack ou do Microsoft Groups para o agente de IA (“Não consigo me conectar à minha VPN” ou “Preciso atualizar meu laptop computer” ou “Preciso de comprovante de emprego para um pedido de hipoteca”), e o agente resolverá automaticamente o problema. Além do mais, as respostas serão personalizadas com base nos perfis e comportamentos dos usuários e o suporte será proativo e antecipativo de quando problemas poderão ocorrer.
Compreendendo os SLMs
Então, o que exatamente é um SLM? É um termo relativamente mal definido, mas geralmente é um modelo de linguagem com algo entre um bilhão e 40 bilhões de parâmetros, contra 70 bilhões a centenas de bilhões para LLMs. Eles também podem existir como uma forma de código aberto onde você tem acesso aos seus pesos, preconceitos e código de treinamento.
Existem também SLMs que são apenas de “peso aberto”, o que significa que você tem acesso a pesos de modelo com restrições. Isso é importante porque um dos principais benefícios dos SLMs é a capacidade de ajustar ou personalizar o modelo para que você possa baseá-lo nas nuances de um domínio específico. Por exemplo, você pode usar chats internos, tickets de suporte e mensagens do Slack para criar um sistema para responder às perguntas dos clientes. O processo de ajuste fino ajuda a aumentar a precisão e a relevância das respostas.
Agentic AI aproveitará SLMs e LLMs
É compreensível querer usar modelos de última geração para IA de agência. Considere que os modelos de fronteira mais recentes têm uma pontuação elevada em matemática, desenvolvimento de software program e raciocínio médico, apenas para citar algumas categorias. No entanto, a pergunta que todo CIO deveria fazer é: precisamos realmente de tanto poder de fogo em nossa organização? Para muitos casos de uso corporativo, a resposta é não.
E mesmo sendo pequenos, não os subestime. Seu pequeno tamanho significa que possuem menor latência, o que é elementary para o processamento em tempo actual. Os SLMs também podem operar em formatos pequenos, como dispositivos de borda ou outros ambientes com recursos limitados.
Outra vantagem dos SLMs é que eles são particularmente eficazes no tratamento de tarefas como ferramentas de chamada, interações de API ou roteamento. É exatamente isso que a IA agente deveria fazer: realizar ações. Os LLMs sofisticados, por outro lado, podem ser mais lentos, envolver-se no tratamento de tarefas excessivamente fundamentado e consumir grandes quantidades de tokens.
Em ambientes de TI e RH, o equilíbrio entre velocidade, precisão e eficiência de recursos para funcionários e equipes de TI ou RH é importante. Para os funcionários, os assistentes de agente baseados em SLMs fornecem ajuda rápida e conversacional para resolver problemas com mais rapidez. Para as equipes de TI e RH, os SLMs reduzem a carga de tarefas repetitivas, automatizando o tratamento, o roteamento e as aprovações de tickets, liberando a equipe para se concentrar em trabalhos estratégicos de maior valor. Além disso, os SLMs também podem proporcionar economias substanciais de custos, pois esses modelos utilizam níveis relativamente menores de energia, memória e poder computacional. Sua eficiência pode ser extremamente benéfica ao usar plataformas em nuvem.
Onde os SLMs ficam aquém
É verdade que os SLMs também não são soluções mágicas. Certamente há casos em que você precisa de um LLM sofisticado, como para processos altamente complexos de várias etapas. Uma arquitetura híbrida – onde os SLMs lidam com a maioria das interações operacionais e os LLMs são reservados para raciocínios avançados ou escalonamentos – permite que as equipes de TI e RH otimizem o desempenho e os custos. Para isso, um sistema pode aproveitar a observabilidade e as avaliações para decidir dinamicamente quando usar um SLM ou LLM. Ou, se um SLM não conseguir obter uma boa resposta, o próximo passo poderá ser um LLM.
Os SLMs estão emergindo como a abordagem mais prática para alcançar o ROI com IA de agência. Ao combinar SLMs com o uso seletivo de LLMs, as organizações podem criar arquiteturas equilibradas e econômicas que se expandem tanto em TI quanto em RH, entregando resultados mensuráveis e um caminho mais rápido para o valor. Com SLMs, menos é mais.
–
Fórum de Nova Tecnologia oferece um native para líderes de tecnologia — incluindo fornecedores e outros colaboradores externos — explorarem e discutirem tecnologias empresariais emergentes com profundidade e amplitude sem precedentes. A seleção é subjetiva, baseada na escolha das tecnologias que acreditamos serem importantes e de maior interesse para os leitores do InfoWorld. A InfoWorld não aceita materials de advertising para publicação e reserva-se o direito de editar todo o conteúdo contribuído. Enviar tudo consultas para doug_dineley@foundryco.com.