7 truques de engenharia imediatos para mitigar alucinações em LLMs -itstec.com.br. All rights reserved.

7 truques de engenharia imediatos para mitigar alucinações em LLMs

Introdução

Grandes modelos de linguagem (LLMs) exibem habilidades excepcionais para raciocinar, resumir e gerar texto de forma criativa. Ainda assim, eles permanecem suscetíveis ao problema comum de alucinaçõesque consiste em gerar informações aparentemente confiáveis, mas falsas, não verificáveis ou, às vezes, até sem sentido.

Os LLMs geram texto com base em intrincados padrões estatísticos e probabilísticos, em vez de depender principalmente da verificação de verdades fundamentadas. Em alguns campos críticos, esta questão pode causar grandes impactos negativos. Robusto engenharia imediataque envolve a habilidade de elaborar instruções bem estruturadas com instruções, restrições e contexto, pode ser uma estratégia eficaz para mitigar alucinações.

As sete técnicas listadas neste artigo, com exemplos de modelos de immediate, ilustram como tanto os LLMs autônomos quanto os sistemas de geração aumentada de recuperação (RAG) podem melhorar seu desempenho e se tornar mais robustos contra alucinações, simplesmente implementando-os nas consultas do usuário.

1. Incentive a abstenção e respostas “Não sei”

Os LLMs normalmente se concentram em fornecer respostas que pareçam confiantes, mesmo quando incertas – verifique este artigo compreender em detalhes como os LLMs geram texto – gerando como resultado fatos às vezes fabricados. Permitir explicitamente a abstenção pode orientar o LLM no sentido de mitigar um sentimento de falsa confiança. Vejamos um exemplo de immediate para fazer isso:

“Você é um assistente de verificação de fatos. Se não tiver certeza de uma resposta, responda: ‘Não tenho informações suficientes para responder a isso.’ Se estiver confiante, dê sua resposta com uma breve justificativa.”

O immediate acima seria seguido por uma pergunta actual ou verificação de fatos.

Um exemplo de resposta esperada seria:

“Não tenho informações suficientes para responder a isso.”

“Com base nas evidências disponíveis, a resposta é… (raciocínio).”

Esta é uma boa primeira linha de defesa, mas nada impede um LLM de desconsiderar essas orientações com alguma regularidade. Vamos ver o que mais podemos fazer.

2. Raciocínio estruturado em cadeia de pensamento

Pedir a um modelo de linguagem que aplique o raciocínio passo a passo incentiva a consistência interna e mitiga lacunas lógicas que às vezes podem causar alucinações de modelo. O Raciocínio de Cadeia de Pensamento (CoT) a estratégia consiste basicamente em emular um algoritmo – como uma lista de etapas ou estágios que o modelo deve abordar sequencialmente para resolver a tarefa geral em questão. Mais uma vez, presume-se que o modelo de exemplo abaixo seja acompanhado por um immediate específico do problema.

“Por favor, pense neste problema passo a passo:
1) Que informações são fornecidas?
2) Que suposições são necessárias?
3) Que conclusão se segue logicamente?”