- Memória persona Armazra a identidade do agente, os traços de personalidade, os papéis, a experiência e o estilo de comunicação.
- Memória da caixa de ferramentas Contém definições de ferramentas, metadados, esquemas de parâmetros e incorporação para os recursos do agente.
- Memória de conversa armazena o histórico de trocas entre o usuário e o agente.
- Memória do fluxo de trabalho Rastreia o estado dos processos de vários etapas.
- Memória episódica armazena eventos ou experiências específicas que o agente encontrou.
- Memória de longo prazo (Base de conhecimento) fornece ao agente um armazenamento persistente de conhecimento de fundo.
- Registro de agentes é um repositório para fatos e informações sobre entidades com as quais o agente interage, como seres humanos, outros agentes ou APIs.
- Memória da entidade armazena fatos e dados associados às várias entidades com as quais um agente interage durante sua operação.
- Memória de trabalho Serve como um espaço de processamento temporário e ativo, que é implementado através da janela de contexto do modelo de idioma grande.
São muitas “memórias”, mas como as trazemos à vida? A indústria ainda está descobrindo isso, mas para a maioria das empresas hoje, o RAG é a maneira mais comum de melhorar a memória de um aplicativo de IA. No RAG, a IA extrai fatos relevantes de uma base de conhecimento (banco de dados) para fundamentar suas respostas. Em vez de confiar apenas no que está embalado no treinamento do modelo (que pode estar desatualizado ou muito geral), a IA realiza uma pesquisa em uma loja externa, geralmente um banco de dados vetorial, para recuperar informações atualizadas ou detalhadas. Isso permite que o sistema “lembre -se” de coisas em que nunca foi explicitamente treinado, por exemplo, os documentos internos de uma empresa ou o histórico de um usuário específico, que ele pode incorporar em sua resposta.
Ao aumentar os avisos com dados obtidos em um banco de dados, os sistemas de IA podem manter uma conversa coerente ao longo do tempo e responder com precisão de perguntas específicas do domínio, ganhando essencialmente o estado e a memória de longo prazo além dos parâmetros de modelo fixo. É uma maneira de garantir que a IA não comece de zero todas as vezes; Ele pode se lembrar do que foi dito anteriormente e explorar fatos além de seu corte de treinamento. Em resumo, os bancos de dados (particularmente as lojas vetoriais) estão se mostrando essenciais para a memória de longo prazo da IA.
Vetores, gráficos e memórias híbridas
Nem todas as memórias são criadas iguais, é claro, e nem todos os bancos de dados funcionam da mesma maneira. Como setor, atualmente estamos experimentando diferentes tecnologias de banco de dados para servir como memória de IA, cada uma com pontos fortes e compensações. Como mencionado, bancos de dados vetoriais são o filho do pôster da memória da IA. Eles se destacam na pesquisa semântica de similaridade, encontrando informações relacionadas ao significado, não apenas por palavras -chave. Isso os torna ideais para dados não estruturados, como pedaços de texto: faça uma pergunta e encontre a passagem que melhor a responde.