Reanking em mosaico AI Vector Sear


Para muitas organizações, o maior desafio com os agentes de IA construídos sobre dados não estruturados não é o modelo, mas é o contexto. Se o agente não puder recuperar as informações corretas, mesmo o modelo mais avançado perderá os principais detalhes e fornecerá respostas incompletas ou incorretas.

Estamos apresentando reranger a pesquisa de vetor de IA em mosaico, agora em visualização pública. Com um único parâmetro, você pode aumentar a precisão da recuperação em uma média de 15 pontos percentuais em nosso benchmarks corporativos. Isso significa respostas de maior qualidade, melhor raciocínio e desempenho mais consistente do agente-sem infraestrutura further ou configuração complexa.

O que é reranger?

A reranger é uma técnica que melhora a qualidade do agente, garantindo que o agente obtenha os dados mais relevantes para executar sua tarefa. Enquanto os bancos de dados vetoriais se destacam em encontrar rapidamente documentos relevantes de milhões de candidatos, a reranger aplica um entendimento contextual mais profundo para garantir que os resultados mais semanticamente relevantes apareçam no topo. Essa abordagem em dois estágios-recuperação rápida seguida de reordenação inteligente-se torna essencial para os sistemas de agentes de trapos onde a qualidade é importante.

Por que acrescentamos rerangendo

Você pode estar construindo agentes de bate-papo voltados internamente para responder a perguntas sobre seus documentos. Ou você pode estar construindo agentes que geram relatórios para seus clientes. De qualquer forma, se você deseja criar agentes que possam usar com precisão seus dados não estruturados, a qualidade está vinculada à recuperação. Remover é como os clientes de busca de vetores aumentam a qualidade de sua recuperação e, assim, aumentam a qualidade de seus agentes de pano.

Do suggestions do cliente, vimos dois problemas comuns:

  • Os agentes podem perder o contexto crítico enterrado em grandes conjuntos de documentos não estruturados. A passagem “direita” raramente fica no topo dos resultados recuperados de um banco de dados vetorial.
  • Os sistemas de reranking homegrown aumentam significativamente a qualidade do agente, mas levam semanas para serem construídos e precisam de manutenção significativa.

Ao re -trabalhar um recurso de pesquisa de vetor nativo, você pode usar seus dados corporativos governados para superfície as informações mais relevantes sem engenharia further.

O recurso Reranker ajudou a elevar nosso chatbot lexi de funcionar como um aluno do ensino médio para se apresentar como um graduado da faculdade de direito. Vimos ganhos transformadores na maneira como nossos sistemas entendem, raciocinam e geram conteúdo a partir de insights de documentos legais que foram enterrados anteriormente em dados não estruturados. – David Brady, diretor sênior da G3 Enterprises

Uma melhoria substancial da qualidade em relação às linhas de base

Nossa equipe de pesquisa alcançou um avanço ao construir um novo sistema composto de IA para cargas de trabalho de agentes. Em nosso benchmarks corporativos, O sistema recupera a resposta correta dentro dos 10 principais resultados 89percentdas vezes (recall@10), uma melhoria de 15 pontos em relação à nossa linha de base (74%) e 10 pontos mais alta que as principais alternativas em nuvem (79%). Crucialmente, nosso reranker oferece essa qualidade com latências tão baixas quanto 1,5 segundos, enquanto os sistemas contemporâneos geralmente levam vários segundos-ou até minutos-para retornar respostas de alta qualidade.

Reanking em mosaico AI Vector Sear
Referência corporativa mostrando recall@10 melhorias com reranking

Recuperação fácil e de alta qualidade

Habilite o reranger reranger em minutos, não semanas. As equipes geralmente passam semanas pesquisando modelos, implantando infraestrutura e escrevendo lógica personalizada. Em contraste, a possibilidade de re -trabalhar para pesquisa vetorial requer apenas um parâmetro adicional em sua consulta de pesquisa vetorial para obter instantaneamente recuperação de qualidade para seus agentes. Nenhum modelo que atenda pontos de extremidade para gerenciar, nenhum invólucro personalizado para manter, nenhuma configuração complexa para sintonizar.

Ao especificar várias colunas em colunas_to_rerank, você está levando a qualidade do reanranker para o próximo nível, dando -lhe acesso a metadados além do texto principal. Neste exemplo, o Reranker usa resumos de contratos e informações de categoria para entender melhor o contexto e melhorar a relevância dos resultados da pesquisa.

Otimizado para o desempenho do agente

A velocidade atende à qualidade para a IA em tempo actual, aplicativos Agentic. Nossa equipe de pesquisa otimizou esse sistema de IA composto para reencaminhar 50 resulta em apenas 1,5 segundos. Isso o torna altamente eficaz para sistemas de agentes que exigem precisão e capacidade de resposta. Esse desempenho inovador permite estratégias sofisticadas de recuperação sem comprometer a experiência do usuário.

Quando usar o reranking?

Recomendamos testar o reranking para qualquer caso de uso do agente do RAG. Normalmente, os clientes verão ganhos maciços de qualidade quando seus sistemas atuais encontrarem a resposta certa em algum lugar dos 50 melhores resultados da recuperação, mas lutam para superá -lo entre os 10 primeiros. Em termos técnicos, isso significa clientes com baixo recall@10, mas alto recall@50.

Experiência aprimorada do desenvolvedor

Além das capacidades de reranquinação, estamos facilitando a criação e implantação de sistemas de recuperação de alta qualidade.

Integração de Langchain: Reranker trabalha perfeitamente com VectorSearchRetrievertOolnossa integração oficial de Langchain para pesquisa vetorial. As equipes que constroem agentes de pano com o VectorSearchRetrievertol podem se beneficiar da recuperação de maior qualidade – nenhuma alteração de código necessária.

Métricas de desempenho transparentes: A latência do reanranker está agora incluída nas informações de depuração da consulta, oferecendo a você uma quebra completa de ponta a ponta do seu desempenho de consulta.

Resposta Latência Redução em milissegundos

Seleção flexível da coluna: Rerrank com base em qualquer combinação de colunas de texto e metadados, permitindo que você alavanca todo o contexto de domínio disponível – de resumos de documentos a categorias a metadados personalizados – por alta relevância.

Comece a construir hoje

Reranker na pesquisa vetorial transforma como você cria aplicativos de IA. Com a sobrecarga de infraestrutura zero e a integração perfeita, você pode finalmente oferecer a qualidade de recuperação que seus usuários merecem.

Pronto para começar?

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *