Player Live
AO VIVO
25 de maio de 2026
Seus agentes de IA precisam de um terminal, não apenas de um banco de dados vetorial

Seus agentes de IA precisam de um terminal, não apenas de um banco de dados vetorial

Quando os fluxos de trabalho de agente falham, os desenvolvedores geralmente presumem que o problema está nas habilidades de raciocínio do modelo subjacente. Na realidade, as informações limitadas fornecidas pela interface de recuperação costumam ser o principal fator limitante. Pesquisadores de várias universidades propõem uma técnica chamada interação direta de corpus (DCI), que permite que os agentes ignorem totalmente a incorporação de modelos, pesquisando corpora brutos diretamente usando ferramentas de linha de comando padrão. Os limites da recuperação clássica Em sistemas de recuperação clássicos como o RAG, os documentos são fragmentados, convertidos em representações vetoriais (ou embeddings) e indexados offline em um banco de dados vetorial. Quando um sistema de IA processa uma consulta, um recuperador filtra todo o banco de dados para retornar uma classificação "top-k" lista de trechos de documentos que correspondem à consulta. Todas as evidências devem passar por esse mecanismo de pontuação antes que ocorra qualquer raciocínio posterior. Mas as aplicações modernas de agentes exigem muito mais. "A recuperação densa é muito útil para uma ampla recordação semântica, mas quando um agente precisa resolver uma tarefa de várias etapas, muitas vezes ele precisa procurar strings exatas, números, versões, códigos de erro, caminhos de arquivos ou combinações esparsas de pistas." disseram os autores do artigo da DCI em comentários fornecidos à VentureBeat. "Esses detalhes de cauda longa são precisamente onde a similaridade semântica pode ser frágil." Ao contrário da pesquisa estática, os agentes também devem rever os seus planos de pesquisa de forma dinâmica após observarem evidências parciais ou localizadas. Restrições lexicais exatas e refinamento de hipóteses em várias etapas são difíceis de executar com recuperadores semânticos. Como o recuperador comprime o acesso em uma única etapa, qualquer evidência crítica filtrada pela busca por similaridade não pode ser recuperada posteriormente, não importa quão avançadas sejam as capacidades de raciocínio downstream do agente. Como explicam os autores, os atuais pipelines de recuperação podem se tornar um gargalo porque "eles decidem muito cedo o que o agente pode ver." Interação direta do corpus Esse acesso direto aborda um problema central em ambientes corporativos: a desatualização dos dados. A incorporação de índices é sempre um instantâneo de um momento específico, exigindo computação e tempo consideráveis ​​para construir e manter. "Em muitos ambientes empresariais, os dados não constituem uma coleção de documentos estável. São relatórios financeiros diários, logs ao vivo, tickets, commits de código, arquivos de configuração, cronogramas de incidentes e documentos internos que estão sempre mudando," disseram os autores. O DCI permite que o agente raciocine sobre o estado atual do espaço de trabalho, em vez do índice vetorial de ontem. O agente opera em um ambiente semelhante a um terminal, onde suas observações são saídas brutas de ferramentas, como caminhos de arquivos, extensões de texto correspondentes e linhas adjacentes. As ferramentas básicas fornecidas pela DCI são poucas, mas altamente expressivas. Os agentes usam comandos como “find” e “glob” para navegar nas estruturas de diretórios e localizar arquivos. Para correspondência exata, eles usam “grep” e “rg” para localizar palavras-chave específicas, padrões regex e strings exatas. Quando a inspeção local é necessária, ferramentas como “head”, “tail”, “sed”, “cat” e scripts Python leves permitem que o agente espie o contexto em torno de uma correspondência ou leia seções específicas do arquivo. O agente pode combinar essas ferramentas por meio de pipelines de shell para executar lógica de pesquisa complexa em uma única etapa. Um agente pode canalizar comandos para impor restrições lexicais estritas, como pesquisar um termo em um arquivo e canalizar a saída para pesquisar um segundo termo. Ele pode combinar várias pistas fracas em um corpus, encontrando um tipo de arquivo específico e pesquisando uma palavra-chave como "relatório," e filtrando por um ano como "2024." Ele também pode verificar imediatamente uma hipótese inspecionando as linhas exatas em torno de uma correspondência de palavra-chave. O DCI delega a interpretação semântica diretamente ao agente, em vez de depender da busca por similaridade baseada em incorporação. O agente pode formular hipóteses, testar padrões lexicais exatos e extrair informações detalhadas que um recuperador semântico tradicional pode perder. Os pesquisadores propõem duas versões deste sistema. DCI-Agent-Lite foi projetado como uma configuração leve e de baixo custo construída no modelo nano GPT-5.4 e restrita exclusivamente a interações brutas de terminal, como comandos bash e leituras básicas de arquivos. Como a leitura de arquivos brutos pode ocupar rapidamente a memória de um modelo menor, esta versão depende de estratégias leves de gerenciamento de contexto em tempo de execução para sustentar a exploração de longo horizonte. DCI-Agent-CC é a versão de maior desempenho, projetada para equipes com maior orçamento computacional. Ele roda em Claude Code desenvolvido por Claude Sonnet 4.6. O Claude Code fornece prompts mais fortes, orquestração de ferramentas mais robusta e manipulação de contexto integrada superior, o que melhora a estabilidade do agente durante pesquisas complexas e de várias etapas em conjuntos de dados heterogêneos. DCI em ação Os pesquisadores testaram ambas as versões do DCI em benchmarks de pesquisa de agentes, como BrowseComp-Plus, controle de qualidade com uso intensivo de conhecimento com raciocínio de salto único e multi-hop e classificação de recuperação de informações em tarefas que exigem raciocínio específico de domínio e verificação científica de fatos. Eles testaram o DCI em relação a três linhas de base. O primeiro incluía agentes de recuperação de peso aberto, como Search-R1, e agentes proprietários alimentados por modelos de fronteira, como GPT-5 e Claude Sonnet 4.6, emparelhados com recuperadores padrão. A segunda linha de base incluía recuperadores esparsos clássicos como BM25 e recuperadores densos como text-embedding-3-large e Qwen3-Embedding-8B da OpenAI. A terceira linha de base consistia em reclassificadores orientados ao raciocínio de alto desempenho, como ReasonRank-32B e Rank-R1. O DCI superou sistematicamente as linhas de base, segundo os pesquisadores. No complexo benchmark BrowseComp-Plus, a troca de um recuperador semântico Qwen3 tradicional por DCI em um backbone Claude Sonnet 4.6 melhorou a precisão de 69,0% para 80,0%, ao mesmo tempo que reduziu o custo da API de US$ 1.440 para US$ 1.016. O retorno do investimento para agentes

Leia Mais »