
Kayo Magalhães / Câmara dos Deputados Laura Carneiro, relatora da proposta A Comissão de Previdência,

Thiago Cristino / Câmara dos Deputados Gilson Daniel é o relator da proposta e pediu

Kayo Magalhães / Câmara dos deputados Kim Kataguiri: “Cálculo por dentro não é transparente” A

Kayo Magalhães / Câmara dos Deputados Bárbara Penna continuou sofrendo ameaças com agressor preso A

(Bloomberg/Getty Images) Continua após publicidade O Itaú Unibanco está com mais de 240 vagas abertas

Eliana Germano, consultora de negócios do Sebrae-SP, durante Encontro de Produtores A programação técnica contou




Quando os fluxos de trabalho de agente falham, os desenvolvedores geralmente presumem que o problema está nas habilidades de raciocínio do modelo subjacente. Na realidade, as informações limitadas fornecidas pela interface de recuperação costumam ser o principal fator limitante. Pesquisadores de várias universidades propõem uma técnica chamada interação direta de corpus (DCI), que permite que os agentes ignorem totalmente a incorporação de modelos, pesquisando corpora brutos diretamente usando ferramentas de linha de comando padrão. Os limites da recuperação clássica Em sistemas de recuperação clássicos como o RAG, os documentos são fragmentados, convertidos em representações vetoriais (ou embeddings) e indexados offline em um banco de dados vetorial. Quando um sistema de IA processa uma consulta, um recuperador filtra todo o banco de dados para retornar uma classificação "top-k" lista de trechos de documentos que correspondem à consulta. Todas as evidências devem passar por esse mecanismo de pontuação antes que ocorra qualquer raciocínio posterior. Mas as aplicações modernas de agentes exigem muito mais. "A recuperação densa é muito útil para uma ampla recordação semântica, mas quando um agente precisa resolver uma tarefa de várias etapas, muitas vezes ele precisa procurar strings exatas, números, versões, códigos de erro, caminhos de arquivos ou combinações esparsas de pistas." disseram os autores do artigo da DCI em comentários fornecidos à VentureBeat. "Esses detalhes de cauda longa são precisamente onde a similaridade semântica pode ser frágil." Ao contrário da pesquisa estática, os agentes também devem rever os seus planos de pesquisa de forma dinâmica após observarem evidências parciais ou localizadas. Restrições lexicais exatas e refinamento de hipóteses em várias etapas são difíceis de executar com recuperadores semânticos. Como o recuperador comprime o acesso em uma única etapa, qualquer evidência crítica filtrada pela busca por similaridade não pode ser recuperada posteriormente, não importa quão avançadas sejam as capacidades de raciocínio downstream do agente. Como explicam os autores, os atuais pipelines de recuperação podem se tornar um gargalo porque "eles decidem muito cedo o que o agente pode ver." Interação direta do corpus Esse acesso direto aborda um problema central em ambientes corporativos: a desatualização dos dados. A incorporação de índices é sempre um instantâneo de um momento específico, exigindo computação e tempo consideráveis para construir e manter. "Em muitos ambientes empresariais, os dados não constituem uma coleção de documentos estável. São relatórios financeiros diários, logs ao vivo, tickets, commits de código, arquivos de configuração, cronogramas de incidentes e documentos internos que estão sempre mudando," disseram os autores. O DCI permite que o agente raciocine sobre o estado atual do espaço de trabalho, em vez do índice vetorial de ontem. O agente opera em um ambiente semelhante a um terminal, onde suas observações são saídas brutas de ferramentas, como caminhos de arquivos, extensões de texto correspondentes e linhas adjacentes. As ferramentas básicas fornecidas pela DCI são poucas, mas altamente expressivas. Os agentes usam comandos como “find” e “glob” para navegar nas estruturas de diretórios e localizar arquivos. Para correspondência exata, eles usam “grep” e “rg” para localizar palavras-chave específicas, padrões regex e strings exatas. Quando a inspeção local é necessária, ferramentas como “head”, “tail”, “sed”, “cat” e scripts Python leves permitem que o agente espie o contexto em torno de uma correspondência ou leia seções específicas do arquivo. O agente pode combinar essas ferramentas por meio de pipelines de shell para executar lógica de pesquisa complexa em uma única etapa. Um agente pode canalizar comandos para impor restrições lexicais estritas, como pesquisar um termo em um arquivo e canalizar a saída para pesquisar um segundo termo. Ele pode combinar várias pistas fracas em um corpus, encontrando um tipo de arquivo específico e pesquisando uma palavra-chave como "relatório," e filtrando por um ano como "2024." Ele também pode verificar imediatamente uma hipótese inspecionando as linhas exatas em torno de uma correspondência de palavra-chave. O DCI delega a interpretação semântica diretamente ao agente, em vez de depender da busca por similaridade baseada em incorporação. O agente pode formular hipóteses, testar padrões lexicais exatos e extrair informações detalhadas que um recuperador semântico tradicional pode perder. Os pesquisadores propõem duas versões deste sistema. DCI-Agent-Lite foi projetado como uma configuração leve e de baixo custo construída no modelo nano GPT-5.4 e restrita exclusivamente a interações brutas de terminal, como comandos bash e leituras básicas de arquivos. Como a leitura de arquivos brutos pode ocupar rapidamente a memória de um modelo menor, esta versão depende de estratégias leves de gerenciamento de contexto em tempo de execução para sustentar a exploração de longo horizonte. DCI-Agent-CC é a versão de maior desempenho, projetada para equipes com maior orçamento computacional. Ele roda em Claude Code desenvolvido por Claude Sonnet 4.6. O Claude Code fornece prompts mais fortes, orquestração de ferramentas mais robusta e manipulação de contexto integrada superior, o que melhora a estabilidade do agente durante pesquisas complexas e de várias etapas em conjuntos de dados heterogêneos. DCI em ação Os pesquisadores testaram ambas as versões do DCI em benchmarks de pesquisa de agentes, como BrowseComp-Plus, controle de qualidade com uso intensivo de conhecimento com raciocínio de salto único e multi-hop e classificação de recuperação de informações em tarefas que exigem raciocínio específico de domínio e verificação científica de fatos. Eles testaram o DCI em relação a três linhas de base. O primeiro incluía agentes de recuperação de peso aberto, como Search-R1, e agentes proprietários alimentados por modelos de fronteira, como GPT-5 e Claude Sonnet 4.6, emparelhados com recuperadores padrão. A segunda linha de base incluía recuperadores esparsos clássicos como BM25 e recuperadores densos como text-embedding-3-large e Qwen3-Embedding-8B da OpenAI. A terceira linha de base consistia em reclassificadores orientados ao raciocínio de alto desempenho, como ReasonRank-32B e Rank-R1. O DCI superou sistematicamente as linhas de base, segundo os pesquisadores. No complexo benchmark BrowseComp-Plus, a troca de um recuperador semântico Qwen3 tradicional por DCI em um backbone Claude Sonnet 4.6 melhorou a precisão de 69,0% para 80,0%, ao mesmo tempo que reduziu o custo da API de US$ 1.440 para US$ 1.016. O retorno do investimento para agentes

Em 19 de maio, 633 versões maliciosas de pacotes npm passaram na verificação de proveniência do Sigstore. Eles foram apagados pelo sistema porque

Empresa brasileira opera o primeiro condomínio residencial do país com entregas autônomas financiadas pelos moradores e amplia atuação em restaurantes, varejo e hospitalidade

FLEX aprimora o design de fachadas, apoia o trabalho de mídia no varejo e fornece insights sobre perdas A Sensormatic Solutions, portfólio global

A Dun & Bradstreet passou mais de 180 anos construindo um banco de dados comercial abrangente. Seu Gráfico Comercial, que abrange 642 milhões

Resolve AI, the production-operations startup backed by Greylock and Lightspeed Venture Partners, today announced a sweeping expansion of its platform that introduces always-on

A rápida transição da IA generativa de chatbots baseados em texto para mídia de alta fidelidade – abrangendo imagens, vídeo, 3D espacial e

Redis construiu seu nome como a camada de cache que evitava que os aplicativos da web entrassem em colapso sob carga. O problema

A geração aumentada de recuperação (RAG) tornou-se o padrão de fato para fundamentar grandes modelos de linguagem (LLMs) em dados privados. A arquitetura
A Samsung enfim decidiu o nome dos seus novos dobráveis do ano: Galaxy Z Fold 8 e Galaxy Z Fold 8 Ultra, apurou

Kayo Magalhães / Câmara dos Deputados Laura Carneiro, relatora da proposta A Comissão de Previdência, Assistência Social, Infância, Adolescência e Família da Câmara

Especialista em Revenue Operations, Telecom e vendas SaaS, Fabiano Bernardes defende um novo modelo de crescimento baseado em previsibilidade, eficiência operacional, retenção e

Em um cenário corporativo cada vez mais pressionado por metas, performance e resultados imediatos, cresce também o debate sobre um modelo de gestão

A tradição italiana que moldou a gastronomia da Serra Falar sobre a Serra Gaúcha é, inevitavelmente, falar sobre culinária italiana. Desde a chegada

Em São Paulo, onde a gastronomia contemporânea muitas vezes acompanha a velocidade frenética da metrópole, o Marú Gastrobar segue na direção oposta: cria

Empresário paranaense constrói ecossistema que integra produção, logística, marketplaces, cultura e operações digitais em escala nacional Durante décadas, a indústria brasileira cresceu sustentada

O Campo Belo ganhou um novo espaço voltado à conexão estratégica entre empresários, líderes e profissionais da região. O Guia Connect, iniciativa do

O elevador improvisado desceu devagar, rangendo entre cabos de aço cobertos de poeira vermelha. A cerca de 150 metros da superfície, um dos

O fim de maio promete ser muito positivo para alguns signos do zodíaco. Segundo as previsões astrológicas da terapeuta energética Kishori Sud, quatro
O governo dos Estados Unidos conhece pelo menos quatro espécies de seres extraterrestres, que teriam sido recuperadas de Objetos Voadores Não Identificados (OVNIs)

Antes de encontrar no artesanato um novo caminho, Zózima construiu uma trajetória marcada pela educação, pela família e por mudanças que transformaram sua
© 2025 Todos os direitos reservados a Handelsblatt