Player Live
AO VIVO
19 de maio de 2026
A arquitetura de contexto está substituindo o RAG à medida que a IA agente leva a recuperação empresarial ao seu limite

A arquitetura de contexto está substituindo o RAG à medida que a IA agente leva a recuperação empresarial ao seu limite

Redis construiu seu nome como a camada de cache que evitava que os aplicativos da web entrassem em colapso sob carga. O problema que visa agora tem a mesma estrutura, mas é mais difícil de resolver: os agentes de IA de produção falham não porque os modelos estão errados, mas porque os dados por baixo deles estão dispersos, obsoletos e estruturados para humanos e não para máquinas. Os pipelines de recuperação criados para consultas únicas não podem absorver o volume gerado pelos agentes. A lacuna que o Redis visa é estrutural: os agentes fazem muito mais solicitações de dados do que os usuários humanos, mas a maioria das camadas de recuperação foram construídas para o problema em escala humana. O Redis Iris, lançado na segunda-feira, é a resposta da empresa: uma plataforma de contexto e memória que fica entre um agente e os dados de que ele precisa para agir. A plataforma combina ingestão de dados em tempo real, uma interface semântica que gera automaticamente ferramentas MCP a partir de modelos de dados de negócios e um servidor de memória de agente construído no Redis Flex, um mecanismo de armazenamento reescrito que executa 99% dos dados em flash por um décimo do custo apenas do armazenamento na memória. O anúncio chega no momento em que a infraestrutura RAG empresarial está em transição ativa. Pulso VB do primeiro trimestre de 2026 da VentureBeat O RAG Infrastructure Market Tracker descobriu que a intenção do comprador de adotar a recuperação híbrida triplicou de 10,3% para 33,3% entre janeiro e março. A otimização da recuperação ultrapassou a avaliação como a principal prioridade de investimento empresarial pela primeira vez. As pilhas de recuperação interna personalizada aumentaram de 24,1% para 35,6% à medida que as empresas superaram as opções disponíveis no mercado. A Redis não é o único fornecedor de infraestrutura que lê esses sinais – vários provedores de plataformas de dados se reposicionaram em torno das camadas de contexto do agente nas últimas semanas. O descompasso de escala é o argumento estrutural por trás do lançamento. "As empresas terão muito mais agentes do que seres humanos," Rowan Trollope, CEO da Redis, disse VentureBeat. "Ordens de magnitude mais agentes do que seres humanos significam ordens de magnitude mais carga nos sistemas back-end." Do cache ao contexto Trollope traça o paralelo com a era móvel: quando back-ends legados criados para caixas de agências de repente tiveram que atender a um milhão de usuários de smartphones, o Redis se tornou a camada de cache que absorveu a carga sem uma reconstrução completa. A diferença desta vez é que os agentes não podem escrever seu próprio middleware. Na era móvel, um desenvolvedor sentava-se com um administrador de banco de dados, identificava as consultas necessárias para um aplicativo e codificava a lógica de cache em uma camada de middleware. Os agentes não podem fazer isso. Eles precisam encontrar os dados certos em tempo de execução, por meio de interfaces criadas antecipadamente para eles, ou pararão. "É como a analogia do supermercado na geladeira," ele disse. "Se toda vez que você tiver que ir fazer seu sanduíche tiver que correr até o supermercado para pegar a comida, isso não é muito eficiente. Você coloca uma geladeira em cada casa, guarda um pouco de comida lá. E é aí que ainda tendemos a existir na pilha de infraestrutura." O que o Redis Iris inclui O Iris fornece cinco componentes que juntos cobrem ingestão de dados, acesso semântico, memória e cache. Integração de dados Redis. Agora em disponibilidade geral. RDI usa pipelines de captura de dados alterados para sincronizar continuamente dados de bancos de dados relacionais, armazéns e armazenamentos de documentos no Redis, com conectores para Oracle, Snowflake, Databricks e Postgres. Recuperador de contexto. Agora em visualização. Os desenvolvedores definem um modelo semântico de dados de negócios usando modelos pydantic e o Redis gera automaticamente ferramentas MCP usadas pelos agentes para consultá-los diretamente, com controles de acesso em nível de linha aplicados no lado do servidor. Trollope descreve a mudança do RAG clássico como uma inversão direcional. "É apenas uma questão de permitir que o agente extraia os dados em vez de pressupor e colocá-los no pipeline," ele disse. Memória do Agente. Agora em visualização. Armazena o estado de curto e longo prazo nas sessões para que os agentes transportem o contexto sem derivá-lo novamente a cada turno. Redis Flex. Um mecanismo de armazenamento reescrito que executa 99% dos dados em SSDs e 1% em RAM, proporcionando recuperação em escala de petabytes com latências inferiores a milissegundos. Pesquisa Redis e LangCache. A espinha dorsal de recuperação e cache semântico abaixo da plataforma. LangCache reduz chamadas de modelo redundantes armazenando em cache as respostas de prompt. O que dizem os analistas A indústria de dados geralmente está caminhando na mesma direção agora. Todo grande fornecedor de banco de dados está apresentando um argumento de camada de contexto. Fornecedores de banco de dados tradicionais incluindo Oráculo estão integrando camadas de contexto e memória para trazer bancos de dados relacionais para a era da IA ​​de agência. Fornecedores de bancos de dados vetoriais específicos, incluindo Pinha estão fazendo o mesmo, construindo uma nova camada de conhecimento para o contexto de IA agente. Camadas de contexto autônomas como Retrospectiva também fazem parte do cenário emergente. Trollope enquadra a posição da Redis como estruturalmente diferente daquela concorrência. "Para ganharmos, ninguém mais precisa perder," ele disse. Muitas implantações do Redis já executam MongoDB ou Oracle como sistema back-end de registro. O Iris reflete e armazena em cache esses sistemas, em vez de deslocá-los. Redis está lançando Iris no mercado Snowflake com conectores nativos. Stephanie Walter, líder prática de AI Stack da HyperFRAME Research, expõe o contexto do mercado de forma clara. "O mercado está convergindo para a mesma conclusão: os agentes não precisam apenas de mais tokens ou de modelos melhores. Eles precisam de um contexto governado, atual e de baixa latência," disse Valter. Sua leitura sobre a diferenciação do Redis se concentra em onde o Redis já

Leia Mais »