Participe de nossos boletins diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais
À medida que a escala das operações da IA corporativa continua a crescer, ter acesso aos dados não é mais suficiente. As empresas agora devem ter acesso confiável, consistente e preciso aos dados.
Esse é um campo em que os fornecedores de banco de dados SQL distribuídos desempenham uma função fundamental, fornecendo uma plataforma de banco de dados replicada que pode ser altamente resiliente e disponível. A atualização mais recente do Cockroach Labs tem tudo a ver com ativar a pesquisa vetorial e a IA agêntica na escala SQL distribuída. A Cockroachdb 25.2 está disponível hoje, prometendo um ganho de 41% de eficiência, um índice de vetor otimizado para AI para a escala SQL distribuída e melhorias no banco de dados do núcleo que melhoram as operações e a segurança.
A Cockroachdb é uma das muitas opções SQL distribuídas hoje no mercado, incluindo Yugabyte, Amazon Aurora DSQL e Google Alloydb. Desde a sua criação, há uma década, a empresa pretendia se diferenciar dos rivais, sendo mais resiliente. De fato, o nome ‘barata’ vem da ideia de que uma barata é realmente difícil de matar. Essa ideia permanece relevante na era da IA.
“Certamente as pessoas estão interessadas em IA, mas as razões pelas quais as pessoas escolheram barata há cinco anos, há dois anos ou até este ano parecem bastante consistentes, elas precisam desse banco de dados para sobreviver”, disse à VentureBeat co-fundador da Spencer Kimball. “A IA em nosso contexto, a IA é misturada com as capacidades operacionais que a barata traz … Então, na medida em que a IA está se tornando mais importante, é como minha IA sobrevive, ela precisa ser tão missionária quanto os metadados reais”.
O problema de indexação de vetores distribuídos que enfrentam a IA da empresa
Os bancos de dados capazes de vetor, que são usados pelos sistemas de IA para treinamento e para cenários de geração aumentada (RAG) de recuperação, são comuns em 2025.
Kimball argumentou que os bancos de dados do vetor hoje funcionam bem em nós únicos. Eles tendem a lutar em implantações maiores com vários nós geograficamente dispersos, que é o que se trata o SQL distribuído. A abordagem do barata da barata aborda o complexo problema da indexação de vetores distribuídos. O novo índice de vetor C-spann da empresa usa o algoritmo spann, que é baseado na pesquisa da Microsoft. Isso lida especificamente a bilhões de vetores em um sistema distribuído baseado em disco.
Compreender a arquitetura técnica revela por que isso representa um desafio tão complexo. A indexação de vetores no baratas não é uma tabela separada; É um tipo de índice aplicado a colunas nas tabelas existentes. Sem um índice, as pesquisas de similaridade vetorial executam varreduras lineares de força bruta por meio de todos os dados. Isso funciona bem para pequenos conjuntos de dados, mas se torna proibitivamente lento à medida que as tabelas crescem.
A equipe de engenharia da Cockroach Labs teve que resolver vários problemas simultaneamente: eficiência uniforme em escala maciça, índices de auto-balanceamento e manutenção da precisão enquanto os dados subjacentes mudam rapidamente.
Kimball explicou que o algoritmo C-Spann resolve isso criando uma hierarquia de partições para vetores em um espaço multidimensional muito alto. Essa estrutura hierárquica permite pesquisas eficientes de similaridade, mesmo em bilhões de vetores.
Os aprimoramentos de segurança abordam os desafios de conformidade da IA
Os aplicativos de IA lidam com dados cada vez mais sensíveis. A Cockroachdb 25.2 apresenta recursos aprimorados de segurança, incluindo segurança no nível da linha e suítes cifras configuráveis.
Esses recursos atendem a requisitos regulamentares como Dora e NIS2 que muitas empresas lutam para atender.
A pesquisa da Cockroach Labs mostra que 79% dos líderes de tecnologia relatam não estar preparados para novos regulamentos. Enquanto isso, 93% citam preocupações com o impacto financeiro de interrupções em média mais de US $ 222.000 anualmente.
“A segurança é algo que está aumentando significativamente e acho que a grande coisa da segurança para perceber é que, como muitas coisas, é impactado dramaticamente por esse material da IA”, observou Kimball.
Big Data Operacional para AI Agentic Set para impulsionar um crescimento maciço
A próxima onda de cargas de trabalho orientadas pela IA cria o que o Kimball terminou “Big Data Operacional”-um desafio fundamentalmente diferente da análise tradicional de big data.
Embora o big data convencional se concentre no processamento de lote de grandes conjuntos de dados para insights, o Big Data Operacional exige desempenho em tempo real em enorme escala para aplicações missionárias críticas.
“Quando você realmente pensa nas implicações da IA agêntica, é muito mais de atividades atingindo APIs e, finalmente, causando requisitos de taxa de transferência para os bancos de dados subjacentes”, explicou Kimball.
A distinção importa enormemente. Os sistemas de dados tradicionais podem tolerar latência e eventual consistência, pois suportam cargas de trabalho analíticas. Os Big Data Powers Operation Data Live Applications, onde os milissegundos matéria e a consistência não podem ser comprometidos.
Os agentes da IA dirigem essa mudança operando na velocidade da máquina, em vez do ritmo humano. O tráfego atual do banco de dados vem principalmente de seres humanos com padrões de uso previsíveis. Kimball enfatizou que os agentes da IA multiplicarão essa atividade exponencialmente.
Desempenho de destaque para a IA Workload Economics
É necessária uma melhor economia e eficiência para lidar com a crescente escala de acesso a dados.
A Cockroach Labs afirma que a Cockroachdb 25.2 fornece uma melhoria de 41% de eficiência. Duas otimizações principais na versão que ajudarão a melhorar a eficiência geral do banco de dados são planos de consulta genéricos e gravações em buffer.
As gravações em buffers resolvem um problema específico com as consultas geradas por mapeamento de objetos (ORM) que tendem a ser “conversadores”. Estes leitura e gravação de dados em nós distribuídos ineficientemente. O recurso de gravações em buffers mantém gravações nos coordenadores locais do SQL. Isso elimina viagens de renda de rede desnecessárias.
“O que as gravações em buffers fazem é que eles mantêm todas as gravações que você planeja fazer no coordenador local do SQL”, explicou Kimball. “Então, se você ler de algo que acabou de escrever, ele não precisa voltar para a rede.”
Os planos de consulta genéricos resolvem uma ineficiência fundamental em aplicações de alto volume. A maioria dos aplicativos corporativos usa um conjunto limitado de tipos de transações que são executados milhões de vezes com parâmetros diferentes. Em vez de reponder repetidamente estruturas de consulta idênticas, a barata agora armazena em cache e reutiliza esses planos.
A implementação de planos de consulta genérica em sistemas distribuídos apresenta desafios exclusivos que os bancos de dados de nó único não enfrentam. A barra de barraca deve garantir que os planos em cache permaneçam ideais em nós distribuídos geograficamente com latências variadas.
“Em SQL distribuído, os planos genéricos de consulta, eles são um elevador um pouco mais pesado, porque agora você está falando sobre um conjunto de nós potencialmente distribuídos com diferentes latências”, explicou Kimball. “Você precisa ter cuidado com o plano de consulta genérico de que você não usa algo abaixo do ideal, porque você meio que confundiu como, oh, bem, isso parece o mesmo.”
O que isso significa para o planejamento das empresas e a infraestrutura de dados
Os líderes de dados corporativos enfrentam decisões imediatas à medida que a IA agêntica ameaça sobrecarregar a infraestrutura atual do banco de dados.
A mudança das cargas de trabalho orientadas pelo ser humano para a IA criará desafios operacionais de big data para os quais muitas organizações não estão preparadas. A preparação agora para o crescimento inevitável do tráfego de dados da IA Agentic é um forte imperativo. Para empresas que lideram a adoção da IA, faz sentido investir em uma arquitetura de banco de dados distribuída agora que pode lidar com as operações tradicionais de SQL e vetorial em escala.
A CockRoachdb 25.2 oferece uma opção em potencial, aumentando o desempenho e a eficiência do SQL distribuído para enfrentar os desafios de dados da IA agêntica. Fundamentalmente, trata -se de ter a tecnologia para escalar a recuperação de dados vetorial e tradicional.
Insights diários sobre casos de uso de negócios com VB diariamente
Se você deseja impressionar seu chefe, o VB Daily o cobriu. Damos a você uma informação interna sobre o que as empresas estão fazendo com a IA generativa, desde mudanças regulatórias a implantações práticas, para que você possa compartilhar informações para o ROI máximo.
Leia nossa Política de Privacidade
Obrigado por assinar. Confira mais boletins de VB aqui.
Ocorreu um erro.
Fonte ==> Cyberseo