Os líderes corporativos dizem

Como o Hospital de Ottawa usa a captura de voz ambiental da IA ​​para reduzir o esgotamento do médico em 70%, alcançar 97% de satisfação do paciente

Quer insights mais inteligentes em sua caixa de entrada? Inscreva -se para que nossos boletins semanais obtenham apenas o que importa para a IA, dados e líderes de segurança corporativos. Inscreva -se agora


Não há dúvida de que os agentes da IA ​​- aqueles que podem funcionar de forma autônoma e assíncrona nos bastidores nos fluxos de trabalho corporativos – são o tópico du jour na empresa no momento.

Mas há uma preocupação crescente de que tudo é exatamente isso – conversa, principalmente hype, sem muita substância por trás disso.

O Gartner, por um lado, observa que as empresas estão no “pico das expectativas infladas”, um período pouco antes de desiludir o aparecimento de desiludições porque os fornecedores não fizeram backup de sua palestra com casos de uso tangível e de uso real.

Ainda assim, isso não quer dizer que as empresas não estejam experimentando agentes de IA e vendo o retorno precoce do investimento (ROI); As empresas globais Block e GlaxoSmithKline (GSK), por suas partes, estão explorando a prova de conceitos em serviços financeiros e descoberta de medicamentos.


Ai escala atinge seus limites

Capitões de energia, custos crescentes de token e atrasos de inferência estão remodelando a IA corporativa. Junte -se ao nosso salão exclusivo para descobrir como são as principais equipes:

  • Transformando energia em uma vantagem estratégica
  • Arquitetagem Inferência eficiente para ganhos reais de rendimento
  • Desbloqueando o ROI competitivo com sistemas de IA sustentáveis

Prenda seu lugar para ficar à frente: https://bit.ly/4mwgngo


“O Multi-Agent é absolutamente o que vem a seguir, mas estamos descobrindo como isso se parece de uma maneira que atende ao humano, o torna conveniente”, disse Brad Axe, líder de tecnologia da Block para a IA e as plataformas de dados, ao CEO e editor-chefe da Venturebeat, Matt Marshall, em um recente evento de impacto de IA patrocinado pela SAP neste mês.

Trabalhando com um único colega, não um enxame de bots

Block, a empresa controladora de 10.000 funcionários da Square, Cash App e Afterpay, se considera no modo de descoberta total, tendo lançado uma estrutura interoperável de agente de IA, com o codinome Goose, em janeiro.

O Goose foi introduzido inicialmente para tarefas de engenharia de software e agora é usado por 4.000 engenheiros, com a adoção dobrando mensalmente, explicou Axen. A plataforma escreve cerca de 90% do código e salvou os engenheiros estima -se 10 horas de trabalho por semana, automatizando a geração de código, depuração e filtragem de informações.

Além de escrever o código, o Goose atua como uma espécie de “companheiro de equipe digital”, comprimindo fluxos de folga e email, integrando as ferramentas da empresa e desova para novos agentes quando as tarefas exigem mais taxa de transferência e escopo expandido.

Axen enfatizou que o bloco está focado em criar uma interface que parece trabalhar com um único colega, não um enxame de bots. “Queremos que você sinta que está trabalhando com uma pessoa, mas eles estão agindo em seu nome em muitos lugares de muitas maneiras diferentes”, explicou.

O Goose opera em tempo real no ambiente de desenvolvimento, pesquisando, navegando e escrevendo código com base na saída do Modelo de Linguagem (LLM), além de ler e escrever arquivos de código e testes de autonomamente, refinar saídas e instalar dependências.

Essencialmente, qualquer um pode construir e operar um sistema em seu LLM preferido, e o ganso pode ser conceituado como a camada de aplicativo. Possui uma interface de aplicativo e linha de comando de desktop embutida, mas os desenvolvedores também podem criar UIs personalizadas. A plataforma é construída no protocolo de contexto de modelo do Anthropic (MCP), um conjunto padronizado de APIs e pontos de extremidade cada vez mais popular de código aberto que conecta agentes a repositórios de dados, ferramentas e ambientes de desenvolvimento.

O Goose foi divulgado sob a licença Apache 2.0 (ASL2) de código aberto, o que significa que qualquer pessoa pode usar, modificá-la e distribuir livremente, mesmo para fins comerciais. Os usuários podem acessar os bancos de dados do Databricks e fazer chamadas ou consultas SQL sem precisar de conhecimento técnico.

“Nós realmente queremos encontrar um processo que permita que as pessoas obtenham valor do sistema sem precisar ser um especialista”, explicou Axen.

Por exemplo, na codificação, os usuários podem dizer o que desejam na linguagem natural e a estrutura interpretará isso em milhares de linhas de código que os desenvolvedores podem ler e analisar. O Block também está vendo valor nas tarefas de compressão, como a leitura de ganso, o Slack, o email e outros canais e resumindo informações para os usuários. Além disso, nas vendas ou marketing, os agentes podem coletar informações relevantes sobre um cliente em potencial e transportá -las para um banco de dados.

Agentes de IA subutilizados, mas a experiência em domínio humano ainda é necessário

O processo tem sido o maior gargalo, observou Axen. Você não pode simplesmente dar às pessoas uma ferramenta e pedir que elas funcionem para elas; Os agentes precisam refletir os processos com os quais os funcionários já estão envolvidos. Os usuários humanos não estão preocupados com a espinha dorsal técnica – o trabalho que eles estão tentando realizar.

Os construtores, portanto, precisam analisar o que os funcionários estão tentando fazer e projetar as ferramentas para serem “o mais literalmente possível”, disse Axen. Então eles podem usar isso para se encaixar e enfrentar problemas maiores e maiores.

“Acho que estamos subordinando enormemente o que eles podem fazer”, disse Axen sobre os agentes. “São as pessoas e o processo, porque não podemos acompanhar a tecnologia. Há uma enorme lacuna entre a tecnologia e a oportunidade”.

E, quando a indústria preenche isso, ainda haverá espaço para a experiência em domínio humano? Claro, diz Axen. Por exemplo, particularmente em serviços financeiros, o código deve ser confiável, compatível e seguro para proteger a empresa e os usuários; Portanto, deve ser revisado pelos olhos humanos.

“Ainda vemos um papel realmente crítico para especialistas humanos em todas as partes da operação de nossa empresa”, disse ele. “Isso não muda necessariamente o que a experiência significa como indivíduo. Apenas oferece uma nova ferramenta para expressá -la”.

Bloco construído em um backbone de código aberto

A interface humana é um dos elementos mais difíceis dos agentes da IA, observou Axen; O objetivo é simplificar as interfaces enquanto a IA está em segundo plano, tomando medidas proativamente.

Seria útil, observou Axen, se mais participantes do setor incorporam padrões semelhantes ao MCP. Por exemplo, “eu adoraria que o Google fosse apenas e ter um MCP público para o Gmail”, disse ele. “Isso tornaria minha vida muito mais fácil.”

Quando perguntado sobre o compromisso de Block com o código aberto, ele observou: “Sempre tivemos uma espinha dorsal de código aberto”, acrescentando que, no ano passado, a empresa está “renovando” seu investimento para abrir tecnologias.

“Em um espaço que está se movendo tão rápido, esperamos que possamos configurar a governança de código aberto, para que você possa fazer com que essa seja a ferramenta que acompanha você mesmo quando novos modelos e novos produtos saem”.

As experiências da GSK com multi -agentes na descoberta de medicamentos

A GSK é um desenvolvedor farmacêutico líder, com foco específico em vacinas, doenças infecciosas e pesquisa de oncologia. Agora, a empresa está começando a aplicar arquiteturas multi-agentes para acelerar a descoberta de medicamentos.

Kim Branson, vice -presidente sênior da GSK e chefe global de IA e ML, disse que os agentes estão começando a transformar o produto da empresa e são “absolutamente essenciais para o nosso negócio”.

Os cientistas da GSK estão combinando LLMs específicos de domínio com ontologias (conceitos e categorias do assunto que indicam propriedades e relações entre elas), cadeias de ferramentas e estruturas de testes rigorosas, explicou Branson.

Isso os ajuda a consultar conjuntos de dados científicos gigantescos, planejar experimentos (mesmo que não haja verdade fundamental) e montar evidências entre a genômica (o estudo do DNA), proteômica (o estudo da proteína) e dados clínicos. Os agentes podem surgir hipóteses, validar dados de dados e compactar ciclos de pesquisa.

Branson observou que a descoberta científica percorreu um longo caminho; Os tempos de seqüenciamento caíram e a pesquisa proteômica é muito mais rápida. Ao mesmo tempo, porém, a descoberta se torna cada vez mais difícil à medida que mais e mais dados são acumulados, principalmente através de dispositivos e wearables. Como Branson disse: “Temos dados de pulso mais contínuos sobre as pessoas do que nunca como espécie”.

Pode ser quase impossível para os humanos analisar todos esses dados, portanto, o objetivo da GSK é usar a IA para acelerar os tempos de iteração, observou ele.

Mas, ao mesmo tempo, a IA pode ser complicada na Big Pharma, porque muitas vezes não há uma verdade fundamental sem realizar grandes experimentos clínicos; É mais sobre hipóteses e cientistas que exploram evidências para encontrar possíveis soluções.

“Quando você começa a adicionar agentes, descobre que a maioria das pessoas nem sequer tem uma maneira padrão de fazê -lo entre si”, observou Branson. “Essa variação não é ruim, mas às vezes leva a outra pergunta.”

Ele brincou: “Nem sempre temos uma verdade absoluta para trabalhar – caso contrário, meu trabalho seria muito mais fácil”.

Trata -se de criar os alvos certos ou saber como projetar o que poderia ser um biomarcador ou evidência para diferentes hipóteses, explicou. Por exemplo: Esta é a melhor avenida a considerar para pessoas com câncer de ovário nessa condição específica?

Para fazer com que a IA entenda que o raciocínio exige o uso de ontologias e questões como: ‘Se isso é verdade, o que X significa?’. Os agentes específicos de domínio podem reunir evidências relevantes de grandes conjuntos de dados internos.

A GSK construiu modelos de linguagem epigenômica alimentados por cerebras do zero que ele usa para inferência e treinamento, explicou Branson. “Construímos modelos muito específicos para nossos aplicativos, onde ninguém mais tem um”, disse ele.

A velocidade de inferência é importante, observou ele, seja para uma pesquisa de modo e partida, e uma pesquisa profunda autônoma, e a GSK usa diferentes conjuntos de ferramentas com base na meta final. Mas as grandes janelas de contexto nem sempre são a resposta, e a filtragem é crítica. “Você não pode simplesmente jogar recheio de contexto”, disse Branson. “Você não pode simplesmente jogar todos os dados nessa coisa e confiar no LM para descobrir isso.”

Testes contínuos críticos

A GSK coloca muitos testes em seus sistemas agênticos, priorizando o determinismo e a confiabilidade, geralmente executando vários agentes em paralelo aos resultados da verificação cruzada.

Branson lembrou que, quando sua equipe começou a construir, eles tinham um agente do SQL que correu “10.000 vezes”, e inexplicavelmente “fingiu” detalhes.

“Nunca vimos isso acontecer novamente, mas aconteceu uma vez e nem entendemos por que isso aconteceu com esse LLM em particular”, disse ele.

Como resultado, sua equipe costuma executar várias cópias e modelos em paralelo ao aplicar a chamada e as restrições de ferramentas; Por exemplo, dois LLMs executarão exatamente a mesma sequência e os cientistas da GSK os verificarão.

Sua equipe se concentra nos loops de aprendizado ativo e está reunindo seus próprios parâmetros internos porque os populares, publicamente disponíveis ao público, geralmente são “bastante acadêmicos e não refletem o que fazemos”.

Por exemplo, eles gerarão várias questões biológicas, marcarão o que acham que o padrão -ouro será, depois aplicará um LLM contra isso e verá como ele classifica.

“Nós buscamos especialmente coisas problemáticas em que não funcionou ou fez uma coisa idiota, porque foi quando aprendemos algumas coisas novas”, disse Branson. “Tentamos fazer com que os humanos usem seu julgamento especializado onde isso importa.”



Fonte ==> Cyberseo

Relacionados

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *