Player Live
AO VIVO
4 de março de 2026
Google lança Gemini 3.1 Flash Lite por 1/8 do custo do Pro

Google lança Gemini 3.1 Flash Lite por 1/8 do custo do Pro

O mais novo modelo de IA do Google está aqui: Gemini 3.1 Flash-Lite, e as maiores melhorias desta vez vêm em custo e velocidade, especialmente para empresas e desenvolvedores que buscam aproveitar o raciocínio poderoso e os recursos multimodais do gigante de busca e nuvem dos EUA. Posicionando-o como o modelo mais econômico e responsivo da série Gemini 3, o Google está oferecendo uma solução desenvolvida especificamente para inteligência em escala. Este lançamento chega poucas semanas após a estreia em fevereiro do seu irmão mais pesado, o Gemini 3.1 Pro, completando uma estratégia em níveis que permite às empresas escalar a inteligência em todas as camadas da sua infraestrutura. Tecnologia: otimizada para o "hora do primeiro token" No mundo da IA ​​de alto rendimento, a métrica que geralmente determina a experiência do usuário não é apenas a precisão: é a latência. Para suporte ao cliente em tempo real, moderação de conteúdo ao vivo ou geração instantânea de interface de usuário, o "hora do primeiro token de resposta" é o principal indicador para saber se um aplicativo parece uma ferramenta ou um companheiro de equipe. Se um modelo demorar até dois segundos para iniciar sua resposta, a ilusão de interação fluida será quebrada. Gemini 3.1 Flash-Lite foi projetado especificamente para essa sensação instantânea. De acordo com benchmarks internos e avaliações de terceiros, o Flash-Lite supera seu antecessor, Gemini 2.5 Flash, com um tempo 2,5X mais rápido para o primeiro token. Além disso, apresenta um aumento de 45% na velocidade geral de saída – 363 tokens por segundo em comparação com 249. Essa velocidade é alcançada por meio do que Koray Kavukcuoglu, vice-presidente de pesquisa do Google DeepMind, descreve em um post X como uma quantidade inacreditável de engenharia complexa para fazer a IA parecer instantânea. Talvez a adição técnica mais inovadora seja a introdução de níveis de pensamento. Padronizado nas variantes Flash-Lite e Pro, esse recurso permite aos desenvolvedores modular dinamicamente a intensidade do raciocínio do modelo. Para uma tarefa de classificação simples ou uma análise de sentimento de alto volume, o modelo pode ser reduzido para obter velocidade máxima e custo mínimo. Por outro lado, para exploração de código complexo, geração de painéis ou criação de simulações, o pensamento pode ser ajustado, permitindo que o modelo execute raciocínio e lógica mais profundos antes de emitir sua primeira resposta. Produto: comparando o rebatedor pesado de peso leve Enquanto o "Leve" sufixo muitas vezes implica um sacrifício significativo na capacidade, os dados de desempenho sugerem um modelo que se enquadra bem no território de sistemas muito maiores. Gemini 3.1 Flash-Lite alcançou uma pontuação Elo de 1432 na tabela de classificação Arena.ai, colocando-o em um nível competitivo com modelos muito maiores em contagem de parâmetros. Os principais resultados do benchmark destacam seus pontos fortes especializados em diversos domínios cognitivos: Conhecimento científico: 86,9 por cento no GPQA Diamond. Compreensão multimodal: 76,8 por cento no MMMU-Pro. Perguntas e respostas multilíngues: 88,9 por cento no MMMLU. Conhecimento paramétrico: 43,3 por cento no SimpleQA verificado. Raciocínio abstrato: 16,0 por cento no Último Exame da Humanidade (conjunto completo) O modelo é particularmente adequado à conformidade de saída estruturada – um requisito crítico para desenvolvedores corporativos que precisam de IA para gerar código JSON, SQL ou UI válido que não interrompa os sistemas downstream. Em benchmarks como LiveCodeBench, o Flash-Lite obteve 72,0%, superando vários rivais em sua classe de peso, incluindo o GPT-5 mini, que obteve 80,4% em um subconjunto diferente, mas ficou significativamente atrás em velocidade e eficiência de custos. Além disso, seu desempenho no CharXiv Reasoning (73,2%) e no Video-MMMU (84,8%) demonstra que seus recursos multimodais são robustos o suficiente para síntese de gráficos complexos e aquisição de conhecimento a partir de vídeo. A hierarquia de inteligência: Flash-Lite vs. 3.1 Pro Para entender o lugar do Flash-Lite no mercado, é preciso olhar para ele junto com o Gemini 3.1 Pro, que o Google lançou em meados de fevereiro de 2026 para retomar a coroa da IA. Enquanto o Flash-Lite é o reflexo do sistema Gemini, o 3.1 Pro é sem dúvida o cérebro. O principal diferenciador é a profundidade do processamento cognitivo. O Gemini 3.1 Pro foi projetado para dobrar o desempenho de raciocínio da geração anterior, alcançando uma pontuação verificada de 77,1% no ARC-AGI-2 – um benchmark projetado para testar a capacidade de um modelo de resolver padrões lógicos inteiramente novos que não encontrou durante o treinamento. Embora o Flash-Lite se mantenha em conhecimento científico com 86,9%, o modelo Pro ultrapassa esse limite para impressionantes 94,3%, tornando-o a escolha superior para pesquisas profundas e sínteses de alto risco. O foco da aplicação também difere significativamente com base nessas lacunas de raciocínio. O Gemini 3.1 Pro é capaz de codificar vibrações – gerando SVGs animados e simulações 3D complexas diretamente a partir de prompts de texto. Por exemplo, em uma demonstração, Pro codificou um complexo murmúrio de estorninho em 3D que os usuários poderiam manipular por meio de rastreamento manual. Pode até raciocinar através de temas literários abstratos, como traduzir o tom atmosférico de Wuthering Heights, de Emily Brontë, em um web design funcional. Gemini 3.1 Flash-Lite, por outro lado, é o carro-chefe para execução de alto volume. Ele lida com milhões de tarefas diárias (tradução, marcação e moderação) que exigem resultados consistentes e repetíveis sem a enorme sobrecarga computacional de um modelo com muito raciocínio. Ele preenche um wireframe com centenas de produtos instantaneamente ou orquestra o roteamento de intenções com 94% de precisão, conforme relatado pelos primeiros testadores. 1/8º do custo do modelo principal Gemini 3.1 Pro (e mais barato que seu antecessor, Flash-Lite 2.5) Para os tomadores de decisões técnicas empresariais, a parte mais atraente da série Gemini 3.1 é a relação entre o raciocínio e o dólar. O Google fixou o preço Gemini 3.1 Flash-Lite a US$ 0,25 por 1 milhão de tokens de entrada e US$ 1,50 por 1 milhão de tokens de saída. Esse preço o torna significativamente mais acessível do que concorrentes como Claude 4.5 Haiku, que custa US$

Leia Mais »