Player Live
AO VIVO
27 de fevereiro de 2026
O Nano Banana 2 do Google visa o problema do custo de produção que manteve a geração de imagens de IA fora dos fluxos de trabalho empresariais

O Nano Banana 2 do Google visa o problema do custo de produção que manteve a geração de imagens de IA fora dos fluxos de trabalho empresariais

Nos últimos seis meses, as empresas que pretendem implementar a geração de imagens de IA de alta qualidade em grande escala enfrentaram uma compensação desconfortável: pagar preços premium pelo modelo Nano Banana Pro da Google ou contentar-se com alternativas mais baratas (por vezes gratuitas), mais rápidas, mas visivelmente inferiores – especialmente em termos de requisitos empresariais, como texto preciso incorporado, diapositivos, diagramas e outras informações não estéticas. Hoje, o Google DeepMind está tentando preencher essa lacuna com o lançamento do Nano Banana 2 (formalmente Gemini 3.1 Flash Image) – um modelo que traz o raciocínio, a renderização de texto e o controle criativo do nível Pro até a velocidade e preços no nível do Flash. O lançamento ocorre apenas dezesseis dias depois que a equipe Qwen do Alibaba abandonou o Qwen-Image-2.0, um desafiante de peso aberto de 7 bilhões de parâmetros que muitos desenvolvedores argumentaram que já havia igualado a qualidade do Nano Banana Pro por uma fração do custo de inferência. Para os líderes de TI que avaliam pipelines de geração de imagens, o Nano Banana 2 reformula a matriz de decisão. A questão não é mais se os modelos de imagem de IA são bons o suficiente para produção – mas sim qual curva de custo do fornecedor melhor se adapta ao fluxo de trabalho. O problema do custo de produção: por que o Nano Banana Pro ficou na caixa de areia Quando o Google lançou o Nano Banana Pro em novembro de 2025, baseado no backbone Gemini 3 Pro, a comunidade de desenvolvedores ficou impressionada com sua fidelidade visual e capacidade de raciocínio. O modelo poderia renderizar texto preciso em imagens, manter a consistência dos caracteres em conversas múltiplas e seguir instruções de composição complexas – todos recursos com os quais os geradores de imagens anteriores tinham dificuldade. Mas os preços Pro-tier criaram uma barreira à implantação em escala. De acordo com a página de preços da API do Google, a saída de imagem do Nano Banana Pro custa US$ 120 por milhão de tokens, equivalendo a cerca de US$ 0,134 por imagem gerada com resolução de 1K pixels. Para aplicativos que geram milhares de imagens diariamente – pense na visualização de produtos de comércio eletrônico, pipelines de ativos de marketing ou geração de conteúdo localizado – esses custos aumentam rapidamente. O Nano Banana 2, construído no backbone Gemini 3.1 Flash, reduz drasticamente esse preço. A saída de imagem da camada Flash custa US$ 60 por milhão de tokens, aproximadamente US$ 0,067 por imagem de 1K por imagem – cerca de 50% mais barata que o modelo Pro. Para empresas que executam fluxos de trabalho de geração de imagens de alto volume, essa é a diferença entre uma prova de conceito e uma implantação de produção. O que Nano Banana 2 realmente oferece O modelo não é simplesmente um Nano Banana Pro mais barato. De acordo com o anúncio do Google DeepMind, o Nano Banana 2 traz vários recursos que antes eram exclusivos do nível Pro, ao mesmo tempo que introduz novos recursos próprios. A melhoria do título é a renderização e tradução do texto. O modelo pode gerar imagens com texto preciso e legível – um ponto historicamente fraco para geradores de imagens de IA – e depois traduzir esse texto para diferentes idiomas dentro do mesmo fluxo de trabalho de edição de imagens. A consistência dos assuntos também melhorou significativamente. Nano Banana 2 pode manter a semelhança de caracteres em até cinco caracteres e preservar a fidelidade de até 14 objetos de referência em um fluxo de trabalho de geração única. Isso permite storyboards, fotografia de produtos com vários SKUs e criação de ativos de marca onde a continuidade visual é importante. A documentação do Google destaca a capacidade de fornecer até 14 imagens de referência diferentes como entrada, permitindo ao modelo compor cenas incorporando vários objetos ou personagens distintos de fontes separadas. Do lado das especificações técnicas, o modelo suporta controle total de proporção de aspecto, resoluções que variam de 512 pixels a 4K e dois níveis de pensamento que permitem aos desenvolvedores equilibrar qualidade e latência. Uma adição notável que falta ao Nano Banana Pro é uma ferramenta de pesquisa de imagens – o modelo pode realizar pesquisas de imagens e usar imagens recuperadas como contexto de base para geração, expandindo sua utilidade para fluxos de trabalho que requerem material de referência visual. O fator Qwen-Image-2.0: por que o Google precisava agir rápido O momento do Google não é coincidência. Em 10 de fevereiro, a equipe Qwen do Alibaba lançou o Qwen-Image-2.0, um modelo unificado de geração e edição de imagens que imediatamente atraiu comparações com o Nano Banana Pro – mas com uma pegada dramaticamente menor. Qwen-Image-2.0 roda em apenas 7 bilhões de parâmetros, abaixo dos 20 bilhões de seu antecessor, enquanto unifica a geração de texto para imagem e a edição de imagens em uma única arquitetura. O modelo gera nativamente com resolução de 2K (2.048 × 2.048 pixels), suporta prompts de até 1.000 tokens para layouts complexos e está classificado no topo ou próximo ao topo da tabela de classificação de avaliação humana cega do AI Arena para tarefas de geração e edição. Para os compradores empresariais, a dinâmica competitiva é significativa. A contagem de 7B de parâmetros do Qwen-Image-2.0 significa custos de inferência substancialmente mais baixos quando auto-hospedado – uma consideração crítica para organizações com requisitos de residência de dados ou cargas de trabalho de alto volume. O modelo anterior da equipe Qwen, Qwen-Image v1, foi lançado no Apache 2.0 aproximadamente um mês após seu anúncio inicial, e a comunidade de desenvolvedores espera amplamente a mesma trajetória para a v2.0. Se os pesos abertos se materializarem, as organizações poderão executar um modelo de imagem competitivo Nano Banana Pro em sua própria infraestrutura, sem cobranças de API por imagem. A arquitetura unificada de geração e edição do modelo também simplifica a implantação. Em vez de encadear modelos separados para criação e modificação – a norma atual da indústria –

Leia Mais »