O Google anunciou nesta terça-feira (26/08) uma atualização significativa nas ferramentas de edição de imagem do Gemini. A novidade é a integração de um novo modelo de IA da DeepMind, chamado de Nano Banana, que garante muito mais consistência e fidelidade ao alterar fotos, mantendo as características originais das pessoas, animais e objetos mesmo após múltiplas edições.
A capacidade de edição de imagens não é totalmente nova para o ecossistema do Google. A empresa já vinha integrando essa funcionalidade desde maio. No entanto, o aprimoramento agora chega de forma mais acessível a todos os usuários do aplicativo e site do Gemini.
A Consistência Chegou para Ficar
A grande promessa do novo modelo é resolver um dos problemas mais comuns desde que os chatbots de IA passaram a aceitar imagens de entrada: a falta de consistência. Em versões anteriores, ao pedir para a IA alterar um detalhe em uma foto, era comum que todo o resto da imagem também mudasse de forma imprevisível.
Com o Nano Banana, a história parece ser diferente. Segundo o Google, o modelo consegue lembrar dos detalhes da imagem original. Isso permite que o usuário realize edições em várias etapas, como trocar a roupa, depois mudar o cenário e, em seguida, adicionar um objeto — tudo isso pelo chat, sem precisar fazer seleções, como em aplicativos de edição convencionais.
O Tecnoblog testou a funcionalidade e teve resultados impressionantes, sem grandes inconsistências entre a versão original e a editada, provando a eficácia do modelo.
Novos Casos de Uso Desbloqueados
Segundo o Google, a atualização desbloqueia novos usos, como:
- Mudar trajes e locais: É possível enviar uma foto sua e pedir para o Gemini reimaginar você em diversos cenários, mantendo sua aparência.
- Misturar fotos: O usuário pode enviar duas ou mais imagens e pedir para a IA combiná-las em uma cena única.
- Edição em várias etapas: Funciona como o processo de criação iterativo dos textos. Agora é possível, por exemplo, adicionar móveis a um cômodo vazio, um item de cada vez, preservando o restante da imagem a cada passo.
O Mistério do Nano Banana
O novo modelo, cujo nome técnico é Gemini 2.5 Flash Image, ganhou notoriedade na comunidade de IA antes mesmo do anúncio oficial. Com o codinome Nano Banana, ele surgiu anonimamente em plataformas de teste como a LMArena. As habilidades de edição do modelo impressionaram os especialistas e o levaram ao topo do ranking da plataforma.
Agora, o Google confirma que o Nano Banana é uma criação da DeepMind. A empresa destaca que, como em outras ferramentas de geração de imagem da casa, todas as fotos editadas no Gemini incluirão uma marca d’água visível, “AI”, e uma marca d’água digital invisível, chamada SynthID, para garantir a transparência.