Gemini Aprimora Edição de Imagens com Novo Modelo da DeepMind

O Google anunciou nesta terça-feira (26/08) uma atualização significativa nas ferramentas de edição de imagem do Gemini. A novidade é a integração de um novo modelo de IA da DeepMind, chamado de Nano Banana, que garante muito mais consistência e fidelidade ao alterar fotos, mantendo as características originais das pessoas, animais e objetos mesmo após múltiplas edições.

A capacidade de edição de imagens não é totalmente nova para o ecossistema do Google. A empresa já vinha integrando essa funcionalidade desde maio. No entanto, o aprimoramento agora chega de forma mais acessível a todos os usuários do aplicativo e site do Gemini.

A Consistência Chegou para Ficar

A grande promessa do novo modelo é resolver um dos problemas mais comuns desde que os chatbots de IA passaram a aceitar imagens de entrada: a falta de consistência. Em versões anteriores, ao pedir para a IA alterar um detalhe em uma foto, era comum que todo o resto da imagem também mudasse de forma imprevisível.

Com o Nano Banana, a história parece ser diferente. Segundo o Google, o modelo consegue lembrar dos detalhes da imagem original. Isso permite que o usuário realize edições em várias etapas, como trocar a roupa, depois mudar o cenário e, em seguida, adicionar um objeto — tudo isso pelo chat, sem precisar fazer seleções, como em aplicativos de edição convencionais.

O Tecnoblog testou a funcionalidade e teve resultados impressionantes, sem grandes inconsistências entre a versão original e a editada, provando a eficácia do modelo.

Novos Casos de Uso Desbloqueados

Segundo o Google, a atualização desbloqueia novos usos, como:

Mudar trajes e locais: É possível enviar uma foto sua e pedir para o Gemini reimaginar você em diversos cenários, mantendo sua aparência.
Misturar fotos: O usuário pode enviar duas ou mais imagens e pedir para a IA combiná-las em uma cena única.
Edição em várias etapas: Funciona como o processo de criação iterativo dos textos. Agora é possível, por exemplo, adicionar móveis a um cômodo vazio, um item de cada vez, preservando o restante da imagem a cada passo.

O Mistério do Nano Banana

O novo modelo, cujo nome técnico é Gemini 2.5 Flash Image, ganhou notoriedade na comunidade de IA antes mesmo do anúncio oficial. Com o codinome Nano Banana, ele surgiu anonimamente em plataformas de teste como a LMArena. As habilidades de edição do modelo impressionaram os especialistas e o levaram ao topo do ranking da plataforma.

Agora, o Google confirma que o Nano Banana é uma criação da DeepMind. A empresa destaca que, como em outras ferramentas de geração de imagem da casa, todas as fotos editadas no Gemini incluirão uma marca d’água visível, “AI”, e uma marca d’água digital invisível, chamada SynthID, para garantir a transparência.

Gemini Aprimora Edição de Imagens com Novo Modelo da DeepMind

A Consistência Chegou para Ficar

Novos Casos de Uso Desbloqueados

O Mistério do Nano Banana

Artigos Relacionados

Gemini Aprimora Edição de Imagens com Novo Modelo da DeepMind

Microsoft Lança "Copilot Mode" no Edge: A Nova Era da Navegação com IA

Proton Lança Lumo: Um Assistente de IA Focado em Privacidade para Proteger Seus Dados

Junte-se à Comunidade

Artigos Populares

Google DeepMind contrata líderes da Windsurf e deixa OpenAI de fora em acordo bilionário por tecnologia de IA

LLMs Locais: Seu Guia Completo para Rodar Modelos no LM Studio e Além

OpenAI Lança "Modo Estudo" no ChatGPT: Foco no Pensamento Crítico para Estudantes

Kiro: A Nova IDE de IA Que Leva Seu Código do Conceito à Produção

OpenAI Lança ChatGPT Agent: A Nova Geração de Agentes de IA Multiuso

Newsletter