O Google anunciou uma nova leva de modelos generativos com foco em imagem, vídeo e música. Os lançamentos incluem o Veo 3, o Imagen 4, o sistema de composição musical Lyria 2 e a plataforma de storytelling audiovisual Flow. A empresa também reforçou seu compromisso com a identificação de conteúdos gerados por inteligência artificial, com o novo SynthID Detector.
As ferramentas integram o ecossistema do Google DeepMind e chegam ao mercado com promessa de aprimorar a produção de conteúdos visuais e sonoros, tanto para usuários finais quanto para empresas e profissionais criativos.
Veo 3 inaugura geração de vídeos com áudio
O Veo 3 é o novo modelo de geração de vídeo da empresa. Além de qualidade de imagem aprimorada em relação ao Veo 2, o sistema agora produz vídeos com som sincronizado, incluindo sons ambientes como pássaros, tráfego urbano e até diálogos entre personagens. A ferramenta interpreta comandos de texto e imagem e gera clipes completos com sincronização labial precisa, a partir de descrições narrativas.
A nova versão está disponível inicialmente no aplicativo Gemini e na plataforma Flow para usuários do plano Ultra nos Estados Unidos, além de clientes corporativos no Vertex AI. O modelo anterior, Veo 2, também recebeu atualizações, incluindo controle de câmera, ampliação de cenas, e manipulação de objetos, agora compatíveis com o ambiente Flow.
Flow integra modelos para produção audiovisual com IA
Desenvolvido em colaboração com profissionais da indústria criativa, o Flow é uma plataforma para criação cinematográfica baseada em IA. Ele integra os modelos Veo, Imagen e Gemini, permitindo que o usuário gerencie personagens, cenários e estilos por meio de comandos em linguagem natural.
Na prática, o sistema atua como uma central de controle narrativo, onde é possível descrever uma cena e obter clipes estilizados conforme os parâmetros definidos. O Flow está disponível para assinantes dos planos AI Pro e Ultra nos EUA e deve ser lançado em breve em outros países.
Imagen 4 aprimora geração de imagens com resolução 2K
A nova versão do modelo de geração de imagens do Google, Imagen 4, destaca-se pela resolução de até 2K e por seu nível de detalhamento. A ferramenta promete entregar precisão em texturas como pelos de animais, gotas d’água e tecidos, sendo eficiente tanto para estilos fotorrealistas quanto para composições mais abstratas.
Além disso, a ferramenta apresenta melhorias em tipografia, facilitando a criação de cards, pôsteres e quadrinhos. Está integrada ao app Gemini, à plataforma Whisk e também pode ser usada em Slides, Vids, Docs e outras aplicações do Google Workspace.
Lyria 2 e Lyria RealTime impulsionam música com IA
O Lyria 2 é o modelo de IA voltado para composição musical, expandido recentemente para uso no Music AI Sandbox, ambiente experimental que oferece ferramentas para músicos, produtores e compositores. A proposta é estimular novas ideias musicais por meio de recursos generativos, como troca de instrumentos, alteração de tom e ajustes de intensidade.
Já o Lyria RealTime foi integrado ao MusicFX DJ e agora pode ser acessado via API e pela plataforma AI Studio. A ferramenta foi projetada para interação ao vivo com músicos, simulando a experiência de “jamear” com uma banda. Segundo o Google DeepMind, o modelo é capaz de gerar músicas em estéreo 48kHz com controle em tempo real de diversos parâmetros sonoros.
Identificação e rastreabilidade de conteúdo por IA

O Google também reforçou suas medidas de segurança com o anúncio do SynthID Detector, um portal que identifica se um arquivo — seja imagem, vídeo, áudio ou texto — foi gerado por inteligência artificial. A nova ferramenta complementa o uso do SynthID, tecnologia de marca d’água invisível já usada pela empresa para rastrear mais de 10 bilhões de conteúdos.
Todos os modelos lançados, incluindo Veo 3, Imagen 4 e Lyria 2, terão marcações por SynthID integradas automaticamente. A medida faz parte do compromisso da empresa com a transparência e combate à desinformação, especialmente em um cenário onde o conteúdo sintético se torna cada vez mais sofisticado.
Lançamentos sinalizam disputa por protagonismo em mídia generativa
Os anúncios da conferência Google I/O 2025 confirmam a aposta da empresa no segmento de mídia generativa, atualmente um dos focos mais competitivos da indústria de tecnologia. Com o avanço de plataformas como Suno, Udio e Riffusion no campo da música, e a popularização de ferramentas visuais como Midjourney e Runway, o Google busca se posicionar com um pacote integrado de soluções de ponta voltadas para criadores, desenvolvedores e empresas.
Ainda não há previsão oficial de lançamento das ferramentas no Brasil, mas a expectativa é de que, como em versões anteriores, o acesso global seja gradualmente liberado ao longo do segundo semestre.
- Leia mais:
- Soundbeats III by Mundo da Música: segundo dia no Rio2C reúne nomes como Tiago Iorc, Adriana Ramos e debate as conexões entre música, mercado e identidade
- Ecad cobra pagamento de direitos autorais em festas juninas do Nordeste
- UBC é reeleita para o Conselho da Cisac e reforça presença global em meio aos debates sobre IA e remuneração
- TikTok integra SoundCloud ao recurso ‘Add to Music App’ em meio a incertezas e críticas
- Rio2C: Latin Grammy impulsiona projeto em espanhol de Tiago Iorc, que prepara álbum com releituras de seus maiores sucessos