Google lança novas ferramentas para criação de música, imagem e vídeo com IA

Ferramentas como Veo 3, Imagen 4 e Lyria 2 mostram como o Google aposta na IA para transformar criação de música e imagem.
Foto de Nathália Pandeló
Nathália Pandeló
Google aumenta opções de música com IA
Google aumenta opções de música com IA (Crédito: Divulgação)

O Google anunciou uma nova leva de modelos generativos com foco em imagem, vídeo e música. Os lançamentos incluem o Veo 3, o Imagen 4, o sistema de composição musical Lyria 2 e a plataforma de storytelling audiovisual Flow. A empresa também reforçou seu compromisso com a identificação de conteúdos gerados por inteligência artificial, com o novo SynthID Detector.

As ferramentas integram o ecossistema do Google DeepMind e chegam ao mercado com promessa de aprimorar a produção de conteúdos visuais e sonoros, tanto para usuários finais quanto para empresas e profissionais criativos.

Veo 3 inaugura geração de vídeos com áudio

O Veo 3 é o novo modelo de geração de vídeo da empresa. Além de qualidade de imagem aprimorada em relação ao Veo 2, o sistema agora produz vídeos com som sincronizado, incluindo sons ambientes como pássaros, tráfego urbano e até diálogos entre personagens. A ferramenta interpreta comandos de texto e imagem e gera clipes completos com sincronização labial precisa, a partir de descrições narrativas.

A nova versão está disponível inicialmente no aplicativo Gemini e na plataforma Flow para usuários do plano Ultra nos Estados Unidos, além de clientes corporativos no Vertex AI. O modelo anterior, Veo 2, também recebeu atualizações, incluindo controle de câmera, ampliação de cenas, e manipulação de objetos, agora compatíveis com o ambiente Flow.

Flow integra modelos para produção audiovisual com IA

Desenvolvido em colaboração com profissionais da indústria criativa, o Flow é uma plataforma para criação cinematográfica baseada em IA. Ele integra os modelos Veo, Imagen e Gemini, permitindo que o usuário gerencie personagens, cenários e estilos por meio de comandos em linguagem natural.

Na prática, o sistema atua como uma central de controle narrativo, onde é possível descrever uma cena e obter clipes estilizados conforme os parâmetros definidos. O Flow está disponível para assinantes dos planos AI Pro e Ultra nos EUA e deve ser lançado em breve em outros países.

Imagen 4 aprimora geração de imagens com resolução 2K

A nova versão do modelo de geração de imagens do Google, Imagen 4, destaca-se pela resolução de até 2K e por seu nível de detalhamento. A ferramenta promete entregar precisão em texturas como pelos de animais, gotas d’água e tecidos, sendo eficiente tanto para estilos fotorrealistas quanto para composições mais abstratas.

Além disso, a ferramenta apresenta melhorias em tipografia, facilitando a criação de cards, pôsteres e quadrinhos. Está integrada ao app Gemini, à plataforma Whisk e também pode ser usada em Slides, Vids, Docs e outras aplicações do Google Workspace.

Lyria 2 e Lyria RealTime impulsionam música com IA

O Lyria 2 é o modelo de IA voltado para composição musical, expandido recentemente para uso no Music AI Sandbox, ambiente experimental que oferece ferramentas para músicos, produtores e compositores. A proposta é estimular novas ideias musicais por meio de recursos generativos, como troca de instrumentos, alteração de tom e ajustes de intensidade.

Já o Lyria RealTime foi integrado ao MusicFX DJ e agora pode ser acessado via API e pela plataforma AI Studio. A ferramenta foi projetada para interação ao vivo com músicos, simulando a experiência de “jamear” com uma banda. Segundo o Google DeepMind, o modelo é capaz de gerar músicas em estéreo 48kHz com controle em tempo real de diversos parâmetros sonoros.

Identificação e rastreabilidade de conteúdo por IA

Inteligência artificial - IA
Crédito: Freepik

O Google também reforçou suas medidas de segurança com o anúncio do SynthID Detector, um portal que identifica se um arquivo — seja imagem, vídeo, áudio ou texto — foi gerado por inteligência artificial. A nova ferramenta complementa o uso do SynthID, tecnologia de marca d’água invisível já usada pela empresa para rastrear mais de 10 bilhões de conteúdos.

Todos os modelos lançados, incluindo Veo 3, Imagen 4 e Lyria 2, terão marcações por SynthID integradas automaticamente. A medida faz parte do compromisso da empresa com a transparência e combate à desinformação, especialmente em um cenário onde o conteúdo sintético se torna cada vez mais sofisticado.

Lançamentos sinalizam disputa por protagonismo em mídia generativa

Os anúncios da conferência Google I/O 2025 confirmam a aposta da empresa no segmento de mídia generativa, atualmente um dos focos mais competitivos da indústria de tecnologia. Com o avanço de plataformas como Suno, Udio e Riffusion no campo da música, e a popularização de ferramentas visuais como Midjourney e Runway, o Google busca se posicionar com um pacote integrado de soluções de ponta voltadas para criadores, desenvolvedores e empresas.

Ainda não há previsão oficial de lançamento das ferramentas no Brasil, mas a expectativa é de que, como em versões anteriores, o acesso global seja gradualmente liberado ao longo do segundo semestre.

  • Leia mais: