Gemini transforma qualquer mensagem ou imagem em música com o novo modelo Lyria 3
Google

Gemini transforma qualquer mensagem ou imagem em música com o novo modelo Lyria 3

Integração tecnológica do Google DeepMind permite converter textos e estímulos visuais em composições de 30 segundos para partilha imediata.
Publicado a
Atualizado a

A Google anunciou esta terça-feira uma atualização estratégica na sua aplicação Gemini com a integração do Lyria 3, o seu modelo de geração de música mais sofisticado até à data.

O objetivo desta inovação é "democratizar a expressão criativa", permitindo que os utilizadores criem não apenas peças musicais, mas também mensagens áudio personalizadas, piadas e memórias sonoras a partir de simples comandos de texto ou imagens.

Desenvolvido pelo Google DeepMind, o Lyria 3 foi concebido para transformar a forma como as pessoas interagem. Joël Yawili, Senior Product Manager do Gemini, e Myriam Hamed Torres, do Google DeepMind, sublinham que a ferramenta visa "ajudar a adicionar uma faixa musical divertida e personalizada à vida diária".

Na prática, o sistema permite converter uma "piada privada" ou uma descrição emocional numa faixa de 30 segundos de alta qualidade. Exemplos facultados pela tecnológica incluem desde baladas cómicas de R&B sobre situações quotidianas até faixas nostálgicas de afrobeat dedicadas a memórias familiares.

A facilidade de partilha -- através de um link direto ou download -- permite que estas composições sejam integradas rapidamente em conversas e redes sociais.

O Lyria 3 já se encontra disponível para utilizadores maiores de 18 anos, com suporte total para português. Embora a funcionalidade seja acessível na versão base do Gemini, os subscritores dos planos Google AI Plus, Pro e Ultra terão acesso a limites de utilização superiores.

O sistema cria automaticamente uma "imagem de capa" para a música gerada.
O sistema cria automaticamente uma "imagem de capa" para a música gerada.Google

Capacidades contextuais

O Lyria 3 apresenta avanços significativos na autonomia criativa. Ao contrário de modelos anteriores, o sistema gera automaticamente as letras com base no contexto fornecido pelo utilizador, oferecendo ainda controlo sobre o estilo, a voz e o tempo da faixa.

A experiência é reforçada pela multimodalidade, permitindo que o Gemini "leia" fotografias ou vídeos para compor bandas sonoras que se adequem ao ambiente visual.

No ecossistema do YouTube, esta tecnologia será integrada no Dream Track, auxiliando criadores de conteúdo a elevar a qualidade sonora dos seus Shorts. Cada criação é acompanhada por uma capa artística única, gerada pelo modelo de imagem Nano Banana.

Transparência e segurança assegurada pelo SynthID

A empresa norte-americana reforçou o seu compromisso com a inteligência artificial responsável ao incorporar a tecnologia SynthID em todas as faixas geradas. Esta marca de água digital, embora impercetível ao ouvido humano, permite identificar a origem do conteúdo, sendo assim detetável como tendo sido gerado por IA.

Pela primeira vez, os utilizadores podem também utilizar o próprio Gemini para verificar a autenticidade de ficheiros de áudio, carregando-os na aplicação para detetar a presença desta marca de água.

Relativamente aos direitos de autor, a empresa garante que o treino do modelo foi realizado sob rigorosos contratos de parceria e que o sistema está programado para a "expressão original", evitando a imitação direta de artistas existentes.

Artigos Relacionados

No stories found.
Diário de Notícias
www.dn.pt