Lyra 3: il nuovo modello musicale di Google (ora in Gemini)

19/02/2026 Mooseek

Condividi su Facebook Condividi su X Condividi su LinedIn Condividi su Telegram Condividi su WhatsApp Condividi su Flipboard Condividi su Pinterest Condividi su Tumblr Condividi via SMS Condividi via Email Condividi Ora

Il video presenta Lyria 3, il modello di generazione musicale più avanzato di Google DeepMind, pensato come vero e proprio collaboratore creativo per musicisti, creator e appassionati.

L’obiettivo è permettere a chiunque di passare in pochi secondi da un’idea – una frase, un’immagine, un ricordo – a una traccia musicale con voce, testo e arrangiamento completi, mantenendo al centro il controllo umano sul risultato finale.

Un collaboratore musicale guidato dai prompt

Nel video si ascolta direttamente musica creata con Lyria 3, mentre una voce narrante spiega come il modello trasformi prompt dettagliati in brani con “natural flow”, cioè con una struttura musicale coerente dall’inizio alla fine.



L’utente può descrivere scene (“stomp your feet on the red clay ground…”, “city lights bleeding through the rain”) e il sistema genera tracce complete che seguono l’atmosfera, il ritmo e l’energia suggeriti dal testo, senza richiedere competenze musicali pregresse.

Lyria 3 è stato progettato per funzionare in modo interattivo: si sperimenta, si rigenera, si affina il risultato, rendendo il modello una spalla creativa con cui giocare, esplorare generi e trovare rapidamente nuove idee.

Dall’idea al brano: testo, voce, genere e dettagli tecnici

Uno degli aspetti centrali, evidenziato anche dalla pagina ufficiale, è che non è più necessario scrivere a mano i testi: Lyria 3 li genera automaticamente a partire dal prompt, adattandoli al tema, al mood e allo stile richiesto.

L’utente può scegliere il genere (dal pop al funk, dal Motown all’elettronica) e definire in modo preciso elementi come il tipo di voce, il timbro, la lingua cantata, il tempo, le dinamiche e l’intensità, dirigendo il brano quasi come un produttore in studio.

La musica prodotta punta a essere più realistica e complessa rispetto alle versioni precedenti del modello, con strutture di canzone più chiare, transizioni fluide e un feeling complessivo più vicino a quello di una produzione professionale, anche nel formato compatto dei 30 secondi di durata standard.

Immagini, ricordi e brand che diventano suoni

Nel video viene mostrata una delle funzioni più caratteristiche: la possibilità di trasformare immagini in audio ad alta fedeltà, usando foto, loghi o visual come punto di partenza per creare una colonna sonora che esprima l’identità di un brand o l’atmosfera di un ricordo.

Una semplice foto può diventare un brano che “racconta” un luogo preferito, un momento vissuto o una storia personale, mentre per i marchi diventa uno strumento rapido per creare sound logo, jingle e musiche coerenti con la propria immagine.



Questa integrazione tra visivo e sonoro è pensata per creator social, videomaker e professionisti della comunicazione che hanno bisogno di soundtrack su misura, generate in pochi secondi ma comunque personalizzabili nel dettaglio.

Controllo creativo, voce realistica e utilizzo nel Gemini app

Il video insiste sul fatto che l’utente può “direzionare i dettagli”: scegliere genere, controllo sulle dinamiche, sul tempo, sui cambi di intensità, decidere se “rompere il silenzio” con esplosioni sonore o fondere ambienti diversi in un unico paesaggio musicale.

Lyria 3 supporta voci realistiche in più lingue e consente di passare da un semplice prompt testuale o da un’immagine caricata a una traccia completa direttamente all’interno dell’app Gemini, dove il modello è in fase di rilascio in beta come strumento di espressione musicale.

Il flusso tipico è: si scrive cosa si vuole sentire (o si carica una foto), si ottiene un brano di circa 30 secondi con testo, voce, strumenti e, in alcuni casi, anche copertina generata, pronto per essere ascoltato, condiviso o usato in contenuti video e social.

Sicurezza, watermark SynthID e uso responsabile dell’AI musicale

Un punto importante, esplicitato nelle informazioni ufficiali, è che tutta l’audio generato da Lyria 3 viene marcato in modo impercettibile con SynthID, la tecnologia di watermark di Google che permette di identificare i contenuti creati o modificati dall’AI.

Questo consente, ad esempio, di caricare un file audio e verificare se è stato prodotto con gli strumenti Google, supportando un utilizzo più trasparente dell’intelligenza artificiale nella musica e facilitando il lavoro di piattaforme e detentori di diritti.

In parallelo vengono applicati filtri, sistemi di etichettatura dei dati e policy d’uso che mirano a evitare contenuti dannosi, a ridurre il rischio di testi problematici e a limitare la possibilità di imitare in modo diretto artisti esistenti, favorendo piuttosto l’uso del modello come mezzo di espressione originale.

Uno sguardo al futuro della creazione musicale con l’AI

Nel complesso, il video e il sito ufficiale tratteggiano Lyria 3 come un passo avanti significativo verso un’AI che non sostituisce i creativi, ma li affianca, accorciando la distanza tra immaginazione e risultato sonoro finito.

La possibilità di partire da parole, immagini o ricordi e ottenere in pochi istanti tracce musicali coerenti, personalizzabili e riconoscibili come generate da AI apre scenari nuovi per musicisti, content creator, brand e semplici appassionati che vogliono sperimentare con il suono.

Lyria 3 si presenta così come uno strumento chiave del nuovo ecosistema creativo di Google, in cui l’intelligenza artificiale diventa un partner accessibile, controllabile e orientato a potenziare – e non a rimpiazzare – la creatività umana.

Link: Vai al Video
Autore: Mooseek
Aggiornato il: 19/02/2026
Categoria: Intelligenza-artificialeMusica
Commenti: 0 Commenti

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Altro in Video

Gemini 3.5 Live Translate: la traduzione vocale che rende il dialogo più naturale

Il video racconta l’arrivo di Gemini 3.5 Live Translate, una tecnologia di Google pensata per tradurre la voce quasi in tempo reale in oltre 70 lingue. L’obiettivo è rendere la conversazione più fluida, naturale e vicina a un vero scambio tra persone che parlano lingue diverse. Come funziona la tecnologi Il sistema non si limita […]

11-06-26 Continua

Introducing Claude Fable 5: il modello AI più potente mai rilasciato pubblicamente

Claude Fable 5 è il modello AI più capace mai sviluppato da Anthropic, ora disponibile per l’uso generale dal 9 giugno 2026. Questo modello “Mythos-class” rappresenta un salto qualitativo fondamentale rispetto alle precedenti versioni di Claude, superando le capacità di qualsiasi modello precedentemente reso generalmente disponibile. Capacità eccezionali per compiti complessi Claude Fable 5 può […]

10-06-26 Continua

Apple WWDC 2026: L’Era dell’Intelligenza Artificiale Inizia con la Nuova Siri

Il video riguarda il keynote di apertura della WWDC 2026 (Worldwide Developers Conference), tenutosi l’8 giugno 2026 presso l’Apple Park di Cupertino, in California. Si tratta di un evento storico sotto molti punti di vista: Tim Cook ha partecipato al suo ultimo keynote da CEO di Apple, prima di cedere il ruolo a John Ternus […]

09-06-26 Continua

“Get Ready for WWDC26”, Apple Accende i Riflettori sulla Conferenza degli Sviluppatori

Il video pubblicato da Apple sul canale YouTube ufficiale, intitolato “Get Ready for WWDC26”, è un invito diretto rivolto a sviluppatori e appassionati di tutto il mondo a prepararsi per vivere al meglio la Worldwide Developers Conference 2026. Il filmato, rilasciato il 31 maggio 2026, fa parte di una più ampia campagna di comunicazione pensata […]

06-06-26 Continua

Il keynote di Microsoft Build 2026: il Futuro dell’AI Agentica Entra in Scena

Il 2 giugno 2026 si è aperto ufficialmente il Microsoft Build 2026, la conferenza annuale per sviluppatori di Microsoft, tenutasi al Fort Mason Center di San Francisco. Il CEO Satya Nadella ha aperto il keynote inaugurale con una visione chiara: trasformare Windows e l’intero stack tecnologico Microsoft in una piattaforma nativa per l’intelligenza artificiale agentica, […]

02-06-26 Continua

Il Keynote di Jensen Huang a NVIDIA GTC Taipei 2026: L’Era dell’IA Utile è Arrivata

Il video è la registrazione del keynote tenuto da Jensen Huang, fondatore e CEO di NVIDIA, all’NVIDIA GTC Taipei 2026, svoltosi in coincidenza con il COMPUTEX di Taipei il 31 maggio 2026 presso il Taipei Music Center. Si tratta di uno degli eventi tecnologici più attesi dell’anno, nel corso del quale Huang ha annunciato alcune […]

01-06-26 Continua

1986: L’Email come Strumento per i Viaggiatori d’Affari nell’Era del Personal Computer

Il video pubblicato dall’archivio della BBC è un affascinante documento storico tratto dalla trasmissione Micro Live, originariamente andata in onda su BBC Two il 12 dicembre 1986. In poco più di sei minuti, la giornalista Lesley Judd compie un viaggio dall’Inghilterra all’aeroporto di Schiphol, in Olanda, per dimostrare al pubblico televisivo dell’epoca come fosse possibile […]

27-05-26 Continua

Video: Un nuova esperienza di finanza personale in ChatGPT

Il video pubblicato da OpenAI il 22 maggio 2026 presenta il lancio in preview di una nuova esperienza di finanza personale integrata in ChatGPT, disponibile per gli utenti Pro negli Stati Uniti. Connessione sicura dei conti finanziari Gli utenti possono ora collegare in modo sicuro i propri conti bancari e finanziari a ChatGPT attraverso Plaid, […]

26-05-26 Continua

Google I/O 2026: un keynote che inaugura l’era degli agenti AI

Google I/O 2026 viene presentato come il momento in cui l’azienda fa un salto netto verso una “era agentica”, in cui l’intelligenza artificiale non si limita a rispondere ma pianifica, decide e agisce nel mondo digitale degli utenti.Il keynote mette al centro Gemini come piattaforma unificata che alimenta prodotti, servizi e dispositivi, con l’obiettivo dichiarato […]

19-05-26 Continua

Introducing Googlebook: Scopriamo la serie di Laptop per Gemini Intelligence

Cos’è Googlebook Googlebook è il nuovo nome di una categoria di laptop che Google ha presentato recentemente nell’ambito dell’Android Show 2026, posizionandolo come il primo portatile progettato da cima a fondo per Gemini Intelligence. Non è un semplice Chromebook con un’assistente AI in più, ma un sistema operativo‑hardware pensato per integrare l’intelligenza artificiale direttamente nel […]

13-05-26 Continua

Code with Claude 2026: l’Opening Keynote

L’Opening Keynote di Code with Claude 2026 rappresenta il momento inaugurale della conferenza organizzata da Anthropic per mostrare l’evoluzione di Claude nel lavoro degli sviluppatori, dei team tecnici e delle aziende che stanno integrando agenti AI nei propri processi. La sessione ufficiale si è tenuta a San Francisco il 6 maggio 2026, dalle 09:00 alle […]

09-05-26 Continua

La Rivoluzionaria Conversione in Tesla della Ford Mustang del 1966

Il video presenta un’eccezionale trasformazione di una iconica Ford Mustang del 1966 in un veicolo completamente elettrico, un progetto ambizioso portato a termine da Calimotive Auto Recycling a Sacramento, California. Questa build, durata due anni, fonde il fascino vintage della muscle car americana con le tecnologie all’avanguardia di Tesla, creando un’auto unica che mantiene l’estetica […]

05-05-26 Continua

Categoria