I sistemi di Intelligenza Artificiale si fanno sempre di più complessi arrivando a confini che solo l’immaginazione può arrivare. E’ questo il caso di MusicLM un progetto che vuole sfruttare le potenzialità dell’AI per generare musica partendo dal semplice testo.
Un campo di ricerca della Cornell University con il supporto tecnologico di Google che sembra già in un buon stato di avanzamento
Cosa è MusicLM, il creatore di musica da testo di Google
MusicLM è un modello che genera musica ad alta fedeltà da descrizioni di testo come “una melodia di violino calmante sostenuta da un riff di chitarra distorto”.
In pratica è sufficiente inserire una frase per far generare la musica dal sistema. Una applicazione che permette poi di ascoltare la musica cosi generata scegliendo tra melodie e strumenti.
Tecnicamente i ricercatori dichiarano (riportiamo il testo vista la complessità tenica):
MusicLM lancia il processo di generazione di musica condizionale come un compito gerarchico di modellazione sequenza-to-sequenza e genera musica a 24 kHz che rimane coerente per diversi minuti.
I nostri esperimenti mostrano che MusicLM supera i sistemi precedenti sia in termini di qualità audio che di aderenza alla descrizione del testo.
Inoltre, dimostriamo che MusicLM può essere condizionato sia sul testo che su una melodia in quanto può trasformare melodie fischiate e canticchiate secondo lo stile descritto in una didascalia di testo.
Per sostenere la ricerca futura, pubediamo pubblicamente MusicCaps, un set di dati composto da 5.5k coppie di testo-musica, con descrizioni di testo ricche fornite da esperti umani.
Se siete curiosi non vi resta che recarvi subito su MusicLM