Un nuovo modo di esprimersi: Gemini ora può creare musica
In un'era digitale in cui l'espressione personale assume forme sempre nuove e diversificate, l'app Gemini compie un passo significativo verso l'innovazione creativa. Il 18 febbraio 2026 segna un momento importante con il lancio della generazione di musica personalizzata, una funzionalità che promette di rivoluzionare il modo in cui interagiamo con la creatività assistita dall'intelligenza artificiale. Questa nuova capacità, annunciata da Joël Yawili, senior product manager dell'app Gemini, e Myriam Hamed Torres, senior product manager di Google DeepMind, introduce il modello Lyria 3, il più avanzato modello di generazione musicale di Google DeepMind.
L'obiettivo è semplice ma ambizioso: permettere a chiunque di creare tracce musicali di 30 secondi, complete di cover art personalizzata, utilizzando semplici descrizioni testuali o immagini. Disponibile in versione beta, questa funzionalità non solo apre le porte a una creatività musicale senza precedenti, ma lo fa anche con un forte impegno verso la trasparenza e la responsabilità, integrando SynthID, la filigrana impercettibile di Google per identificare i contenuti generati dall'IA. Fin dal suo lancio, l'app Gemini ha fornito strumenti per incoraggiare l'espressione creativa attraverso immagini e video, e ora espande queste possibilità al mondo dell'audio, offrendo agli utenti un mezzo divertente e unico per dare voce ai propri pensieri e stati d'animo attraverso la musica.
La potenza di Lyria 3: creazione musicale semplificata
Lyria 3, il più recente modello di musica generativa di Google DeepMind, rappresenta un balzo in avanti significativo nella tecnologia di generazione audio. È stato progettato per rendere la creazione musicale accessibile e divertente, consentendo agli utenti di trasformare idee astratte in brani concreti e accattivanti. Basta descrivere un'idea o caricare una foto, e Gemini, con la potenza di Lyria 3, la tradurrà in una traccia di alta qualità in pochi secondi. Immaginate di digitare "una lenta jam R&B comica su un calzino che trova la sua coppia" e vedere Gemini trasformare questa singolare richiesta in un pezzo musicale. È anche possibile chiedere a Gemini di trarre ispirazione da un elemento caricato, spingendo ulteriormente i confini della creatività.
Miglioramenti chiave di Lyria 3
Lyria 3 apporta miglioramenti sostanziali rispetto ai precedenti modelli Lyria di generazione audio, concentrandosi su tre aree fondamentali che arricchiscono l'esperienza utente e la qualità del prodotto finale:
- Nessuna necessità di fornire i propri testi! Ora i testi verranno generati automaticamente in base al tuo prompt, liberando gli utenti dalla necessità di scrivere o trovare parole.
- Maggiore controllo creativo su elementi come lo stile, le voci e il tempo desiderati, offrendo agli utenti la possibilità di modellare la traccia in modo più preciso secondo la propria visione.
- Capacità di creare tracce più realistiche e musicalmente complesse, elevando la qualità e la sofisticazione dei brani generati dall'IA.
Esempi di utilizzo: dal testo alla melodia, dall'immagine al suono
La flessibilità di Lyria 3 si manifesta nella varietà di modi in cui gli utenti possono interagire con la funzionalità di generazione musicale. Che si tratti di evocare un ricordo o di accompagnare un'immagine, Gemini è pronto a tradurre l'input in musica.
Dal testo alla traccia
Questa modalità consente agli utenti di descrivere un genere specifico, un'atmosfera, una battuta interna o un ricordo per creare tracce uniche con testi o audio strumentale che si adattano perfettamente all'atmosfera desiderata. Ad esempio, una richiesta come: "Mi sento nostalgico. Crea una traccia per mia madre sui bei momenti che abbiamo vissuto da bambini e i ricordi delle sue piantaggine cucinate in casa. Fai una divertente traccia afrobeat con una vera atmosfera africana", può trasformarsi in un brano che evoca esattamente quelle sensazioni e quel contesto culturale, come dimostrato dall'esempio audio di "Sweet Like Plantain" fornito dagli sviluppatori.
Da foto e video alla traccia
Gli utenti possono caricare una foto o un video e osservare Gemini utilizzare il contenuto per comporre una traccia con testi che si adattano perfettamente all'umore. Immaginate di caricare una serie di foto del vostro animale domestico e chiedere: "Usa queste foto per creare una traccia sul mio cane Duncan durante un'escursione nel bosco". Gemini analizza il contenuto visivo per cogliere l'atmosfera e lo stile, trasformandolo in una composizione musicale originale e pertinente.
L'arte della copertina e la condivisione
Ogni traccia di 30 secondi creata dall'app Gemini è accompagnata da una copertina personalizzata, generata da Nano Banana. Questa integrazione rende facile e immediato condividere le creazioni con gli amici, sia tramite download diretto che semplicemente cliccando sul link di condivisione. L'obiettivo primario di queste tracce non è la creazione di un capolavoro musicale destinato alle classifiche, bensì l'offerta di un modo divertente e distintivo per esprimere la propria individualità e creatività nel quotidiano.
Integrazione con YouTube Dream Track
Oltre all'app Gemini, i creatori possono esplorare le capacità di Lyria 3 anche su YouTube con la funzionalità Dream Track. Attualmente disponibile negli Stati Uniti e in fase di lancio per i creator di YouTube in altri paesi, Lyria 3 migliorerà la qualità delle colonne sonore uniche per i video Shorts. Che si tratti di creare una strofa con testo o una base musicale d'atmosfera, la possibilità di personalizzare meglio la colonna sonora permetterà ai creator di portare i loro Shorts a un livello superiore di coinvolgimento e originalità.
Nuove capacità di verifica audio con SynthID
La trasparenza e la responsabilità sono pilastri fondamentali nello sviluppo dell'IA generativa di Google. Per questo motivo, tutte le tracce generate nell'app Gemini sono dotate di SynthID, la filigrana impercettibile di Google progettata per identificare i contenuti generati dall'IA. Questo strumento è cruciale per mantenere un ecosistema digitale fidato e sicuro.
Inoltre, Google sta ampliando le sue capacità di verifica nell'app Gemini per includere l'audio, oltre a immagini e video. Questo significa che gli utenti avranno a disposizione più strumenti per aiutare a identificare i contenuti generati dall'IA. Basterà caricare un file audio e chiedere a Gemini se è stato generato utilizzando l'IA di Google; Gemini controllerà la presenza di SynthID e utilizzerà il proprio ragionamento per fornire una risposta. Questo approccio proattivo garantisce che gli utenti possano distinguere con certezza i contenuti generati dall'IA.
Il nostro impegno per uno sviluppo responsabile dell'IA generativa
Fin dal lancio di Lyria nel 2023, Google si è impegnata a sviluppare questa tecnologia in modo responsabile, collaborando attivamente con la comunità musicale. Attraverso queste collaborazioni e esperimenti, come il Music AI Sandbox, sono state acquisite importanti conoscenze. Questo processo ha permesso di affinare il training di Lyria 3, prestando la massima attenzione ai diritti d'autore e agli accordi con i partner.
Principi di creazione musicale e filtri
La generazione musicale con Lyria 3 è specificamente progettata per l'espressione originale, non per imitare artisti esistenti. Se un utente nomina un artista specifico nel suo prompt, Gemini interpreterà questa richiesta come un'ampia ispirazione creativa e creerà una traccia che condivide uno stile o un'atmosfera simile, ma senza riprodurre opere esistenti. Sono stati implementati filtri rigorosi per controllare gli output rispetto ai contenuti esistenti, garantendo il rispetto della proprietà intellettuale.
Segnalazione di contenuti e conformità alle normative
Google riconosce che nessun approccio è infallibile e, per questo, offre agli utenti la possibilità di segnalare contenuti che potrebbero violare i propri diritti o quelli di terzi. Inoltre, per utilizzare i prodotti Google, gli utenti devono aderire ai Termini di servizio e alle norme sull'uso proibito dell'IA generativa, che vietano esplicitamente le violazioni della proprietà intellettuale e dei diritti alla privacy altrui. Questo quadro normativo garantisce un utilizzo etico e legale della tecnologia.
Disponibilità e accesso
Lyria 3 è ora disponibile nell'app Gemini per tutti gli utenti di età superiore ai 18 anni, in diverse lingue: inglese, tedesco, spagnolo, francese, hindi, giapponese, coreano e portoghese. Sono previsti piani per espandere la qualità e la copertura a un numero maggiore di lingue in futuro. La funzionalità è stata lanciata oggi sul desktop e sarà disponibile sull'app mobile nei prossimi giorni. Inoltre, gli abbonati a Google AI Plus, Pro e Ultra potranno godere di limiti di utilizzo più elevati, offrendo loro maggiori possibilità creative.
Conclusione
Con l'introduzione della generazione musicale nell'app Gemini, Google offre un'opportunità entusiasmante per aggiungere una colonna sonora personalizzata e divertente alla vita quotidiana. Che si tratti di creare un sottofondo per un ricordo speciale, di accompagnare un'immagine evocativa o semplicemente di sperimentare con la musica, Gemini e Lyria 3 rendono la creatività sonora accessibile a tutti. Non resta che provare questa nuova funzionalità e scoprire un modo completamente inedito di esprimersi e di interagire con il mondo attraverso il suono. Visita gemini.google.com oggi stesso per iniziare la tua avventura musicale.