Publié le 2024-05-16 10:23:00. Google Gemini s’équipe d’une intelligence artificielle capable de composer des morceaux de musique de 30 secondes à partir de simples instructions textuelles, ouvrant de nouvelles perspectives créatives pour les utilisateurs et les créateurs de contenu.
- Gemini, grâce à son nouveau modèle Lyria 3, peut générer des pistes musicales originales ou remixer des morceaux existants.
- Cette fonctionnalité sera intégrée à YouTube, permettant aux créateurs de produire des accompagnements sonores pour leurs vidéos, notamment les Shorts.
- Google a mis en place un système de filigrane numérique (SynthID) pour identifier les contenus créés par son IA et lutter contre la désinformation.
Google a annoncé l’arrivée de Lyria 3, un modèle d’IA qui étend les capacités de Gemini au-delà de la génération de texte, d’images et de vidéos. Désormais, les utilisateurs pourront demander à Gemini de composer une mélodie, un rythme ou un morceau complet en quelques mots. L’outil se distingue par sa capacité à produire des résultats pertinents même avec des requêtes minimalistes. Google donne l’exemple d’une simple instruction : « un slow jam R&B comique sur une chaussette qui trouve son match ». Il est également possible d’affiner les paramètres, comme le tempo ou le style de batterie, pour un contrôle plus précis.
La création musicale ne se limite pas au texte. Gemini peut également s’inspirer d’images ou de vidéos pour composer une musique adaptée. De plus, l’IA est capable de générer des pochettes d’album pour accompagner les créations sonores. Selon Google, Lyria 3 représente une amélioration significative par rapport aux modèles de génération audio précédents, offrant des pistes plus « réalistes et musicalement complexes » et permettant un contrôle accru sur les différents éléments d’une chanson, y compris la génération automatique de paroles.
Pour l’instant, les morceaux générés par Gemini sont limités à 30 secondes. Cependant, la démonstration de Google laisse entrevoir la possibilité d’allonger ces clips ou d’intégrer cette fonctionnalité à d’autres applications de l’écosystème Google, comme Google Messages. L’entreprise a également déployé son Détecteur SynthID, un outil conçu pour identifier le contenu généré par l’IA, afin de garantir la transparence et de lutter contre les utilisations abusives.
Les créations de Gemini sont identifiées par un filigrane numérique, une mesure destinée à empêcher la diffusion de fausses informations. Bien que les exemples fournis par Google soient prometteurs, certains observateurs notent que les paroles générées par Lyria 3 peuvent parfois paraître artificielles ou maladroites.
La fonctionnalité Lyria 3 est accessible dès aujourd’hui pour les utilisateurs de Gemini âgés de 18 ans ou plus et parlant anglais, espagnol, allemand, français, hindi, japonais, coréen ou portugais.