Créer de la musique n’est pas pour tout le monde. De la création des paroles à la mélodie, puis à l’enregistrement, le processus demande du temps, du dévouement, des connaissances et beaucoup de compétences. Cependant, l’utilisation de l’intelligence artificielle peut simplifier ce processus. C’est ce que promet Riffusion, un outil qui vous permet de créer des sons à partir de simples commandes textuelles.
Selon les créateurs du projet, Riffusion est en fait une adaptation d’une autre intelligence artificielle plus connue, Stable Diffusion. Il permet de créer des images originales à partir de commandes de texte et est alimenté par une grande base de données composée d’images préexistantes, qui aident à entraîner le système à associer certaines images à des textes.
Dans le cas de Riffusion, ce système est utilisé pour créer des spectrogrammes à partir de textes. Felipe Vassão, producteur de musique qui a déjà remporté un Latin Grammy, a expliqué à EXAME que les spectrogrammes sont utilisés dans l’industrie musicale depuis des décennies et sont des « représentations visuelles des sons ».
« Nous sommes habitués à l’onde sonore, mais elle ne montre essentiellement que l’amplitude du son, qu’elle soit plus forte ou plus faible, elle ne montre pas la fréquence. Le spectrogramme compose ce son en montrant la fréquence et le temps. Vous pouvez identifier le type du son par couleur, le plus clair ou le plus foncé, le plus fort ou le plus faible. C’est une technique de décomposition très ancienne », commente-t-il.
L’idée derrière les créateurs de Riffusion était de former l’intelligence artificielle open-source de Stable Diffusion pour transformer des textes en spectrogrammes et, à partir de là, créer de la musique originale. Les commandes de l’outil sont simples, et certaines sont suggérées par le système lui-même, comme « chant chinois ancestral » ou « Ibiza à 3 heures du matin ».
Vassão observe cependant que la création de chansons souffre de la même limitation que d’autres types de services qui impliquent l’intelligence artificielle : « si vous n’avez pas cette base, vous ne savez pas quoi faire, vous ne reconnaissez pas que Si une chanson vient de sortir et qu’elle n’est pas enregistrée dans le jeu de données, tu ne pourras pas créer une chanson basée sur ça, tu essaieras de te rapprocher de ce que tu as ».
De plus, l’utilisation de cette technologie dans des domaines plus créatifs, comme la création de musique et d’œuvres d’art, a ouvert la porte à un autre type de controverse : celle de la propriété intellectuelle. « L’art a toujours été basé sur la création par dessus ce qui a déjà été fait, voire comme une manière d’honorer. Quand tu vends de l’art, de la musique, tu crées cette idée de propriété intellectuelle. En tant que créateur, détenteur des droits musicaux, Je me sens un peu violé si quelqu’un utilise ma musique pour créer quelque chose », s’interroge le producteur.
Même ainsi, il considère des projets comme Riffusion comme « très intéressants ». Selon lui, il serait important que ces intelligences artificielles soient accompagnées de systèmes permettant d’identifier exactement quelles œuvres antérieures ont été utilisées et quelle part de cette création est originale, quitte à obtenir une juste rémunération. Compte tenu de ces aspects, il « regarde avec de bons yeux, car les gens ont très peur que les machines remplacent les humains, je ne pense pas que cela arrivera ».
Il considère que le grand potentiel de projets comme Riffusion est de servir de point de départ pour créer de la musique, sans avoir à recommencer tout le processus à zéro. « Surtout dans l’esthétique actuelle de la musique pop, qui est très basée sur des échantillons d’autres musiques, le regroupement de sons faits par d’autres personnes. Aujourd’hui, nous utilisons déjà des programmes avec des bases de données de parties de chansons, de sons, libres de droits qui peuvent être utilisés , et quelque chose comme Riffusion peut vraiment être utilisé pour ça, pour obtenir certains sons, avec des caractéristiques spécifiques ».
Même s’il estime que le site a encore « un son plutôt grossier » et qu’il pourrait s’améliorer, Vassão affirme qu’il serait déjà possible de l’utiliser pour aider à créer de la nouvelle musique, et qu’il n’exclut pas que dans « un, deux ans « L’industrie musicale aura de nombreuses chansons, même primées, aux origines liées à l’intelligence artificielle.
Et Riffusion n’est pas le seul projet de ce genre. Google a déjà annoncé qu’il travaillait sur la création d’un outil qui transforme les textes en sons, et Vassão commente que, d’après ce qui a été annoncé, il a tendance à avoir une qualité encore meilleure.
Selon lui, ce domaine « connaît un moment de lutte, car le grand obstacle à la créativité via l’intelligence artificielle a été la partie juridique. La technologie est déjà prête, mais elle n’est pas publiée pour des raisons juridiques, je pense que maintenant nous y sommes sera une tempête de procès ».
Pour vous qui aimez lire les actualités cryptographiques, Mynt est l’application idéale pour vous. Investissez et découvrez la crypto en même temps avec un contenu simple pour tous les publics. Cliquez ici pour ouvrir votre compte.