Shimon

On tient peut-être le prochain gagnant des rap contenders. Shimon, un robot conçu au sein de la Georgia Institute of Technology, est capable de lâcher des rimes, en rythme, et de s'engager dans des « conversations » musicales avec des humains et même de les aider à composer des paroles de chanson. Un robot rappeur, en somme.

Après avoir sorti son premier album sous le nom de Shimon The Robot au printemps dernier, ses créateurs en ont révélé un peu plus sur son processus de création musicale et sa manière d'utiliser le machine learning pour créer de la musique.

Shimon The Robot, un premier album à streamer partout

Les premières compositions musicales générées par ordinateur datent des années 1950, avec l'utilisation d'algorithmes capables de créer des mélodies. Avec le machine learning moderne, le robot Shimon, dont la première version a été créée en 2011 à la Georgia Institute of Technology, peut s'inspirer de vastes bases de données pour créer ses propres mélodies et, surtout, improviser.

Un compositeur original à la tête en forme de « boule » et plusieurs bras robotiques. Ces bras lui permettent de jouer de plusieurs instruments, comme le marimba, un xylophone africain à résonateurs qui demande de manier quatre baguettes.

Au printemps dernier, après avoir « appris » plus de 5 000 chansons, Shimon a révélé son premier album, « Shimon Sings », que l'on peut streamer sur toutes les plateformes.

Bienvenue dans le rap game

Ces derniers mois, son principal créateur, Gil Weinberg, a amélioré le robot pour lui permettre de s'attaquer à un autre genre musical : le rap.

Quand Shimon effectue des battle de rap, son programme enregistre les mots utilisés par son adversaire. Il en extrait des mots-clés, puis les utilise pour générer de nouvelles paroles. Tout en se basant sur les mots prononcés par l'adversaire, Shimon puise le contenu de son rap dans des bases de données customisées, venues de chansons de Lil Wayne, Jay-Z et d'autres. Au total, le vocabulaire atteint 3 000 mots. Une limite voulue par les créateurs, qui permettent au robot de réagir rapidement – sans
avoir à puiser longtemps dans une base de données trop importante.

En parallèle, l'un des ajouts récents de Shimon est l'utilisation de « données phonèmes ». Un phonème est la plus petite unité, non segmentable, de la prononciation d'un mot. Un son qui ne peut pas être divisé, en somme. L'utilisation de données utilisant des phonèmes permet alors à Shimon de découper son texte en couches rythmiques.