Aujourd’hui je m’y prends tôt. En fait on pourrait dire que j’expédie, car j’ai toujours le nez plongé dans les vocaloids et je compte bien l’y laisser. À la différence que maintenant fini les pipi-caca. Je commence à entamer les grands travaux. C’est fou ce qu’on peut faire avec ce machin. De la pop à deux ronds comme d’harmonieuses polyphonies qui feraient se lisser les bacchantes au plus fortuné des aristocrates. C’est pour l’image. Les polyphonies, ce n’est pas de la musique d’aristocrate, ça se retrouve dans beaucoup les cultures, et c’est une façon très populaire de chanter ensemble. Je précise parce que j’ai en tête une discussion en ligne ou ça causait de musique et cinéma, et ou quelqu’un dont j’ai oublié le pseudo pointait très justement du doigt le fait que c’était toujours les méchants fortunés qui écoutaient de la musique classique. Essayons donc de nous départir de ces mauvais réflexes. La polyphonie, c’est tout simplement deux personnes ou plus qui chantent ensemble mais pas les mêmes notes. Ça donne très rapidement quelque chose d’émouvant.
Je ne vous l’ai pas expliqué, mais vocaloid, c’est tout d’abord un logiciel. Un séquenceur midi. Seulement il y a aussi les vocaloids, ou loids, qui sont des chanteuses et chanteurs virtuel·les. Il y en a beaucoup. Pour tous les goûts, j’ai envie de dire. Même si je pense que le simple fait que les voix soient factices et pour la plupart chantent en japonais en rebutera plus d’un très vite. Tant pis pour celles-ci et ceux-là, z’ont pas les oreilles assez élastiques. Il y a donc des voix masculines, des voix féminines, des voix haut-perchées et d’autres tout dans les graves. Il y a des voix cassées, des voix cristallines, des faites pour le rock, d’autres pour les berceuses. Vous vous rendez compte de la manière dont je qualifie de fausses voix générées par des ordinateurs ? Allé, je vais vous en donner un petit exemple. Sans aucun mot, juste des [ä].
Alors ? Là je n’ai même pas bidouillé les paramètres. C’est ce qui sort directement avec cet·te artiste virtuel·le androgyne quand on place les notes qu’on veut où on le veut. Et on peut vraiment bidouiller. Ça fait réfléchir sur l’avenir de la synthétisation des voix hein ? Car ce n’est que le début. Ça doit aussi effrayer quelques chanteurs et chanteuses de certains milieux de la pop. Moi ça va, je ne suis pas chanteur, alors je m’en fiche.
Bref, tout ça pour vous dire que j’y retourne, et pour vous expliquer pourquoi hier j’ai oublié d’écrire et n’ai posté la note qu’in extremis, un quart d’heure avant minuit. C’est que je suis tout entier accaparé par ce nouveau jouet.
À demain.
Entre les IA qui savent pondre des textes cohérents de plus en plus longs, celles qui génèrent des images (même animées) crédibles à partir d’un tableau ou d’une photo, et celles qui arrivent à chanter… Dans moins de dix ans on pourra leur demander d’écrire/composer/scénographier/interpréter un opéra. Et avec les hologrammes on pourra même leur demander de se produire sur Broadway en mode Meluche VS 2Pac.
C’est clair. Je pense qu’il faudra quand même encore des humains pour effectuer des choix, ou au moins des sélection au milieu de tous ces processus, mais si le monde de s’effondre pas avant, c’est sûr que ça finira par arriver.
Sinon pour répondre à ta question d’hier, j’ai essayé UTAU, j’ai rien pigé, c’est tout en japonais. Faudra que j’essaie de trouver si personne ne l’a traduit en anglais au moins, mais ça pourrait expliquer la discrétion de ce logiciel par ici.