Google réussit à créer une voix quasiment humaine : WaveNet

Je vous parlais la semaine dernière d’intelligence artificielle, et notamment de son utilisation dans beaucoup de domaines différents. Nous avions évoqué les victoires de cette technologie dans le jeu de Go, mais je vous interpellais sur le fait que ce n’est rien, comparé à ce qui nous attend.

Ainsi, DeepMind, la société rachetée par Google, n’en finit plus d’explorer de nouvelles possibilités. Leur dernière trouvaille ? Réussir à imiter une voix quasi humaine, mais non pas en collant des bouts de voix enregistrées, mais en faisant la synthèse de manière intelligente de plusieurs discours prononcés par des êtres humains. En l’occurrence, il s’agissait de 44 heures enregistrées par 109 volontaires. Le nom de cette technologie ? WaveNet. A défaut d’en entendre parler, je pense que vous l’entendrez de plus en plus souvent une fois qu’elle sera finalisée.

Comprenez bien qu’il s’agit bien d’un apprentissage intelligent, fait grâce à Deep Learning qui a permis cette prouesse, et non pas des petites mains qui ont travaillé directement sur des banques de sons.

Je vous le dis et vous le répète, les problématiques et solutions apportées par l’intelligence artificielle en général, et les réseaux de neurones et autres Deep Learning en particulier sont quasiment infinis. Restez à l’écoute !

Pour les anglophones, voici le site de Deepmind, bien plus complet :

https://deepmind.com/blog/wavenet-generative-model-raw-audio

Source : Lefigaro.fr

A propos de Mourad

Participe au comité de lecture d'AOC (qui a dit pas régulièrement ?) et donne des coups de main sur le site ou sur tout un tas d'autres sujets (qui a dit c'est trop vague ?).

Consulter aussi...

« Des timbres pour la science-fiction ! »

La société Royal Mail (opérateur postal du Royaume-Uni) vient de produire une série de 6 …

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.