Je vous parlais la semaine dernière d’intelligence artificielle, et notamment de son utilisation dans beaucoup de domaines différents. Nous avions évoqué les victoires de cette technologie dans le jeu de Go, mais je vous interpellais sur le fait que ce n’est rien, comparé à ce qui nous attend.
Ainsi, DeepMind, la société rachetée par Google, n’en finit plus d’explorer de nouvelles possibilités. Leur dernière trouvaille ? Réussir à imiter une voix quasi humaine, mais non pas en collant des bouts de voix enregistrées, mais en faisant la synthèse de manière intelligente de plusieurs discours prononcés par des êtres humains. En l’occurrence, il s’agissait de 44 heures enregistrées par 109 volontaires. Le nom de cette technologie ? WaveNet. A défaut d’en entendre parler, je pense que vous l’entendrez de plus en plus souvent une fois qu’elle sera finalisée.
Comprenez bien qu’il s’agit bien d’un apprentissage intelligent, fait grâce à Deep Learning qui a permis cette prouesse, et non pas des petites mains qui ont travaillé directement sur des banques de sons.
Je vous le dis et vous le répète, les problématiques et solutions apportées par l’intelligence artificielle en général, et les réseaux de neurones et autres Deep Learning en particulier sont quasiment infinis. Restez à l’écoute !
Pour les anglophones, voici le site de Deepmind, bien plus complet :
https://deepmind.com/blog/wavenet-generative-model-raw-audio
Source : Lefigaro.fr