Robotiser la voix
Aujourd’hui, j’ai testé Murf, une solution en ligne de Text to speech[1] ou de transformation d’un texte écrit en voix parlée. Voici une revue de détails de l’interface et des fonctionnalités de l’outil en ligne. Vous pouvez écouter la comparaison plus bas pour un texte identique récité et dialogué par deux voix humaines puis par deux voix de synthèse. Le fichier est court, il dure moins d’une minute. |
Revue des voix proposées
L'application propose plus de 20 langues mais aujourd’hui, il y a peu de voix françaises et certaines sont réservées aux abonnés pro. Vous pouvez choisir entre une voix de femme ou d’homme.
Un choix d’âge est proposé (jeune ou âge moyen), notez qu'il n’y a pas de voix « mature »… Il n’existe pas de proposition de registres de voix ou de tessitures vocales (basse, soprano, alto…).
Abonnements
Il y a quatre abonnements free, basic, pro et entreprise avec des prix s’étalant de 0 à 167 $ par mois pour un abonnement mensuel.
La version gratuite permet de partager un fichier audio mais pas de l’exporter.
Une ergonomie efficace
L’interface est très intuitive, pas besoin de trop chercher pour importer son texte (format txt). Le menu d’icônes, à gauche, permet de choisir une voix, une langue, d’ajouter une vidéo.
L’outil vous propose de découper votre texte en phrases ou en paragraphes. Ce qui vous permet ensuite de choisir votre locuteur ou voix-off pour l’ensemble du texte ou si vous avez des dialogues, comme dans mon exemple, plus bas, d’alterner entre plusieurs voix que vous sélectionnez selon les paragraphes ou phrases.
Au bas de d’écran, sur la timeline (ligne de temps) vous pouvez déplacer le bloc ou segment (phrases ou paragraphes), ajouter une vidéo, une image ou de la musique.
Vous pouvez écouter chaque segment séparément et changer deux réglages : le pitch et la vitesse mais à utiliser avec précautions car ils dénaturent beaucoup la voix.
Il est possible d’ajouter une pause au milieu du segment. Et de les ré-agencer très facilement.
Voice Changer : cet outil permet de charger un fichier audio ou vidéo pour changer la voix sans écrire le texte. (L’interprétation des mots et phrases sera à bien vérifier tout de même).
Ajouter une musique
Un gros stock de musique au mètre est disponible avec une grande variété de styles
Les exportations de fichier
Bonne nouvelle, l’export de fichiers de sous titre SRT est offert en version free.
Ensuite il faudra payer pour les autres téléchargements.
Un export en vidéo est proposé en mp4 ou en mov.
L’export audio est possible par segment (phrase ou paragraphe) ou pour l'ensemble du document. Vous pouvez choisir différentes qualités :haute qualité à la fréquence de 48 kHz et 16 bits ou très basse et différents formats : MP3, WAV ou FLAC
Comparaison entre voix humaine et voix de synthèse
Ecoutez la différence entre nos voix humaines, ici celle de François Jonquières, la mienne versus la voix de synthèse de Victor M (middle aged) et Renée F (young adult).
Lien vers le fichier sur l'application Murf avec des voix robotisées
https://murf.ai/share/la7yldt8
Le fichier original avec des voix humaines
No comment !
Text to Speech ou comédien ?
Certes les progrès sont indéniables mais on est encore loin de la voix du comédien qui interprète son texte selon vos indications et transmet des émotions à ses auditeurs.
En formation, entendre la voix de son formateur donne un sentiment de proximité et rassure quant à sa présence même si elle n’est que virtuelle. Une formation à distance doit inclure du tutorat ou un accompagnement synchrone sans quoi l’apprenant se sentira abandonné. La voix synthétique me donne le même sentiment d’abandon ou d’impuissance que lorsqu’on est face à un répondeur qui ne propose pas de réponse à votre besoin.
Il y a tout de même des fonctions intéressantes comme l’export de fichier sous-titres ou l’export de voix par phrase ou paragraphe.
Si vous voulez tester : https://murf.ai