Avis ElevenLabs - Je clone ma voix avec l'IA : Voici le résultat
Avis ElevenLabs en bref 🧐
Après un test concluant, ElevenLabs s’avère être le meilleur outil en 2024 pour générer et cloner des voix IA.
J’ai littéralement été bluffé par la qualité du rendu !
Je vous recommande chaudement de le tester au travers de sa version gratuite.
👍 Points forts :
- Voix IA réalistes
- Grand choix de voix et de langues
- Outil rapide et efficace
ElevenLabs c'est quoi ? Présentation de l'outil
ElevenLabs est un outil IA qui permet de générer des voix-off à partir d'un simple texte (Text-to-Speech). Mais pas que !
Ce logiciel de synthèse vocale vous permets de cloner n’importe quelle voix, ou de traduire vocalement en des dizaines de langues, n’importe quel contenu.
ElevenLabs fait partie de ces nombreux SaaS ayant vu le jour, suite à la démocratisation de l’intelligence artificielle.
Lancée en avril 2022 par deux amis d’enfance (Mati Staniszewski et Piotr Dabkowski) cette start-up avait pour volonté de « rendre tout contenu universellement accessible dans n’importe quelle langue et avec n’importe quelle voix« , selon le PDG.
Un an après, et des dizaines de millions de dollars levés, ElevenLabs s’inscrit aujourd’hui comme le logiciel de synthèse vocale le plus convaincant.
Si tout n’est pas encore parfait, le rendu des voix-off IA reste bluffant, et le système clonage de voix très pertinent.
A qui s’adresse ElevenLabs ?
A la base, les logiciels de synthèse vocale s’adressent aux personnes mal-voyantes ou ayant un handicap visuel. L’objectif étant d’améliorer l’accessibilité des contenus écrits, par la retranscription vocale.
Puis ils se sont vus être une solution pour les élèves ayant des difficultés à décoder des textes, notamment ceux du secondaire.
Mais avec l’avènement du numérique, d’Internet et du Web-Marketing, cette technologie est devenue un moyen de créer du contenu tout en levant de nombreuses barrières…
D’ailleurs, ElevenLabs décrit son logiciel comme étant une solution permettant de « créer des voix IA naturelles instantanément, dans n’importe quel langue – parfait pour les créateurs de contenus vidéos, les développeurs et les business« .
Le Marketing de contenu est légion en 2024.
Être présent sur les réseaux sociaux, des plateforme vidéos comme YouTube, ou avoir une chaîne de podcasts, est un réel atout pour son business.
Seulement, tout le monde n’est pas à l’aise à l’oral. D’ailleurs, beaucoup n’osent pas s’enregistrer, car ils détestent entendre leur voix.
C’est précisément là qu’un outil comme ElevenLabs peut s’avérer utile.
D’autres, voient également ces outils comme un excellent moyen de produire du contenu audio/vidéo, plus facilement, sans devoir perdre du temps à enregistrer sa voix.
Grâce à ElevenLabs, il suffit de copier-coller un texte (un script) ou un article, et de demander à l’IA de le retranscrire en audio.
Ce logiciel s’inscrit alors dans une logique de productivité.
D’un point de vue SEO, en 2024 il est recommandé d’ajouter des vidéos au sein de ses contenus.
Un petit coup de copier-coller sur ElevenLabs permet de créer un média audio/vidéo en un rien de temps pour agrémenter ses pages web.
Mais vous le verrez dans la suite de cet article, ElevenLabs peut s’avérer utile dans bien d’autres domaines.
Avec un simple état des lieu des fonctionnalités de l’outil, vous prendrez conscience des possibilités, et des opportunités énormes qu’il a à offrir.
Les fonctionnalités d’ElevenLabs : Comment ça marche ?
ElevenLabs ne se résume pas à un simple outil de synthèse vocale.
Voici un résumé des fonctionnalités principales du logiciel.
Text-to-Speech : Transformez du texte en voix
Comme son nom l’indique, cette fonctionnalité vous permets de transcrire du contenu texte, en contenu audio.
Ici, il vous suffit d’insérer le texte à transformer.
Vous pouvez rédiger à la main, ou faire un copier-coller d’un contenu existant (un article de blog, ou un script rédigé sur Word par exemple)
Choisissez une voix-off (ici j’ai sélectionné Nicolas animateur).
Puis cliquez sur le bouton Generate speech.
En quelques secondes votre texte se transforme en fichier audio, téléchargeable en MP3.
Voici le rendu avec une des voix de ElevenLabs :
Que pensez-vous du rendu ? 😉
Au passage, ElevenLabs c’est plus de 1.000 voix IA (avatars) disponibles dans la Voice Library !
Vous pourrez filtrer par :
- Genre (homme, femme, neutre)
- Âge (Jeune, Adulte, Senior)
- Langue (plus de 29 langues disponibles)
- Accent (ex : français belge, africain, parisien, québecois, suisse, créole, etc.)
Speech-to-Speech : Modifiez ou échangez votre voix
Maintenant, imaginez que vous n’êtes pas à l’aise à l’idée de diffuser votre propre voix.
Car comme beaucoup de personnes, vous la trouvez horrible à écouter. 😉
C’est là que la fonctionnalité Speech-to-Speech intervient !
Grâce à elle, vous pourrez très facilement transposer une nouvelle voix à un fichier audio existant.
Dans l’exemple ci-dessous, imaginons que la voix d’homme (Nicolas animateur) ne me plaise pas.
Et que je souhaite la remplacer par une voix de femme.
Tout ce que vous avez à faire, c’est de télécharger votre fichier audio (comme ci-dessous).
Puis de cliquer sur Generate Speech.
Et voici le résultat :
Simple comme bonjour. 🙂
Et le rendu est extra !
Dubbing : Doublez ou Traduisez votre voix
Que se passerait-il maintenant, si vous décidiez d’exporter votre contenu à l’international ? 🌎
Sans l’IA vous devez faire appel à un traducteur, et tout réenregistrer.
C’est long, et ça coûte un bras.
Avec l’IA et ElevenLabs, deux clics et quelques secondes suffisent.
La fonction Dubbing (Doublage) vous permet de traduire n’importe quel contenu, dans quasi n’importe quelle langue.
Cette fonctionnalité est incroyablement puissante.
Vous avez la possibilité de traduire un audio ou une vidéo en 29 langues !
Langues disponibles :
- Anglais 🇬🇧
- Français 🇫🇷
- Chinois 🇨🇳
- Espagnol 🇪🇸
- Indou 🇮🇳
- Portugais 🇵🇹
- Allemand 🇩🇪
- Japonais 🇯🇵
- Arabe 🇸🇦
- Russe 🇷🇺
- Coréen 🇰🇷
- Italien 🇮🇹
- Turque 🇹🇷
- Polonais 🇵🇱
- Suédois 🇸🇪
- Grecque 🇬🇷
- Danois 🇩🇰
- Etc.
Si vous souhaitez voir la fonctionnalité Dubbing en action, rendez-vous à 6:41 dans ma vidéo sur ElevenLabs.
Pour traduire un audio ou une vidéo c’est très simple :
➡️ Étape 1 : Sélectionnez la langue originelle
➡️ Étape 2 : Sélectionnez la langue dans laquelle vous voulez traduire le fichier
➡️ Étape 3 : Choisissez un moyen d’importer votre fichier :
- Téléchargez un fichier audio/vidéo depuis votre ordinateur
- Ou Copier-coller le lien d’une vidéo YouTube, TikTok, X (Twitter), Vimeo, ou de n’importe quelle page web.
➡️ Étape 4 : Cliquez sur Create.
En quelques secondes (ou minutes si le fichier source est conséquent), ElevenLabs traduira votre contenu.
Voilà un excellent moyen de scaler votre business à l’international, facilement et rapidement. 😎
Voice Cloning : Clonez n’importe quelle voix
En vous rendant dans l’onglet « Voices », vous pourrez soit :
- Choisir une voix générative (parmi plus de 1.000 voix disponibles)
- Créer votre propre voix personnalisée, autrement dit un clone vocal
La fonction Instant Voice Cloning vous permet de créer un « sample » de votre voix. Autrement dit un modèle de voix ressemblant à la vôtre (un clone vocal).
Pour le créer, il vous suffit d’enregistrer votre voix pendant 1 minute. ⏳
L’IA d’ElevenLabs va alors tenter de la répliquer, pour que vous puissiez la réutiliser dans vos futurs projets.
La qualité du clonage avec Instant Voice Cloning est plutôt satisfaisant.
Mais si vous souhaitez un clonage de voix de meilleur qualité, je vous recommande l’option Professional Voice Cloning.
Ici, ElevenLabs vous demander de vous enregistrer pendant 30 minutes consécutives. ⏳
Grâce à cet apport plus important de données vocales, l’outil reproduira plus fidèlement votre voix.
Personnellement, j’ai lu un livre durant 30min pour m’éviter de devoir improviser lors de l’enregistrement.
💡 Je vous conseille au passage de bien articuler, de varier votre ton ou vos émotions, et d’avoir un bon micro (cela vous aidera à obtenir une meilleure voix clonée).
Après cela, vous pourrez utiliser votre propre avatar pour les fonctions Text-to-Speech et Speech-to-Speech.
Et si vous vous posez la question : Oui, vous pouvez reproduire n’importe quelle voix, pas seulement la vôtre.
Si votre rêve est de créer du contenu avec la voix de Goku, Kratos, Joshua Graham, Macron ou n’importe quel personnage… Avec ElevenLabs c’est tout à fait possible.
Attention tout de même : vous êtes responsable de vos actes. 🙂
L’API de ElevenLabs
Enfin, pour les passionnés de développement, ElevenLabs dispose de sa propre API.
Si vous souhaitez intégrer de la synthèse vocale dans vos projets, c’est tout à fait possible.
A ce propos, une librairie Github ElevenLabs est dispo pour les accros à Pyhton.
De nombreux guides sont accessibles depuis l’interface de l’outil.
Pour vous montrer tout le potentiel de l’outil et de son API, vous pouvez imaginer créer un service type « support client ».
En couplant l’API d’ElevenLabs et celle d’OpenAI (ChatGPT), vous pourrez créer un agent IA conversationnel, en charge de répondre en direct, et vocalement aux demandes de vos clients ou utilisateurs.
Avec une latence inférieure à 400 ms, les réponses sont plutôt rapide.
Certaines entreprises commencent déjà à s’équiper de cette technologie (Websockets) pour faire de la relation client via chatbot IA.
Pour aller plus loin, des streamers utilisent cette même technologie pour créer un clone capable de dialoguer en Live avec leurs viewers.
Nul doute que cette tendance ce démocratise dans les mois à venir.
Avantages et inconvénients de ElevenLabs
Avantages
Voix IA réalistes
Grand choix de voix IA (+1000 avatars)
Traduction multilingue (29 langues)
Clonage de voix efficace
Disponible en version gratuite
Excellent rapport qualité/prix
Inconvénients
Manque parfois de nuances émotionnelles
Prix et tarifs ElevenLabs : Combien ça coûte ?
Malheureusement, toute cette technologie a un coût.
Mais rassurez-vous, elle reste accessible ! 👌
ElevenLabs n’est pas l’outil le plus cher du marché.
Je dirais même que c’est le logiciel de génération de voix IA au meilleur rapport qualité/prix.
Le logiciel propose 5 plans d’abonnements différents :
- Free ($0)
- Starter ($5/mois)
- Creator ($22/mois)
- Pro ($99/mois)
- Scale ($330/mois)
J’utilise personnellement le plan « Creator », qui me permets de générer jusqu’à 2h de contenu audio par mois.
Ce plan d’abonnement est très intéressant, puisque 100.000 caractères peuvent être retranscris en vocal chaque mois.
Mais il permet surtout de débloquer l’option de clonage de voix professionnelle, pour obtenir la meilleure voix IA clonée. 👍
De plus, les plans d’abonnements supérieurs (comparés au plan Free gratuit), permettent d’être moins limités en termes de quotas.
A titre d’exemple, la version gratuite dispose d’un quota de seulement 1.000 caractères.
Ce qui est amplement suffisant pour tester l’outil, mais insuffisant pour générer plus d’une vidéo (de 10 minutes) par mois.
Si vous souhaitez faire votre propre avis sur ElevenLabs et tester l’outil gratuitement, aucun moyen de paiement ne sera nécessaire.
Par contre, si vous optez pour un plan d’abonnement payant, vous devrez vous munir de votre CB (Visa/Mastercard/American Express). 💳
💡 L’option « virement bancaire » est disponible et vous fait bénéficier de 5$ de cashback.
Note ElevenLabs : je le passe sur le banc
- Rapport qualité/prix : 9.5/10
- Simplicité d’utilisation (UX) : 9/10
- Fonctionnalités : 9/10
- Qualité du support : 8/10
- Communauté (Discord) : 8.5/10
- Qualité du rendu : 9/10
⭐️ Note globale ElevenLabs : 8.8/10
Mon avis sur ElevenLabs
S’il est vrai qu’il existe un grand nombre d’outils de synthèse vocale, ElevenLabs est actuellement le plus convaincant du marché.
La qualité de transcription vocale et de clonage est top !
L’outil offre également un large choix de voix-off IA et de langues côté traduction.
Le rendu des audios est quasi parfait. Voire parfois « trop » parfait, ce qui peut à certains moments déshumaniser l’ensemble.
Néanmoins, on est très loin des voix robotiques, qui faisaient rage dans les débuts de l’intelligence artificielle.
Certains logiciels, en sont encore au stade des voix « robotisée » alors que ElevenLabs propose des voix très proches de l’Humain.
Ayant testé plusieurs logiciels homologues, celui-ci est (selon mon avis) le meilleur en termes de rendu. 🏆
Si vous cherchez un outil qui fait le job, avec ElevenLabs vous ne serez clairement pas déçu.
D’autant plus que l’entreprise entraîne continuellement sont IA, la rendant davantage qualitative de jour en jour.
Pour conclure, je dirais que ce logiciel est une réelle opportunité pour l’ensemble de la communauté des créateurs de contenus.
Dîtes-vous qu’une chaîne YouTube comme « Sagesse Stoïcienne » a récolté près de 170.000 abonnés en moins d’un an, uniquement avec du contenu créé en intelligence artificielle et ElevenLabs.
Si vous hésitiez à vous lancer dans l’univers de la vidéo faceless (sans montrer votre visage), aujourd’hui vous avez les outils pour dépasser vos barrières. 🚀
Un outil comme ElevenLabs c’est aussi un moyen de dépasser les frontières.
Désormais, vous ne vous contenterez plus du marché francophone.
Une simple traduction avec ElevenLabs vous permettra de toucher une cible internationale, et de scaler votre business à très grande échelle.
Pensez-y ! 😉
Me contacter