Comment créer une voix d’IA qui vous ressemble avec ElevenLabs

L’IA générative et les deepfakes sont entrés en collision avec le développement d’outils vocaux d’IA. L’idée est simple : vous prenez une voix et la manipulez pour qu’elle prononce les mots que vous lui donnez.

ElevenLabs, qui propose un outil d’IA vocale gratuit, est le chef de file dans ce domaine.

Qu’est-ce qu’ElevenLabs ?

Fondée par un ancien ingénieur en apprentissage automatique de Google et un ancien stratège en déploiement de Palintir, ElevenLabs est une société de recherche en technologie vocale. Les logiciels d’IA vocale sont un élément clé de sa stratégie, mais l’objectif final est de créer un outil qui « convertit instantanément l’audio parlé entre les langues ».

ElevenLabs a développé de nouveaux modèles de synthèse vocale capables de créer une voix humaine réaliste. Son site web indique ce qui suit : « Notre mission est de faire du support audio multilingue à la demande une réalité dans les domaines de l’éducation, du streaming, des livres audio, des jeux, des films et même de la conversation en temps réel.

Google Translate et ses alternatives sont une chose, mais pouvez-vous imaginer un outil qui traduise instantanément ce que vous entendez ? Le clonage de la voix de l’orateur afin que vous entendiez le discours tel qu’il le prononcerait est une étape importante dans cette direction.

Qu’est-ce que la génération de voix par IA ?

Décrite simplement, la génération de voix d’IA vous permet de prendre une voix et de lui faire dire ce que vous voulez entendre. Il suffit de choisir une voix, de fournir un dialogue et l’outil fait le reste.

Vous pourriez vous dire « Eh bien, Microsoft Sam faisait cela dans les années 1990 » et vous auriez tout à fait raison. Mais Microsoft Sam et d’autres outils similaires ressemblaient à des robots. L’outil d’ElevenLabs, quant à lui, ressemble beaucoup plus à des humains.

ElevenLabs propose trois options d’IA vocale : ses voix « prémâchées » entièrement gratuites, le générateur de voix (qui vous permet de sélectionner le sexe, l’âge et l’accent) et les voix « clonées » uniquement sur abonnement que vous pouvez télécharger.

Voir aussi :  Onduleur sinusoïdal pur ou modifié : lequel acheter ?

Voici un exemple :

L’utilisation de l’IA à des fins créatives s’accompagne de certaines responsabilités morales et éthiques, et la création de voix avec l’outil d’IA vocale d’ElevenLabs n’est pas différente.

En bref, n’utilisez pas la voix de quelqu’un sans son autorisation. Même si ce n’est pas illégal, cette personne pourrait en être contrariée.

Avant de poursuivre, n’oubliez pas qu’au moment où nous écrivons ces lignes, l’outil d’IA vocale d’ElevenLabs est en version bêta. Cela signifie qu’il ne s’agit pas d’un produit fini.

Génération d’un dialogue d’IA de base

La façon la plus simple d’utiliser ElevenLabs est d’utiliser l’outil gratuit d’IA vocale.

Pour l’utiliser, rendez-vous sur beta.elevenlabs.io et créez un compte (vous pouvez utiliser votre propre adresse électronique, un compte Google ou Facebook).

Suivant :

  1. Cliquez sur Synthèse vocale
  2. Sélectionnez l’une des voix prédéfinies dans Paramètres (des voix masculines et féminines sont disponibles)
  3. Développer Réglages de la voix pour régler Stabilité et Clarté + amélioration de la similarité (une stabilité élevée est monotone, une clarté élevée est plus proche de la voix voulue) curseurs
  4. Sélection Onze monolingue (anglais standard)
  5. Saisissez le texte que vous souhaitez convertir en parole
  6. Cliquez sur Générer
  7. Une fois le processus terminé, il devrait se dérouler automatiquement ; si ce n’est pas le cas, cliquez sur Jouer

Vous pouvez également Télécharger l’échantillon généré.

Générer une voix avec ElevenLabs

Si vous préférez créer une nouvelle voix, vous pouvez utiliser la fonction Ajouter une voix pour accéder à la fenêtre VoiceLab Pour générer une nouvelle voix basée sur les préréglages d’ElevenLabs :

  1. Cliquez sur Ajouter une voix > Conception de la voix
  2. Définir la Genre, L’âge et Accent champs
  3. Ajuster les Intensité de l’accent selon les besoins
  4. Saisissez le texte que vous souhaitez convertir
  5. Cliquez sur Générer
  6. Quand c’est fait, écoutez

Lors des tests, j’ai constaté que les accents féminin/jeune/australien et masculin/ancien/australien étaient nettement « américains ». C’est un problème qui sera probablement résolu au fur et à mesure que la technologie se développera.

Voir aussi :  Qu'est-ce qu'un fichier M3U8 ? Comment l'ouvrir

Créer sa propre voix dans l’IA

Si les options prédéfinies et configurables sont intéressantes, l’élément vraiment passionnant de la technologie d’ElevenLabs est l’outil de clonage instantané de la voix.

Contrairement aux autres options, l’outil Instant Voice Cloning nécessite un abonnement. Plusieurs options sont disponibles, la moins chère étant de 5 $ par mois. Au moment où nous écrivons ces lignes, une réduction de 80 % est accordée pour le premier mois, ce qui fait que l’abonnement ne coûte que 1 $.

Les autres options coûtent 22 $, 99 $ et 330 $ par mois, avec la possibilité de générer jusqu’à 40 heures d’audio par mois.

Pour utiliser Instant Voice Cloning, il vous faut non seulement des dialogues, mais aussi un échantillon de votre voix. N’importe quoi peut faire l’affaire, pourvu que ce soit clair et au format MP3. Plus l’échantillon est long, mieux c’est, jusqu’à 5 minutes.

A partir de l’écran VoiceLab :

  1. Cliquez sur Ajouter une voix > Clonage vocal instantané
  2. Dans la fenêtre résultante, définissez un nom
  3. Cliquez ou faites glisser un fichier approprié pour télécharger un échantillon (jusqu’à 25 échantillons peuvent être ajoutés pour une meilleure précision).
  4. Cliquez sur Étiquettes et spécifiez une clé + une valeur (par exemple Accent/British) – faites ceci jusqu’à 5 fois.
  5. Saisir une brève description de la voix
  6. Cochez la case de confirmation du consentement Ajouter la voix

Une fois la voix ajoutée, vous pouvez la régler dans l’écran Synthèse vocale comme ci-dessus.

Que pouvez-vous faire avec une voix d’IA ?

La parole artificielle avec des voix pré-fabriquées et clonées offre de nombreuses possibilités. Comme nous l’avons indiqué, l’objectif final d’ElevenLabs est la traduction en direct, mais ils ont noté plusieurs autres utilisations.

Les livres audio sont mentionnés (peut-être lus par une star de cinéma décédée depuis longtemps) ainsi que les jeux vidéo (l’utilisation de la parole artificielle permettrait d’économiser les voix des acteurs). Mais l’utilisation de l’IA va bien au-delà, de la musique à la satire en passant par l’aide à l’autonomie, et probablement au-delà.

Voir aussi :  Qu'est-ce qu'un DAC et en avez-vous besoin ?

Il est même possible de créer un podcast à l’aide de l’IA, même si le résultat risque d’être plat et ennuyeux.

L’introduction d’un épisode de notre Podcast vraiment utile a été produite à l’aide d’ElevenLabs :

Bien que les résultats ne soient pas tout à fait à la hauteur de nos espérances, ils sont suffisamment bons pour être utilisés, et la technologie ne peut que s’améliorer.

Entre-temps, ElevenLabs prévoit une fonction de « conversation vocale » générée qui sera introduite à une date ultérieure.

Utilisez votre voix d’une nouvelle manière grâce à l’IA vocale d’ElevenLabs

L’intelligence artificielle nous a apporté de nouveaux outils étonnants au cours des dernières années. Chat-GPT peut être utilisé pour créer des textes, répondre à des questions, rédiger des rapports, etc. Midjourney est un outil étonnant qui génère des œuvres d’art à partir d’invites.

Aujourd’hui, l’outil d’IA vocale d’ElevenLabs permet de manipuler facilement une voix. C’est comme une imitation, mais avec un clone de la voix originale.

Bien qu’il existe des arguments éthiques contre l’utilisation de voix sans consentement, il s’agit d’un outil puissant qui offre des possibilités intéressantes. Mieux encore, il est étonnamment facile à utiliser et donne des résultats impressionnants.

S’abonner à notre lettre d’information

Puis-je créer ma propre voix d’IA ?

La première étape de la création de votre propre voix d’IA consiste à enregistrer des échantillons vocaux de haute qualité de vous-même. Cette étape est importante car le modèle d’IA que vous entraînerez sera basé sur ces échantillons. Vous devrez utiliser un microphone et un logiciel d’enregistrement de haute qualité pour capturer votre voix avec précision.

Quelle IA Eleven Labs utilise-t-elle ?

Prime Voice AI Le logiciel d’IA le plus réaliste et le plus polyvalent qui soit.

Cliquez pour évaluer cet article !
[Total: Moyenne : ]

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *