|
|<
<< Page précédente
1
Page suivante >>
>|
|
documents par page
|
Tri :
Date
Titre
Auteur
|
|
Informatique
/ 21-11-2024
Wadoux Lily
Voir le résumé
Voir le résumé
Les avancées récentes ont élargi le champ des possibles en synthèse de parole, en particulier pour les systèmes multi-locuteurs. Le clonage de voix correspond à la production de parole ressemblant à la voix d'un locuteur cible à partir d'une entrée textuelle et d'un échantillon audio de la cible. En théorie, ils sont capables de synthétiser la voix de n'importe quel locuteur, à partir d'un corpus audio de référence de quelques minutes seulement. Dans ce document, deux questions sont au cœur des raisonnements et des expériences présentées : Si le clonage de voix peut, en théorie, reproduire la voix de n'importe quel locuteur, alors comment se comporterait-il face à des locuteurs atypiques ? Cet axe est exploré dans ce document en premier lieu à travers des données issues de livres audio, puis avec des études préliminaires visant à une application pour les patients atteints de dysphonie. La grande majorité des études portant sur le clonage de voix sont entraînées et testées sur des données en anglais. Serait-il possible, et avec quelles performances, d'entraîner un modèle de clonage de voix dans une autre langue et de le tester avec des locuteurs parlant cette langue ? Cette question est abordée dans ce document avec le choix de la langue française, qui restreint les possibilités en termes de disponibilité de corpus, et implique des compromis entre qualité et nombre de locuteurs.
|
|
|<
<< Page précédente
1
Page suivante >>
>|
|
documents par page
|