Audio Samples from "Human-in-the-loop Speaker Adaptation for DNN-based Multi-speaker TTS"

Speech sample 1


Text (jp): また、東寺のように、五大明王と呼ばれる、主要な明王の中央に配されることも多い。
mata toojinoyooni godaimyooootoyobareru shuyoonamyoooonochuuoonihaisarerukotomoooi

GT TL Mean Spkr. SLS-Worst SLS-Mean SLS-Best
Speaker: jvs005 (male)
Speaker: jvs010 (female)
Speaker: jvs060 (female)
Speaker: jvs078 (male)

Speech sample 2


Text (jp): ニューイングランド風は、牛乳をベースとした、白いクリームスープであり、ボストンクラムチャウダーとも呼ばれる。
nyuuingurandofuuwa gyuunyuuobeesutoshita shiroikuriimusuupudeari bosutonkuramuchaudaatomoyobareru

GT TL Mean Spkr. SLS-Worst SLS-Mean SLS-Best
Speaker: jvs005 (male)
Speaker: jvs010 (female)
Speaker: jvs060 (female)
Speaker: jvs078 (male)

Speech sample 3


Text (jp): コンピューターゲームのメーカーや、業界団体などに関連する人物のカテゴリ。
konpyuutageemunomeekaaya gyookaidantainadonikanrensurujinbutsunokategori

GT TL Mean Spkr. SLS-Worst SLS-Mean SLS-Best
Speaker: jvs005 (male)
Speaker: jvs010 (female)
Speaker: jvs060 (female)
Speaker: jvs078 (male)