STUDIES Corpus: Japanese empathetic dialogue speech corpus

ダウンロード (Download link):
here (application form on NII IDR)

概要:

STUDIES コーパスは,声優3名 (男性1名・女性2名) による模擬対話音声を収録した音声コーパスです.
本コーパスは,「対話相手に寄り添って発話可能なAIエージェント」の実現を目指して構築されています.
「個別指導塾の女性講師が,勉強の合間に生徒と雑談している」シチュエーションを想定しており,声優は,自身と対話相手の両方の台詞と感情ラベルを考慮して発話しました.
対話の台本と感情ラベルは,クラウドソーシングにより収集したものを開発者で一部校正して作成しました.
音声データはすべて48kHz/16bitのwavファイルです.
研究目的であれば無償で利用可能ですが,再配布・公序良俗に反する利用などの行為はご遠慮ください.
論文などで利用される場合,下記の通りに引用していただければ幸いです.

Summary:

The STUDIES contains simulated dialogue recorded by three voice actors (one male and two females).
This corpus is designed with the aim of developing an AI agent that can speak in close proximity to its interlocutor.
The dialogue in this corpus is based on a situation where a female teacher of a cram is chatting with her students in between studying, and the voice actors spoke considering the dialogue lines and emotion labels of both oneself and interlocutor.
The dialogue lines and emotion labels were collected through crowdsourcing and partially proofread by the developers.
All audio data are 48kHz/16bit wav files.
The materials may be used free of charge for research purposes, but please refrain from redistribution or use that is offensive to public order and morals.
If you wish to use this information in your paper, please cite the following paper:

収録音声 (Contents):


デモ (Demonstrations):


更新情報 (Update information):

主な開発者 (Main developers):

謝辞 (Acknowledgements):