齋藤佑樹, Ph.D.

Language: EN/JP

東京大学のシステム情報学専攻第一研究室の講師です．
産業技術総合研究所人工知能研究センター知的メディア処理研究チームの特定フェローとしても勤務しています．
音声合成，音声変換，機械学習などに興味があります．

履歴書 (英語版) は [こちら (full)] と [こちら(short)]

Email: yuuki_saito {at} ipc.i.u-tokyo.ac.jp Twitter: @ysaito_human LinkedIn: yuki-saito-36a32a129

研究発表:

チュートリアル

Yuki Saito, Shinnosuke Takamichi, and Wataru Nakata, "Emerging topics for speech synthesis: versatility and efficiency," APSIPA ASC 2024, Macau, China, Dec. 2024. (Slide)

解説記事

齋藤佑樹, "共感的対話音声合成--より表現力豊かな音声対話システムに向けた音声合成--," 日本音響学会誌, Vol. 80, No. 12, pp. 667--674, 2024年12月.

原著論文

査読付き国際会議

研究会 (Technical Reports)

全国大会 (Domestic Conferences)

学位論文

齋藤佑樹, "Statistical speech synthesis based on human's speech information processing abilities," 博士論文, 東京大学大学院情報理工学系研究科システム情報学専攻, 2021年3月. (指導教員: 猿渡洋教授) (情報理工学系研究科研究科長賞) (PDF, Slide)
齋藤佑樹, "High-quality statistical parametric speech synthesis using generative adversarial networks," 修士論文, 東京大学大学院情報理工学系研究科創造情報学専攻, 2018年3月. (指導教員: 猿渡洋教授) (PDF, Slide)

競争的資金:

国立研究開発法人科学技術振興機構国家戦略分野の若手研究者及び博士後期課程学生の育成事業 (BOOST) 次世代AI人材育成プログラム（若手研究者支援）, "音声メディアの合成と品質評価のための深層学習モデルの統合的最適化," 5000万円, 2025年xx月--2030年xx月 (代表)
日本学術振興会若手研究, "絵文字で制御可能なテキスト音声合成の研究開発," 360万円, 2025年4月--2028年3月.（代表）
Google-initiated Research Grant, 30,000 USドル, 2023年11月--2024年10月. (Representative: Yuki Saito)
国立研究開発法人科学技術振興機構 ACT-X, "インタラクティブ強化学習に基づく人間参加型適応的テキスト音声合成," 450万円, 2023年10月--2026年3月 (代表)
Travel Grant Award for INTERSPEECH2023, 750ユーロ, 2023年8月.
立石科学技術振興財団研究助成 (S), "スモールデータ機械学習に基づくリアルタイム音コミュニケーション能力拡張システム," 3,000万円, 2023年4月--2026年3月.（分担）
日本学術振興会若手研究, "eスポーツ理解に向けた実況解説音声の分析及び音声合成アルゴリズムの開発," 360万円, 2022年4月--2025年3月.（代表）
立石科学技術振興財団研究助成 (A), "連合学習に基づく多話者音声変換のユーザ参加型学習," 220万円, 2022年4月--2023年3月.（代表）
日本学術振興会研究活動スタート支援, "Continual Learning に基づく持続的に学習可能な音声合成," 240万円, 2021年9月--2023年3月.（代表）
2021年度キオクシア（旧東芝メモリ）奨励研究, 100万円, 2021年6月--2022年3月.（代表）
日本学術振興会特別研究員奨励費, "聞き手モデルに基づく能動的音声合成に関する研究," 250万円, 2018年5月--2021年3月.（代表）
公益財団法人 NEC C&C 財団平成30年度前期国際会議論文発表者助成受給者, 25万円, 2018年4月.

受賞:

Winners of The INTERSPEECH2024 Discrete Speech Challenge (TTS Track), 2024年9月.
情報処理学会 2024年度山下記念研究賞, 2024年7月.
第40回井上科学振興財団井上研究奨励賞, 2024年2月.
Travel Grant Award for INTERSPEECH2023, 2023年8月.
音学シンポジウム2023 優秀発表賞, 2023年6月.
第22回船井情報科学振興財団船井研究奨励賞, 2023年5月.
2021年度電子情報通信学会論文賞, 2022年6月.
2021年度情報処理学会音声言語情報処理研究会企業賞 (Yahoo!Japan賞), 2022年3月.
2020 IEEE SPS Young Author Best Paper Award, 2021年6月.
2020年度東京大学大学院情報理工学系研究科研究科長賞（システム情報学専攻・博士課程）, 2021年3月.
日本音響学会第49回粟屋潔学術奨励賞, 2021年3月.
2018年度C&C若手優秀論文賞, 2019年1月.
The 12th IEEE Signal Processing Society Japan Student Journal Paper Award, 2018年11月.
平成29年度音声研究会研究奨励賞, 2018年8月.
日本学生支援機構第一種奨学金特に優れた業績による奨学金返還免除 (半額) 対象者, 2018年5月.
第34回電気通信普及財団テレコムシステム技術学生賞, 2018年3月.
The 1st IEEE Signal Processing Society Tokyo Joint Chapter Student Award, 2017年11月.
Spoken Language Processing Student Grant of ICASSP, 2017年3月.
日本音響学会第14回学生優秀発表賞, 2017年3月.
2017年 SP研究会学生ポスター賞, 2017年1月.
平成27年度釧路高専専攻科学生特別研究発表会奨励賞, 2016年2月.
平成25年度釧路高専校長賞, 2014年3月.

共著者の受賞:

日本音響学会第30回学生優秀発表賞, 2025年9月. (受賞者: 淺井航平)
音学シンポジウム2025 優秀発表賞, 2025年6月. (受賞者：朴浚鎔)
The 18th IEEE SPS Japan Student Conference Paper Award, 2025年3月. (受賞者: 山内一輝)
日本音響学会第29回学生優秀発表賞, 2025年3月. (受賞者: 小川諒)
Candidates for the APSIPA ASC 2024 Best Student Paper Award, 2024年12月. (受賞者: 中田亘)
YANSシンポジウムスポンサー賞 (株式会社IVRy賞), 2024年9月. (受賞者: 高野大成)
日本音響学会第28回学生優秀発表賞, 2024年9月. (受賞者: 山内一輝)
Shortlisted for the ISCA Best Student Paper Award 2024, 2024年8月. (受賞者: Dong Yang)
音学シンポジウム2024 優秀発表賞, 2024年6月. (受賞者：山内一輝)
2024年 SP研究会学生ポスター賞, 2024年3月. (受賞者：山内一輝)
2023年度情報処理学会音声言語情報処理研究会企業賞 (Fairy Devices賞), 2024年3月. (受賞者：平井龍之介)
日本音響学会第27回学生優秀発表賞, 2024年3月. (受賞者: 渡邊亞椰)
Google Travel Grants for Students in East Asia, 2022年7月. (受賞者：西邑勇人)
令和2年度国立高等専門学校機構学生表彰, 2021年3月. (受賞者：藤井一貴)
音学シンポジウム学生ポスター賞, 2020年6月. (受賞者：藤井一貴)
フジサンケイビジネスアイ先端技術大賞特別賞, 2020年6月. (受賞者：藤井一貴)
情報処理学会山下記念研究賞, 2020年3月. (受賞者: 高道慎之介)
The 3rd IEEE Signal Processing Society Tokyo Joint Chapter Student Award, 2019年12月. (受賞者: 田丸浩気)
日本音響学会第18回学生優秀発表賞, 2019年3月. (受賞者: 溝口聡)
音学シンポジウム優秀賞, 2018年6月. (受賞者: 高道慎之介)

査読:

Journals: Transactions on Machine Learning Research (from 2025), Neural Networks (from 2024), Information Fusion (from 2024), Acoustical Science and Technology (from 2024), IEEE Open Journal of Signal Processing (from 2023), Computer Speech and Language (from 2023), Journal of Audio Engineering Society (from 2022), IEICE Transactions on Information and Systems (from 2022), Journal of Information Processing (from 2022), APSIPA Transactions on Signal and Information Processing (from 2021), EURASIP Journal on Audio Speech and Music Processing (from 2021), IEEE Access (from 2021), IEEE/ACM Transactions on Audio, Speech, and Language Processing (from 2020), IEEE Signal Processing Letter (from 2018)
Conferences: CoG (from 2025), ASRU (from 2025), WASPAA (from 2025), SLT (from 2024), ISCSLP (from 2024), NeurIPS (from 2024), INTERSPEECH (from 2021), MLSP (from 2019), ICASSP (from 2018)

職歴:

産業技術総合研究所人工知能研究センター知的メディア処理研究チーム協力研究員, 2025年6月1日--2030年5月31日. (Lab. page)
東京大学講師, 2024年4月1日--20xx年xx月xx日. (猿渡・齋藤研究室) (Lab. page)
東京大学助教, 2023年4月1日--2024年3月31日. (猿渡・高道研究室) (Lab. page)
東京大学特任助教 (JST ムーンショット型研究開発事業 "音響情報処理・音声変換の研究開発"), 2021年4月1日--2023年3月31日. (代表者: 猿渡洋) (Project)
東京大学技術補佐員 (総務省SCOPE "知覚モデルに基づくストレスフリーなリアルタイム広帯域音声変換の研究"), 2019年4月1日--2021年3月31日. (代表者: 高道慎之介) (Project)
株式会社ディー・エヌ・エー (DeNA) AIシステム研究開発部アルバイト, 2018年10月1日--2019年3月29日 & 2019年6月1日--2020年3月31日. (指導者: 橘健太郎)
日本学術振興会特別研究員 (DC1, "聞き手モデルに基づく能動的音声合成に関する研究"), 2018年4月1日--2021年3月31日. (代表者: 齋藤佑樹) (KAKEN) (Project)
NTT メディアインテリジェンス研究所音声言語メディアプロジェクトインターン, 2017年8月30日--2017年10月31日. (指導者: 井島勇祐)
NTT コミュニケーション科学基礎研究所メディア情報研究部インターン, 2016年8月8-日-2016年9月9日. (指導者: 亀岡弘和)

学会活動など:

ICASSP 座長 (2025年~)
INTERSPEECH 座長 (2024年~)
日本音響学会研究発表会副座長 (2023年~)
電子情報通信学会音声 (SP) 研究会幹事補佐（2024年4月--2026年3月）.
情報処理学会音声言語情報処理 (SLP) 研究会幹事（2024年4月--2026年3月）.
日本音響学会学生・若手フォーラム幹事会員（2017年3月--現在）兼副代表（2019年4月--2022年3月）.

音声コーパス:

渡邊亞椰, 高道慎之介, 齋藤佑樹, 辛徳泰, 猿渡洋, "Coco-Nut: 自由記述文による声質制御に向けた多話者音声・声質自由記述ペアデータセット," 2023年11月. (URL)
辛徳泰, 江俊鋒, 高道慎之介, 齋藤佑樹, 相澤彰子, 猿渡洋, "JVNV: 言語音声と非言語音声を持つ日本語感情音声コーパス," 2023年10月. (URL)
齋藤佑樹, 飯森英治, 高道慎之介, 橘健太郎, 猿渡洋, "STUDIES 2 (CALLS) Corpus: Complaint handling and Attentive Listening Lines Speech," 2023年3月. (URL)
齋藤佑樹, 高道慎之介, 猿渡洋, "SMASHコーパス: ゲーム動画の後づけ実況解説音声収録に基づく自発発話音声コーパス," 2022年6月. (URL)
齋藤佑樹, 西邑勇人, 高道慎之介, 橘健太郎, 猿渡洋, "STUDIES Corpus: Japanese empathetic dialogue speech corpus," 2022年3月. (URL, arXiv preprint)
高道慎之介, 三井健太郎, 齋藤佑樹, 郡山知樹, 丹治尚子, 猿渡洋, "JVS corpus: free Japanese multi-speaker voice corpus," 2019年8月. (URL, arXiv preprint)

招待講演 / 訪問講演:

Yuki Saito, "Towards human-in-the-loop DNN-based speech synthesis technologies," Seminar by IEEE NZ Signal Processing / Information Theory Joint Chapter and Acoustics Research Center, the University of Auckland, Dec. 2022.
Yuki Saito, "Towards human-in-the-loop speech synthesis technologies," Seminar by IEEE Systems, Man and Cybernetics Singapore Chapter, Chinese and Oriental Languages Information Processing Society Teochew Doctorate Society, Singapore, and Human Language Technology Lab., National University of Singapore, Aug. 2022.

特許:

橘健太郎, 齋藤佑樹, 阿久澤圭, “音声処理装置及び音声処理プログラム," 特許7360814, 2019年5月21日出願.
高道慎之介, 齋藤佑樹, 佐伯高明, 猿渡洋, “音声変換方法及び音声変換プログラム," 特許734942, 2019年8月19日出願.
高道慎之介, 齋藤佑樹, 佐伯高明, 猿渡洋, “音声変換装置、音声変換方法及び音声変換プログラム," PCT/JP2020/031122, 2020年8月18日出願.
高道慎之介, 齋藤佑樹, 佐伯高明, 猿渡洋, “音声変換装置、音声変換方法及び音声変換プログラム," 特許7421827, 2021年2月5日出願.

講義:

東京大学工学部計数工学科信号処理論第一（2025年度~ 主担当）
- 01."はじめに" Slide
- 02."数学的準備" Slide
- 03."信号の展開表現、フーリエ級数展開" Slide
- 04."フーリエ変換、離散時間フーリエ変換" Slide
- 05."サンプリング定理、離散フーリエ変換" Slide
- 06."窓関数、高速フーリエ変換" Slide
東京大学工学部計数工学科応用音響学（2024年度~ 主担当）
- 07."音声生成" Slide
- 08."音知覚" Slide
- 09."音声認識システム" Slide
- 10."テキスト音声合成システム" Slide
- 11."音声変換システム" Slide
- 12."話者認識システム" Slide
東京大学工学部計数工学科信号処理論第一（2025年度~ 主担当）
- 第1回「はじめに」Slide
東京大学教養学部(前期課程) 学術フロンティア講義 (サイバネティクス入門ー物理・人・社会を繋げる情報科学の先端ー)「音を解析・合成する信号処理技術」（2024年度主担当）Slide
東京大学工学部計数工学科システム情報工学演習第三「信号処理と機械学習」（2024年度主担当）
東京大学工学部計数工学科システム情報工学設計演習「プロジェクト演習」（2016--2017年度 TA，2023年度主担当）
東京大学工学部計数工学科計数工学実験「ディジタル信号処理と音響システム」（2023年度主担当）
東京大学大学院情報理工学系研究科信号処理特論（ゲスト講師）
- 2022年度 (Slide)
- 2024年度 (Slide)
東京大学大学院情報理工学系研究科ガウス過程と機械学習特論（2021年度ゲスト講師） (Slide)

学歴:

東京大学大学院情報理工学系研究科システム情報学専攻博士課程, 2021年3月修了. (指導教員: 猿渡洋教授)
東京大学大学院情報理工学系研究科創造情報学専攻修士課程, 2018年3月修了. (指導教員: 猿渡洋教授)
釧路高専専攻科電子情報システム情報工学専攻, 2016年3月修了. (指導教員: 天元宏准教授)
釧路高専情報工学科, 2014年3月卒業. (指導教員: 天元宏准教授)
釧路市立大楽毛中学校, 2009年3月卒業.

その他:

Google Research Talk at Tokyo に参加しました. (2018年11月)
Google Speech Technology Summit 2018 at Google London, UK に参加し, ICASSP 2018 に採択された2件の論文についてポスターセッションで発表しました. (2018年3月)
我々の論文中の図が, IEEE/ACM TASLP (January/February issue) の表紙を飾りました.

齋藤 佑樹, Ph.D.

齋藤佑樹, Ph.D.