Speech Rate Conversion

話速変換技術

話速変換とは音声の高さを変えずに発話速度のみを変更させる技術のことです.話速変換技術は,ラジオやテレビといったユーザが聞き手となる一方向のアプリケーションで実用化されている一方で,人間同士のインタラクションのように双方向通信が必要とされる場面での応用例は少ないです.本研究室では話速変換を双方向通信が必要な遠隔会話に利用することを目的としています.

demo

通常のスロー再生では声の高さが低くなりますが,話速変換によるスロー再生では声の高さに変化がありません.話速変換を利用することでゆっくり話した声(原音声 5mora/sec)に近い声に変換できていることが分かります.

原音声(8mora/sec)

スロー再生

話速変換によるスロー再生

原音声(5mora/sec)

※DEMOの原音声には話速バリエーション型音声データベース(SRV-DB)を利用させて頂きました