« ▲アンチフォルマントによる音声合成 | トップページ | ◆膨らんではじけるブラックホール »

▲連続する母音を滑らかにつなぐ音声合成

 母音滑らか連結合成

母音を滑らかに変化させながらつなぐ試験です。
テキスト入力部にあ~おの文字並びを入れ、[音声再生]を押すと、 音声が再生されます。(音声合成の時間が若干かかります)
入力可能なのは「あ」~「お」のひらがなまたはa,i,u,e,o で、12文字まで有効です。[音声再生]の行にある「文:」で 例文を選択することもできます。


Appletを有効にしてください


この仕組みを発展させたサンプル sample5.mp3▲「ん」「な行」「ま行」と「が」音声合成試験

音の持続、変化時間を調整できます。
立ち上がり、[主部]、[連結部]それぞれ1秒を44100とした時間で 指定します。連結部を長くすると、例えば「あ」から「い」 への変化などを聞くことができます。
[子音部]は試験中なので気にしないでください。

声質のパラメータも細かく変更可能です。値の効果に関しては ▲アンチフォルマントによる音声合成 を参照してください。

声質のパラメータは予め用意した幾つかのセットの中から選択できます。
喋らせる文字列も幾つか用意しました。

アクセントおよびイントネーションは適当に簡単なアルゴリズムで付けています。 このようなものでも人間は絶対平板なイントネーションで 発話することはないということは重視すべきです。

 出力データの解析

「あいうえお」と発声させたデータをAdobe-Audition3でフォルマント解析 してみました。


aiueo_07_02.wav

今回使った仕組みから言って当然なのですが、周波数帯を上下2つに 分けるアンチフォルマント渓谷がはっきりと見えます。

 F1,F2を変更せず声の高さを変える

F1,F2は変更せず音の高さを変えたものを載せます。(「音の高さ」0.8->1.4に したものです)
周波数は変わってもアンチフォルマント渓谷の位置に変化がないことは分ります。 (一般的に言われるピークとしてのフォルマント周波数は位置が変わります)


aiueo_07_05.wav

 平板イントネーション

アクセント、イントネーションを平板([flat]をon)にしたものを載せます。
周波数は変化しないまま各帯の強弱がアンチフォルマント渓谷を作っていることが 分ります。


aiueo_07_06.wav

 周波数帯の上部と下部

アンチフォルマント渓谷の上側、即ち一般に言われる第2フォルマント(F2)、 が無くとも「あいうえお」とは聞き取れるようです。明瞭さは失われます。
同じF1であってもF2の選択により聞き分けることはできますが、F1の選択に あたってはF1(と崖の傾き)のみで区別が可能なものを重視すべきでしょう。
「あ」と「お」は高域不要で「え」のみが高域を必要としている ようにも聞こえます。「い」もほんの少しあった方がよい。


aiueo_07_03.wav

因みにアンチフォルマント渓谷の下側を削除した場合は母音として聞き取ることは できません。


aiueo_07_04.wav

###

2011/7/19
パラメタセットを幾つか用意して選択できるようにした。

2011/7/20
F1とF2の割合を音毎に設定できるようにした。

|

« ▲アンチフォルマントによる音声合成 | トップページ | ◆膨らんではじけるブラックホール »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック


この記事へのトラックバック一覧です: ▲連続する母音を滑らかにつなぐ音声合成:

« ▲アンチフォルマントによる音声合成 | トップページ | ◆膨らんではじけるブラックホール »