数値計算ソフトを使って音声の波形の生成を理解する　その4 摩擦音の「さ」音の生成

<音声の波形の生成を理解する>

その4：　2管声道モデルと乱流音の代用ノイズ源による摩擦音の「さ」音の生成のこころみ

２つの管（チューブ）をつなぎ合わせた模型と、乱流音を代用するノイズ音源を使って「さ」の音の生成を実験してみた。
音としては、先行するノイズ音とそれに続く母音の音から合成される。
先行するノイズは、「か」の場合は口内を舌で狭め強い圧力を一瞬かける短期的なものであるのに対して、「さ」は歯先に息を吹きかけて発生させる乱流音のため高い周波数になり、状態が持続的である。

後続の母音部分の作成

時間経過とともに管の断面積と長さが変化する、２つの管（チューブ）をつなぎ合わせた模型を使って母音の部分を生成する。
口を閉じた状態(start)から、「あ」の発生の状態（target)まで、時間変化させる。

管の断面積と長さの時間変化を下図の示す。

この条件で生成した波形は以下の様になり、音(wav)になる。

先行するノイズ部分の作成

乱流音を代用するノイズには、息の吹きかけによる息の速度の上昇の影響と、乱流が発生する場所の周囲との共鳴効果が考えられる。（子音の発生を参照のこと）
まず、息の速度の加速上昇による乱流音、つまり、時間経過とともに周期が短くなる（周波数が上昇する）ノイズ音を、パーリンノイズの手法を応用して作成してみた。
例えば、「ふー」音の息を吹きかける感じを再現するためには速度上昇が不可欠である。下図が作成した波形であり、時間の経過とともに信号の周期が短く（より密）になっていることが分かる。音(wav)になる。

歯先の乱流音は高い周波数の成分が期待される。パーリンノイズの手法を応用して作ったノイズは低域成分を多く含むため、ハイパスフィルター(High pass filter)を掛けて高い周波数への狭域化を行う。下図は、Audacityのスペクトラム表示を利用して作成した、元の低域成分を含んだ広帯域なものと、高い周波数へ狭域化したもののスペクトルの比較である。

狭域化したノイズの波形は下図の様になり、音(wav)になる。

そして、このノイズに、２つの管（チューブ）をつなぎ合わせた模型を使って、共鳴の効果を付加する。
２つの管（チューブ）をつなぎ合わせた模型の音源としてこのノイズを使い、管の共鳴効果のある出力をえる。
下図は、効果を付加した波形。更にその下は、波形の矢印の部分の（局所的な）スペクトルの一例である。（スペクトルは場所によって変動する。）赤丸のピークは共鳴効果によってあらわれたものである。

少し「す」の感じがする音(wav)になる。

先行するノイズ部分と母音部分の合体

人間の耳は不連続な音の変化に敏感なので、ノイズ部分と後続の母音部分が滑らかにつながるように、波形一部を加工して、つなぎ合わせる。
下図が合体した波形である。

この波形の音は「さ」の音に似た音(wav)になる。

参考までに、2管声道モデルと乱流音の代用ノイズ源による音の生成のpythonプログラムをおいておきます。使い方はzipファイルを解凍した中にあるREADME.txtを見てください。

No.2 2019年2月3日