
VOCALOID入門
コントロールトラック その1
←前ページ
目次
次ページ→
コントロールトラックと合成される音声の関係を
実際の分析結果に沿って説明します。とは言え、合成は
多くの条件を総合して行われますので、場合によっては
ここに示すものとは異なる動作を行います。
ベロシティ
ベロシティーは子音を短く弱く発音することで、
声の立ち上がりを早くします。
同時に、ピッチの遷移速度を上げ、早いフレーズに対応可能
な発声を行います。
通常のMIDI信号ではノートオンベロシティは音量を決める
要素です。しかし、初音ミクでは音量は変化せず、
子音の発音やピッチの遷移、音の立ち上がりを指定し、
フレーズの速に追従するための要素となります。



「さ」をベロシティを変化させながら発声(0、32、64、96、128)
上の例ではベロシティーを0から129まで全範囲で
可変しながら「さ」を発声しています。
母音部の振幅には大きな変化は発生していませんが、
先頭部の子音[s]には、ベロシティーによる変化が見られます。
エンベロープで見ると、ベロシティーが小さい程、子音部の振幅は大きく、長さも
長くなり、逆に、ベロシティーが大きくなると、子音部の
振幅は小さくなり、長さが短くなります。
スペクトルで見ても、ベロシティーが大きい程、子音部
(先頭部の高域のノイズ成分)が短く、弱くなっているのが
分かります。
つまり、ベロシティーは音量を変化させるのではなく、
子音を短く、弱く発音することにより、歯切れの良い、立ち上がりの
良い発音を行わせるためのパラメータです。



「え」をベロシティを変化させながら発声(0、32、64、96、128)
ベロシティは子音に影響するため、母音には大きな影響
を与えません。上図は母音「え」を0〜128のベロシティ
で発音させたものですが、エンベロープ、スペクトルともに
大きな変化は見られません。(ベロシティ0の場合だけ、
振幅が少し小さくなっているが、これは、初音ミクが歌い出し
の音を小さめに発音するためです)
音程を変化させながらベロシティの影響を観察すると、
ベロシティーがピッチ遷移速度をコントロールしている
様子が分かります。



ベロシティ:0
聞いてみる


ベロシティ:127
聞いてみる
歌の一節を異なるベロシティーで発声
上の実験データでは、ポルタメント設定はOFFと
なっています。(ベンドの長さは20)しかしながら、ベロシティが小さくなると、
ピッチの変化速度が遅くなり、大きなポルタメントが生じ
ます。逆に、ベロシティを最大にすると、殆どポルタメント
は感じられず、瞬時に後続音の音程に到達します。
エンベロープを見ると、ベロシティーが大きい方が、
音の立ち上がりやアタックが強調されていることが
分かります。
ダイナミックス
ダイナミックスは音量を設定すると同時に、
中高音域を増強し、聴感上の発声強度を
指定します。エンベロープやピッチには影響を
与えません。



「しょ」をダイナミクスを変化させながら発声(0、32、64、96、128)
ダイナミクスを変化させると、値に従って素直に音量
が変化します。ダイナミクス0では発音が止まります。
上図は母音「しょ」を0〜128のダイナミクスで発音
させたものですが、エンベロープを見ると、最初の音の
発音がありません。
ダイナミクスで音量以外の要素がどのように変化している
のかを調べるため、ダイナミクスを変化させて発音させた
データの音量が同じになるように、レベル調整した上で
分析しました。



「しょ」をダイナミクスを変化させながら発声(0、32、64、96、128)
すべての音の最大振幅が同じになるように、ツールにてレベル調整
図に赤丸で示す中音域がダイナミクスの増大によって
強調されています。高音域の強調は僅かです。
子音は、主に高音域にエネルギーが分布しているため、
ダイナミクスの増大にによって増強される程度は低いと
言えます。
以前、子音はダイナミクスの増大に比例して強く発音さ
れると記述しておりましたが、訪問者の方から貴重な
ご指摘を頂き、調査した結果、記述の誤りが発見され
訂正させて頂きました。ご指摘ありがとうございました。
ダイナミクスは音量と中音域の強調度合いを同時に制御します。
ブレシネス
ブレシネスはノイズ成分の割合を増加させ、
声の擦れた感じを出します。エンベロープやピッチに
は影響を与えません。



「か」をブレシネスを変化させながら発声(0、32、64、96、128)
ブレシネスが大きくなると、スペクトル上では
(横縞模様になって現れる)基本波とその高調波が
目立って減少し、上下に広く分布するノイズ成分が
増加しています。エンベロープ上でも、トゲトゲした
ノイズ成分の増大が観察されます。

ブレシネス0

ブレシネス100
「か」の母音部分の瞬時スペクトラム
母音部のスペクトラムを観察すると一層顕著に
ブレシネスの効果が観察できます。ブレシネス0(上図)
では、周期的にピークを示す周期成分が支配的ですが、
ブレシネスを100にすると、周期的なピークを示さない
ノイズ成分が支配的になっています。
ご自由にリンクを設定してください。バナーもご利用頂けます。
