
VOCALOID入門
特性を活かした楽な使い方の実例2
簡易なエンベロープ(ダイナミクス)の制御
←前ページ
目次
ここで説明すること
エンベロープ(振幅の変化)は歌に抑揚を与える重要な要素
です。ここでは、直線を用いて行う簡単なダイナミクス設定で、
エンベロープを効果的に制御して、歌唱に抑揚を与える方法を
紹介します。
つまり、ここでは理解し易く、操作し易い方法でダイナミクスを制御
して、抑揚の効いたボーカルを得る方法を検討して紹介します。
ところで、エンベロープ形状(抑揚)は、ダイナミクスだけではなく、
他のパラメータによっても制御されます。このため、ダイナミ
クスだけを調整しても、希望のエンベロープが得られない場合
もあります。また、折角設定したダイナミクスが、他のパラ
メータの変更によって台無しとなる場合もあり得ます。
そこでこのページでは、先ずエンベロープ形状に影響を与える
「ディケイ」や「アクセント」の作用について詳しく説明します。
続いて、直線で単純化したダイナミクス調整の方法を解説します。
そして最後に、それを歌唱に応用した実例を紹介します。
このページで引用している各種のデータは音声合成による歌唱生成の研究目的に限ってご利用ください。
エンベロープに影響するパラメータ
ディケイとアクセントはエンベロープに大きな影響を与えるパラメータ
です。
ディケイで生じるエンベロープ形状の変化
「最初は勢い良く、次第に弱くなる」というエンベロープが歌唱におい
ては良くみられます。このように発声することで、音の情報が集中
している音頭部が強調され、歌詞が明瞭になり、また、弾むような
力強い抑揚が得られます。ディケイは自動的にこれを行うパラメータです。
下の例は同じ「る」の音に、ダイナミクスの変化を与えない
状態で、ディケイだけを変化させて発音させたものです。


ディケイによるダイナミクスの変化
左0% 中央50% 右100%
(上段:ベンドの長さ10、下段:ベンドの長さ100)
聞いてみる
上の図に白い線で示すのが、エンベロープ形状です。
前のページで既に説明したように、ディケイの値を大きくすると、
エンベロープは時間とともに減衰して行きます。
また、上下の波形を比較して分かるように、減衰に要する
時間は「ベンドの長さ」の影響を受けません。
ディケイによって生じるエンベロープ形状を詳細に観察すると、
下図に示すように、3つの区間があることが分かります。
(ディケイ50%の例です)

ディケイによるダイナミクス変化の形状
上図の@の区間はエンベロープが減少し始める区間で、減少速度は
少しだけ緩やかです。Aの区間はエンベロープが減少する区間
です。Bの区間はエンベロープが安定する区間で、一定の値を維持、
あるいは、ゆっくりと減少します。ディケイの値を変化させると、
図に白矢印で示すように、エンベロープ形状が変化します。
細かい事に目をつぶって、大雑把に言えば、次のように整理できます。
・減衰する「ア」の区間と、一定値を保つ「イ」の区間がある
・「ア」の区間の時間はディケイに関係なく一定(1.2秒程度)である
・「イ」のレベルがディケイの値によって変化する
アクセントで生じるエンベロープ形状の変化
音の出始める一瞬を強く発声することで、発音がはっきりし、
元気良くなります。アクセントは自動的にこれを行うパラメータです。
下の例は同じ「る」の音に、50%のディケイを与えた
状態で、アクセントだけを1〜100%に変化させて発音させたものです。

アクセントによるエンベロープの変化
上0% 中央50% 下100%
聞いてみる
上図を見ると、アクセントを大きくすると、音の先頭部の極僅か
な時間(0.1秒程度)のエンベロープが増強されることが分かり
ます。
下図はアクセントで生じたエンベロープの変化と、ディケイで生じた
エンベロープの変化を赤と白で色分けして示したものです。

アクセントとディケイの関係
赤線:アクセントによるダイナミクス変化
白線:ディケイによるダイナミクス変化
白い線で示すディケイが緩やかにエンベロープを減少させるのに対して、
赤い線で示すアクセントは音の出始める瞬間のエンベロープだけを
増強していることが分かります。
ダイナミクスによるディケイとアクセントの表現
このように見てゆくと、ディケイやアクセントは、コントロール
トラックを用いたダイナミクスの設定で近似的に表現できることが分
かります。


ダイナミクスによるアクセントとディケイの表現
左:アクセント100%/ディケイ100%
右:アクセント0%/ディケイ0%として、ダイナミクスで調節
聞いてみる
上図の左側がアクセントとディケイでエンベロープを制御した
例で、右側はアクセントとディケイは使用せずに、ダイナミクス
で同様にエンベロープを制御した例です。
波形を見ると、左右のエンベロープはかなり似ています。しかし、
発声を聞いてみると、ダイナミクスで調節した場合は後半の音の
倍音が乏しくなっているのが分かります。これは、ダイナミクスが
音量だけではなく、音質も調整するためです。
ダイナミクスの調整
VOCALOID2ではフリーハンドで描いた自由曲線でダイナミクス
を指定することができるので、きわめて微妙な抑揚の制御が可能です。
しかし、自由曲線はとらえどころがなく、これを使いこなして
意図した抑揚が表現できるまでに、かなりの訓練を要します。
そこで、ここでは、ダイナミクスを、直線で構成される単純な形状
で表現することで、手軽に、かつ、ある程度効果に抑揚表現を行う方法を
検討します。
もちろん、この方法に慣れれば、次の段階として自由曲線による
抑揚表現に進むことも容易です。
ダイナミクスの基本形
操作と理解を容易にするために、ダイナミクスの形状を次の3つに
整理します。


ダイナミクスの3つの基本形
左:T形 中央:U形 右V形
聞いてみる
便宜上これらに名前を付けます。
T形:最初が大きく、次第に小さくなる(所謂デクレッシェンド)
U形:初めと終わりは小さく、途中で大きくなる
V形:初めは小さく、次第に大きくなる(所謂クレッシェンド)
3つとも、基本は3角形で、山の頂上の場所が前後に変化している
だけです。
「短いT形」と各基本形の組み合わせ
T形のダイナミクス(の短いもの)は、発音を明瞭に
するために、他のダイナミクスと組み合わせて使用されます。


ダイナミクスの3つの基本形
左から 短いT形 短いT形+T形 短いT形+U形 短いT形+V形
聞いてみる
T、U、Vのいずれも形も、先頭に短いT形を組み合わせることで、
アタックが強調されます。
音量とダイナミクス変化量
通常のフェーダー(ミキサのスライド)はdBで効くように
設計されているため、たとえば5mmだけつまみを動かせば、
音量が大きい(スライドが上の方にある)ときも、小さい
(スライドが下の方にある)ときも、ほぼ同じ音量変化が得ら
れます。
しかし、VOCALOID2のコントロールトラックの
ダイナミクスは、線形に(dBで効くのではなくて、形の通りに)
音量を制御します。このため、画面上でダイナミクスを
5mm変化させても、
ダイナミクスの大きいときは、効き目が小さく、
逆にダイナミクスの小さいときは、効き目が大きくなります。


音量とダイナミクスの変化
左:音量音大きい場合 中央と右:音量の小さい場合
聞いてみる
上の図の赤い矢印で基準のダイナミクスを示しています。
@は基準のダイナミクスが大きい場合、AとBは小さい場合です。
抑揚を付けるために白い矢印で示すダイナミクスの変化(U形)
を付与していますが、基準のダイナミクスの小さなAの場合、
@と同じだけの変化(白い矢印で示す)を付与すると、効果が過剰
(黄色い矢印で示す)になります。
この場合、基準のダイナミクスの大きさに応じて、Bの白い矢印のよう
に少なめに変化を付与することで、@と同程度の抑揚が生じます。
つまり、同じ抑揚を得るために付与するダイナミクスの変化量は、
基準のダイナミクス高い部分では大きく、低い部分では小さくします。
音群に対するダイナミクス付与
ダイナミクスは一つの音(ノート)について設定する
場合もありますが、複数の音の集合(音群)を一つの音とみなして
設定する場合もあります。


音群に対するダイナミクス設定
聞いてみる
上の例では、単音「る」に対してダイナミクスを付与するのと
同様に、音群「あいして」に対してT形とU形のダイナミクスを
付与しています。
ダイナミクスによる音量補正
VOCALOIDでは、音程や歌詞等によって、音量に変動が生じます。
これは、歌詞によって決まる声道の周波数特性に、発声する音程が共鳴
する場合もあれば、そうでない場合もあるからだと思われます。(推測)
人間が歌う場合は、これによる音量の差は無意識に補正したり、
声帯が声道と共振してある程度同調したりしますが、
VOCALOIDの場合は(ある程度は補正されているようにも思え
ますが、強引にピッチパルスを印加しているようなので(推測))
利用者が意識的に音量を補正する必要があります。


歌詞や音程による音量のばらつき
聞いてみる
上の例は、適当に「あいしてる〜」と歌詞入力したところですが、
波形を見ると、「あ」が大きく、続く「い」は小さくなっています。
もちろん、それが効果的(聴いて心地よい)場合は問題ありませんが、
歌詞や音程による望ましくない音量の変化がある場合はダイナミクスを
増減して補正する必要があります。
たとえば、「あ」を小さくする場合は次のようにダイナミクスを調整
します。


ダイナミクスによるエンベロープ音量補正
聞いてみる
歌唱のダイナミクス調整例
実際の歌唱にここで説明した簡易なダイナミクス付与を応用した例を
サンプル曲を使って紹介します。
ダイナミクス付与の作業は、一番盛り上がる部分(サビ)から初めて、
順次その前後に作業範囲を広げてゆくとうまく行きます。
歌唱のダイナミクス調整例1
この曲で一番盛り上がるのは、次の部分です。


サビ部へのダイナミクス付与
聞いてみる
図に黄色の四角形@とAで示す区間は無音期間なので、その間の
ダイナミクス変化は音声に影響を与えません。
最初に、上図に緑の矢印で示す、大まかな音量の増減をイメージ
します。
複数の音符を「一気に歌う感じ」がする部分は、「音群」と
考えます。この部分では図にB等の橙色の四角形で示すで示すよう
に、6箇所あります。
カラオケを歌うつもりで、力を入れるところを見極めて、図に
白い線で示すダイナミクスを付与して行きます。音の先頭に力が
入っていればT形、真ん中で力が入ればU形、後ろならV形とします。
この例では、T形のダイナミクスが大部分で、V+T形と、
U+T形がそれぞれ一つ現れています。この例のように、元気の良い
部分ではT形が多くなります。もちろん、どのような形状を適用
するかは好みの問題です。
「せんごくまじん」の「ん」の音は、次に来る「ご」の音のダイナミクス
が大きいので、それに引っ張られて後ろが大きくなり、V形になっています。
このように、次に大きな音が来る場合、その前の音が影響を受けて
V形が発生する場合があります。
最後の音群のダイナミクスはちょっと特殊で、一つの音にU+TとUの
2つのダイナミクスを与えています。この2山現象は歌い終わりの長い音符
に時々見られる現象です。
歌唱のダイナミクス調整例2
盛り上がりの前の部分は次の通りです。


サビの手前部分へのダイナミクス付与
聞いてみる
ここでも同様に、ダイナミクスを付与します。U形が2箇所に現れて
いる他はT形を使用しています。音群は8箇所にあります。
歌唱のダイナミクス調整例3
同様にして、曲全体にダイナミクスを付与し、カラオケと
ミックスして出来上がりです。


サビと導入部のダイナミクス付与
カラオケとMIXして仕上げる
聞いてみる
バックコーラスやカラオケとMIXして、出来上がりです。
上図の波形はカラオケ等を含んでいます。
このページで紹介したシーケンスデータその他のご参考データはこちらです。
シーケンスデータ(.VSQ)やその他のサンプル(100Mバイト程度)
このページで引用している各種のデータは音声合成による歌唱生成の研究目的に限ってご利用ください。
ご自由にリンクを設定してください。バナーもご利用頂けます。
