VOCALOID入門

パラメータ設定の実例 その4

下行するピッチの制御

←前ページ  目次  次ページ→

 具体的な問題点を取り上げ、パラメータを修正してこれらを 解決する方法を示します。
 パラメータが相互に影響し合う様子を見て頂くために、 欠陥のある解決法もあえて取り上げ、その問題点を解決します。

下行音の発音が不自然になる

 この例では、「さびしぃさ、ときどぉきは」の 「も」の音がどうにも不自然です。




下行音が不自然になった例
聞いてみる

 スペクトルで見ると、赤い四角で示すように、 「さ」→「も」にかけてピッチが滑らかに変化してしまっており、 その影響で「も」の先頭のピッチが吊り上っています。
 しかし、このとき、下図に示すように、「下行形でポルタ メントを付与」はONにはしていません。


表情コントロールプロパティ

 つまり、たとえ「ポルタメントを付与」がOFFで あっても、音程はある程度滑らかに変化するので、特に、 大きく音程が下行するときは、その影響で、後続音の 先頭部が吊り上って不自然な発音となります。

解決策1:ベンドの長さを0にする

 ピッチ変化の速度はベンドの長さで制御されていますので、 これを0に設定すれば、ピッチの変化が迅速になり、不自然さ が多少緩和されます。


表情コントロールプロパティ

聞いてみる

 しかし、この例のように、ベンドの長さを20から0に変更 しても、ピッチ変化速度の向上度合いは僅かです。とはいえ、 聴感上はかなり改善します。最も一般的な対策だと思われます。

解決策2:ベロシティーを大きくする

 ピッチ変化の速度はベロシティでも制御されていますので、 これを大きくすれば、ピッチの変化が迅速になり、不自然さ が多少緩和されます。


表情コントロールプロパティ

聞いてみる

 しかし、この例のように、ベロシティを96から127に高め ても、ピッチ変化速度の向上度合いは僅かです。ベンドの長さを 0に設定してもピッチ変化速度が遅い場合に併用すると多少の効果 があります。

解決策3:ポルタメントポジションを早める

 ピッチ変化の開始時間はポルタメントポジションで制御されていますので、 これを小さな値に設定すれば、ピッチの変化が早めに生じ、 下行音は、基準ピッチから開始します。ただし、先行する音 の後半はピッチが垂れ下がります。



ポルタメントポジションを早める
聞いてみる

 コントロールトラックに赤枠で示す部分でポルタメント を早めています。その結果、スペクトラムに赤枠で示すよう に、下行音は基準ピッチから発声されています。
 この場合、先行音「さ」の後半が垂れ下がることが、効果的 であるかどうかを判断する必要があります。もし、効果的であ れば、この対策が適用できます。この例では(好みの問題ですが)この対策はそれな りの効果をあげているようです。歯切れの良さが求められる場合には 不適な対策です。

解決策4:上の1,2,3を組み合わせて対策する

 先行音の尾部もできるだけ垂れ下げたくない、という場合は、 ベンドの長さを0にし、ベロシティーも最大にした上で、 ポルタメントポジションを多少前へ移動させます。


総合的に対策を行う
聞いてみる

 スペクトラムを見ると、ポルタメントポジションのみで対策した 場合に比べて、先行音末尾の垂れ下がりが少なくなっています。( ピッチ変化が迅速になっています)解決策3にくらべて、多少歯切れがよく なります。

解決策5:ギャップを設ける

 これは、異なるタイプの解決法です。先行音と後続音の間 にギャップを設けると、後続音の 頭部のピッチの吊り上りが緩和されます。
 ピッチ変化の速度が速くなった訳ではなく、ギャップに よってポルタメントポジションが多少前に移動し、加えて 後続音先頭のピッチ変動部が、ギャップとして発音されない と考えた方が良さそうです。
 デュレーションを変化させるだけの簡単な解決法ですが、 音が途切れますので、そのような曲想である場合にだけ 適用できます。



ギャップを設ける
聞いてみる

解決策6:ピッチベンドを用いて音程変化させる

 ピッチベンドを使用すると任意の速度で音程変化を行う ことができます。ここでは、「も」→「と」にかけて、900セント(半音9個分)ピッチが 下がっていますから、ピッチベンド感度(PBS)を9に設定し、ピッチ(PIT) を中央(0)から、最下部(8192)まで変化させます。




ピッチベンドによる音程変化
聞いてみる

ピッチは瞬時にして(あたりまえですが)変化し、後続音の音程も非常に安定していますが、音声は非常に機械的になります。
 原因は2つあります。1つ目は、ピッチベンドで行った音程変更は発声には 反映されないと言うことです。つまり、初音ミクはG2で発声してい るものの、フォルマント(口の形/声道周波数特性)はE3を発声する状態に 設定しています。これによって、本来の初音ミクではない声になっています。
 2つ目は、ピッチが人間に不可能な速さで変化していることです。これによって、 音素片合成のような、つまりロボット的な声になっています。
 上の2つの問題のうち、1つ目ははPITを徐変させることで解決できますが、 1つ目は根本的な問題ですので、回避できません。従って、この方法は、笑いを 取る目的などに限定して適用できるといえます。

解決策7:ピッチベンドで音程変化を補正する

 上の解決策6では、ピッチベンドだけで音程を変化させると、発声ピッチと口の形が合わなくなり、不自然な発音となることがわかりました。
 そこで、音程は音符で変化させておき、変化の速度だけをピッチベンドで補正して 方法を説明します。
 先行音でピッチが下がり始めるあたりから、PITを上昇させます。先行音が終わる と即座にPITを下げ、後続音のピッチが吊り上っている分を補正するように、 PITを再び上昇させます。



PITを用いて、音程変化を極限まで加速した例
聞いてみる

 上の例は、迅速にピッチ変化することだけを目指してPITを使用して います。 スペクトログラフを見ると、ピッチが瞬時に変化しています。 しかし、人間の発声ピッチは瞬時に変化することは無い ので、早すぎて不自然になっています。補正過剰な状態と言えます。
 そこで、ピッチの変化速度はそこそこに抑えて、これに、後続音の ダウンベンドが生じるようにPITの曲線を変更たのが下の例です。



PITを用いて、音程変化を加速し、後続音にダウンベンドを加えた例
聞いてみる

 このようにすれば、単にピッチ変化を高速化した場合より自然です。 後続音にダウンベンドが必要か否かは、曲想によります。
 この対策は手間が掛かるのが欠点ですが、上で説明した解決策3等では、 歯切れが悪くて困る場合に利用できます。



ご自由にリンクを設定してください。バナーもご利用頂けます。