…というのが、ともかく、めんどうな説明を一切省いた最も単純な答えになるのですが、それとは別にちゃんとした理由があります。
「fransing を用いた音源」あるいは「多音階で低い音になるにつれて遅い bpmで録るようにする音源」などなど…、音源内で bpm が一定でない音源だとしても、先行発音とオーバーラップは一定にした方が良いです。
(もちろん、右ブランクも同じだと良いですが、例外があります。後述)
例えば
「はてしない」
という歌詞のブロックがあったとします。これは、UTAU 上だと
[- は] [a て] [e し] [i な] [a い]
という連続音表記になって分かれると思いますが、
「『て』でもっとハキハキさせたい」し、
「『な』をもっと溜めたい」
と思ったとします。すると、
[- は] [- て] [e し] [i ん][n な] [a い]
のように「て」と「な」の部分を変更することになると思います。
でも、このノートに設定されているのは変更前のエイリアスの原音設定の値になります。
変更によって原音設定の各パラメータが変わってしまうために、発音のタイミングがずれたり、エンベロープの形が不正になったりするのです。
こういった例以外にも、作曲してる方が制作途中で歌詞を変えようと思ったときにも起こりうる問題ですよね。
上の例の場合、[- て]で、すべて一定であれば、エンベロープを削って使えば、パラメータを気にすること無く[- て] [a て] [i て] [u て] [e て] [o て] [n て]のなんと6種類から選んで使えたりできます。(もともと連続音の特性ではありますが)
ここで、なにが嬉しいかというと、エイリアスを切り替える度に発音のタイミングは変わらず、エンベロープもそのまま使えるので、先行発音とオーバーラップは音源内ですべて同じ値にした方が良いんですね。
他にも、こういうテクニックとしては[- は]に関して言えば、[n は]や[u は]に代えたりして、"タメ"を作るようにすることもできますよね。
連続音の原音設定をするときは、全てのエイリアスの先行発音とオーバーラップを同じ値で作った方が、音源をエイリアス変更に強いものにできる。
ので、音源内では共通の値にした方が良いね。というお話でした。
…
右ブランクも、基本的には同じ値(マイナス表現のもの)にした方がいいです。
例えば、「ばばびばぶべば」で[e ば]だけ長く録れていた、からといって[e ば]の右ブランクだけ伸縮範囲を多く録るために右ブランクを右にずらすのは良くないです。
なぜかというと、もし「べーーーばーーー」と歌う歌があったときに「べ」と「ば」で音声に乗る伸縮ノイズの具合に差が出てしまいます。
ただ…、これは微妙な部分があって、もし歌が「べばーーーー」だったときは、「ば」の方にだけに伸縮ノイズが乗る…ということになるので、こういうときは右ブランクを変更した方がいい、例外になってきます。
基本的には伸縮ノイズの具合を均一化させるために右ブランクは固定である方がいい…と思っています。(あくまで「思う」ということにとどめています。)
上の「はてしない」の例であったように、特定の音素でだけパラメータが違う、となると変更したときに音の"感じ"にばらつきがでてしまいます。
が、「それが良い」としたり「あえて右ブランクに余裕があるエイリアスをチョイスするように調整する」というのもアリとは思います。
(でも、それに関して「長いものが欲しい」というだけなら、下で言及しているロングトーンを別で録った方がいいのでは?と思います。)
ただまぁ、収録に適するBPMの記事↓で検証したように、確率の話ではbpm125や100で録れば90%くらいで劣化がおこらないはずなので、やはり、右ブランクをひとつひとつ変えるという必要性は薄いかなと感じます。
fanbox post: creator/34949409/post/478889
あらかじめ「あーーーーーーーーーーーーーーーーーーーーーーーーーーー」などの音素を録っておいたりするのをロングトーン音源と言ったりします。
で、例えば
「べーーーばーーー」
と歌わせるときに起きる、伸縮ノイズを低減させる為に
[- べ] [e え長] [e ば] [a あ長]
というような形で、長く収録した母音を間にクロスフェードさせる手法があります。
ただやはり、うまく音素がクロスフェードしなかったり、[a あ長]をやたらと使ってしまうとロボ声っぽくなってしまうことがあるので、なんともいえないです。
(逆にそこは、ユーザの腕の見せどころになるのかもしれませんが)
あるいは、そもそも[e ば]とか、全部をめちゃくちゃ長く発声するというで伸縮ノイズを低減させるアプローチもあります。
かつて、2モーラ連続音で、2モーラ目をめちゃくちゃ長く録ってみるという音源を録ってみたことがあったんですが↓
・こんな感じの声になります。
・比較用のfloatで同じustを歌わせたものです。
たしかにこう聴くと、通常の音源に比べれば、当然、劣化はめちゃくちゃ少ないんですが……こういった遅い歌の為だけに長く録ったり、右ブランクを変更するのはほんと時間がやたらかかるだけなので、やっぱ微妙かなぁ、と…
どちらかというとロングトーン音素の方がまだ現実的です。
↓一応限定で配布してます
fanbox post: creator/34949409/post/399467
ちなみに、2モーラ連続音のustはこんな感じの専用の語尾になっています。
この、2モーラにしたメリットが、(そうじゃないと息が保たないというのもありますが)各aiueonに対応する語尾息が、すべて専用のものにできるという点があるのです。でも、音素名がわかりづらいし、トータルで見るとやっぱり収録効率がうーんという感じのもあってやっぱり無いかなぁという感じの。
21/6/20 記事をリファインしました