minelaru

【UTAUコラム】なぜ、連続音の先行発音とオーバーラップは全て同じ値にした方がいいのか

Added 2019-05-04 15:29:30 +0000 UTC

収録時、bpm が一定である方が声が安定するから

…というのが、ともかく、めんどうな説明を一切省いた最も単純な答えになるのですが、それとは別にちゃんとした理由があります。

「fransing を用いた音源」あるいは「多音階で低い音になるにつれて遅い bpmで録るようにする音源」などなど…、音源内で bpm が一定でない音源だとしても、先行発音とオーバーラップは一定にした方が良いです。

（もちろん、右ブランクも同じだと良いですが、例外があります。後述）

先行発音とオーバーラップが一定でないと…

例えば

「はてしない」

という歌詞のブロックがあったとします。これは、UTAU 上だと

[- は] [a て] [e し] [i な] [a い]

という連続音表記になって分かれると思いますが、

「『て』でもっとハキハキさせたい」し、

「『な』をもっと溜めたい」

と思ったとします。すると、

　　　[- は] [- て] [e し] [i ん][n な] [a い]

のように「て」と「な」の部分を変更することになると思います。

でも、このノートに設定されているのは変更前のエイリアスの原音設定の値になります。

変更によって原音設定の各パラメータが変わってしまうために、発音のタイミングがずれたり、エンベロープの形が不正になったりするのです。

こういった例以外にも、作曲してる方が制作途中で歌詞を変えようと思ったときにも起こりうる問題ですよね。

一定にすると

上の例の場合、[- て]で、すべて一定であれば、エンベロープを削って使えば、パラメータを気にすること無く[- て] [a て] [i て] [u て] [e て] [o て] [n て]のなんと６種類から選んで使えたりできます。（もともと連続音の特性ではありますが）

ここで、なにが嬉しいかというと、エイリアスを切り替える度に発音のタイミングは変わらず、エンベロープもそのまま使えるので、先行発音とオーバーラップは音源内ですべて同じ値にした方が良いんですね。

他にも、こういうテクニックとしては[- は]に関して言えば、[n は]や[u は]に代えたりして、"タメ"を作るようにすることもできますよね。

なので、

連続音の原音設定をするときは、全てのエイリアスの先行発音とオーバーラップを同じ値で作った方が、音源をエイリアス変更に強いものにできる。

ので、音源内では共通の値にした方が良いね。というお話でした。

…

余談（右ブランクについて）

　右ブランクも、基本的には同じ値（マイナス表現のもの）にした方がいいです。

例えば、「ばばびばぶべば」で[e ば]だけ長く録れていた、からといって[e ば]の右ブランクだけ伸縮範囲を多く録るために右ブランクを右にずらすのは良くないです。

なぜかというと、もし「べーーーばーーー」と歌う歌があったときに「べ」と「ば」で音声に乗る伸縮ノイズの具合に差が出てしまいます。

　ただ…、これは微妙な部分があって、もし歌が「べばーーーー」だったときは、「ば」の方にだけに伸縮ノイズが乗る…ということになるので、こういうときは右ブランクを変更した方がいい、例外になってきます。

　基本的には伸縮ノイズの具合を均一化させるために右ブランクは固定である方がいい…と思っています。（あくまで「思う」ということにとどめています。）

上の「はてしない」の例であったように、特定の音素でだけパラメータが違う、となると変更したときに音の"感じ"にばらつきがでてしまいます。

　が、「それが良い」としたり「あえて右ブランクに余裕があるエイリアスをチョイスするように調整する」というのもアリとは思います。

（でも、それに関して「長いものが欲しい」というだけなら、下で言及しているロングトーンを別で録った方がいいのでは？と思います。）

ただまぁ、収録に適するBPMの記事↓で検証したように、確率の話ではbpm125や100で録れば90%くらいで劣化がおこらないはずなので、やはり、右ブランクをひとつひとつ変えるという必要性は薄いかなと感じます。

fanbox post: creator/34949409/post/478889

余談２（ロングトーン）

あらかじめ「あーーーーーーーーーーーーーーーーーーーーーーーーーーー」などの音素を録っておいたりするのをロングトーン音源と言ったりします。

で、例えば

「べーーーばーーー」

と歌わせるときに起きる、伸縮ノイズを低減させる為に

[- べ] [e え長] [e ば] [a あ長]

というような形で、長く収録した母音を間にクロスフェードさせる手法があります。

ただやはり、うまく音素がクロスフェードしなかったり、[a あ長]をやたらと使ってしまうとロボ声っぽくなってしまうことがあるので、なんともいえないです。

（逆にそこは、ユーザの腕の見せどころになるのかもしれませんが）

余談３（ロングトーン連続音）

あるいは、そもそも[e ば]とか、全部をめちゃくちゃ長く発声するというで伸縮ノイズを低減させるアプローチもあります。

かつて、２モーラ連続音で、２モーラ目をめちゃくちゃ長く録ってみるという音源を録ってみたことがあったんですが↓

・こんな感じの声になります。

2mora

・比較用のfloatで同じustを歌わせたものです。

float

たしかにこう聴くと、通常の音源に比べれば、当然、劣化はめちゃくちゃ少ないんですが……こういった遅い歌の為だけに長く録ったり、右ブランクを変更するのはほんと時間がやたらかかるだけなので、やっぱ微妙かなぁ、と…

どちらかというとロングトーン音素の方がまだ現実的です。

↓一応限定で配布してます

fanbox post: creator/34949409/post/399467

ちなみに、2モーラ連続音のustはこんな感じの専用の語尾になっています。

この、２モーラにしたメリットが、（そうじゃないと息が保たないというのもありますが）各aiueonに対応する語尾息が、すべて専用のものにできるという点があるのです。でも、音素名がわかりづらいし、トータルで見るとやっぱり収録効率がうーんという感じのもあってやっぱり無いかなぁという感じの。

21/6/20 記事をリファインしました

(Fanbox)

【UTAUコラム】なぜ、連続音の先行発音とオーバーラップは全て同じ値にした方がいいのか

More Creators

The AnKing

patreon

skiny

fanbox

Drew Gardner

gumroad

狗查查

fanbox

elinanoodles

patreon

Glidus

patreon

vanillavelvetaudio

patreon

flowerxl

patreon

FallQM

patreon

ricon

patreon

zinfian

fanbox

Futile3D

patreon

Takoro

patreon

Wiriya Tumme

patreon

authenticsound

patreon

megusuri

fanbox

Ragged

patreon

watari1118

fanbox

R1anochka

boosty

gucchiann

fanbox

u77

gumroad

Ad Interim

patreon

PA5510N

fanbox

Ken8696

patreon

dirtymansfm

fanbox

Lofii

patreon

The Paranoid Pumpkin

patreon

Skulltitti

gumroad

the-never-were

fanbox

Pandam

patreon

Motion By Scott

gumroad

Sir Rumple

patreon

gon

patreon

Victoria Evans

patreon

Yamwamm

patreon

fastvass

patreon

Remy Rock

gumroad

Idlecum

fanbox

robertc4112

fanbox

vaneroku

fanbox