こんばんは。みなとです。
最近あつくてたいへんです。
UTAU の 3 つの要素
この度、nmasao1 さんの ust を全部で 249 個お借りして、さまざまな集計を行いました。
それに伴って改めてわかる、UTAU音源において重要なの 3 つの要素、
「音階」 「歌詞」 「長さ」
これらについて全3回分の記事で、以下の内容を書いていく予定です。
後の記事を書いたあとに加筆・修正するかも。
0.前提
0.1 ust の条件
1.音階 ←今回はここ
1.1 音階の登場頻度
1.2 音階の遷移の傾向
2.歌詞
2.1 新しく制作したリスト 「頻度重み順 CV-VC(V)」
3.長さ
3.1 最適な収録長
0.前提
ust をお借りした、とは言いましたが、全てをそのままお借りしたわけではないです。
おおむね以下の条件で除外や変更を加えています。
0.1 ust の条件
・ハモリの ust は除外
・セリフしかない、あるいは極端に短い ust も除外
・特殊な音素は都度修正
└例) 「息」 などを 「R」 に置換
…など完全にそのまま全部使用しているわけではないです。
そもそも手動で ust を若干整えるのが地味にしんどいので、これくらいの数で勘弁してください。
1.1 音階の登場頻度
まずは、というかこちらの図をご覧ください。
これが全ての結果です。
赤くしたところが、全 ust で最も使用されていた音階です。
G4 で、9815 回使われていました。
単純計算で、1 つの ust 内で 9815 / 249 ≒ 39.4 回 G4 で音源が使われるわけです。
使用した ust は大抵女声キーの歌だったので、これはつまり
「女声音源は最低でもG4は録っておけばOK」
ということや、
「男声音源はG4より上を録る意味はそんなにない」
ということが分かります。
あるいは、女声キーの歌をオクターブを下げての運用するという点においていえば
「男声音源では最低でもG3を録っておいた方がいい」
ということになるでしょう。
※下方向の劣化を意識するのであれば2, 3音下げても良いと思います。
1.2 音階の遷移の傾向
これは、ある音階からある音階への遷移を集計した図です。
小さくて見づらいですが、
例えば 60 (= C4) から 62 (=D4)へ移動した回数が 804 回だった。という図です。
(drive で共有した方がいいかな・・・?)
例として、67(G4) についてクローズアップして考察してみます。
この行の合計値は 8081 なので、
2017 / 8081 = 0.249... という算数から、
(G4) → (G4) と移動する確率は 25 % くらいということが分かります。
ここで 「UTAUにおいて、全音階程度の合成変形は誤差」 だということを考えると、
全音の範囲まで含んで、 (1454 + 834 + 2017 + 634 + 1559) / 8081 = 0.804...
つまり (G4くらい) → (G4くらい) と移動する確率は 80 %という風に考えることができます。
これを逆に捉えて、
「20 % くらいの登場頻度の音素の為だけに、音階を変動させる音源を録るのか?」
ということを考えたかったのです。
そして、ここで次回解説する予定の新しく制作したリスト 「頻度重み順 CV-VC(V)」 に繋がります。
これは、質と量のバランスを備えたリストになっています。