settings module

Settings 各種定数や初期値の設定

settings.FLAGS

使用するフラグの設定。

Type

flags.Flags

settings.PYWORLD_F0_FLOOR
worldでの分析するf0の下限
デフォルトでは71.0
Type

float, default pw.default_f0_floor

settings.PYWORLD_F0_CEIL
worldでの分析するf0の上限
デフォルトでは800.0
Type

float, default pw.default_f0_ceil

settings.PYWORLD_PERIOD
worldデータの1フレーム当たりの時間(ms)
デフォルトでは5.0
Type

float, default pw.default_frame_period

settings.PYWORLD_Q1
worldでスペクトル包絡抽出時の補正値
通常は変更不要
Type

float default -0.15

settings.PYWORLD_THRESHOLD
worldで非周期性指標抽出時に、有声/無声を決定する閾値(0 ~ 1)
値が0の場合、音声のあるフレームを全て有声と判定します。
値が0超の場合、一部のフレームを無声音として判断します。
本来の初期値0.85はharvestと組み合わせる前提で調整されていますが、
UTAUでの合成では1回でも判定ミスがあるとストレスなので0にしています。
Type

float, default 0

settings.USE_PYWORLD_CACHE
wavファイルと同一個所に、.npzファイルがあれば、wavの読み込み・f0,sp,apの解析を省略します。
Trueにすると、2回目以降の処理が早くなりますが、設定ファイルが存在しない1回目はより時間がかかるようになります。
実装しましたが、期待したほど高速化しない上にnpzファイルのサイズが大きいため、Falseにしておきます。
Type

bool, default False

USE_D4C_FILE: bool, default True

wavファイルと同一個所に、.d4cファイルがあれば、apの解析を省略します。
Trueにすると、2回目以降の処理が早くなりますが、設定ファイルが存在しない1回目はより時間がかかるようになります。
d4cファイルは、wavの20倍程度の容量になります。ファイルサイズが気になる場合は、Falseにしてください。
A4FRQ: float, default 440

基準となる音高

TONE_NUM: dict

UTAUから渡される音高名をnotenumに変換するための辞書
notenumはC1=24、C#1=25...B7=107で、以下の式で与えられる。
>>> notenum = (octave+1) * 12 + TONE_NUM[key]

PITCH_EFFECTS: list of effects.base.PitchEffectBase

ピッチ処理時に適用するエフェクトのクラスを指定する。

F0_EFFECTS: list of effects.base.EffectBase

synthesizeでf0に適用するエフェクトのクラスを指定する。

SP_EFFECTS: list of effects.base.EffectBase

synthesizeでspに適用するエフェクトのクラスを指定する。

AP_EFFECTS: list of effects.base.EffectBase

synthesizeでapに適用するエフェクトのクラスを指定する。

WORLD_EFFECTS: list of effects.base.WorldEffectBase

synthesizeで適用するエフェクトのうち、f0,sp,apの複数のパラメータを変更するクラスを指定する。

OUT_WAVE_EFFECTS: list of effects.base.EffectBase

synthesize後のwaveに適用するエフェクトのクラスを指定する。

OUTPUT_BITDEPTH: int, default 16

出力するwavのビット深度。8, 16, 24, 32のいずれかでなければなりません。

DEFAULT_FRAMERATE: int, default 44100

扱うデータのサンプル周波数