settings module
Settings 各種定数や初期値の設定
- settings.FLAGS
使用するフラグの設定。
- Type
- settings.PYWORLD_F0_FLOOR
- worldでの分析するf0の下限デフォルトでは71.0
- Type
float, default pw.default_f0_floor
- settings.PYWORLD_F0_CEIL
- worldでの分析するf0の上限デフォルトでは800.0
- Type
float, default pw.default_f0_ceil
- settings.PYWORLD_PERIOD
- worldデータの1フレーム当たりの時間(ms)デフォルトでは5.0
- Type
float, default pw.default_frame_period
- settings.PYWORLD_Q1
- worldでスペクトル包絡抽出時の補正値通常は変更不要
- Type
float default -0.15
- settings.PYWORLD_THRESHOLD
- worldで非周期性指標抽出時に、有声/無声を決定する閾値(0 ~ 1)値が0の場合、音声のあるフレームを全て有声と判定します。値が0超の場合、一部のフレームを無声音として判断します。本来の初期値0.85はharvestと組み合わせる前提で調整されていますが、UTAUでの合成では1回でも判定ミスがあるとストレスなので0にしています。
- Type
float, default 0
- settings.USE_PYWORLD_CACHE
- wavファイルと同一個所に、.npzファイルがあれば、wavの読み込み・f0,sp,apの解析を省略します。Trueにすると、2回目以降の処理が早くなりますが、設定ファイルが存在しない1回目はより時間がかかるようになります。実装しましたが、期待したほど高速化しない上にnpzファイルのサイズが大きいため、Falseにしておきます。
- Type
bool, default False
USE_D4C_FILE: bool, default True
wavファイルと同一個所に、.d4cファイルがあれば、apの解析を省略します。Trueにすると、2回目以降の処理が早くなりますが、設定ファイルが存在しない1回目はより時間がかかるようになります。d4cファイルは、wavの20倍程度の容量になります。ファイルサイズが気になる場合は、Falseにしてください。
- A4FRQ: float, default 440
基準となる音高
TONE_NUM: dict
UTAUから渡される音高名をnotenumに変換するための辞書notenumはC1=24、C#1=25...B7=107で、以下の式で与えられる。>>> notenum = (octave+1) * 12 + TONE_NUM[key]
PITCH_EFFECTS: list of effects.base.PitchEffectBase
ピッチ処理時に適用するエフェクトのクラスを指定する。
F0_EFFECTS: list of effects.base.EffectBase
synthesizeでf0に適用するエフェクトのクラスを指定する。
SP_EFFECTS: list of effects.base.EffectBase
synthesizeでspに適用するエフェクトのクラスを指定する。
AP_EFFECTS: list of effects.base.EffectBase
synthesizeでapに適用するエフェクトのクラスを指定する。
WORLD_EFFECTS: list of effects.base.WorldEffectBase
synthesizeで適用するエフェクトのうち、f0,sp,apの複数のパラメータを変更するクラスを指定する。
OUT_WAVE_EFFECTS: list of effects.base.EffectBase
synthesize後のwaveに適用するエフェクトのクラスを指定する。
OUTPUT_BITDEPTH: int, default 16
出力するwavのビット深度。8, 16, 24, 32のいずれかでなければなりません。
DEFAULT_FRAMERATE: int, default 44100
扱うデータのサンプル周波数