パワースペクトルの変換に関するメモ
かなり久しぶりだけど、うまくは行ってないのでアイディアのメモだけ。
今の変換の問題の話
今はパワーを の範囲に正規化1ための として、 を使っている。これは 2 で 。
ただこれだと、畳み込み層の padding が 0 埋めのせいで、スペクトログラムの縁がすごいパワーが高い感じになってしまう。そのため、 な関数を使いたい3。
これは単純に とすれば良さそうだ。計算コストも安そうだし(楽観主義)。
さて、そうと決まれば派生した話をしなきゃいけない。学習した値からパワーに戻す方法と、inf が出ないようにする方法だ。
inf が出ないようにする
深層学習では基本的に一箇所でも inf が出てしまうと、芋づる式に全ての値が inf と NaN で埋め尽くされてしまう! これを回避するために、例えば を に変えたりする(ただし、 は とかの適当な小さな値)。
個人的な趣味で下界を維持したいから、次のようにする。
パワーに戻す
softplus の値域は で、是非ともこれをパワー に戻したい。使う式の逆だ。
これでいいだろう。
最後に
新しい式は決まった。これで padding のせいで値が変になるなんてことはないだろう(予想の上では)。
今から新しい式を使って学習してみようと思う。
良さそうだったら今度報告するね。バイバイ!