Hintonら(2006)は高次元パラメータをもつ階層ボルツマンマシンを大規模データを用いて学習させることに成功した。 この学習アルゴリズムにContrastive Divergence Learningが用いられており、Hintonらはこれが重要なファクターであることを示唆したが、このContrastive Divergence Learningの理論背景は明確ではなかった。
既約なマルコフ連鎖は,唯一の定常分布をもつ。 しかし、マルコフ連鎖の訪れる状態数が大きいとき、その定常分布を陽に求めることは困難であり、定常分布がサンプルを生成する真の分布に近づくようにマルコフ連鎖のパラメータを学習させることは難しい。
本研究では、このようなマルコフ連鎖の定常分布を真の分布に近づけるための新しい学習法としてDetailed Balance Learning (DBL) を提案する。
ボルツマンマシンなどの離散分布においては、しばしば、同時分布を定義した時の正規化定数をパラメータの関数として陽に表現することが困難になる。 このようなモデルにおいて条件付き分布は、例えば、各離散変数が二値であれば二項分布であるように容易に求めることができる。 ここで提案するDBLは、このような条件付き分布を用いたギプスサンプリングによるマルコフ連鎖にも適用できるため、ボルツマンマシンなどの正規化定数の計算が困難な離散変数の分布の学習に適用できる。
また、この学習法はContrastive Divergence Learning (CDL)と密接な関係をもつ。
本研究では,マルコフ連鎖の定常分布を学習する方法としてDBLを提案し、DBLがCDLと密接な関係をもつことを示した。 今後、DBLの学習速度、収束性の改善を検討する予定である。