はじめに
動機は忘れたが、2値分類問題を解く方法の一つである「Probitモデル」について調べた。納得するのに手数を要した事柄について備忘録代わりにまとめておく。本記事で使う記号は英語版Wikipediaの記事に従う。
潜在変数モデルについて
潜在変数モデルでは、独立変数に対して潜在変数はと仮定される。
は標準正規分布に従う確率変数である。ただしの最初の要素は1に固定されている(これによって分布のオフセットを表現している)。従属変数は次の規則で決まるものと仮定される。
すなわち
最後から二番目の等号は、標準正規分布が原点に関して対称であることから成り立つ。また、は標準正規分布の累積分布関数である。
対数尤度関数が上に凸であること
以下に述べるように、対数尤度関数は大域的に上に凸である。このため、勾配降下法ベースの最適化アルゴリズムによっての推定値を計算できる。
独立変数と従属変数の観測値の組から最尤推定によりを推定するための尤度関数は次式である。
上式の対数をとり、対数尤度関数を得る(次式)。
これがに関して上に凸であることを示す。個々の項が上に凸であることを示せばよい。なぜならば、上に凸な関数の和もまた上に凸であるから。証明をさらに省力化するため、次の性質を使う。
最後から2番目の等号は標準正規分布が連続型分布であることから従う。はを原点に関して対称に折り返したものであるから、後者が上に凸であれば前者もそうである。
結局、がに関して上に凸であることを言うにはがそうであることを示せば良い。
を標準正規分布の確率密度関数とする。
であることは容易に判る(は半正定を表す)。を示す。 そのためにはとおいてであることを示せば充分である。 のときであること、およびは容易に判る。これとよりである。
以上よりであり、は上に凸である。ここに、は半負定を表す。
以上よりは少なくとも上に凸である。実用上は多数のランダムサンプルを用いるため、のHesse行列は厳密に負定となることが普通である。このときは上に狭義凸である。
Mathematicaによる数値例
最後にMathematicaによる数値実験を行う。としてランダムサンプルを生成し、を推定してみた。