rastudylife

機械学習や統計についての勉強ログ

GLMからGLMM(一般化線形混合モデル)へ

libraryandarchives.hatenablog.com

一般化線形混合モデル

今までは,観測者が認識し保有しているデータのみに基づいて回帰分析を行ってきた.

しかし,観測者が影響を及ぼしていると気づいていないデータが,実際は目的関数に大きな影響を与えているかもしれない.例えば,植物のサンプルデータでいうと,地質の違い(観測者は影響を与えていると気づいていないのでデータ化していない)等が密かに影響を与えているかもしれないし,個体の特性に基づく性質が影響を与えているかもしれない.実際に影響を与えている全ての現象に気づいて記録するのは難しい.観測されたデータからは理論上二項分布になるはずだと思っても,実際は,個体差がや場所差が影響して過分散していて二項分布にならない場合がある.こういった場合に,密かに影響しているであるろう個体差を表すパラメータをGLMの線形予測子に追加する.この追加パラメータは何らかの確率分布に従っていると仮定する.こうした個体差や場所差の影響をGLMに取り込んだのが一般化線形混合モデル(GLMM)である.

今までGLMで扱ってきたような線形予測子は固定効果,今回新たに追加したその時の状況に基づいて変化するような線形予測子をランダム効果というようだ.この効果が混合しているモデルだから,一般化線形混合モデル(GLMM)と呼ばれる.

現実のデータ解析ではGLMMが重要.

 固定効果とランダム効果について読ませていただきました.

d.hatena.ne.jp