久々に統計手法で足踏みした一日。
GLMMで解析をしているのだが、ゼロデータが多いけど過分散ではなかったのでいいかなと思っていたが、
過小分散はそれはそれで問題らしい。(なんでもばらつきが一定ではないとか)
指摘されたらやはり対応しなければということで、zero-inflatedモデルを弄くることに。
まぁ、Rだったら専用のパッケージを入れるだけで基本的には普通のGLMと同じなのだが、なんかエラーがでて今まで組んでいたフルモデルが組めない。まだまだ一般的ではない手法なのでネットでも情報が少ないのはいたい。今回の論文はモデル選択を使っており、フルモデルからAICを基準にステップワイズで変数を排除していくやり方でベストフィットモデルに到達、その後残った変数というか注目している変数のAIC変化量を検討するというやり方をとっていたが、しょうがないのでヌルモデルから変数を加えていくやり方にシフト。
で、でてきたものは狙っている変数のAIC変化量はゼロインフレモデルを使う前より大きくなったのだが、Wald検定では有意差が消えてしまった。いや、今回はAICの変化量で議論しているからここはどうなろうといいんだけど、なんとなく嫌な感じになるのは有意差検定の呪いに未だに囚われているからなのだろう。
あと気になるのはゼロインフレモデルを使った論文がまだ少ないということ。混獲の分野ではそれなりに知名度があるモデルなので大丈夫とは思うが、前回の論文ではどちらのレビュアーも統計に疎かったので少々気になるところ。
同僚はRや統計にものすごく詳しいので、いろいろアドバイスを受けつつ、葛藤する一日。
PR