統計について思うことをつらつらと

統計解析はおもしろい。そして、基本的な分析はだいたい回帰分析の応用なのだ。そう考えるとわりと同じ次元で理解することができる(気がする)。もちろん、SEMは最小二乗法ではなく最尤法だったり、コレスポンデンス分析などのカテゴリカルデータの分析はよく理解していないのだが、心理学一般で使われる予測・説明の分析はだいたい回帰分析の枠に収まる。
特に、差の検定の代表である分散分析も同じ枠組みっていうのは学部での授業から考えればなかなか衝撃的な話。分散分析のキモは交互作用だと思ってるし、心理学はたとえば2つの対立する理論は第3の変数による交互作用効果の結果として考えられてきた経緯があるので、まあ学部では分散分析を教えるとこから始まる。

ただ、授業で教える分散分析よりも回帰分析の枠組みで交互作用を考えたほうがより精密な結果を提示できる。
しかも、回帰分析の枠組みであっても視覚的に原理を示すことは可能だし、わかりやすさの点からいってもさほど変わりはないのではないかと思う。
交互作用だけではなく、説明率、偏回帰係数、因子分析など重要な指標を統合的に理解できるし、媒介分析、マルチレベルモデルなどの最近多く使われる手法にも応用できる。
あと、回帰分析の枠組みがちゃんと理解できていれば、因果を明らかにする分析なんてあほな説明はなくなると思う。

みたいなことを考えてると、はじめに分散分析を教えるメリットってないよなあ。むしろこれを先に教えることで、統合的な理解の妨げにすらなる気がしている。
その点、心理統計学の基礎(南風原2002)はとても素晴らしい基礎の教科書だと思う(これをベースに勉強したからこういう考えを持ったというトートロジー的な側面ももしかしたらあるかもしれない笑)
ぶっちゃけこの本は1人で読むのは難しい人はたしかに多いと思うのだが、そんなのは教える人によってどうにでもできるんじゃないかなと思っている。

なので、ここまでの結論としては、回帰分析をまず理解すればだいたいの統計手法に応用できるし、統計の教育もそれをベースにすればいいじゃん、ということ。

ここで問題になるのが、統計的仮説検定そのものが否定され始めているという現状笑
mcmcでリサンプリングしまくってこっちで分布作ってしまえばよくねって話(だと理解している)。
この発端はp値による議論に対するアンチテーゼだったよな確か。ベイズ推定の考え方は、確かに直感とマッチしているのでそれだけ聞くとわかりやすい。
が、統計的仮説検定の枠組みを知っていないとベイズ推定の枠組みってわかりにくいんじゃないかな。
そして、だいたいベイズ推定の議論では統計的仮説検定がだめだ、という前提があるように思う。
具体的にやり玉にあがるのは背理法的考えと最尤法。
まず、背理法的考え方の問題は直感にマッチしないだけなんじゃないかな。ただし、ユーザーの問題として、p値の過大視と、nsだった時に関連がないと言い切る(言い切らざるを得ない)ことが挙げられると思う。これは結局手法の問題というより研究者の研究姿勢にかかってる問題であって、p値や背理法そのものに対する本質的な問題ではないように思う。
次に、最尤法の問題は、分析不可だったり、間違ったとこを最大尤度としちゃうとこだろうか。
ただ、そんながたがた分布を再構成し直して、ちょっと複雑っぽいモデルを解釈することにどの程度の意味があるのかが今一わからない。もちろん現実の分布はきっとがたがただろうし、現実に即していた方がいいに決まってる、という話はその通りだと思うのだが、それを言い始めると、最終的には個人差を細かくし過ぎて結局よくわからんみたいな話になりそうな気もする。
ニューラルネットワークも認知心理の枠組みというよりもはや神経生理の枠組みみたいな感じだし、心理学が示すのはいわゆるモデルであって、現実をそのまま描くのとはちょっとことなってもいいんじゃないかな。
そうはいっても、全体のモデルが示された上でそれに当てはまらない個人差を地道に説明している段階が現状だと思うので、やはり個人差とかより現実に即したものを示すことは重要だと思うが。

ここまでで思うところは、確かにより現実に即した結果は重要だし、ベイズ推定は統計的仮説検定に比べるとより効果的だと思う。
だが、統計的仮説検定は無意味ではなく、それゆえ統計的仮説検定を排除していくということに疑問を感じる。

そもそも、ベイズ推定はより現実に即しているのか?
単純に、手持ちのデータからランダムにサンプリングをすることを繰り返すだけなのだから、元のデータが偏っていたら結果も偏るだろうし、その場合この点においては統計的仮説検定と違いはない。
それに、ベイズファクターによるモデル評価は、結局基準が便宜的に定められているので、統計的仮説検定におけるp値と、その閾値の厳しさの程度はあれど、本質的な違いはないのではないだろうか。
こう考えていくと、ますます統計的仮説検定の排斥は方向性としては極端かなとも思ったりする。

ただ、ベイズの話はしっかり理解しているわけではないので、間違った解釈も多々あると思う。
そう考えると、やっぱり知る必要がある。
知らないのと知っていて使わないのとでは圧倒的な違いがあると思う。それに、自分がこう思うから統計的仮説検定(ないしベイズ)は教えない、というのは、学生にとってはそうではない可能性を踏まえれば、やはり客観的な視点でちゃんと全部教えた方がいいよなあ。それに、なんだかんだベイズは発想としてすごいと思う笑

あと、やっぱりベイズにしろ統計的仮説検定にしろ、統計そのものがおもしろいんだよなあ笑
だからがっつりはまってがっつりやりたいけど、統計のおもしろさを知ったのは統計(計算)そのものではなくそれをツールにして何かを明らかにする、みたいな側面があったからだから、多分統計そのものをやってしまったらつまんなくなっちゃうかもなー。
あと、個人的な嗜好としては、統計ソフトにモデルを入力し、それがアウトプットされることにカタルシスを覚えるという側面もある笑

ただ、常に気をつけておきたいのは、研究は研究者の研究手法に依存し、統計は結果を裏付けるための手段に過ぎない、ということ。
これを忘れると心理学者ではなくなってしまう。まあそれが良いか悪いかはわからないが、少なくとも私が生きていける領域ではない笑