Independent-samples t-test
- 分析手法の種類
- 予測する
- 要因を探る
- 比較する
- 分類する
- 集計する
- 可視化する
独立した2群の平均値の比較
t検定(t-test)は、検定統計量t値を利用する検定手法の総称で、2つのグループ間の平均値の差の検定を行う場合によく利用されます。独立したサンプルのt検定(Independent-samples t-test)は、比較するサンプルに対応がない場合のt検定です。対応のないサンプルのt検定(unpaired t-test)や2標本t検定(two sample t-test)等とも呼ばれます。
例えば、母親の喫煙習慣が子どもの出生時体重(g)にどのような影響を与えるかを調べる場合、喫煙「あり」と「なし」の2つのグループの出生時体重(g)を比較するためにt検定を行います。このとき、喫煙「あり」と「なし」のグループのサンプルには対応がないので、独立したサンプルのt検定を用います。
独立したサンプルのt検定によって有意差が認められた場合は、母集団において2つのグループ間の平均値の差が0ではないことを意味するのみであり、どの程度の差があるかまでは分かりません。そこで、差の95%信頼区間を用いて、2つのグループの差の大きさの推定や効果量による評価も重要です。
正規性と等分散性の仮定があり、正規性を逸脱する場合はノンパラメトリック検定のマン-ホイットニーのU検定(Mann-Whitney U test)を適用します。また、等分散性を逸脱する場合は、ウェルチ検定(Welch test)を適用する方法があります。ウェルチ検定は、等分散の場合でも適用可能で独立したサンプルのt検定よりも信頼性が高いとされています。
ソフトウェア
SPSSでは、基本機能のBaseのみで実行可能です。効果量としてCohen’d や Hedge’s gなどを自動的に出力します。Rでは、t.test()関数を使って対応のあるt検定を実行します。Pythonでは、scipyライブラリのttest_ind()関数を使用することができます。
参考文献
- Student (1908). “The Probable Error of a Mean.” Biometrika, 6(1), 1-25.
- Cohen, J. (1988). “Statistical Power Analysis for the Behavioral Sciences.” Lawrence Erlbaum Associates.
- 東京大学教養学部統計学教室(1991),統計学入門 (基礎統計学Ⅰ),東京大学出版会
- 大久保街亜,岡田謙介(2012),伝えるための心理統計: 効果量・信頼区間・検定力,勁草書房
- 対馬 栄輝(2018),SPSSで学ぶ医療系多変量データ解析,東京図書