どのようなデータをどのような手法で解析すればよいか?
基本は意外とシンプルで、図1に要約されます。
従属変数 (目的変数) | 独立変数 (説明変数) | パラメトリック検定 | ノンパラメトリック検定 |
名義変数 | 連続変数 | 独立したサンプルのt検定 | Mann-Whitney test |
名義変数 | 連続変数 | 対応のあるサンプルのt検定 | Wilcoxon signed-rank test |
名義変数 | 名義変数 | ー | X2(カイ二乗)検定 Fisher 直接確率検定 |
連続変数 | 連続変数 | Pearsonの相関係数 | Spearmanの順位相関係数 |
名義変数(3群) | 連続変数 | One way ANOVA (一元配置分散分析) | Kruskal-Wallis検定 |
ポイント① 従属変数と独立変数は連続変数?名義変数?
変数の種類についてはこちら>>変数の種類
従属変数:目的変数、アウトカムとも言われる
独立変数:説明変数とも言われる
表のとおり、従属変数と独立変数の組み合わせによって使う検定が絞られます。
ポイント② パラメトリック検定?ノンパラメトリック検定?
パラメトリック検定とは連続変数が正規分布であるとみなすことができる場合に用いられます。正規分布とみなすことができない連続変数の場合はノンパラメトリック検定を用います。
連続変数×連続変数の相関をみたい場合にはどちらも正規分布に従う場合はパラメトリック検定、少なくとも一方が正規分布に従わない場合にはノンパラメトリック検定を選びます。
名義変数×名義変数の場合はノンパラメトリック検定であるX2検定もしくはFisherの正確検定を用いますが、使い分けについてはSPSSのところで具体的に述べていきます。
コメント