単変量解析が終わったら、多変量解析を行いましょう。
重回帰分析は従属変数が連続変数である場合に用います。
従属変数がカテゴリー変数(2値数)である場合にはロジスティック回帰分析を行います。詳細はこちら>>SPSSでロジスティック回帰分析
重回帰分析は正規分布を仮定したパラメトリック検定であるため、本来は従属変数、独立変数ともに正規分布に従うことが望ましいとされていますが、実際には非正規分布の変数も許容して使用することが多いです。
重回帰分析の考え方と目的
重回帰分析は従属変数yを複数の独立変数xを用いた回帰式で説明しようという試みです。
回帰式y’=β0 + β1*x1 + β2*x2 + β3*x3 … + βp*xp
これで得られた予測値y’と実測値yの相関が最大となるような係数βを求めていきます。
重回帰分析を行う目的としては主に
①予測式を求めたい。
②従属変数に対する独立変数の影響を知りたい。
という場合があると思います。目的によって変数の選び方、重点を置くべきポイントが異なりますので、分析をする前に何を目的とするのかを明確にしておきましょう。
SPSSで重回帰分析
今回は「血液検査のBNPの値を説明する因子は何か?」を明らかにしたいと思います。予測式を作ることが目的ではなく、どの因子がどれくらい影響するかを知りたいので、上記の②です。
y(従属変数)=BNP、x(独立変数)=Age、Sex、BMI、HT(高血圧)、EF(心エコーでの駆出率)を用います。
分析➡回帰➡線形
①②従属変数と独立変数をそれぞれ選択
③方法は[強制投入法]を選びます。ステップワイズ法というものもありますが、これはp値によって自動的によりよいモデルを構築していくものです。臨床研究では単変量解析や先行研究、仮説に応じた独立変数を選択するべきですので、強制投入法が適していると思われます。ただし、モデルの構築だけが目的であればステップワイズ法を選択することもあります。
④[統計量]を選択し、
⑤[推定値]、[信頼区間95%]、[モデルの適合度]、[共線性の診断]などにチェックを入れて
⑥[続行]、[OK]をクリックします。
重回帰分析 結果の解釈
①「モデルの要約」でモデルの当てはまり(予測精度)を確認します。このモデルでどの程度yを説明できるかを見たものでR、R²ともに1に近づくほどよいとされています。R>0.7, R²>0.5でよいモデルとされることが多いです。
②有意なモデルかどうかp値を確認。
このモデルは回帰式は有意ですが、R²=0.226と予測精度は低いと言えます。
③Bが係数、それぞれの有意確率p値、95%信頼区間を確認します。VIFは多重共線性の指標であり、10を超えている場合はその係数は外したほうが良いとされています。多重共線性は相関が強い係数が含まれていると高値となり、重回帰分析に支障が出てしまいます。
このモデルからは
BNP=1061+4.18*Age-4.38*Sex-13.8*BMI+41.0*HT-12.6*EF
という回帰式が構築されました。結果としてはそれぞれ変数の係数、95%信頼区間、p値を報告します。
コメント