推定の考え方と95%信頼区間の解釈

疫学統計の基礎

推定の考え方

私たちはなぜデータを集めて、統計ソフトを使って分析を行うのでしょうか?
集めたデータの特徴を把握するため?それもとても大切なことですが、最も大切なことは「母集団を推定する」ことです。日本人全体のデータがほしいけれど、それはできません。それなので、日本人全体(母集団)中からの一部を取ったもの(例えば自分の病院を受診した患者さん)を標本(サンプル)とし、この小さな標本から母集団の特徴を推定するのです。
統計を使うことで持っている小さなデータを一般化する試みを行っているわけです。

図1 推定の考え方

95%信頼区間とは?

「95%信頼区間」はp値と同じくらいおなじみの言葉だと思いますが、正しく解釈できているでしょうか?
問題)95%信頼区間の意味、どちらが正しいでしょう?
A 区間推定を行ったときに、真の値が含まれる確率が95%
B 推定値の95%が信頼区間の中に含まれる


正しくはAです。Bと勘違いしていませんか?

図2 95%信頼区間

本当に推定したいものは母集団の平均値であるμです。これを忘れないようにしましょう。区間推定はある程度の範囲をもって、このμの推定を行います。
標本から100回区間推定を行ったときに、母集団の本当の平均であるμが含まれない(推定失敗)が5回ある(正しく推定できる確率が95%)、これが正しい95%信頼区間の解釈です。

コメント

タイトルとURLをコピーしました