第10回 2変数の関係を表す統計量の推定

第10回 2変数の関係を表す統計量の推定
2変数の関係を表す統計量、具体的には相関係数とクラメールの連関係数について、手元のデータの2変数の関係性から母集団における2変数の関係性を区間推定する方法を解説する。95%信頼区間について、相関係数を例にとり、その意味を解説する。
【キーワード】
相関係数、クラメールの連関係数、区間推定


10.1 標本の相関関係から母集団の相関係数を推定する

相関係数(第4回)
二つの量的変数の(直線的な)関係性の指標
共分散Sxyを2変数それぞれの標準偏差の積SxSyで割った指標

rxy = Sxy / SxSy

相関係数rxyは -1から+1の範囲に収まる
共分散を標準化した指標

母集団の相関係数ρ ← 標本の相関係数r

研究結果から主張したいこと
自損感情と精神的健康は正の相関関係がある。
得られたデータを越えて、「一般的に(調査対象者以外においても)」自損感情が高い人は精神的健康が高いという関係がある。ということを主張したい。

10.2 相関係数の標本分布

10.2.1 確立変数としての標本相関係数

「標本統計量は確立変数である」

母相関係数と標本サイズを固定した場合において、得られる標本相関係数の確率的な変動を表したものが標本相関係数の標本分布です。

10.2.2 相関係数の標本分布の形状

標本分布は標本統計量についての確立分布です。

10.3 母相関係数の推定

10.3.1 母相関係数の点推定

点推定:母数の値を1つの値で推定すること

点推定の場合には「おそらくこの値からこの値の範囲に母相関係数がある」というような、推定に幅をもたせて報告するほうが望ましい。

10.3.2 母集団係数の区間推定

区間推定:得られたデータに基づいて、母数の値を特定の値ではなく、ある一定の区間で推定すること。

信頼度:あらかじめ定められた確率

信頼区間:その確率で母数を含むと推定される区間

統計的仮設検定では背理法の原理を用い「母数について特定の値を仮定し、そのような母集団からデータを取った際に、滅多に起きないと考えられていることが起こったとしたら、その母数についての仮定が間違っていた」と判断する。

10.4 標本の関連係数から母集団の関連係数を推定する。


推定統計学の力を借りて、特定のデータから一般的なことを主張する

標本相関係数・標本連関係数は、標本抽出のたびに変動する
ひとつの値で母数を推定する点推定よりも、変動を考慮して区間推定を行うほうが望ましい。
95%信頼区間は「今回得られたデータと整合的である母数の範囲」と理解できる
95%信頼区間の上限値と下限値は、標本抽出のたびに変動する。

Pocket
LINEで送る