第6回 統計的推定
無作為に抽出された標本データを元に母集団について推定する統計的推測について理解する。
【講師】秋光淳生(放送大学准教授)
【キーワード】フィッシャーの3原則、点推定、区間推定
6-1
フィッシャーの3原則の組み合わせとして正しいものが1つある。それはどれか
なるべく偏りがなく、母集団の特徴を知るために、同じ条件で複数回繰り返し、複数の条件がある場合にはランダムに割当て、またブロックで条件が同じになるように局所的に管理します。
クラスター抽出法は、あるクラスターを選び、そのクラスターについては全数調査を行います。
6-2
推定については点推定と区間推定があります。信頼係数というのは真の値が含まれる確率ですが、この確率が低いほど信頼区間は狭くなります。
シミュレーションを1回行うと信頼区間が求められます。真の値がその範囲に収まるような信頼区間になることもありますし、そうでないこともあります。真の値が信頼区間に含まれる確率を確認するには、実験を複数回行う必要があります。それがこの回のシミュレーションになっています。実際に確認してみてください。
6-3
以下の文は次のシミュレーションについて述べたものである。この中に誤っているものが1つある。それはどれか?
prob <- 0.3
n <- 1001
m <- 100
alpha<- 0.05
est <- numeric(m)
for(j in 1:m) {
est[j] <- sum(rbinom(n,1,prob)/n)
}
z <- tibble(count=1:m,est=est,
lower=est-qnorm(1-alpha/2,0,1)*sqrt(est*(1-est)/n),
upper=est+qnorm(1-alpha/2,0,1)*sqrt(est*(1-est)/n),
check= ifelse( abs(prob-est) < qnorm(1-alpha/2,0,1)*sqrt(est*(1-est)/n),”Y”,”N”) )
ggplot(z)+geom_point(aes(x=count,y=est))+
geom_segment(aes(x=count,y=lower,xend=count,yend=upper,colour=check))+
geom_hline(yintercept=prob,colour=”red”)