第5回 確率分布②
5-2
次のグラフは、一様分布 U(0,1)�(0,1)、λ=1 の指数分布、自由度1010 の t 分布、F分布F(3,10) をRで描いたものである。この中で t分布を表すグラフはどれか。
それぞれ以下のようにして作成しています。
t 分布は正規分布に近く左右対称な形をしているというのが特徴です。
ggplot(data=data.frame(x=c(-4,4)), aes(x=x)) +
stat_function(fun=dt, args=c(df=10) )
ggplot(data=data.frame(x=c(0,6)), aes(x=x)) +
stat_function(fun=df, args=c(df1=3,df2=10) )
ggplot(data=data.frame(x=c(-0.5,1.5)), aes(x=x)) +
stat_function(fun=dunif, args=c(min=0,max=1) )
確率変数 Z1 、Z2 、⋯⋯ 、Zn� がそれぞれ独立に標準正規分布N(0,1) に従うとする。
このとき、W=Z21+Z22+⋯+Z2n は自由度( ア )の( イ )に従う。
カイ2乗分布、t分布、F分布とありますが、正規分布から派生したこれらについて、どう変換したものがどの分布に従うのかを理解しておきましょう。また、どういうときに自由度が n や n−1 なのかを丁寧に確認してみてください。
F分布の定義で説明した式なので、正解を選ぶ事自体は難しくないと思います。
2-4 のスライドの右側で説明していますが、確率変数 Xi�� が正規分布に従うときに、W=∑ni=1(Xi−X¯)2σ2�=∑�=1�(��−�¯)2�2 は自由度 n−1�−1 のカイ2乗分布に従うことになります。
ある正規分布に従うと考えられるデータからいろいろとデータを観測して、そこから平均や分散などを計算する。
その平均や分散はどういう確率分布に従うのか、ということでカイ2乗分布とt分布とF分布を学びました。これらを6回以降の講義で使うことになります。
1つ1つが何を求めた計算なのかを考えながらスライドを見直してみてください。
確率分布やその特徴について述べた次の文の中に誤っているものが 1つある。それはどれか。
XとY が独立にある確率分布に従う確率変数で、和X+Y もその確率分布に従うとき、その確率分布には再生性があるといいます。正規分布には再生性があり、2つの確率変数の和は正規分布に従います。
次のグラフは、一様分布 U(0,1)、λ=1 の指数分布、自由度10 の t 分布、F分布F(3,10) をRで描いたものである。この中で t分布を表すグラフはどれか。
それぞれ以下のようにして作成しています。
t 分布は正規分布に近く左右対称な形をしているというのが特徴です。
ggplot(data=data.frame(x=c(-4,4)), aes(x=x)) +
stat_function(fun=dt, args=c(df=10) )
ggplot(data=data.frame(x=c(0,6)), aes(x=x)) +
stat_function(fun=df, args=c(df1=3,df2=10) )
ggplot(data=data.frame(x=c(-0.5,1.5)), aes(x=x)) +
stat_function(fun=dunif, args=c(min=0,max=1) )
p=1/2 の確率で表が出るコインを 10000 回投げることを考える。このときに表が出る回数 X について、二項分布 B(10000,0.5) を正規分布N(5000,√10000×12×12) で近似する。
このとき、表が出る回数が 4950回以上から5050回以下となる確率をRを用いて求めた。その結果として最もふさわしいものはどれか。
正規分布は平均を中心に左右対称に広がった分布をしています。広がり方の目安として標準偏差が使われます。
(μ−σ,μ+σ)に 68.2%
(μ−2∗σ,μ+2∗σ)に 95.4%
(μ−3∗σ,μ+3∗σ)に99.7%
ということは大体のイメージとして知っておいてよいと思います。
また、ちょうど95%になるところとして 1.96 というのも今後の講義で出てきます。