第5回 確率分布②


5-2

次のグラフは、一様分布 U(0,1)�(0,1)λ=1 の指数分布、自由度1010 の t 分布、F分布F(3,10) をRで描いたものである。この中で t分布を表すグラフはどれか。

それぞれ以下のようにして作成しています。

t 分布は正規分布に近く左右対称な形をしているというのが特徴です。

ggplot(data=data.frame(x=c(-4,4)), aes(x=x)) +

stat_function(fun=dt, args=c(df=10) )

ggplot(data=data.frame(x=c(0,6)), aes(x=x)) +

stat_function(fun=df, args=c(df1=3,df2=10) )

ggplot(data=data.frame(x=c(-0.5,1.5)), aes(x=x)) +

stat_function(fun=dunif, args=c(min=0,max=1) )

確率変数 Z1 、Z2 、 、Zn がそれぞれ独立に標準正規分布N(0,1) に従うとする。

このとき、W=Z21+Z22++Z2n は自由度( ア )の( イ )に従う。

 

カイ2乗分布、t分布、F分布とありますが、正規分布から派生したこれらについて、どう変換したものがどの分布に従うのかを理解しておきましょう。また、どういうときに自由度が n や n1 なのかを丁寧に確認してみてください。

正答: ア n    イ カイ2乗分布
確率変数 Z が標準正規分布N(0,1) に、また、確率変数W が自由度m のカイ2乗分布に従い、Z とW が互いに独立であれば Z/(W/m) は自由度( ア )の( イ )に従う

F分布の定義で説明した式なので、正解を選ぶ事自体は難しくないと思います。

2-4 のスライドの右側で説明していますが、確率変数 Xi�� が正規分布に従うときに、W=ni=1(XiX¯)2σ2�=∑�=1�(��−�¯)2�2 は自由度  n1�−1 のカイ2乗分布に従うことになります。

正答: ア m    イ t 分布
確率変数W1�1 、W2�2 が互いに独立に自由度 m1�1 、m1�1 の( ア )に従うとき W1/m1W2/m2�1/�1�2/�2 は( イ )に従う。

ある正規分布に従うと考えられるデータからいろいろとデータを観測して、そこから平均や分散などを計算する。

その平均や分散はどういう確率分布に従うのか、ということでカイ2乗分布とt分布とF分布を学びました。これらを6回以降の講義で使うことになります。

1つ1つが何を求めた計算なのかを考えながらスライドを見直してみてください。

正答: ア カイ2乗分布  イ F 分布

確率分布やその特徴について述べた次の文の中に誤っているものが 1つある。それはどれか。

1つ選択してください:
確率変数 X1 、X2 がどちらも独立に正規分布に従うとき、その確率変数の和 X1+X2 はガンマ分布に従う
2つの確率分布が独立に同じ分布に従い、その和の分布も同じ確率分布に従うとき、この確率分布は再生性を持つという
指数分布には無記憶性という特徴がある。つまり、Xが指数分布に従い、 s0,t0のとき、P(X>s+t|X>s)=P(X>t) が成り立つ
2変量正規分布の同時確率密度関数は2つの変数の平均と分散及び相関係数の値によって定まる
—————-

XY が独立にある確率分布に従う確率変数で、和X+Y もその確率分布に従うとき、その確率分布には再生性があるといいます。正規分布には再生性があり、2つの確率変数の和は正規分布に従います。

正答: 確率変数 X1 、X2 がどちらも独立に正規分布に従うとき、その確率変数の和 X1+X2  はガンマ分布に従う

次のグラフは、一様分布 U(0,1)λ=1 の指数分布、自由度10 の t 分布、F分布F(3,10)  をRで描いたものである。この中で t分布を表すグラフはどれか。

それぞれ以下のようにして作成しています。

t 分布は正規分布に近く左右対称な形をしているというのが特徴です。

ggplot(data=data.frame(x=c(-4,4)), aes(x=x)) +

  stat_function(fun=dt, args=c(df=10) )

ggplot(data=data.frame(x=c(0,6)), aes(x=x)) +

stat_function(fun=df, args=c(df1=3,df2=10) )

ggplot(data=data.frame(x=c(-0.5,1.5)), aes(x=x)) +

stat_function(fun=dunif, args=c(min=0,max=1) )


p=1/2 の確率で表が出るコインを 10000 回投げることを考える。このときに表が出る回数 X について、二項分布 B(10000,0.5) を正規分布N(5000,10000×12×12)  で近似する。

このとき、表が出る回数が 4950回以上から5050回以下となる確率をRを用いて求めた。その結果として最もふさわしいものはどれか。

正規分布は平均を中心に左右対称に広がった分布をしています。広がり方の目安として標準偏差が使われます。

(μσ,μ+σ)に 68.2%

(μ2σ,μ+2σ)に 95.4%

(μ3σ,μ+3σ)に99.7%

ということは大体のイメージとして知っておいてよいと思います。

また、ちょうど95%になるところとして 1.96 というのも今後の講義で出てきます。

正答: 0.6826895
Pocket
LINEで送る