第3回 記述統計と確率
第3回 記述統計と確率
基本統計量について学び、Rでの計算方法について説明する。その後、確率について説明する。
【キーワード】
平均、分散、標準偏差、中央値、最頻値、相関係数、事象、条件付き確率、ベイズの定理
コルモゴリフの公理
確率は降水確率や当選確率など生活の中でも用いられ、中学数学でも出現頻度をもとにした確率を学びます。しかし、出現頻度をもとにしたアプローチでは可算無限個の事象の取り扱いが難しいためここではコルモゴロフの公理(Kolmogorov Axioms)として知られる公理的なアプローチで確率を定義[1]します。
可算無限個の集合の取り扱いの難しさの一つに演算結果が閉じない[2]ことがあります。そのままでは議論の見通しが立てにくいので補集合と和集合が閉じるような集合に限定して話を進めます。
- 各事象の値が0以上であること
- 標本空間全体の値が1であること
- 任意の可算無限個の事象に対し互いに排反な事象の和集合の値は各事象の値の和になる
中央値は順に並べたときの真ん中の人の値ですから、今回は8番目と9番目の人の平均で52.5点となります。
合計を人数で割った50点は平均値です。最頻値は頻度が最も大きい階級の階級値となります。
また、四分位数はちょうど25%、50%、75%
x <-c(11,21,31,32,41,43,51,52,
summary(x)
とすると5数要約がでるのですが、1st Qu. は38.75となっています。
quantile(x) としても38.75です。
help(quantile)
とすると、type で計算方法を指定できることが分かります。
quantile(x,type=2)
が選択肢の説明で求めたものです。少し難しいですが、四分位数の計算は実際にはいくつかあるとご理解してい
箱ひげ図は最小値、最大値、第1四分位数、中央値、第3四分位数を元にグラフを作成します。
この問いのヒストグラムは度数が表示されており、度数分布表で表すと次のようになります。
階級 | 度数 |
---|---|
0点から9点 | 1 |
10点から19点 | 1 |
20点から29点 | 1 |
30点から39点 | 4 |
40点から49点 | 6 |
50点から59点 | 3 |
16人を4分割したとき、4番目と5番目の人はどちらも30点台、12番めと13番目の人の値は40点台なので、30点から50点の間に箱があると考えることができます。
それに合うグラフは a だけなので、a が正解となります。