第3回 記述統計と確率

第3回 記述統計と確率

基本統計量について学び、Rでの計算方法について説明する。その後、確率について説明する。

【キーワード】
平均、分散、標準偏差、中央値、最頻値、相関係数、事象、条件付き確率、ベイズの定理


コルモゴリフの公理

確率は降水確率や当選確率など生活の中でも用いられ、中学数学でも出現頻度をもとにした確率を学びます。しかし、出現頻度をもとにしたアプローチでは可算無限個の事象の取り扱いが難しいためここではコルモゴロフの公理(Kolmogorov Axioms)として知られる公理的なアプローチで確率を定義[1]します。

可算無限個の集合の取り扱いの難しさの一つに演算結果が閉じない[2]ことがあります。そのままでは議論の見通しが立てにくいので補集合と和集合が閉じるような集合に限定して話を進めます。

  1. 各事象の値が0以上であること
  2. 標本空間全体の値が1であること
  3. 任意の可算無限個の事象に対し互いに排反な事象の和集合の値は各事象の値の和になる

中央値は順に並べたときの真ん中の人の値ですから、今回は8番目と9番目の人の平均で52.5点となります。

合計を人数で割った50点は平均値です。最頻値は頻度が最も大きい階級の階級値となります。

また、四分位数はちょうど25%、50%、75%のところの値ということですが、講義ではあまり説明していませんが、色々と計算の方法があります。高校で学ぶのは偶数個の場合は前半と後半の2つにします。奇数個の場合、真ん中の数を除いて2つに分けます。そのグループの中央値として四分位数を求めます。今回は16個なので、8個ずつに分けて4番目と5番目の平均で36.5 というのが選択肢です。ですが、実は他にも色々な方法があって、RやExcelでは別の計算方法をしています。Rで

x <-c(11,21,31,32,41,43,51,52,53,55,57,61,62,71,74,85)
summary(x)
とすると5数要約がでるのですが、1st Qu. は38.75となっています。
quantile(x) としても38.75です。
help(quantile)
とすると、type で計算方法を指定できることが分かります。全部で9通りあります。何も指定しないと type=7 です。
quantile(x,type=2)
が選択肢の説明で求めたものです。少し難しいですが、四分位数の計算は実際にはいくつかあるとご理解していただければと思います。

 

正答: 中央値は800点を16で割った値である50点である 合計を人数で割った50点は平均値です

Pocket
LINEで送る