第2回 データの尺度水準と可視化
第2回 データの尺度水準と可視化
心理学で用いるデータとは何か、変数の定義を解説し、データの種類、データを要約・可視化することの重要性を説明する。また具体的にデータを可視化する手法についていくつか示し、ソフトウェアを用いて図表を作成する方法を習得することを目的とする。
【キーワード】
尺度水準、量的データ、質的データ、可視化
尺度水準
量的データ(1.比例尺度、2.間隔尺度)
質的データ(3.順序尺度、4.名義尺度)
1.比例尺度水準
・数値が大きくなるほど、程度が大きくなることを意味する
・同じ単位であれば、数値が等間隔・原点が存在し、0が「無い」ことを意味する。四則演算が可能
2.間隔尺度水準
・数値が大きくなるほど、程度が大きくなることを意味する
・同じ単位であれば、数値が等間隔
・原点が存在し、0が「無い」ことを意味する。加算・減産が可能
3.順序尺度水準
・数値が大きくなるほど、程度が大きくなることを意味する
・同じ単位であれば、数値が等間隔
・原点が存在し、0が「無い」ことを意味する。四則演算するべきでない。
4.名義尺度水準
・数値が大きくなるほど、程度が大きくなることを意味する
・同じ単位であれば、数値が等間隔
・原点が存在し、0が「無い」ことを意味する。四則演算すべきでない。
データの可視化
可視化の重要性
・大量のデータは理解が困難
ヒストグラム(histogram)・・・・・等間隔の区間を作り、各階級に含まれるデータの個数を棒の高さで可視化
散布図(scatter plot)
折れ線グラフ(line plot)
棒グラフ(bar plot)
ヴァイオリンプロット(violin plot)
度数分布表(frequency distribution table)
クロス集計表(cross table)