第2回 統計処理の基礎
データの図示と分布
記述統計(代表値,散布度)
テキスト 鵜沼・長谷川 第2章
pp. 16-44
ポイント
①質的変数の度数分布表では,変数のカテゴリーごとに度数を集計する。
②質的変数の度数分布を図示する際には,横軸に度数、縦軸にカテゴリーを取ることが一般的である。
③量的変数の度数分布表では,変数の値をグループ化して階級に分けなければならない。
④量的変数の度数分布を図示する場合,ヒストグラムでは横軸の階級の間を離してはならない。
データファイルの作成
ポイント
データの形式: 被験者×変数
変数名(一行目)を作る→各列が変数
一人の対象者のデータ→一行に
分析の考え方と手順
1.各変数ごとに、変数の性質(質的/量的)に応じて、基本的な分析を行う
–質的変数→度数分布表、棒グラフなど
–量的変数→度数分布表、ヒストグラムなど
2.変数の関係を分析する
(今回は1のみ)
1変数の度数分布表、図示
質的変数
Table 2.2.1
量的変数
Table 2.3.1
本日の課題1
•質的変数の度数分布表を作成する
•データ Table2.2.1 : ← Excelファイル
https://hideyukiunuma.wixsite.com/visualperception/gradstat2021
課題2
•量的変数の度数分布表を作成する
データ Table2.3.1 : ← Excelファイル
課題3
Excelファイル Table 2.3.1 を使って、平均値、標準偏差、分散を求める。
R
平均値 mean(変数名)
標準偏差 sd(変数名)
分散 var(変数名)
var( )は不偏分散*
sd( )はその平方根
*母分散の不偏推定量であるとの意味で不偏分散 (unbiased variance) と呼ぶ(テキスト pp.148-155)
提出
5/26まで(次回5/27の前日)
1 Teams の中から「課題」タブを開き、
添付されたWordファイルを編集して、Rの出力結果を、コピー&ペーストで貼りつける。
2 Teams の中から「課題」に図のpdfファイルを追加する。
次回までの事前課題
テキスト pp. 147-196.
•標本分布とは (第5章)
•平均値の区間推定とは? (第6章)
◎ 表 2.3.1 から平均値の信頼区間をもとめる