第5回 判別分析
判別分析
独立変数(説明変数) 量的(連続)変数
従属変数(目的変数) 質的(カテゴリ)変数
判別分析
青木研究室(群馬大学)
http://aoki2.si.gunma-u.ac.jp/lecture/Discriminant/index.html
課題
例題の分析結果を文章でまとめる。
データ disc.csv
プログラム
d <- read.csv("disc.csv")
d
library(MASS)
lda(Group~X1+X2,data=d)
zz <- lda(Group~X1+X2,data=d)#判別分析
Y <- predict(zz,d)#予測値
Y
table(d[,1],Y$class)#交差確認
分析結果
> d <- read.csv("disc.csv")
> d
Group case X1 X2
1 1 1 5 10
2 1 2 0 7
3 1 3 4 7
4 1 4 8 6
5 1 5 2 5
6 1 6 2 4
7 2 1 10 8
8 2 2 7 7
9 2 3 9 5
10 2 4 5 3
11 2 5 9 2
12 2 6 5 2
> library(MASS)
> lda(Group~X1+X2,data=d)
Call:
lda(Group ~ X1 + X2, data = d)
Prior probabilities of groups:
1 2
0.5 0.5
Group means:
X1 X2
1 3.5 6.5
2 7.5 4.5
Coefficients of linear discriminants:
LD1
X1 0.3969227
X2 -0.3217480
>
> zz <- lda(Group~X1+X2,data=d)
> Y <- predict(zz,d)
> Y
$class
[1] 1 1 1 2 1 1 2 2 2 2 2 2
Levels: 1 2
$posterior
1 2
1 0.975235408 0.024764592
2 0.997394881 0.002605119
3 0.917225487 0.082774513
4 0.135277294 0.864722706
5 0.939385457 0.060614543
6 0.883171374 0.116828626
7 0.100603215 0.899396785
8 0.437431342 0.562568658
9 0.030514281 0.969485719
10 0.205560680 0.794439320
11 0.003639689 0.996360311
12 0.112069402 0.887930598
$x
LD1
1 -1.6463273
2 -2.6656971
3 -1.0780061
4 0.8314329
5 -1.2283556
6 -0.9066076
7 0.9817824
8 0.1127621
9 1.5501036
10 0.6059086
11 2.5153476
12 0.9276566
> table(d[,1],Y$class)
1 2
1 5 1
2 0 6
>
f = a x1 + b x2
判別関数
↑ 「群間の分散/全体の分散」(相関比)最大化
合成変数で評価(変動の平方和)
次回までの課題
数量化Ⅱ類
統計自習ノート 群馬大学(青木研究室)
数量化Ⅱ類と判別分析の関係