第三节 X2检验
一、X2检验用途
1、两个及以上率(或构成比)之间差异比较;
2、推断两变量间有无相关关系;
3、检验频数分布的拟合优度。
二、X2检验类型
1、四格表X2检验;
2、行×列表X2检验;
3、配对四格表X2检验。
三、X2检验基本思想及检验步骤
假设两总体率相等
H0 : 两总体阳性率相等, 即π1=π2 =53.59%;
H1 : 两总体阳性率不等, 即π1≠π2;
α=0.05。
如果H0 成立,则表10.7的第一行第一列理论上的生存数为:
86×97/181=86×53.59%=46.09
此结果称为理论数 ,用T表示。上述计算可由下式计算
nr=同行合计数,nC=同列合计数,n=总例数
按此公式,可以计算四个理论数
52 |
34 |
45 |
50 |
只有这四个格子的数据是基本的,其它的数据都是由这四个数据推算出来的,这种资料又称为四格表资料。且表格内的数字为实际资料的数字,故称为实际数,用A表示。
从表10.7可见,基本格子的实际数都不等于理论数
显而易见:两样本率相差愈大,则实际数与理论数的差值就愈大。实际数与理论数的差值服从X2 分布:
X2值的大小,除了决定于A-T的差值外,还取决于格子数,严格地说是与自由度v有关。因为各格的(A-T)2/T都是正值,故格子数愈多,X2值也就会愈大。自由度的计算公式为
v=(行数-1)(列数-1)
四格表的v=(2-1)(2-1)=1。
如果检验假设成立,则实际数和理论数的差别不会很大,X2值也不会很大;否则X2值会很大。要大到多大程度才有统计学意义? 按v查X2界值表,由X2值确定P值,按P值大小作出推断。
X2 界值表特点:
(1) X2 >0;
(2) P一定时,自由度ν越大,X2值越大;
(3)自由度ν一定时,X2值越大,P越小;
以v=1 查X2界值表得:
X21,0.05=3.84,X21,0.01=6.63