根据公式(5.6),知道了一组测量的标准差和信度系数就可以求出测量的标准误。进一步我们就可以从每个人的实得分数估计出真分数的可能范围,即确定出在不同或然率水准上真分数的置信区间。人们一般采用95%的或然率水准,其置信区间为:
(X-1.96SE)≤T≤(X+1.96SE) (5.7)
这就是说,大约有5%的可能性真正分数落在所得分数±1.96SE的范围内,或有5%的可能性落在这范围之外。这实际上也表明了再测时分数改变的可能范围。
例如:在一次测验中有些学生得80分,这是否反映了他们的真实水平?如果再测一次他们的分数将改变多少?已知该次测验的标准差为5,信度系数为0.84,将适当的数值代入公式5.6与5.7,并解之:
SE=5× =2
T=80±1.96*2=80±3.92=76.08~83.92
我们可说这些学生的真正分数有95%的可能性落在76与84分之间。即若再测一次,他们的分数低于76、高于84的可能性不超过5%。
(二)两种测验分数的比较
来自不同测验的原始分数是无法直接比较的,只有参照同一个团体的平均分数,将它们转换成相同尺度的标准分数,才能进行比较。
譬如某班期末考试,张生语文数学的成绩转换成T分数(平均数为50、标准差为10)分别为65和70,由此我们可以知道张生的数学比语文考得稍好些,但二者差异是否有意义,仍不清楚。为了说明个人在两种测验上表现的优劣,我们可用“差异的标准误”来检验其差异的显著性,常用的公式如下:
SEd= (5.8)
式中SEd为差异的标准误,SE1、SE2分别是两组测验分数的标准误,用SE1= 和SE2= 代入公式5.8可得:
SEd= (5.9)
这里S表示相同尺度的标准分数之标准差,Txx表示第一种测验的信度系数,ryy表示第二种测验的信度系数。
在上例中,假定此次语文,数学考试的信度系数分别为0.84和0.91,张生的两个分数转化成T 分数后,其差异的标准误为:SEd= 5
采取95%的置信区间(即.05显著水平),,则张生在这两门课上了分数的差异必须达到或超过1.96SEd=1.96×5=9.8,始能认为二者真有差异。因为数学的T分数只比语文高5分,所以差异并不显著。
用SE估计个人分数的误差要注意三点:1)一个测验有很多可能的信度估计,因而也有同样多的标准误估计,为此,我们要选择最适合某一特殊情况的信度估计来解决问题。例如倘若我们对半年内的分数稳定性感兴趣,我们就以六个月为时距施测两次的相关系数作为信度估计,依据此信度系数求出标准误,再用来估计在六个月内分数可能改变多少。2)这个估计假定SE在所有分数水平都一样,但有时高分段与低分段其标准误并不相同。上面所计算的SE实际是整个分数范围的平均测量误差指标。如果分数的分布近似正态,而且实得的分数不超过可能的全距,则测量的标准误差在所有分数水平上近似一致。3)测验上所得分数是一个人真正分数的最佳现成估计,但是,由于存在测量误差,所以它并不是个确切的指标。所得分数对真分数估计得如何精确,可以由SE的大小或间接地由测验的信度显示出来。因为在一般情况下,rxx<1.00,se>0,所以我们必须将测验分数看成范围或带状,而不要看成确切的点。这条带子有多宽将取决于测量标准误的大小,最终取决于信度系数。rxx越小,SE越大,这个范围便越广。若经常将分数想成是一个范围,我们在比较不同被试的分数,或同一个被试在不同测验上的分数时,就可以克服对分数间的微小判别作出过分解释的习惯。4)测量标准误是对测量误差的描绘,用它能对个人真正分数的置信区间作出估计,但用它来估计个人真正能力则可能导致严重错误,因为它没有考虑到系统误差的影响,真分数与真正能力是两个不同的概念。
一级建造师二级建造师消防工程师造价工程师土建职称房地产经纪人公路检测工程师建筑八大员注册建筑师二级造价师监理工程师咨询工程师房地产估价师 城乡规划师结构工程师岩土工程师安全工程师设备监理师环境影响评价土地登记代理公路造价师公路监理师化工工程师暖通工程师给排水工程师计量工程师