测量的信度
第一节 什么是信度
一、信度的定义
信度又叫可靠性,指的是测量的一致性程度。一个好的测量工具必须稳定可靠,即多次测量的结果要保持一致,否则便不可信。信度只受随机误差影响。随机误差越大,信度越低。因此,信度亦可视为测量结果受机遇影响的程度。系统误差产生恒定效应,不影响信度。
在测量理论中,信度被定义为:一组测量分数的真变异数与总变异数(实得变异数)的比率。即,
(5.1)
式中rxx代表测量的信度,S 代表真分数的变异数, 代表实得分数的变异数,即总变异数。
根据公式(4.3),信度还可表示为
(5.2)
该定义有两点要注意: 1)信度指的是一组测验分数或一列测量的特性,而不是个人分数的特性。2)真分数的变异数是不能直接测量的,因此信度是一个理论上构想的概念,只能根据一组实得分数作出估计。
任何测验只能包含特定样本的题目,由特定的施测者,对特定的被式,在特定的时间、地点施测,情况不同便会得到不同的分数。信度涉及的主要问题是对测验分数的意义的概化能力,即从一次测量来推论总体(真实分数)能达到何种正确程度。
根据现代信息论,每组信息可包括一些真正信息(信号)和一些错误的信息(噪音)。为了提供有用的数据,任何测量必须有高的信号噪音比率——即提供更多真正的信息。信号可由真实分数的变异数表示,噪音可由误差分数的变异数表示。
信噪比与信度有如下关系:
信号/噪音= (5.3)
公式(5.3)并不难证明,将 代入上式的右端可得:
=信号/噪音
假如一个测验的信度为0.90,则信噪比为0.90/(1—0.90)=9.0即真正变异数对误差变异数的比率为9:1。
一个测验的信度只要稍微增加一点就会使信噪比大大改变。例如,信度从0.90增为0.91,可使信噪比从9:1,变为10.1:1。因此,即使一个相当可靠的测验也应努力改善其信度。
二、信度系数
大部分的信度指标都以相关系数表示,即用同一被试样本所得的两组资料的相关作为测量一致性的指标,称作信度系数。
与信度系数有关的一个概念叫信度指数,是实得分数与真分数的相关,这是部分与整体的相关,可用下式表示:
信度指数的平方就是信度系数,可用下列公式表示,
(5.4)
换言之,信度系数是实得分数与真正分数相关的平方。相关系数的平方表示两个变量间共有的变异数比例。因此,信度系数实际是真正分数与实得分数之间的决定系数。可以解释为在实得分数的变异数中有多少比例是由真分数的变异决定的。例如,当rxx =0.90时,我们可以说实得分数中有90%的变异数是来自真正分数的差别,仅有10%是来自测量误差,在极端例子中,如rxx=1.00,则无测量误差,所有的变异都来自真分数,若rxx=0,则所有的变异均反映了测量误差。
对信度系数也要注意三点,1)在不同情况下,对不同样本,采用不同方法会得到不同的信度系数,因此一个测验可能不止一个信度系数。2)信度系数只是对测量分数不一致性程度的估计,并没有指出不一致的原因。3)获得较高的信度系数并不是心理测量追求的最终目的,它只是迈向目标的一步,是使测验有效的一个必要条件。
信度系数达到多高才可以接受呢?最理想的情况是 rxx=1.00m,但这是办不到的。不过我们可用已有的同类测验作为比较的基准。一般能力与学绩测验的信度系数在0.90以上,有的可以达0.95,至于性格、兴趣、价值观等人格测验的信度系数,通常在0.80到0.85或更高些。当 rxx<0.70时,不能用测验来对个人作评价,也不能在团体间作比较,当 rxx="">0.70时,可用于团体间比较;当 rxx>0.85时,可用于鉴别个人。
由于信度系数总是在特定情况下获得的,因此只有当一个测验在很多情况下都被证实具有较高的信度时,才可以说它是比较可靠的测验。
三、信度与测验分数的解释
信度系数有两个实际用处:一是用来解释个人分数的意义,二是用来比较不同测验分数的差异.
(一)个人测验分数的误差
信度仅表明一组测量的实得分数与真分数的符合程度,但并没直接指出个人测验分数的变异量。由于存在测量误差,一个人所得分数有时比真分数高,有时比真分数低,有时二者相等。理论上我们可对一个人施测无限多次,然后求所得分数的平均数与标准差。在这个假设的分布里,平均数就是这个人的真分数,而标准差则为测量误差大小的指标。这在实际上是行不通的。然而,我们可以用一组被试(人数足够多)两次施测的结果来代替对同一个人反复施测,、以估计测量误差的变异数。此时,个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差就是测量的标准误,是表示测量误差大小的指标。
测量的标准误可用下式求出:
SE=S
这里SE为测量的标准误, 为所的分数的标准差, 为测量信度。从式中可以看出,测量的标准差与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大。
测量的标准误实际上是在一组测量分数中误差分布的标准差,可以象其它标准差一样地解释。因此,个人每次测量所得分数(X)有68%的可能性落在真分数(T)加减一个单位标准误(SE)的范围内,有95%的机会落在真分数加减1.96个标准误的范围内。图5—1表明实得分数在真实分数上的回归,以及距回归线一个标准误的平行线。
一级建造师二级建造师消防工程师造价工程师土建职称房地产经纪人公路检测工程师建筑八大员注册建筑师二级造价师监理工程师咨询工程师房地产估价师 城乡规划师结构工程师岩土工程师安全工程师设备监理师环境影响评价土地登记代理公路造价师公路监理师化工工程师暖通工程师给排水工程师计量工程师