心理测量的误差
前面我们已经讨论了什么是测验,以及如何编制测验,现在转入研究什么是一个好的测验。
无论何种测量工具,我们对它起码的要求是稳定,准确。用心理测量学的术语来说,就是要可信和有效。所谓可信是指多次测量的结果是一致的,所谓有效是指正确地测量了所要测的东西。信度是测量一致性程度的估计,效度是测量准确性程度的估计。
关于测量的信度和效度问题,下边有专章分别讨论。为了考察测量的信度和效度,首先要了解测量的误差。
第二节 误差的来源
一个测验要准确可靠,必须控制各种误差,为此首先要了解误差的来源。
根据误差定义,任何变因只要与测量目的无关,并使得结果不准确、不一致,便可认为是一种误差因素。在心理测量中,
常见的误差来源于三个方面:测验内部,施测过程,受测者本身。
一、测验内部引起的误差
测验内部的误差主要来源于题目取样:当测验题目较少或取样缺乏代表性时,被试的反应受机遇影响较大,(譬如一次考试碰巧准备到或没准备到某题),当几个测验复本不等值时,接受不同的题目,就会获得不同的分数。
除题目取样不当可引起误差外,其它一些因素,如题目用词的模棱两可,对反应步骤说得不清,题目过难引起猜测,时限短使被试仓促作答等,也都可能成为误差的来源。
二、由施测过程引起的误差
在三种误差来源中,与施测过程有关的误差可能是最容易控制和检验的。通过长期实践,测验的标准化水平越来越高,大部分施测条件能够得到控制。但由于心理现象的复杂性,许多意想不到的偶然因素仍可能影响测验分数,使人防不胜防。
(一)物理环境
施测现场的温度。光线,声音、桌面好坏,空间阔窄等皆具有影响。
(二)主试者方面:
主试者的年龄、性别、外表,施测时的言谈举止、表情动作等均能影响测验结果。倘若不按照规定实施测验,如制造紧张气氛,给予特别协助或暗示,以及计时错误等,都会带来较大误差,特别是当测验具有复杂步骤和说明,或测验题本身是模糊不确定的形式时,当主试者在安排测验条件上有较多余地(例如个别施测)时,当测验是对幼儿,有情绪困扰者以及对测验程序不熟悉的人施测时,主试者的影响更大。
(三)意外干扰:
在测验环境复杂,特别是当受试人数较多时,容易发生出乎预料的干扰或分心事件。例如:停电、有人生病,有人作弊,计价表停了、临时发现题目或作答纸印刷不清或装订错误等,无论哪种情况都会引起不安和扰乱,导致成绩不准确、不一致。
(四)评分计分,
评分不客观以及计算登记分数出错等也是常见的误差。一般选择题的评分较为客观。而问答题、论文题等自由反应型的题目,评分标准很难掌握,加之阅卷者的偏好各不相同,因而难以保证分数的一致性.
早在几十年前,国外就有人对旧法考试的评分误差做过研究。斯达奇(D?storch)和埃立奥特(E?C?Elliott)将一份英文考卷请142位英文教员评阅,所得分数从50分到98分应有尽有。某国教育界还有一件引为笑谈的事,1920年夏季,许多大学教授在评阅历史试卷时,有一位教授为评分便利起见,自己写了一份标准答案,不料和其它考卷混在一起,经另一位教授评阅竟然不及格。为慎重起见,由其它教授重复评定,结果所得分数以10分到90分不等。1961年美国教育测验中心由53个评判员组成专门小组。对大学一年级学生写的200篇作文按九个等级评分,结果有1/3的文章得到了九个等级,有60%的文章得到了七个或八个等级,没有一篇文章少于五个等级。一般理科评分要比文科客观些,但也不尽然。罗雪(Ruch)将—道地理题的解答请91位教员评阅,满分为20分,结果给17种分数,全距为2—20,给各种分数的人次见表4—1,斯达奇和埃立奥特将一份几何考卷请115位中学教员评立,所得分数为28—92分,全距60多分。我国1979年高考数学试卷第四题叙述并证明勾股定理,对于
表4—1 91位教师对于一个地理题的回答所给分数的分布
分数 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
人次 0 0 1 2 0 1 4 3 7 5 24 5 14 8 2 10 2 1 1 0 1
用余弦定理进行循环论证的答卷,有的阅卷教师不给分,有的却给满分(6分)。不仅各教师间有此差异,即使同一教师一次评许多卷,受情绪,疲劳,外界干扰;卷面整洁、试卷前后位置引起的对比效应以及对学生成见的影响,标准也可能不统一,甚至同一张试卷隔一段时间再评,前后给分也可能不一致。至于学校之间,地区之间的差别就更大了。1980年,清华大学受教育部委托对新生进行数学复试,并与高考数学成绩对照。将各省市学生按两次考试的平均成绩分别排队。G省学生的高考平均成绩居第11名,而复试成绩降到第28名,T市学生成绩次序由第8名降到第23名。相反H省和S省考生的名次由第15名和第18名分别升至第3名和第7名,产生这种变化的原因很多,其中很重要的一条是各省评分标准掌握不同,宽严不一。这就使得学生分散的差异在一定程度上反映的是评分者的差异,而不完全是学生水平的差异。
一级建造师二级建造师消防工程师造价工程师土建职称房地产经纪人公路检测工程师建筑八大员注册建筑师二级造价师监理工程师咨询工程师房地产估价师 城乡规划师结构工程师岩土工程师安全工程师设备监理师环境影响评价土地登记代理公路造价师公路监理师化工工程师暖通工程师给排水工程师计量工程师