自学考试《实验心理学》专项习题及答案:论述题
1.试述实验法在心理学研究方法中的地位。
答:实验心理学的方法有广义和狭义之分。狭义的主要就是指实验法。在心理学研究中,实验法并不是唯一的科学方法,但它的确位于所有应用于心理学研究的科学方法的序列顶端。为了准确说明实验心理学专精的研究方法,实验法,在心理学研究中最顶端的方法学地位;有必要对心理学研究所采用的各种科学方法作一番介绍和比较,它们包括:观察法、相关法和实验法。
(1)观察法:是较为原始的一种心理学研究方法。顾名思义,观察法就是通过一定程序收集资料,以期获得描述性的数据来简化复杂现象的过程。虽然观察法在心理学研究的早期阶段非常实用,它可以帮助研究者选择和限定研究的范围作一些前期探索,为进一步实验研究提供资料和课题。然而,因为观察法是描述性的,这种特性必定为其带来如下限制:其一,观察法无法让研究者对各因素间的关系作出推论;其二,有时,观察法的结论难以得到重复验证;其三,使用观察法的研究者往往超出了描述水平,对观察结果进行各种主观解释;其四,观察活动总是极大地受研究者各自世界观的影响。因而来自于研究者的期望等主观因素往往会干扰观察结果,这种干扰比起被试的反应性来更难排除。
(2)相关研究法:心理学研究方法的第二层次。相关研究和观察法一样,也是一种基于描述的科学研究方法,不能解释变量间的因果关系。但相关研究法不同于观察法的简单描述,相关系数表示了变量间的联系紧密程度。所以,如果变量间的联系(相关)足够高,那么就能从一个变量的值推断出另一个变量的大小。这正是相关研究法提供的一项功能:预测。这就是相关法的优点:显示变量间的共变关系,从而提示研究者注意到各种现象间可能存在的因果关系。但是由
于其方法学特性,决定了相关研究法的缺点在于:其一,相关研究的结果往往取决于其选用相关法的前提条件是否得到了满足;(2)相关研究法无法确定因果关系的方向。
(3)实验法:实验法是科学心理学研究的最高级方法,也是实验心理学系统发展、讨论、应用的科学方法。实验法脱离了观察法和相关研究法的描述性层次,而真正具备了完整的解释、检验和预测功能。
实验,是指通过人为地、系统地操作环境,导致某些行为发生变化,并对之进行观察,记录和解释的科学方法。更具体地说,就是设立有关各种可能因果关系的实验假设和推论,并将这一假设转化为各种变量间的关系,通过各种有效的实验控制方法来检验这些变量间的因果关系。
实验具有观察法和相关研究法所无可比拟的优点,因而更受到实验心理学的青睐:其一,实验能更好地控制无关变量的影响。就是通过一定的方法和手段,来控制其他因素,从而使自变量以外的其他因素都保持恒定。这样,在逻辑上就可以认为,所获得的任何结果都是由自变量引起的。换句话说,自变量的变化引起了所观察到的因变量的变化;其二,经济。运用自然观察法时,观察者必须很耐心地等待所要观察的情况出现。如果你住在北极圈附近的挪威特伦汗港,但却想研究热对攻击行为的影响,那么只靠太阳产生高温就需要极大的耐心和时间了。但如果实验者通过设置感兴趣的情景来控制环境,就可以迅速有效地获得数据。但是,不能认为有了实验法就可以抛弃描述性研究方法。正像观察法能够为相关研究法提供必要的准备一样,实验法也离不开较低层次的描述性方法的支持。正是观察法和相关研究法,提供了最初的假设来源和因果猜测,离开了这些,实验法的假设检验和因果结论也就无从谈起。
总之,比起其他科学方法——观察法和相关研究法,实验法在方法学上的地位显然更为突出,因而实验心理学在科学心理学中的地位也是核心和基础的。在实验心理学研究中,研究者用实验来证实或证伪理论,并提供解释心理现象及行为的数据。从这点来说,实验法比观察和相关法更能提供确切的,令人信服的证据来解释各种心理现象和行为背后的因果关系。不过在另一方面,实验的来源和前期准备往往又离不开观察和相关研究。所以这三种方法并不是相互割裂的,而是能够形成一个整体,以最终的实验研究为核心与重点,应用于实验心理学之中。
2.试述实验心理学研究的一般程序。
答:实验心理学研究通常要遵循这样的基本程序:课题确定、被试选择、实验控制、数据整合和研究报告撰写。
1.课题确定
确定课题过程包括选择课题、确定实验类型、提出假设三个步骤。选择课题就是在众多的研究内容中作出一个选择,确定实验类型就是明确所要研究的问题属于何种类型的过程,提出假设就是将问题变成可以检验的假设,以便于进一步转变为可操作的实验。
(1)选择课题就是根据各方面需要提出所要研究的问题。课题的选择通常有以下四个来源:实际需要;理论需要;个人经验;前人研究与文献资料
(2)科学探索,可分为两阶段或两个类型:第一阶段是探明规定某个行为的条件是什么;第二个阶段是探明某些条件与行为之间的函数关系如何。与这两个阶段相对应,实验可以分为两种类型:因素型实验和函数型实验。研究者应根据所处的研究阶段,确定实验类型。
(3)在课题确定及其所属的实验类型均明确之后,问题还需以假设的形式提出。所谓假设是关于条件和行为之间的关系的陈述。针对因素型、函数型两种实验类型,假设的陈述也包括因素型假设和函数型假设两种方式。如果把对条件的叙述记为a,把对行为的叙述记为b,那么因素型假设就是“如果a,那么b”的形式,而数型假设则方程式b=f(a)表示。
2.选择被试
被试选择主要取决于两个因素:课题的性质以及研究结果的概括程度。
(1)课题的性质可以指导实验选择人类被试还是非人类被试。许多实验心理学研究课题涉及到人类的心理和行为,因此往往首选人类作为被试。但是在以下两种情况下研究者应该考虑选择非人类被试:第一,实验程序有可能对人类被试造成身心损害;第二,非人类被试有助于实验对无关变量的控制。
(2)实验研究结果所要求的概括程度可以指导被试选择如何取样的问题。心理学研究的群体可能只是一个小群体,他们仅具有某种特性,而选定什么样的被试样本,要依研究的问题和据此而推论的全体而定。如果被试的取样出现偏差,就会影响实验效度。一般来说,可以通过随机抽样法和分层随机取样法来减少取样偏差。
3.确定实验控制
进行科学实验能做的就是从课题确立阶段的资料准备开始,圈定最可能影响实验的那一部分变量进行控制。至于在此之外无数可能成为干扰的额外变量,一方面要理解其中许多会影响因变量的可能性基本上为零;另一方面还可以有赖科学方法本身独有的自我完善特性。
4.数据整合
心理学研究所能收集到的资料大致分为计数资料、计量资料、等级资料、描述性资料四类:计数资料,即按个体的某一属性或某一反应属性进行分类记数的资料;计量资料,即用测量所得到的数值的大小来表示的资料;等级资料,它介于计数资料和计量资料之间,可称为半计量资料;描述性资料,即非数量化的资料。
针对计数资料和计量资料在实验变量上的不同组合,需使用不同的数据处理方法:
(1)自变量为计数资料,因变量为计量资料:最恰当有效的统计工具是方差分析,当然在一些结构最简单的实验中,如果自变量和因变量都只有一个,并且自变量只有两个水平,那么也可以选用t检验作为评价因变量均数差异的方法。
(2)自变量和因变量都为计量资料:首先,可以将计量资料的自变量降级为计数资料使用,借助方差分析和t检验等技术进行数据处理。其次,如需要用多个计量资料的自变量来解释单个计量资料的因变量,可使用多元回归。
(3)自变量为计量资料,因变量为计数资料:通常选用logistic回归进行数据分析。
(4)自变量和因变量都为计数资料:只能使用非参数检验进行数据分析。
5.报告撰写
研究报告撰写时必须注意的一些要点:
(1)研究者需要回顾与研究有关的前人工作。(2)研究者应该清晰明确地描述实验设计和研究过程。(3)实验报告应能做到使专业领域的同行可以据此重复研究者的工作。(4)实验报告中的客观描述和研究者本身的主观解释应当能清晰地区分开来。
3.谈谈实验中的各种变量及其控制。
答:1.自变量
实验中实验者所操纵的、对被试的反应产生影响的变量就是自变量。心理学实验涉及到的自变量种类很多,但是大致可以分为三类:(1)作业变量——实验中被试任务的任何特性;(2)环境变量;(3)被试变量——可能影响对某种刺激的反应的被试的特性因素,包括:被试的性别 、年龄、健康状况、智力、教育水平、人格特征、动机、态度、内驱力等。有些被试变量可以由实验者操纵,例如内驱力强度就可以用禁食或禁饮的时间加以操纵,而有些则不能操纵的,只能进行测量,例如智力、教育水平、自我强度等。
对自变量控制的好环,直接影响实验的成败。它主要经历以下两个步骤:
(1)对自变量下操作定义:许多时候,实验者无法从实验目的直接得到合适的自变量,直接得来的自变量往往不够明确。解决这一问题的办法是采用明确、统一、可以量化的术语对自变量进行严格的规定,这就是对自变量下操作定义的过程。操作定义明确了自变量的内涵,同时也往往指出了自变量操纵的方法。例如实验者把疲劳定义为“从事某种体力劳动的时间量”,这就意味着对“疲劳”这一自变量的操纵就是通过改变被试的劳动时间来完成的。
(2)确定自变量的各个水平:所谓自变量的水平,即指自变量的一个取值(或操纵结果)。例如以疲劳为自变量的研究中,设定了“体力劳动时间”这一操作定义,那么接下来研究者就可以确定两个水平的疲劳程度了,如:1小时、2小时。自变量的水平数至少为2。因素型实验的自变量一般不超过4个水平,并应尽量使自变量变化范围(全距)较大,各个水平在全距上分布平均。而函数型实验的自变量水平需要更多些,如果预期实验考察的是线性函数关系,可以取3—5个水平;如果是关于更复杂函数关系的,则至少需要5个水平。同样,自变量的变化范围不宜过小,一般应该通过文献工作确定合适的全距大小。至于自变量各个水平在全距范围上的分布,则可以根据实际情况而定。若预期自变量和因变量的关系是接近于线性函数,则各水平平均分布即可;而如果预期自变量和因变量符合对数函数关系,则各水平间的间距应按对数单位变化。
2.因变量
由操纵自变量而引起的被试的某种特定反应称为因变量。一般来说,对于因
变量的测量有客观指标也有主观指标。其中客观指标主要有:(1) 反应速度;(2)反应速度的差异,例如:在内隐学习的研究中,被试对随机组字母和规则组字母的反应时之差就可以作为内隐学习量的指标;(3)反应的正确性;(4)反应的难度,有些作业可以定出一个难易等级,看被试或动物能达到什么水平,如斯金纳箱就有三个难度等级。而因变量的主观指标主要是指被试的口语记录。口语记录是指被试在实验时对自己心理活动进程所作叙述的记录,或在实验之后,被试对主试提出问题所作回答的记录。
因变量的控制主要着眼于如何精确客观地记录下它的变化。一般而言,有几种主要方法可以用于因变量的控制:
(1)反应控制:目的是让被试的反应确实发生在实验者感兴趣的因变量维度上。在人作为被试的实验中,对反应的控制往往是通过指导语实现的。心理学实验中,规范的指导语应符合以下要求:内容确定、完全、简单明确、标准化。在指导语不能充分控制反应时,就要很好地考虑刺激条件和实验装置,使刺激条件、实验装置与指导语配合起来,使被试只能作出主试所要求的反应。
(2)选择恰当的因变量指标:为使实验中被试的反应能够具体度量,就要规定一定的标准。这其实就是为使反应能够具体度量而规定一系列标准或具体指标的过程,简单地说,也即选择恰当的因变量指标的过程。在心理学实验中,一般常用的反应指标有:绝对阈限、差别阈限、反应时、反应持续时间、反应程度、完成量、错误率、完成一定的作业所需要的时间、达到一定基准所需要的次数以及口头报告等等。但是不管怎样,一个恰当的因变量指标必须满足以下标准:有效性——指标充分代表当时的现象或过程的程度;(2)客观性——指标是客观存在的;(3)数量化——指标能数量化,便于记录、统计和互相比较。
(3)避免量程限制:在以上几个选择指标的条件中,有效性是最重要的。在影响指标有效性的各种因素里,天花板效应和地板效应是尤其典型的情况。这两种效应是指反应指标的量程不够大,而造成反应停留在指标量表的最顶端或最低端,从而使指标的有效性遭受损失。通常,避免天花板和地板效应的方法是:尝试着先通过实验设计去避免极端的反应,然后再试着通过测试少量的先期被试来考察他们对任务操作的反应情况。如果被试的反应接近指标量程的顶端或底端,那么实验任务就需修正。
3.控制变量
实验中并不仅仅只有自变量才是和因变量有关的,在自变量之外往往存在着额外相关变量。同时又由于实验者必须想办法控制额外变量对因变量的影响,额外变量也常被叫做控制变量。一般来说,实验过程中的温度、环境噪音、照明情况、被试身体状况等都能成为额外变量的来源。不过对于心理学实验而言,有一部分额外变量是其特有的,那就是来源于主试和被试相互作用的额外变量。
在实验中,主试(实验者)和被试之间可能存在着某种干扰实验、使实验结果发生混淆的相互作用。这种相互作用就可能带来一些额外变量。这种作用主要表现为两个方面:(1)实验者效应:主试在实验中可能以某种方式(如表情、手势、语气等)有意无意地影响被试,使他们的反应附和实验者的期望。(2)要求特征:实验中,被试自发地对实验者的实验目的产生一个假设或猜想,然后再以一种自以为能满足这一假想的实验目的的方式进行反应的特征。要求特征的典型例子是霍桑效应和安慰剂效应。
在心理学实验中,对额外变量的控制技术主要有:(1)排除法:把额外变量从实验中排除出去。例如,如果外界的噪音和光线影响实验,最好的办法就是进入隔音室或暗室,这样可以把它们排除掉;(2)恒定法:旨在使额外变量在实验过程中保持恒定不变;(3)匹配法:使实验组和控制组中的被试属性相等的一种方法;(4)随机化和平衡法:把被试随机地分派到各处理组中去的技术,以使额外变量的效果互相抵消;(5)统计控制法:在实验完成后通过一定的统计技术来事后避免实验中额外变量的干扰。
4.论述实验效度及其影响因素。
答:实验效度是指实验方法能达到实验目的的程度,也就是实验结果的准确性和有效性程度。实验效度主要包括内部效度和外部效度。
1.内部效度
实验的内部效度是指实验中的自变量与因变量之间因果关系的明确程度。如果在实验中:当自变量发生变化时因变量随之发生改变,而自变量恒定时因变量则不发生变化,也就是说确实是自变量而不是其他因素引起了因变量的变化,那么这个实验就具有较高的内部效度。由此可知,内部效度与无关变量的控制有关。
当实验中未得到控制的无关变量越多时,因变量的变化不是由自变量引起的可能性就越大,实验的内部效度就越低。当实验结果未受到任何其他变量的干扰,自变量与因变量的因果关系明确时,实验的内部效度则是高的。
内部效度问题其实就是实验变量控制的问题,各种典型的无关变量都会影响到实验的内部效度,现分述如下:
(1)主试-被试间的相互作用:在心理学实验研究中,除了主试给出指导语及被试按指导语要求完成任务的相互作用之外,他们之间还可能存在着某种干扰实验、使实验结果发生混淆的相互作用。尽管研究者总要在研究中引入尽可能多的实验控制,但即使是在最谨慎的研究者那里,有两种来源的偏差仍可能受到忽视:要求特征和实验者效应。
(2)统计回归:第一次测量平均值偏高者,第二次测量平均值有趋低的倾向(向常态分布的平均数回归);第一次测量平均值偏低者,第二次测量平均值有趋高的倾向。当实验分组涉及到某些具有极端特性的个体作为被试(如高焦虑组和低焦虑组)时,统计回归将对实验的内部效度起到极大的影响,实验者将无法区分统计回归的效应和自变量本身的效应。为避免统计回归对实验效度的影响,通常建议实验者在匹配被试时必须考虑两组被试本身是否同质,如果不同质(就象白人儿童和非裔儿童)就必须以几组被试各自的相对水平进行匹配。此外,利用统计控制进行协方差分析,在某种程度上也能降低统计回归对实验效度的影响。
(3)其他影响内部效度的因素:实验内部效度还与许多其他因素的控制有关。例如在实验中,被试的一些固有的和习得的差异,如性别、年龄、经验、个性等都对研究存在一定的影响。在对被试进行分组时,如果没有使用随机取样和随机分配的方法,即存在被试的选择偏性的话,那么实验结果就会发生混淆,从而降低内部效度。另外在一些长期实验中,参加实验的人员的流失率会随着时间而增大。即使开始参加实验的被试样本是经过随机取样和随机分配的,但由于被试的中途缺失,常常使缺失后的被试样本难以代表原来的样本,这同样会降低实验的内部效度。对于时间跨度较长的实验,必须考虑到个体本身的生长和成熟因素也能影响内部效度。此外,增设控制组,同样能够解决由于实验程序本身、控制方式的不一致以及测量程度的变化对实验内部效度的影响。例如,在使用前测
后测的实验研究中,一般正常情况下,即使没有接受任何实验处理,后测的分数也将比前测的分数高一些。这中间可能包括练习因素、临场经验、以及对实验目的敏感程度的效应。而这些影响实验效度的问题,可以通过增设一个无实验处理,仅有前后测的控制组加以解决。如果实验组的后测明显高于控制组的后测,那么实验组被试的前后变化就确实是由自变量引起的(至少是高于控制组的那部分)。
2.外部效度
实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性,研究者也将之称为生态效度。
实验的外部效度就要受到很多因素的制约。主要有以下三个方面的影响。
(1)实验环境的人为性:实验是在严格的控制条件下进行的,实验环境的人为性可能使某些实验结果难以用来解释日常生活中的行为现象。在特定的实验情境中,被试通常知道自己是处于被观察的地位,因此其行为可能会受到影响,表现为与他们不知道自己正在被观察或不参加实验时有很大的不同。而且实验室中的仪器设备也会影响被试的典型行为。此外,像我们在前面所提到的那样,被试参与实验时都存在一定的动机和对实验的预期,这些因素都会影响其行为表现。
(2)被试样本缺乏代表性:从理论上讲,参与实验的被试必须具有代表性,必须从将来预期推论、解释同类行为现象的总体中进行随机取样。但实际上这很难做到。因为如果总体很大,即使能够随机取样,但由于心理学实验的被试通常是自愿的,所以也很难把被随机选上的人全部请来做实验。如果总体是无限的,例如“七岁儿童”就是一个无限的总体,包括过去的、现在的、将来的所有七岁儿童,随机取样实际上是行不通的。这样的结果自然会降低实验的外部效度。同样,如果研究者选择一些具有独特心理特质的被试进行实验时,因为这些独特的心理特质有利于对实验处理造成较佳的反应,就很难将得出的结果推广到其他特质的被试上去。例如,如果选择一些智力水平较高的学生,进行发现式教学与传统教学的比较,实验结果发现前一种教学法优于后一种教学法。但是这一结果显然不能推论到实验以外的其他一般的学生中去。因为参加实验的对象是具有高智力水平的学生,他们也许比这种特质低的学生(例如,低智力水平的学生)更能从发现教学法中获益。如果将这种结果随意推广到所有学生上去,显然会造成推论的错误。
(3)测量工具的局限性:实验者对自变量和因变量的操作性定义往往以所使用的测量工具的测量结果来加以考虑的。例如,把成就动机作为一个因变量,实验者常以某种成就动机量表所测得的分数来界定并评价其强度。但成就动机的测量工具有各种不同的形式,所测量出的分数并不代表同一种成就动机及其强度。如果在实验时采用的是某一种成就动机的量表,那么所得出的实验结果便不能推论到采用其他成就动机的量表的情况中去。
5.核对清单阅读法在阅读过程中的八大问题是什么?
答:核对清单法要求读者带着自己的问题来阅读心理学论文,将自己的思考与作者的论述进行核对,以发现自己与作者之间的不同,并能够尽力解释这些不同。
通常,清单上共有八个主要问题,它们是分别针对实验报告的不同部分提出的,它们为:
读完引言后,回答:
1.该论文的研究的目的是什么?
2.实验中将要验证的假设是什么?
3.如果由我来验证这个假设,我是否会像作者这样设计实验?写下你的方法的主要思想。
读完方法后,核对:
对问题3的回答,你与作者的异同。
核对后,回答:
4(a).我提出的方法优于作者的吗?
4(b).作者的方法确实能验证假设吗?
4(c).实验中的自变量、因变量和控制变量各是什么?
比较我与作者在回答上述问题时的差异后,回答下一个问题:
5.使用作者所描述的被试、仪器或材料及程序,能得到怎样的预期结果?
读完结果后,核对:
我的预测与作者的结果之间的异同。
如果不同,请从问题6开始回答。
如果相同,请回答问题7(a) 和7(b)。
核对后,回答:
6.实验结果如我所料吗?
如果和我的预期不同,可以从两个角度思考:或者我的预测错了,或者作者的研究结果不可信。可能其方法不当,不能充分验证假设或介入了无关变量。若果真如此,可以改进方法来重做研究。
7(a).我会怎样解释此实验结果?
7(b).从我对结果的解释中,能得出的意义和启发是什么?
读完讨论后,核对:
在解释结果方面,我与作者的异同。
核对后,回答:
8(a).我的解释与作者的解释,哪一个能更好地说明数据?
思考这个问题时,不要迷信作者的解释。他们也可能会出错,因为讨论时作者的自由度很大,他们的结论可能夸大而不被数据支持。
8(b).我的与作者的解释中,哪一个更有意义、更能启发其他研究者?
6.请阐述标准实验报告的格式。
答:按照美国心理学会2001年的《APA出版手册》(第五版)中的描述(这本出版手册已被美国大学心理学及相关专业作为教材),一份标准的实验报告的各个关键部分应该以固定的页码顺序排列如下:
封面包括文章的题目、作者姓名和工作单位、以及行文标题。手稿中每页的右上角会有短标题,它是由题目中的几个词构成,主要用于编辑时确认手稿。当手稿被打印发表的时候,这种短标题就称为行文标题,它会被打印在手稿的封面上。
第二页包含短标题、摘要及关键词。关键词一般是在摘要后,列出和文章内容息息相关的几个单词或短语。此外从第二页开始,除了最后的图片页外,每页顶端都要列出短标题和页码。
实验报告正文从第三页开始,首先是文章的完整题目,紧接着是引言。通常来说,无须给引言加注小标题。写完引言后,紧随方法部分,无须换页。一般来说,小标题“方法”应打印在它所在行的中央。在撰写方法部分时,应写上几个下一级子标题,如“被试”、“仪器”和“程序”等,以帮助读者快速明确相关信息。方法之后紧跟着结果部分、讨论部分,和此前一样,仍不必换页,小标题打印在行的中央。需要注意的是:正文中不要直接出现图表,只需在相应位置标注出图表编号即可,所有图表的详细内容都在正文之后另行打印。
在讨论部分之后,另起一页写参考文献。参考文献是整篇论文中的写作格式最为复杂的一部分,因此写作时要小心准备。可以参考《APA出版手册》和最近的期刊文章。如果实验报告包含有作者注或脚注,则也分别需要另起一页写在参考文献的后面。一般当研究者准备发表论文时,考虑受到过的各方援助,需要写作者注来表示感谢;而行文过程中若有些部分确需要另行注释,就要按编号写脚注,但一般并不鼓励研究者写脚注。
最后需要另起一页,开始报告正文中涉及的图和表,先表后图。表格每页一个,前面要标上号码并设置简洁易懂的标题;图则首先集中报告所有图片的编号和说明,然后开始每页打印一张图,背面要写上作者的姓名(或短标题)以及图的号码。
7.试举一例说明速度-准确性权衡问题在反应时实验中的关键性。
答:反应时在心理学研究中被广泛使用,反应时的快慢常被作为衡量加工的自动化程度、概念的激活水平以及注意需求量等的指标。然而,在具体采用反应时指标时常常会遇到一些问题,因为反应时实验有两个基本的因变量,即速度和准确性。反应时实验中的一个突出问题就是反应速度和反应准确性间的反向关系,这使得我们必须在它们之间作出权衡。我们都有这样的常识,当你急于做某件事时,你更可能出错;相反,当你试图准确地完成某件事时,如完成学期论文,为了达到预期的准确性,你必须放慢工作速度。心理学家将这种关系称为速度-准确性权衡。这对于以反应时为因变量的研究有着重要影响。
反应时任务的速度-准确性权衡的探讨和大量以反应时为因变量的心理实
验的信度密切相关,速度-准确性的探讨有助于有效地提高心理实验的信度。下面就让我们来看一个思维方面的实验研究,看看研究者是怎样使用速度-准确性权衡来提高实验结论的信度的。
邓克的盒子问题是问题解决领域的经典研究。它揭示了被试在问题解决中的功能固着现象。实验中,被试的任务是将三支蜡烛安置门上,被试可以使用的材料是几枚大头钉、几根火柴、三个火柴盒以及蜡烛。正确的问题解决方法是先将盒子钉到门上作为平台,然后再把蜡烛底部融化后粘在盒子上。将21个被试平均分入三个实验条件中:控制条件下,盒子是空的;功能固着条件下,盒子里装有蜡烛、火柴或图钉,盒子的功能会被固着为容器;在中性条件下,盒子中装有钮扣等非解决问题所需的中性物品,盒子也被固着为容器。结果发现,在控制条件下,7位被试都解决了问题;在功能固着条件下,仅3个被试解决了问题;在中性条件下,只有一个被试解决了问题。至此,邓克得出结论认为,是功能固着影响了问题解决。而事实是这样吗?鉴于速度-准确性权衡的原理,亚当森纳入了时间变量来检验邓克实验的信度。
在亚当森的实验中,因变量指标有两个:一个是在20分钟内能够解决问题的被试占被试总数的百分比;而另一个是被试成功解决问题所花的时间。下面我们来看看在纳入了反应时后,会得出怎样的实验结论。
除了纳入反应时因变量之外,亚当森还增加了两个实验任务——螺丝锥问题和回形针问题。结果十分有趣。当亚当森使用和邓克一样的因变量,即20分钟内能够解决问题的被试占被试总数的百分比作为因变量时,他只在盒子问题上验证了功能固着效应,他发现86%的控制组被试解决了盒子问题,而只有41%的功能固着组被试解决了盒子问题,功能固着对问题解决产生了显著的影响。然而,由于另外两种实验任务中存在天花板效应,即两种条件下几乎所有被试都解决了问题,其结果不可能解释原先的实验结论——功能固着对问题解决产生了显著的影响。这时实验结论的信度相当低,因为整个实验的三项任务中只有一项任务验证了原来的前提假设,整个实验中的各个部分不完全一致,因变量的不灵敏导致研究者无法识别两种条件下可能存在的任何差别。
现在让我们用速度-准确性原则再次考虑此问题。在螺丝锥问题和回形针问题中,或许20分钟的时间限制对被试来说,过于简单,他们完全可以不考虑
速度,而只求高准确性。换言之,20分钟足以让功能固着组被试跳出思维定势从而解决问题,准确率的天花板效应似乎不可避免。在泰奥斯的简单反应时实验中,当被试遵循高反应速度原则时,他们的准确率随着刺激呈现概率的降低而降低,那么亚当森的实验中,我们是否也可以根据速度-准确性权衡作出这样的假设:在被试遵循高准确率的情况下,被试的反应时会随着功能固着效应的增大而提高呢?亚当森使用的第二个因变量指标——反应时验证了这一假设。尽管几乎所有被试都能解决问题,但两种条件下的反应时有很大差别,不管是在解决螺丝锥问题时,还是在解决回形针问题时,被试在控制条件下解决问题要比在功能固着条件下解决问题快得多。因此,当某一问题的解决过程伴随着功能固着时,被试表现为问题解决速度变慢,功能固着显著地影响了被试执行问题解决的反应时。亚当森这一结论的提出明显地提高了整个研究的信度,即功能固着效应在三个任务中都得到了验证。从另一个角度来说,如果亚当森在实验中将问题解决的实验控制在10分钟或是更短,那么成功解决问题的被试百分比这一因变量应该会更可靠些,因为被试在追求速度的同时,必将以准确性作为牺牲,所以功能固着的影响一定能在准确率上反映出来。
至此可知,事实的确如邓克所说的,功能固着会影响被试的问题解决。可见,在以反应时为因变量指标时,单一考虑速度,或单一考虑准确性,都会极大地损害实验研究的信度。因此,在进行反应时实验时,必须考虑两个因变量——速度和准确性;当只选择一个因变量指标时,应对为何不使用另一个的原因有所交代。
8.什么是加因素法?
答:认知心理学家斯腾伯格发展了唐德斯的减数法反应时逻辑,提出了加法法则,称之为加因素法。它不是对减数法反应时间的否定,而是减数法的发展和延伸。
斯腾伯格首先提出了加因素法的主要假设,也即加因素法的实验逻辑。斯腾伯格认为,人的信息加工过程是系列进行的而不是平行发生的。人的信息加工过程是由一系列有先后顺序的加工阶段组成的。这是加因素法的一个基本前提,加因素法的采用是在假定这个前提成立的条件下进行的。因此,在加因素法反应时
间的实验中,研究者通常认定,完成一个作业所需的时间是这一系列信息加工阶段分别需要的时间总和。加因素法反应时间实验的逻辑是:如果两个因素的效应是互相制约的,即一个因素的效应可以改变另一因素的效应,那么这两个因素只作用于同一个信息加工阶段;而如果两个因素的效应是分别独立的,即可以相加,那么这两个因素是各自作用于不同的加工阶段的。也就是说,加因素法假设:如果两个因素有交互作用,那么它们是作用于同一个加工阶段的;而如果两个因素不存在交互作用,即相互独立,那么它们则作用于不同的加工阶段。
根据这个逻辑,在应用加因素法进行实验时,研究者在影响反应时间的各种因素(变量)中找出其中独立的因素。如果发现可以影响完成作业所需时间的一些因素,那么单独地或成对地应用这些因素进行实验,就可以观察到完成作业时的时间变化。当两个实验因素影响两个不同的阶段时,它们将对总反应时间产生独立的效应,即不管一个因素的水平变化如何,另一个因素对反应时间的影响是恒定的,这样称两个因素的影响效应是相加的。加因素法就是这样通过探索有相加效应的因素,来区分不同的加工阶段,从而尝试找出某信息加工的所有阶段,以推断整个的信息加工过程。可见,加因素法实验所侧重的,不是区分出每个阶段的加工时间,而是证实不同加工阶段的存在,以及辨认它们各自的前后顺序。
斯腾伯格曾借助加因素法揭示了短时记忆提取过程的四个独立因素,并根据这四个独立因素,提出了短时记忆信息提取过程包含相应的四个独立加工阶段,即刺激编码阶段、顺序比较阶段、二择一的决策阶段和反应组织阶段。按照斯腾伯格的看法,测试项目的质量对刺激编码阶段起作用,识记项目的数量对顺序比较阶段起作用,反应类型对决策阶段起作用,反应类型的相对频率对反应组织阶段起作用。
对于加因素法所依托的系列加工而不是平行加工的这个前提,一些心理学家提出了质疑,他们认为信息加工中是应该存在平行加工的可能的。加因素法首先假设信息加工是系列的,然后推测出信息加工的各个加工阶段,这有一种循环论证的倾向。另一方面,关于加因素法反应时实验的逻辑,即能否应用可相加和相互制约的效应来确认信息加工的阶段,也遭到了众多研究者的质疑。相反,斯腾伯格用加因素法进行了一系列严谨的实验,并得出了一系列有力的实验结果。因此,不能因为这些质疑而否定加因素法的价值,加因素法实验在很大程度上对认
知心理学的发展起到了积极的推动作用。
9.试述感觉阈限测量的三种基本方法。
答:1.最小变化法
最小变化法的特点是将刺激按递增或递减系列的方式,以间隔相等的小步变化,寻求从一种反应到另一种反应的瞬时转换点或阈限的位置。
(1)在测定绝对阈限时,递增系列的起点安排在被试基本觉察不到的物理刺激强度范围内;递减系列的起点安排在被试基本觉察到的物理刺激强度范围内。在实验时,每个刺激系列都从起点处沿递增或递减方向,依次呈现给被试,要求被试报告表示是否感觉到刺激,若被试感觉“说不准”,则要求其进行猜测。主试以“有”“无”或“+”“一”记录被试的反应。对于递增系列,到被试第一次报告“有”,便停止实验;对于递减系列,到被试第一次报告“无”,停止。然后,先计算每个刺激系列的阈限,即被试者反应转折点处所对应的两个刺激强度的中点,再求出所有系列阈限的均值,便是最后求得的绝对阈限值。
(2)和绝对阈限的测定不同,用最小变化法测定差别阈限时,每次要呈现两个刺激,让被试比较,一个是强度大小不变的标准刺激,另一个是强度按递增或递减顺序排列的比较刺激。标准刺激在每次比较时都出现,比较刺激按递增或递减系列与标准刺激匹配呈现,直到被试的反应发生转折。将被试的报告分为三类反应,(1)比较刺激大于标准刺激,记为“+”;(2)比较刺激等于标准刺激时,记为“=”;(3)比较刺激小于标准刺激,记为“-”。当被试在比较时表示怀疑,可记作“?”。差别阈限2luLLDL?=,其中Lu为递减系列中 “+”到非“+”反应的中点,Ll为非“-”到“-”反应的中点。
(3)最小变化法测定绝对阈限产生的误差主要有四种:习惯误差和期望误差、练习误差和疲劳误差。为了让习惯误差和期望误差尽可能相互抵消,最小变化法的递增和递减序列要做到数量一致。而练习与疲劳误差可以通过ABBA 法进行控制。最小变化法测定差别阈限时,除了上述四种误差,还会产生由标准刺激和比较刺激每次呈现的相对关系导致的时空误差,这可用多层次ABBA法进行控制。
2.恒定刺激法
恒定刺激法的具体作法如下:(1)主试从预备实验中选出少数刺激,一般是5到7个,刺激最大强度被感觉到的可能性应不低于 95%,刺激的最小强度被感觉到的可能性应不高于 5%;(2)选定的每种刺激呈现50到200次;(3)刺激呈现的次序事先经随机安排,不让被试知道。用以测量绝对阈限时,则无需标准值;如用以确定差别阈限或等值时,则需包括一个标准值;(4)此法在统计结果时必须求出各个刺激变量引起某种反应(有、无或大、小)的次数,并用直线内插法求出阈限值。在用直线内插法求绝对阈限时,只要将刺激作为横坐标,以正确判断的百分数作为纵坐标,画出曲线。然后再从纵轴的50%处画出与横轴平行的直线,与曲线相交于点a,从点a向横轴画垂线,垂线与横轴相交处就是阈限。在用直线内插法差别阈限时,如要求被试做三类反应,则用直线内插法求得50%的次数被判断比标准刺激大的刺激强度和50%的次数被判断比标准刺激小的刺激强度,两者相间除二便是差别阈限。当只要求被试进行两类反应时,则要选取75%处,作直线内插,再求差别阈限,这种阈限称为75%差别阈限。
3.平均差误法
平均差误法的基本程序是呈现一个标准刺激,令被试再造、复制或调节一个比较刺激,使它与标准刺激相等,主试则记录每次调节的结果。测定绝对阈限时,只要设定标准刺激为零即可,绝对阈限等于每次调节的均值。而差别阈限NPSEXAE M?Σ=或NSXAE tst?Σ=,其中PSE为每次调节的均值,而St为标准刺激强度。
在平均差误法实验中,一般要被试自己操纵实验仪器来调整比较刺激,使其与标准刺激相等。这就要产生动作误差,亦即因被试所采用的方式不同而产生误差。若标准刺激和比较刺激是相继呈现的,又易产生时间误差。因此,在实验中应加以控制,控制方法依具体实验不同而不同,一般可采用多层次的ABBA法,还可使比较刺激从小到大,从大到小两方面来进行调整,以便控制动作误差等。
10.试述信号检测论的基本思想。
答:信号检测实际就是从噪音背景中检测信号,所以信号和噪音是信号检测论中最基本的两个概念。在心理学领域,信号检测论所指的信号可以理解为刺激。
而噪音就是信号所伴随的背景。
心理学上的信号检测实验一般是在信号和背景不易分清的条件下进行的。对信号检测起干扰作用的所有背景都是噪音。这里的“噪音”不仅是指纯音信号出现时的其他噪音而言的;在视觉实验中,伴随着亮点信号出现时的照度均匀的背景也叫做“噪音”。总之,对信号起着干扰作用的因素都可当作“噪音”。主试呈现的刺激,有时只呈现“噪音”刺激(以N表示);有时信号刺激和噪音刺激同时呈现(以SN表示),让被试对信号刺激做出反应,被试每次都要判断所接受到的:(1)仅仅是噪音背景;或者(2)在噪音背景上叠加了信号。
信号伴随噪音,和单独出现噪音这两种情况下,分别可以在心理感受量值上形成两个分布:信号加噪音(SN)分布和噪音(N)分布,前者也常常简称为信号分布。由于信号总是叠加在噪音背景之上,因此总体上信号分布总是比噪音分布的心理感受更强些。
信号分布的均值总是大于噪音分布的均值,由于信号和噪音的感觉强度都受各种随机因素影响,因此两个分布都呈正态。信号分布和噪音分布在中间强度上相互重叠,说明这一强度范围的感觉可能由信号导致,但是单独的噪音也有可能引起这一强度的感受。信号的心理感受强度可以用两个分布之间的距离来描述。同样,信号分布和噪音分布间的距离也可以作为心理物理学实验中对被试感受性的衡量指标,这被称为辨别力指标(d’)。
我们可以将上述信号和噪音两个感觉分布视为无数次感觉过程累计。这样,观察者(被试)的每一次感觉过程都会产生一定的感觉量值x。这个x必定落在噪音分布和信号分布所覆盖的范围内。如果x很弱并离开了信号分布,就必定来自噪音分布;反之x很强并离开了噪音分布,也就一定是信号。问题集中在信号分布和噪音分布重叠的中间感受区域上:这一区间的x值即可能对应信号,也可能对应于噪音。对于此区间内任意一个x,它来自信号分布或噪音分布的可能性,可以用其在两个分布中对应的纵线高度(O)来衡量。x对应的两个分布上的纵线高度之比被称作似然比,它被记为l(x)。 )()()(NOSNOxl=
信号检测论假设,观察者选择某一个似然比的值作为产生“信号”、“噪音”
两种判断反应的分界点,或称决策标准(β)。观察者的决策规则(decision rule)就是比较当前观察得到的x所对应的似然比l(x),与观察者自定的决策标准β的大小。如果l(x)大于等于β,观察者就选择进行“信号”反应;如果l(x)小于β,观察者就选择进行“噪音”反应。
决策标准的设定受到各种非感觉因素的影响,包括信号出现的先定概率,以及利益得失的权衡等。信号检测论可以给出在给定信号强度和敏感性水平下能得到的最大收益的β值(βOPT)。其计算公式为:
)()()()()()(MCHVFACCRVSPNP++×=β
式中P(N)和P(S)分别是噪音概率,V代表由正确反应得到的价值,C代表错误反应得到的代价(负值)。当V(CR)+C(FA)=V(H)+C(M)时,最大收益将从最小错误而得到。此时βOPT随信号概率P(S)的变化而变化(P(S)十P(N)=1),当P(S)上升时,放宽反应标准,即降低β是有利的反应策略;当P(S)降低时,严格的反应标准使提高β更有利。但当从正确反应中得到的收益与错误反应付出的代价不等时,βOPT将发生相应的变化。
以上分析使我们明确了反应偏向(β)的含义。可见β值虽被认定为反应阈限,但这个阈限和传统阈限概念不同,它并非恒定不变,而是随SN和N两种先定概率和判定结果的奖惩办法而变动的。更准确地说,β不再是对被试感觉状态的绝对分界,而是被试主观决策反应的判断标准。