第八章 偏倚及其控制
误差 (error)对事物某一特征的测量值偏离真实值的部分。包括随机误差、系统误差
随机误差:指随机抽样所得的均值与总体参数的差异,也称抽样误差。只能减少,不能避免。
随机误差的两个特点
1、样本的观察值都在平均值上下分布,从许多无偏倚样本中得到的观察值均数,假如数量较大,总是趋向于接近总体值;
2、随机误差的范围可以用可信区间估计,当保持随机方法而加大样本时,样本均值逐渐向总体均值接近。
系统误差:当对群体的某一特征做一次测量或对某一个体的某一特征做多次测量时,所得均值与总体间的真实性也会产生误差,如果误差向量的方向一致或基本一致时,这种误差称为系统误差。
随机误差和系统误差的区别
1、假设一项研究可以将样本量增至无穷大,如果研究样本无穷大能使误差减小到零,则此误差为随机误差。系统误差不受样本量增加的影响,因此在研究样本无穷大时仍然存在的误差是系统误差;
2、适当的重复试验或增加样本含量可以减少随机误差,但不能减少系统误差。
偏倚(bias):指在流行病学研究中样本人群所测得的某变量系统地偏离了目标人群中该变量的真实值,使得研究结果或推论的结果与真实情况之间出现偏差,这是由系统误差造成的。
选择偏倚(selection bias ):指被选入到研究中的研究对象与没有被选入者特征上的差异所造成的系统误差。主要产生于研究的设计阶段,在各类流行病学研究中均可能发生,以在病例对照研究与现况研究中为常见。
常见的选择偏倚
1、入院率偏倚(admission rate bias)亦称伯克森偏倚(Berkson’s bias),是指利用医院就诊或住院病人作为研究对象时,由于入院率的不同或就诊机会的不同而导致的偏倚。
用住院病例进行研究时可能没有包括:
1)抢救不及时死亡的病例
2)距离医院远的病例
3)无钱住院的病例
4)病情轻的病例
2、现患-新发病例偏倚(Prevalence-incidence bias)又称奈曼偏倚(Neyman bias),凡因现患病例与新病例的构成不同,只调查典型病例或现患病例的暴露状况,致使调查结果出现的系统误差都属于本类偏倚。
3、无应答偏倚和志愿者偏倚(non-respondent bias and volunteer bias)无应答者指调查对象中那些因为各种原因不能回答调查研究工作所提出的问题的人。一项研究工作的无应答者可能在某些重要特征或暴露上与应答者有所区别。如果无应答者超过一定比例,就会使研究结果产生偏倚,即无应答偏倚。
4、检出征候偏倚(detection signal bias)亦称为揭露伪装偏倚(unmasking bias),指某因素与某疾病在病因学上虽无关联,担由于该因素的存在而引起该疾病症状或体征的出现,从而使患者及早就医,接受多种检查,导致该人群较高的检出率,以致得出该因素与该病相关联的错误结论。
5、易感性偏倚(susceptibility bias)有些因素可能直接或间接影响观察人群或对照人群对所研究疾病的易感性,导致某因素与某疾病间的虚假联系,由此产生的偏倚称为易感性偏倚。
6、排除偏倚(exclusive bias)在研究对象的确定过程中,没有按照对等的原则或标准,而自观察组或对照组中排除某些研究对象,这样导致因素与疾病之间联系的错误估计,称为排除偏倚。
选择偏倚的控制
1、研究者应充分了解该项研究工作中各种可能的选择偏倚来源,并在研究设计过程中尽量避免;
严格掌握研究对象的纳入与排除标准,使研究对象能较好地代表其所出自的总体;
2、为了避免存活因素的影响,在进行病例对照研究时,如果病例组选择新诊断的病人,则对照组不应由慢性病病人组成;如果对照所患的慢性病严重地影响暴露,则更不应作为对照;
信息偏倚(information bias )又称观察偏倚(observational bias),指研究中有关研究对象的或来自研究对象的信息是错误的,会产生系统误差。信息偏倚的表现是使研究对象的某种特征被错误分类如暴露于某因素者被错误地认为是非暴露者,某病的患者被认为是非患者。