第五章 抽样
一、抽样的步骤。
1、设计抽样方案。首先要界定总体;其次介绍抽样框的具体内容;再次胡定样本所含个体数目。
2、抽取样本。指抽样人员按照抽样方案中选定的抽样方法,从抽样框中实际抽取总体元素,构成样本的过程。
3、评估样本。指样本抽出后,对样本的代表性和各类误差情况的检验和评估,目的是为了防止由于样本偏差过大而导致对总全推断的失败。
二、配额抽样的缺点。
1、为了不偏离总体,配额矩阵中的数字必须十分准确,要做到这一点,就必须掌握总体的最新资料,但这并不容易做到。
2、尽管配额方法是一种改进,但最后抽样仍由调查员根据方便原则执行,他们从某些特定的矩阵格子中选择样本时,有很大的随意性。这些情况都会降低样本的代表性。
三、随机数表产生随机数的步骤。
1、确定选出的随机数的位数。
2、决定从5位数组中选择哪几位数字。
3、确定在表中选择数字的顺序。
4、确定开始选择的5位数组起点。
5、处理大于总体规模或重复的随机数。
四、简单随机抽样的不足。
1、当总体规模较大时,采取这种抽样方法工作量较大。
2、简单随机抽样的样本在总体中比较分散,这会大大增加研究费用,抽样节约成本的优点就大打折扣了。
五、分层抽样需解决的问题。
1、怎样进行分层,或者说根据什么原则确定分层变量。
2、怎样确定样比本例。
3、确定实际分层抽取样本的方法。(一是先将所有总体元素按分层变量进行分层,并计算各层在总体中的比例。二是适用于等比例分层抽样。)
六、多段整群抽样需解决的问题。
1、要决定是多抽群,还是多抽群中的元素。
2、处理群大小不等的情况。
七、分层抽样的优点。
与简单随机或系统抽样相比,分层抽样能减少抽样误差,提高样本的代表性。
1、当样本规模不变的情况下,总体异质性越高,样本状态偏离总体状态的机会就越大。在这种情况下,采用分层抽样的方法,将一个异质性的总体分成若干个同质性的层,按照各个层在总体中的实际比例去分配各层的样本规模,以确保总体中每个同质的层都有适量的元素被抽中,从而使样本状态偏离总体状态的机会减小,减少了抽样误差,增大了代表性。
2、当研究者感兴趣 的某个类别在总体中比例很小,简单随机或系统抽样很有可能会漏掉该类别的元素时,研究者就会使用分层抽样。
八、非概率抽样与概率抽样的区别。
1、非概率抽样主要是依据研究者的主观意愿、判断或是否方便等因素来选取对象。
2、概率抽样主要是按照随机原则来选取对象,完全不带有研究者的主观因素。
3、两种方法最大的差别是,在概率抽样中,能够比较精确地估算出抽样误差,这样根据被抽出的少数对象的情况,便可以对全体对象的情况进行推论;而在非概率抽样中,则无法估算抽样误差,这样有时即使碰巧抽到的少数对象确实具有代表性,研究者也不知道,因为非概率抽样的代表性只有将抽出的少数对象的情况与全体对象的情况比较后才能得知,所以,非概率抽样是无法对全体对象进行推论的。
1、进行抽样主要是考虑:①研究成本;②研究的可行性。
2、抽样方法:①非概率抽样(依据研究者的主观意愿、判断或是否方便等因素来选取对象);②概率抽样(按照随机原则来选取对象,完全不带有研究者的主观因素。)两者区别:非概率抽样无法对全体对象进行推论。
3、抽样的有关术语:①总体(全体研究对象)、样本(代表一组元素)、元素(调查对象)。②抽样框、抽样单元(抽样框中的总体元素)。③参数值、统计值、抽样误差。
4、总体划分为:研究总体、目标总体。样本中元素个数与总体中元素个数的比率,即样本规模与总体规模的比率称为抽样比率。
5、参数值与统计值之间的差异就是 抽样误差 。差异越大,抽样误差就越大;差异越小,抽样误差也就越小。
6、抽样误差是衡量样本代表性大小的标准,它主要取决于总体的异质性程度和样本规模。
7、进行概率抽样的前提条件:抽样框。
8、非概率抽样方法:①方便抽样、②配额抽样、③判断抽样、④雪球抽样。
9、判断抽样经常被用于的研究场景:①选择特别能提供信息的独特个案(如问卷设计、发掘流行文化议题); ②选取很难以接近的特殊人群(城市外来人员等);③选取某种特殊个案类型。
10、概率抽样方法:①简单随机抽样、②系统抽样、③分层抽样、④多阶段整群抽样。
11、简单随机抽样的要求:①满足等概率要求;②满足独立性要求。
12、引入随机性的理由:①随机抽样由于排除了研究者个人对样本的主观决定,所以可以避免研究者自觉或不自觉的偏见;②随机抽样是以概率理论为基础,因此,可以计算参数值和抽样误差。
13、系统抽样(等距抽样)的步骤:①确定开始抽取人选的位置;②计算抽样间距(抽样间距K是由总体规模N与样规模n之比决定的:K=N/n)。③确定抽取元素的方法。(从中间开始)
14、与简单随机或系统抽样相比,分层抽样能减少抽样误差,提高样本的代表性。因为当样本规模不变的情况下,总体异质性越高,样本状态偏离总体状态的机会就越大。
15、如果先不考虑经费问题,那么样本规模主要取决于 抽样精度 和 总体标准差 。一般说来,抽样希望达到的精确度越高,总体的异质性程度越大,所需的样本规模就越大。
16、在简单随机抽样中,推论总体平均数的样本规模计算公式为:n=t2*P(1-p)/e2。其中,T为置信度所对应的临界值,P为总体的成数或百分比,E为抽样误差。
方便抽样:偶遇抽样,指研究者使用对自己最为便利的方法来选取样本。(电视台、记者“街头拦人”调查)
配额抽样:首先要根据某些参数值,确定不同总体类别中的样本配额比例,然后按比例在各类别中进行方便抽样。
判断抽样:立意抽样,指研究者根据其研究目的或专家的判断来选取样本。
雪球抽样:网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累积抽样方法。(特别适合对成员难以找到的总体进行抽样,如城市中的散工、无家可归的流浪者和吸毒者等)。
系统抽样:=等距抽样、机械抽样,抽样效果与简单随机抽样相同,但操作起来却容易很多。
分层抽样:指研究者先把总体分为若干个同质的层(次级总体),然后用简单随机或系统抽样方法,从每层中抽取样本元素。
【>>> 自考资料包点击领取 <<<】
在线做题:华课网校高等教育自学考试模考题库预测考点考题,章节练习题、模拟练习题、历年真题、自由组卷、专业答疑
自学考试考生都在趁着疫情期间在家争分夺秒的进行备考复习大战,要在有限的时间里进行强化提分,密训练习不可或缺,冲刺阶段利用好这些有针对性的试题,一键考试复习将事半功倍!【2020年全国高等教育自学考试考前模拟卷备考资料包领取>>>】
◀ 扫一扫,刷题抢分 ▶ | ||||
高频易错考点卷 ▶ | ◀ 章节模拟测试卷 | |||
全真模考预测卷 ▶ | ◀ 历年真题解析卷 | |||
强化巩固习题卷 ▶ | ◀ 考前冲刺提分卷 |
扫码进入学习群 |
点击领取 |
点击上方按钮进行下载领取↑↑↑
不知道如何备考?从何下手?考试科目太多?临渊羡鱼不如退而结网,华课网校校开通了2020自学考试全科VIP班,让学员选择自己想要的科目自考全科VIP班 各科精讲+黑科技焚题库+考前模拟试题+导师课程随您挑选 助力自考!
2020年自考报名有疑问、不知如何选择主考院校及自考专业,自考当地政策不了解?点击加入自考学历提升群:516835448,更快提升学历 。