统计和数据
一.统计的含义
统计学是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。统计分析数据分为描述统计和推断统计两大类。
描述统计是研究数据搜集、处理和描述的统计学方法。其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合、概括与分析,得出所关心的数据特征。
推断统计则是研究如何利用样本数据来推断总体特征的统计学方法,内容包括参数估计与假设检验两大类。
二、数据类型:
1.定性变量的观察结果称为定性数据,这类数据的最大特点是它只能反映现象的属性特点,不能说明具体量的大小和差异。如天气形势:天气晴和阴转多云,职业:生产工人、公务员,教育程度:小学、大学等。这种只能反映现象分类特征的变量又称为分类变量,分类变量的观察结果就是分类数据。如果类别具有一定的顺序,如教育程度,中学的教育程度就是比小学高,大学又比中学高,这样的变量称为顺序变量,相应的观察结果就是顺序数据。
用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异,这些变量就是定量变量,也称为数值变量,定量变量的观察结果成为定量数据。如天气温度、上证股指、月收入。
分类变量没有数值特征,所以不能对其数据进行数学运算。分类变量只能用来区分事物,而不能用来表明事物之间的大小、优劣关系。
顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。顺序变量之间虽然可以比较大小,却无法计算相互之间的大小、高低和优劣的距离。
很多适用于数值型数据的统计方法并不适用于定性数据,但适用于定性数据的方法则大多可以应用于数值型数据。
2.观测和实验数据
观测数据是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。是取得数据最主要的方法,用各种调查方法得到的数据都属于观测数据。观测数据可能是全面数据也可能是样本数据。
实验数据一般是在科学实验环境下取得的数据。自然科学研究中所用的数据多为实验数据。
三、数据来源与搜集方法
1.从使用者的角度来看,统计数据资料的来源主要有两种渠道:一种是通过直接的调查或实验获得的原始数据,这是统计数据的直接来源,一般称之为原始或第一手统计数据;另一种是别人调查的数据,并将这些数据进行加工和汇总后公布的数据,通常称之为次级数据或第二手间接的统计数据。一切间接的统计数据都是从原始的、第一手数据过渡而来的。
统计调查或进行实验就是统计数据的直接来源。
数据的间接来源有以下一些:一是公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构;二是尚未公开发表的统计数据。
在应用间接数据时应注意以下问题:一是否了解并正确理解了间接数据中变量的含义、计算口径、计算方法,以防止误用、错用他人的数据;二引用间接数据时要注明数据来源,尊重他人的劳动成果和知识产权。
2.搜集数据的方法:
常用的统计调查种类有:
普查:特点是一种全面调查,具有资料包括范围全面、详尽、系统的优点;它是一次性的专门调查,因为普查的工作量大,耗资也多,时间周期较长,一普查不宜经常举行。
抽样调查:例如,想了解某学校学生的零花钱支出情况,可以从中抽了一个样本获得样本数据。这里“全校所有学生”就是总体;从全校学生中抽取300人进行调查,这就是一个样本,构成样本的元素的数目称为样本量。
抽样调查的特点:一是样本单位按随机原则抽取,排除了主观因素对选取样本单位的影响;二是能够根据部分调查的实际资料对调查对象的总体的数据特征进行推断,从而达到对调查总体的认识;三是在抽样调查中会存在抽样误差,但是这个误差可以事先计算并加以控制。
抽样调查既能节省人力、物力、财力,又可以提高资料的时效性,而且能取得比较正确的全面统计资料,具有许多优点。是一种非全面的、一次性的或经常性的专门调查,使用非常广泛。
抽样方法主要有两种:概率抽样和非概率抽样。
从理论上讲,概率抽样是最科学的抽样方法。常用的概率抽样形式为简单随机抽样;分层抽样;整群抽样;系统抽样又称为等距抽样。
非概率抽样由于方法简单、经济,所以也是人们常用的方法。
一级建造师二级建造师消防工程师造价工程师土建职称公路检测工程师建筑八大员注册建筑师二级造价师监理工程师咨询工程师房地产估价师 城乡规划师结构工程师岩土工程师安全工程师设备监理师环境影响评价土地登记代理公路造价师公路监理师化工工程师暖通工程师给排水工程师计量工程师
执业药师执业医师卫生资格考试卫生高级职称护士资格证初级护师主管护师住院医师临床执业医师临床助理医师中医执业医师中医助理医师中西医医师中西医助理口腔执业医师口腔助理医师公共卫生医师公卫助理医师实践技能内科主治医师外科主治医师中医内科主治儿科主治医师妇产科医师西药士/师中药士/师临床检验技师临床医学理论中医理论