统计整理
(一)统计资料整理的内容和方法
统计资料整理是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化、从而得到反映总体特征的综合资料的过程。
统计整理的内容,主要包括以下几个方面内容:P26-27
1、对原始资料进行审核与检查,如果发现被调查单位的资料不齐全或有差错,要及时查询订正。2、对各项指标进行综合汇总,并按调查和分析目的的要求进行各种分组,汇总出各组单位数和各项指标的总数。3、将汇总的结果编制成统计表与分析表,以便进一步分析和应用。4、对统计资料进行系统积累。
统计整理的基本方法:是分组、汇总和编制统计图表。
(二)统计分组概念:是根据研究的任务和对象的特点,按照某种分组标志将统计总体分为若干组成部分。注意三点:对象是总体;应有分组标志;对总体总体而言是“分”,对总体单位而言是“合”。
作用:1、发现社会经济现象的特点和规律。2、将复杂的社会经济现象划分为性质不同的各种类型。3、分析总体中各个组成部分的结构情况。4、揭示现象之间的依存关系。
方法:统计分组的关键是选择分组标志与划分各组界限。选择分组标志的原则:1、应根据研究目的与任务选择分组标志。2、要选用能反映事物本质或主要特征的标志。3、要根据现象所处的历史条件及经济条件来选择标志。
1、分组方法:P30-31确定分组标志后,进行具体分组的方法有以下几种:
(1)按品质标志与数量标志分组 。按品质标志分组就是反映事物的属性、性质的标志分组,它可以将总体单位划分为若干类型。按数量标志分组是用事物数量的多少作为标志来进行分组。
(2)按主要标志与辅助标志分组
2、统计分组体系:P31统计分组体系是根据统计分组的要求,对同一总计进行多种不同分组而形成的体系。1、简单分组与平行分组体系。将总体按一个标志分组称为简单分组。将同一总体选择两个或两个以上的标志分别进行独立的简单分组,就形成平行分组体系。平行分组体系的特点是:每一个分组固定一个分组标志的差异,以反映总体内部的分布情况,所有分组都是独立进行的,各分组之间是平行并列的关系。
2、复合分组与复合分组体系。对同一总体选择两个或两个以上的标志重叠起来进行分组,叫复合分组。多个复合分组组成的分组体系就是复合分组体系。
3、统计工作中常用的分组。按生产资料所有制性质分组。按国民经济行业分组。按单位隶属关系分组。按地区分组。
次数分布的概念:将按某一标志进行分组后的总体再按一定的顺序进行归并排列,形成总体单位数在各组间的分布,称为次数分布或变量分布、统计分布。
根据分组标志的不同,分配数列可分为品质(属性)数列和变量数列。按照变量是否离散变量或连续变量,变量数列又可分为离散变量数列和连续变量数列。连续变量数列,一般是组距式的,每个组包含若干变量值;对于离散变量数列,如果变量值数目不多,可编成单项式,即以一个变量值作为一个组(或每个组只包含一个变量值),如果变量值很多,应编制成组距式。
在编制组距式变量数列时,要注意以下四个方面的基本要素:1、组距与组数。组距是指每个组变量值中最大值与最小值之差,一般把最大值叫该组的上限,最小值叫该组的下限。组距等于上限或下限之差,即:组距=上限-下限。2、等距数列与异距数列。在组距数列中,各组组距都相等的数列,叫等距数列;各组组距不相等的数列,叫异距数列(或不等距数列)。对于标志值的变动幅度在各组之间相等的分组,即为等距分组,否则为不等距分组。3、组限与组中值。组限是指每个组的两端标志值,每一组的起点值为下限(或最小值),终点值为上限(或最大值)。每个组上限与下限的中点值叫组中值,
即:组中值=(上限+下限)÷2。
划分组限时,相邻组的上下限可以不重叠,也可以重叠。在后一种情况,与上限相等的标志值应该计入一组,即“上限不在组内”。
首组开口组的下限=首组上限—邻组组距
末组开口的上限=末组下限+邻组组距
首组开口组的组中值=首组上限—邻组组距÷2
末组开口组的组中值=末组上限+邻组组距÷2
4、频数,是指分配数列中各组的单位数,也称次数。频数实际上是各组标志值的加权,用以衡量各组作用的大小。
次数分布的表示方法组要有列表法和图示法。图示法形式:直方图、折线图、曲线图、饼图。
5、正太分布。次数分布是统计描述社会经济现象的一种重要的方法,其中,以标志变量的平均值为中心,沿对称轴向两边发展,越接近中心,分配的次数越多,离中心越远,分配的次数越少,形成“两头小、中间大”的钟形分布曲线,叫正态分布或钟形分布。
运用电子计算机汇总,大致分为以下几个步骤:1、编制程序2、编码3、数据录入4、数据编辑5、计算与制表。整个汇总工作成败的关键,它包括以下几个方面:1、做好登记与审查工作。2、控制录入质量3、利用计算机进行审查。
单项式变量数列的编制方法(计算)P34
1、将所有变量值按由小到大或由大到小的顺序排列。