(3)描述样本数据分散程度的统计量
总体中各个个体的取值总是有差别的,因此样本的观测值也是有差异的,这种差异有大有小,反映样本数据的分散程度的统计量实际上反映了总体取值的分散程度,常用的有如下几种:
①样本极差:
例10.数据为 ,样本观测值为:140,150,155,130,145,那么将它们从小到大排序后为:130,140,145,150,155
解析:最小值为130,最大值为155,因此样本极差R=155-130=25
②样本方差:
同样,对分组数据来讲,样本方差的近似值为:
其中 表示第i组的组中值。
样本极差的计算十分简便,但对样本中的信息利用得也较少,而样本方差就能充分利用样本中的信息,因此在实际中样本方差比样本极差用得更广。
③样本标准差:
样本标准差的意义:
样本方差尽管对数据的利用是充分的,但是方差的量纲(即数据的单位)是原始量纲的平方,例如样本观测值是长度,单位是“毫米”,而方差的单位是“平方毫米”,单位不同就不便于比较,而采用样本标准差就消除了单位的差异。
四、样本数据的整理
从总体x中获得的样本是总体的一个缩影,具有丰富信息的数据,我们需要对数据进行加工,将有用的信息提取出来,以便对总体有所了解。
对数据加工有两种方法:
一是计算统计量,二是利用图形与表格。上面提到的便是常用的统计量,它具有概括性,但不够形象,下面给出对数据进行整理的表格与图形描述。我们结合一个例子来叙述对计置数据给出频数频率分布表的步骤。