一、考试要求
1.掌握统计量的概念
2.掌握样本均值和样本中位数概念及其计算方法
3.掌握样本极差、样本方差、样本标准差和样本变异系数概念及计算方法
4.熟悉抽样分布概念
5.熟悉t分布、 分布和F分布的由来
二、内容讲解
第三节 统计基础知识(续)
三、统计量
(一)统计量的概念
样本来自总体,因此样本中包含了有关总体的丰富信息。但是不经加工的信息是零散的,为了把这些零散的信息集中起来反映总体的特征,需要对样本进行加工,图与表是对样本进行加工的一种有效方法,另一种有效的办法就是构造样本的函数,不同的函数反映总体的不同的特征。
不含未知参数的样本函数称为统计量。
[例1.3-5] 从均值为 ,方差为 的总体中抽得一个样本量为n的样本 ,其中 与 均未知。
那么 ,max{ }是统计量,而 , 都不是统计量。。
根据统计量的定义可以构造各种用途的统计量。其中有一部分是常用统计量,下面介绍描述样本集中位置与样本分散程度两类常用统计量。
(二)描述样本集中位置的统计量
对一组样本数据,可以用一些量来表示它们的集中位置。这些量中,常用的有样本均值、样本中位数和样本众数。
(1)样本均值
样本均值也称样本平均数,记为 ,它是样本数据 的算术平均数:
(1.3-1)
[例1.3-6] 轴直径的一个n=5的样本观测值(单位:cm)为:15.09,15.29,15.15,15.07,15.21,则样本均值为:
对于n较大的分组数据,可利用将每组的组中值 用频率 加权计算近似的样本均值:
(1.3-2)
[例1.3-7] 在例1.3-3中,100个罐头的净量的均值按分组计算为:
样本均值是使用最为广泛的反映数据集中位置的度量。它的计算比较简单,但缺点是它受极端值的影响比较大。
2)样本中位数
样本中位数是表示数据集中位置的另一种重要的度量,用符号 或 表示。在确定样本中位数时,需要将所有样本数据按其数值大小从小到大重新排列成以下的有序样本:
其中: 分别是数据的最小值与最大值。
样本中位数定义为有序样本中位置居于中间的数值,具体地说:
(1.3-3)
与均值相比,中位数不受极端值的影响。因此在某些场合,中位数比均值更能代表一组数据的中心位置。
[例1.3-8] 对例1.3-6中的5个轴直径数据进行按从小到大的重新排序,得到如下有序样本:
15.07,15.09,15.15,15.2l,15.29
这里n=5为奇数,(n+1)/2=3,因而样本中位数Me= =15.15。
注意,在此例中,中位数15.15与均值15.162很接近。
(3)样本众数
样本众数是样本数据中出现频率最高的值,常记为Mod。例如对例1.3-3中的罐头净量,100个数据中,344出现的次数最多,为12次,因此Mod=344。样本众数的主要缺点是受数据的随机性影响比较大,有时也不惟一。当n大时,较多地采用分组数据。在本例中第5组(343.5,346.5)的频率为0.30(见表1.3-3),是所有组中最高的,因而该组的组中值345可以作为众数的估计,注意到该数与前面定的344相差不大。考试通
来源:考试网-质量工程师考试