如下有序样本:
15.07,15.09,15.15,15.2l,15.29这里n=5为奇数,(n+1)/2=3,因而样本中位数Me= =15.15。
注意,在此例中,中位数15.15与均值15.162很接近。
(3)样本众数
样本众数是样本数据中出现频率最高的值,常记为Mod。例如对例1.3-3中的罐头净量,100个数据中,344出现的次数最多,为12次,因此Mod=344。样本众数的主要缺点是受数据的随机性影响比较大,有时也不惟一。当n大时,较多地采用分组数据。在本例中第5组(343.5,346.5)的频率为0.30(见表1.3-3),是所有组中最高的,因而该组的组中值345可以作为众数的估计,注意到该数与前面定的344相差不大。
(三)描述样本分散程度的统计量来源:考试通
一组数据内部总是有差别的,对一组质量特性数据,大小的差异反映质量的波动。也有一些用来表示数据内部差异或分散程度的量,其中常用的有样本极差、样本方差、样本标准差和样本变异系数。
(1)样本极差
样本极差,就是样本数据中最大值与最小值之差,用R表示。对于有序样本,极差R为:
R= (1.3-4)
例如在例1.3-6,5个轴直径数据的极差R=15.29-15.07=0.22。
样本极差只利用了数据中两个极端值,因此它对数据信息的利用不够充分,极差常用于n不大的情况。
(2)样本方差与样本标准差
数据的分散程度可以用每个数据 偏离其均值 的差 来表示, 称为 的离差。对离差不能直接取平均,因为离差有正有负,取平均会正负相抵,无法反映分散的真实情况。当然可以先将其取绝对值,再进行平均,这就是平均绝对差:
但是由于对绝对值的研究较为困难,因此平均绝对差使用并不广泛。使用最为广泛的是用离差平方来代替离差的绝对值,因而数据的总波动用离差平方和
来表示,样本方差定义为离差平方和除以n-1,用 表示:
因为n个离差的总和必为0,所以对于n个独立数据,独立的离差个数只有n-1个,称n-1为离差平方和的自由度,因此样本方差是用n-1而不是用n除离差平方和。
样本方差的正算术平方根称为样本标准差,即:
注意标准差的量纲与数据的量纲一致,所以它使用频繁,但其计算一般通过先计算样本方差 获得。
在具体计算时,离差平方和也可用以下两个简便的公式:
因此样本方差计算可用以下公式:
对例1.3-6的轴直径数据,离差平方和、样本方差及样本标准差的计算可列表进行。
因此:
为了计算方便,可以将数据减去一个适当的常数,这样不影响样本方差及样本标准差的计算结果。例如,在本例中,将每个数据减去15,即可大大减少计算量。在实际使用中还可以利用计算器来计算,特别是许多科学计算用的计算器,都具有平均数、方差与标准差的计算功能。
(3)样本变异系数
样本标准差与样本均值之比称为样本变异系数,有时也称为相对标准差,记为
例如对例1.3-6的轴直径数据,样本变异系数为:
样本变异系数是在消除量纲影响后的样本分散程度的一种度量。
来源:考试网-质量工程师考试