一组数据内部总是有差别的,对一组质量特性数据,大小的差异反映质量的波动。也有一些用来表示数据内部差异或分散程度的量,其中常用的有样本极差、样本方差、样本标准差和样本变异系数。
(1)样本极差
样本极差,就是样本数据中最大值与最小值之差,用R表示。对于有序样本,极差R为:
R= (1.3-4)
例如在例1.3-6,5个轴直径数据的极差R=15.29-15.07=0.22。
样本极差只利用了数据中两个极端值,因此它对数据信息的利用不够充分,极差常用于n不大的情况。
(2)样本方差与样本标准差
数据的分散程度可以用每个数据 偏离其均值 的差 来表示, 称为 的离差。对离差不能直接取平均,因为离差有正有负,取平均会正负相抵,无法反映分散的真实情况。当然可以先将其取绝对值,再进行平均,这就是平均绝对差:
(1.3-5)
但是由于对绝对值的研究较为困难,因此平均绝对差使用并不广泛。使用最为广泛的是用离差平方来代替离差的绝列值,因而数据的总波动用离差平方和
来表示,样本方差定义为离差平方和除以n-1,用 表示:
(1.3-6)
因为n个离差的总和必为0,所以对于n个独立数据,独立的离差个数只有n-1个,称n-1为离差平方和的自由度,因此样本方差是用n-1而不是用n除离差平方和。
样本方差的正算术平方根称为样本标准差,即:
(1.3-7)
注意标准差的量纲与数据的量纲一致,所以它使用频繁,但其计算一般通过先计算样本方差 获得。
在具体计算时,离差平方和也可用以下两个简便的公式:
(1.3-8)
因此样本方差计算可用以下公式:
(1.3-9)
对例1.3-6的轴直径数据,离差平方和、样本方差及样本标准差的计算可列表进行。
1
2
3
4
5 15.09
15.29
15.15
15.07
15.21 227.7081
233.7841
229.5225
227.1049
231.3441
合计 75.81 1149.4637
因此:
为了计算方便,可以将数据减去一个适当的常数,这样不影响样本方差及样本标准差的计算结果。例如,在本例中,将每个数据减去15,即可大大减少计算量。在实际使用中还可以利用计算器来计算,特别是许多科学计算用的计算器,都具有平均数、方差与标准差的计算功能。
(3)样本变异系数
样本标准差与样本均值之比称为样本变异系数,有时也称为相对标准差,记为 ;
(1.3-10)
例如对例1.3-6的轴直径数据,样本变异系数为:
样本变异系数是在消除量纲影响后的样本分散程度的一种度量。考试用书
来源:考试网-质量工程师考试