(3)正态标准差 的无偏估计也有两个,一个是对样本极差 进行修偏而得,另一个是对样本标准差s进行修偏而得,具体是:
其中 与 是只与样本量n有关的常数,其部分值列于表1.4-1,更详细的表参见第四章的表4.2-2。
表1.4-1 修偏系数 与 的数值表
当n=2时,上述两个无偏估计相同;当n≥3时,它们不同,但总有:
[例1.4-6] 把钢材弯曲成钢夹,其间隙大小是一个质量特性,现随机从生产线上取5只钢夹,测其间隙,得数据如下:
0.75 , 0.70 , 0.65 , 0.70 , 0.65
已知钢夹间隙X服从正态分布 ,要对 和 做出估计。
用样本均值 和样本方差 分别做出 与 的估计:
作为标准差 的估计选用 ,其值为:
也可选用:
在本例中两者相差不大。
二、区间估计
(一) 区间估计的概念
点估计仅仅给出参数一个具体的估计值,但是没有给出估计的精度,而区间估计是用一个区间来对未知参数进行估计,区间估计体现了估计的精度。
设 是总体的一个待估参数,其一切可能取值组成的参数空间为 ,记从总体中获得样本量为n的样本为 ,对给定的 ,确定两个统计量:
若对任意 ∈ 有P( ≤ ≤ )≥l- ,则称随机区间[ , ]是 的置信水平为l- 的置信区间,简称[ , ]是 的l- 的置信区间, 与 分别称为 的l- 的置信下限与置信上限。
置信区间的含义是:所构造的随机区间 覆盖(盖住)未知参数 的概率为 。由于这个随机区间随样本观测值的不同而不同,它有时覆盖了参数 ,有时没有覆盖 ,但是用这种方法做区间估计时,100次中大约有100( )个区间能覆盖未知参数 。图1.4-1中每一条竖线表示由一个样本量为4的样本按给定的 与 求得的一个区间。重复抽取100个样本,就得到100个这样的区间,在( )中,100个区间有51个包含(覆盖了)参数真值=50000,这对50%的置信区间来说是一个合理的偏离;在( )中,100个区间有90个包含参数真值=50000,这与90%的置信区间一致。
如果P( < )=P( > )= /2,则称这种置信区间为等尾置信区间。
下面着重讨论正态总体参数的置信区间及比例p的置信区间,它们都是等尾置信区间。
(二)正态总体参数的置信区间
设总体分布为 ,从中抽取的样本记为 ,样本均值为 ,样本方差为 ,样本标准差为s。
(1)总体均值 的置信区间的求法: 的估计一般用样本均值 ,从 的分布来构造置信区间。
当总体标准差 已知时,利用正态分布可得 的l- 置信区间为:
今后也记为 ,其中 是标准正态分布的 分位数。
当总体标准差 未知时, 用其估计s代替,利用t分布可以得到 的l- 置信区间为:
其中 表示自由度是n-l的t分布的 分位数。
(2)总体方差 与标准差 的置信区间的求法: 的估计常用样本方差 ,因此从 的分布来构造置信区间。
利用 (n-1)分布可以得到 的l- 置信区间为:
将上式两边开平方,可得 的l- 置信区间为:
以上讨论总结如下表1.4-2中,可供选用。
[例1.4-7] 某溶液中的甲醛浓度服从正态分布,从中抽取一个样本量为4的样本,求得 ,样本标准差为 ,分别求正态均值 及标准差 的95%的置信区间。
解:先求正态均值 的置信区间,由于 未知,故采用 分布来求。
, ,又 , ,查附表1-4得 ,从而正态均值 的95%的置信区间为:
再求 的置信区间。由于 , ,查附表1-5得: , ,则正态标准差 的95%的置信区间为:
[例1.4-8] 设一个物体的重量 未知,为估计其重量,用天平去称,所得称重(测量值)与实际重量间是有误差的,因此所得的称重是一个随机变量,通常服从正态分布。如果已知称量的误差的标准差为0.1克(根据天平的精度给出),为使 的95%的置信区间的长度不超过0.1,那么至少应该称多少次?
解:这是估计样本量的问题。在 已知时, 的95%的置信区间为:
其中 ,置信区间的长度是:
为使它不超过0.1,可解不等式 ,得 ,即至少应称16次。
来源:考试网-质量工程师考试