四、抽样分布
(一)抽样分布的概念
统计量的分布称为抽样分布。为了说明抽样分布概念,我们先考察下面的例子。
[例1.3-9] 图1.3-7左侧为一个总体,右侧是从该总体随机抽取的4个样本,每个样本均有5个观测值。
从上面的例子可以看出:
(1)每一个统计量都有一个抽样分布。
(2)不同的统计量可得不同的抽样分布。
抽样分布将是今后进行统计推断的基础,一些抽样分布可通过上述抽样方法获得,但是,当样本来自某个正态总体 时,其样本均值 ,样本方差 ,以及它们的某种组合的抽样分布已在理论上被导出,我们将叙述其中三个,即t分布, 分布和F分布,号称“三大抽样分布”。在这之前,我们先回忆一下样本均值 的分布。
(二)样本均值 的抽样分布
从抽样分布角度看,中心极限定理一节告诉我们:
(1)当总体分布为正态分布 时,其样本均值 的抽样分布(精确地)为 , 的标准差 。
(2)当总体分布不为正态分布时,只要其总体均值 与总体方差 存在,则在n较大时,其样本均值 的抽样分布近似于 ,, 的标准差 。
[例1.3-10] 样本均值 的抽样分布的例子。
(1)设 是来自正态总体N(5,1)的一个样本,则其样本均值 ~N(5,O.2)。 .
(2)设 是来自参数为 的指数分布的一个样本,若 =0.04,则该指数分布的均值与方差分别为:
而该样本均值 ,其中符号“~”表示“近似服从”。
(3)设 是来自二点分布b(1,p)的一个样本,若p=0.02,则该二点分布的均值与方差分别为:
E(x)=p=0.02
Var(x)=p(1-p)=0.02×0.98=0.0196
而其样本均值 =N(0.02,0.01982)。
(4)设 是来自泊松分布P( )的一个样本,则其样本均值 。
(5)在例1.3-9中所涉总体是仅含20个数的有限总体,该总体可用如下随机变量x及其分布表示
容易算出该总体的均值与方差,它们分别为
E(x)=10.3 Var(x)=1.81
若从该总体每次(可重复)取出样本量为n的一个样本,则样本均值 近似服从N(10.3,1.81/n)。比如
n=5, ~N(10.3,0.362)
n=10, ~N(10.3,0.181)
(三)三大抽样分布
(1)t分布
首先,我们应把注意力放在服从t分布的t变量的构造上。
设 是来自正态总体 的一个样本,则有:
对样本均值 施行标准化变换,则有:
当用样本标准差s代替上式中的总体标准差 ,则上式u变量改为t变量,标准正态分布N(0,1)也随之改为“自由度为n-1的t分布”,记为t(n-1),即:
自由度为n-1的t分布的概率密度函数与标准正态分布N(0,1)的概率密度函数的图形大致类似,均为对称分布,但它的峰比N(0,1)的峰略低一些,而两侧尾部要比N(O,1)的两侧尾部略粗一点,参见图1.3-8。当自由度超过30后,两者区别已很小,这时可用N(0,1)代替t(n-1)。
(2) 分布
设 是来自正态总体 的一个样本,则其样本方差 的n-1倍(也即离差平方和 除以总体方差 的分布是自由度为n-1的 分布,记为 ,即:
自由度为n-1的 分布的概率密度函数在正半轴上呈偏态分布,参见图1.3-9。
(3)F分布
设有两个独立的正态总体 和 ,它们的方差相等。又设 是来自 的一个样本; 是来自 的一个样本,两个样本相互独立。它们的样本方差比的分布是自由度为n-1和m-l的F分布:
其中n-1称为分子自由度或第1自由度;m-1称为分母自由度或第2自由度。F分布的概率密度函数在正半轴上呈偏态分布,参见图1.3-10。
来源:考试网-质量工程师考试