四、事件的概率
随机事件的发生由偶然性,但是随机事件发生的可能性有大小之分,是可以度量的。实际上,通常人们关心事件发生的可能性大小。例如:
(1) 抛一枚硬币,出现正面和反面的可能性各为。
(2) 购买彩票的中奖机会有多少呢?等等
一个事件发生A发生的可能性大小通常用P(A)表示。概率是一个介于0和1之间的数。概率越大,事件发生的可能性越大;概率越小,事件发生的可能性越小。
下面介绍概率的统计定义。
1 概率的统计定义
若与事件A相关的随机现象允许大量重复试验,而且假设在n次重复实验中,事件A发生 次,则事件A发生的频率为,根据概率论中的定理,频率 将会随着试验次数不断增加而趋于稳定,这个频率的稳定值就是事件A的概率。在实际中,无法把一个试验无限地重复下去,只能用重复试验次数n较大时的频率去近似它。
2 概率的性质
性质1 (非负性) 性质2 。
性质3 。特别地,若事件A与事件B互不相容,则 。
性质4 对任何事件A有 。
性质5 。特别地,若 ,则 。
很显然,由上面的不等式知,对任一事件A,有。
性质6 若事件A与B相互独立,即事件A的发生不影响事件B的发生,则A与B的交事件的概率为
。
例2 已知 。求:
; ; 。
解 因为 ,且AB与 互不相容,有
五、随机变量及其分布
1 随机变量
表示随机现象结果的变量称为随机变量。常用大写字母X, Y, Z等表示随机变量,它们的取值用小写字母 等表示。
常见的有两种随机变量。
离散型随机变量:仅取数轴上的有限个点或可列个点。比如,一批产品中的次品数X是离散型随机变量,它的可能取值是0,1,2,……
连续型随机变量:可能取值充满数轴上的一个区间。一台电视机的寿命 (单位:小时)是连续型随机变量,在 上取值。“ ”表示事件“寿命不超过10000小时。”
2 随机变量的分布
(1) 离散型随机变量的分布
离散型随机变量的分布可用分布烈表示。假设离散型随机变量 可能取的值为 。取这些值的概率为, 。这些可以用一个表清楚地表示出来
… …
概率 … …
作为一个分布, 满足一下条件: , 。这样的分布称作离散分布, 称作分布的概率函数。
例 3 设袋中装有6个球,编号为{-1,2,2,2,3,3},从袋中任取一球,求取到的球的号 的分布律。
解 因为 可取的值为-1,2,3,而且 , , ,所以 的概率分布为
-123
例 4 某厂生产的三极管,每100支装一盒,记X为一盒中不合格品数,厂方多次抽查,根据近千次的抽查纪录,从未发现一盒中有6支或6支以上的不合格三极管,用统计方法整理历史数据可得如下分布:
0 1 2 3 4 5
0.284 0.2000 0.0900 0.080 0.004
从表中可以看出,最可能发生的不合格品数在0到2之间,它的概率为:
而超过3个不合格品的概率很小:
3 连续型随机变量的分布
连续型随机变量 的分布用概率密度函数 表示。下面以产品的某个质量特性值 来说明 的由来。
假如我们一个接一个地测量产品的质量特性 ,把测量得来的x值一个接一个地描在数轴上,当累积到很多x时,就形成了一个图形,把纵轴改为单位长度上的频率,由于频率的稳定性,随着被测质量特性x的增多,图形就越稳定,其外形显现出一条曲线,这条曲线就是概率密度曲线,相应的表达式称为概率密度曲线。由于频率稳定于概率,因此可以用概率代替频率,从而纵轴成为“单位长度上的概率”,这就是概率密度的概念,故最后形成的曲线称为概率密度曲线,它一定位于x轴的上方,即 ,并且与x轴所夹面积恰为1。而X在区间 (a,b)上取值的概率为 区间上的面积。
4 随机变量分布的均值、方差与标准差
随机变量的分布有几个重要的特征数,用来表示分布的中心位置和散布大小。
均值用来表示分布的中心位置,用 表示。
(1) 均值的计算方法:
(2) 方差的计算方法
方差表示分布的散布大小,用 表示。方差越大,分布越分散;方差越小,分布越集中。
(3) 标准差
方差的平方根即为标准差,记为 ,即 。
来源:考试网-质量工程师考试