第二章 数值变量(计量)资料的统计分析
第一节 计量资料的统计描述
一、计量资料的频数分布
(一)频数表的编制
1、求极差(全距)
R=最大值-最小值
=132.5-108.2=24.3
2、求组距(i)
i=极差/组数=24.3/10=2.4≌2
3、分组段
原则:第一组段包括最小值,最后组段包括最大值。
每一组段都有上限和下限
上限:组段的终点(最大值)
下限:组段的起点(最小值)
4、列表划记
(二)频数分布的特征
1、集中趋势:数据向某一数值集中的倾向
2、离散趋势:数据的数值大小不等的倾向
(三)频数分布的类型
1、对称分布: 集中位置在中间,左右两侧频数大体对称
2、偏态分布:
(1)正偏态:集中位置偏向数值小的一侧;
(2)负偏态:集中位置偏向数值大的一侧
(四)频数表的用途:
1、揭示资料的分布特征和分布类型
2、便于进一步计算指标和统计分析
3、便于发现特大或特小的可疑值
二、集中趋势的描述
(一)常用平均数的种类:
1、算术均数(简称均数)
2、几何均数
3、中位数
(二)算术均数(均数)
样本均数用X表示,总体均数用μ表示
1、适用范围:对称分布,尤其是正态分布的资料
2、计算方法:
(1)直接法 X=∑X / n
(2)加权法 适用于频数表资料
X=∑fX / ∑f
其中 X=组中值=(上限+下限)/ 2
f=频数
(三)几何均数(简记为G)
1、适用范围:
(1)等比级数资料,如血清滴度资料
(2)对数正态分布资料
2、计算方法:
(1)直接法
G=log-1(∑logX/n)
(2)加权法
G=log-1(∑flogX/∑f)
(四)中位数(简记M)
1、中位数的定义:
中位数: 将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数。在全部观察值中,大于和小于中位数的观察值的个数相等。
2、中位数的适用范围:
(1)偏态分布资料
(2)分布不明资料
(3)分布末端无确定值资料(开口资料)
理论上,中位数可用于任何分布的计量资料, 但实际应用中常用于偏态分布,特别是开口资料。在对称分布资料中,M=X