第二章 数据描述
一、用图表展示定性数据
定性数据包括分类数据和顺序数据,可能用频数分布表和图形来描述。常用饼图和条形图、环形图表示。
二、用图表展示定量数据
定性数据图示的表示方法,也都适用于定量数据。定量数据有一些特定的图示方法,并不适用于定性数据。
一般的分级个数在5-15之间。最大值为上限,最小值为下限。
组距=上限-下限
采取上限不在内的原则,计算在与下限相同的组内。
常用来表述定量数据的统计图形有直方图、折线图、散点图,还有茎叶图、箱线图。
直方图:横坐标代表变量分组,纵坐标代表各变量值出现的频数。
三、用统计表来表示数据
统计表由五个部分组成:表头、行标题、列标题、数字资料和表外附加构成。
表头放在表的上方,说明的是表的主要内容;
行标题和更标题一般放在表的第一行和第一列,表示的是所研究问题类别的名称和指标名称;
表的其余部分是具体的数字资料;
表外附加放在统计表的下方,用来说明资料来源、指标注释和必要的说明内容。通常情况下,统计表的左右两边不能封口。
四、用数字来概括数据
1、对定性的集中趋势常用的方法就是计算百分比、中位数和众数。
中位数(Median),它是按照大小排列之后位于中间的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数)
众数(MODE)是数据中出现次数或出现频率最多的数值,用得最多。
2、定量数据:
反映数据的集中趋势水平度量:平均数、中位数、众数和分位数等。
反映数据离散程度的差异度量:极差、四分位差、标准差和方差。
简单算术平均与加权算术平均
平均数,单位变量值,总体单位数,权数的符号及其含义.
平均数对于严重偏态分布的数据,代表性较差。
中位数和众位数不受极端值的影响,具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数和众数,这时它们的代表性要比平均数好。
极差:又称全距,是最简单的离散指标,是一组中最大值与最小值之差。极差容易受数据中极端值的影响,不能准确地描述数据的分散程度。
方差:是将各个变量值和其均值离差平方的平均数,反映样本中各个观测值到其均值的平均离散程度。方差:不开根号,标准差:开根号。
牢记未分组的计算公式和分组的计算公式,
标准差:是方差的平方根。
总体标准差计算公式: 包括总体未分组的计算公式,总体分组的计算公式,样本标准差计算公式,未分组的计算公式,总体分组的计算公式.
在一个统计样本中,其标准差越大,说明它的各个观测值分布越分散,它的趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就超好。
离散系数:也称变异系数、标准差系数。它是将一组数据的标准差除以其均值,用来测度数据离散程度的相对数。
牢记其计算公式:
总体数据的离散系数与样本数据的离散系数.
标准分数:标准化值或Z分数.它是变量值与其平均值的离差除以标准差后的值,用以测定某一个数据在该组数据中的相对位置。(计算公式)
标准分数的最大的用途是可以把两组数据中的两个不同均值、不同标准差的数据进行对比,以判定在各组中的位置。
一级建造师二级建造师消防工程师造价工程师土建职称公路检测工程师建筑八大员注册建筑师二级造价师监理工程师咨询工程师房地产估价师 城乡规划师结构工程师岩土工程师安全工程师设备监理师环境影响评价土地登记代理公路造价师公路监理师化工工程师暖通工程师给排水工程师计量工程师
执业药师执业医师卫生资格考试卫生高级职称护士资格证初级护师主管护师住院医师临床执业医师临床助理医师中医执业医师中医助理医师中西医医师中西医助理口腔执业医师口腔助理医师公共卫生医师公卫助理医师实践技能内科主治医师外科主治医师中医内科主治儿科主治医师妇产科医师西药士/师中药士/师临床检验技师临床医学理论中医理论