统计师

各地资讯

当前位置:考试网 >> 统计师 >> 辅导资料 >> 初级统计师 >> 文章内容

初级统计师考试《统计实务》重要考点:第五章第一节

来源:考试网  [2016年9月5日]  【

  第五章 相关分析与回归分析

  相关分析是研究两个或两个以上变量之间相关关系的方法论,而回归分析是研究变量之间相关关系类型,进而掌握其发展变化规律,预测未来的方法论。

  第一节 相关关系

  一.相关关系

  在现实世界中,任何事物或现象都不是孤立存在的,而是相互联系、相互制约、相互依存的。当某些现象发生变化时,另一现象也会随之发生变化。如商品价格的变化会刺激或抑制商品销售量的变化;劳动力素质的高低会影响企业的效益;直接材料、直接人工的价格变化会对产品销售成本有直接的影响;居民收入的高低会影响对该企业产品的需求量等等。

  研究这些现象之间的依存关系,找出它们之间的变化规律,是对经搜集、整理过的统计数据进行数据分析,为客观、科学地统计提供依据。

  现象间的依存关系大致可以分成两种类型: 一类是函数关系,另一类是相关关系。

  (1)函数关系。函数是指现象之间有一种严格的确定性的依存关系。表现为某一现象发生变化另一现象也随之发生变化,而且有确定的值与之相对应。例如,银行的1年期存款利率为年息1.98%,存入的本金用x表示,到期本息用y表示,则y=x+1.98%x(不考虑利息税);

  (2)相关关系。相关关系是指客观现象之间确实存在的,但数量上不是严格对应的依存关系。在这种关系中,对于某一现象的每一数值,可以有另一现象的若干数值与之相对应。例如成本的高低与利润的多少有密切关系,但某一确定的成本与相对应的利润的数量关系却是不确定的。这是因为影响利润的因素除了成本外,还有价格、供求平衡、消费嗜好等因素以及其他偶然因素的影响

  相关关系和函数关系既有区别,又有联系。有些函数关系往往因为有观察或测量误差以及各种随机因素的干扰等原因,在实际中常常通过相关关系表现出来;而在研究相关关系时,当对其数量间的规律性了解得越深刻的时候,其相关关系就越有可能转化为函数关系或借助函数关系来表现。

  (3)相关关系的两个特点

  ①现象之间确实存在着数量上的依存关系。就是说,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。

  ②现象间的数量依存关系值是不确定的。就是说,一个现象发生数量上的变化,另一个现象会有几个可能值与之对应,而不是唯一确定的值。

  相关分析的主要内容:

  (1)确定现象之间有无关系。

  (2)确定相关关系的表现形式,运用相应的回归分析方法进一步分析现象之间的数量依存关系。用一个数学表达式,来反映有相关关系的变量之间的数值变化关系,据此由一个或若干个自变量的数值推断出因变量的可能值,这种分析称为回归分析。相关分析与回归分析既有区别又有联系,两种分析构成了相关关系分析的基本内容。

  (3)测定相关关系的密切程度。

  二.相关关系的描述---散点图

  对于两个变量x和y,通过观察或实验,我们可以得到若干组数据,记为(xi,yi)(i=1,2,…,n)将这些数据按x值由大到小(或由小到大)以序列表表示,即构成相关表。

  将一一对应的(xi,yi)描点于坐标轴上,即构成散点图,又称相关图。通过散点图所反映出的坐标点的分布状况可以直观地判断变量之间是否存在相关关系,以及相关的形态、方向。例如:

  散点图是相关关系的一种描述方法,它直观、形象,通过散点图可以观察到现象的关系类型以及相关方向、程度。

  1. 相关的形态

  按照相关形式不同分为:线性相关和非线性相关。

  线性相关——又称直线相关,是指当一个变量变动时,另一变量随之发生大致均等的变动,从图形上看,其观察点的分布近似地表现为一条直线;例如,人均消费水平与人均收入水平通常呈线性关系。

  非线性相关——一个变量变动时,另一变量也随之发生变动,但这种变动不是均等的,从图形上看,其观察点的分布近似地表现为一条曲线,如抛物线、指数曲线等,因此也称为曲线相关。例如,工人加班加点在一定数量界限内,产量增加,但一旦超过一定限度,产量反而可能下降,这就是一种非线性关系。

  2. 相关的方向

  按照相关的方向不同分为:正相关和负相关。

  正相关——当一个变量的值增加或减少,另一个变量的值也随之增加或减少。如工人劳动生产率提高,产品产量也随之增加;居民的消费水平随个人所支配收入的增加而增加。

  负相关——当一个变量的值增加或减少时,另一变量的值反而减少或增加。如商品流转额越大,商品流通费用越低;利润随单位成本的降低而增加。

  三.相关程度的测定:

  在直线相关的类型中,人们使用相关系数测定变量之间的相关关系。

  (一) 相关系数的计算

  相关系数是测定变量之间关系密切程度的量。对两个变量之间的线性相关程度的度量称为单相关系数。通常以r表示样本的相关系数。

  样本的相关系数的定义公式为:

  计算该相关系数时,假定两个变量之间是线性关系,而且两个变量都是随机变量。此外,样本数据中不应有极端值,否则会对相关系数的值有较大影响。相关系数的性质如下:

  1. 相关系数的值介于–1与+1之间,即–1≤r≤+1。

  当r>0时,表示两变量正相关,当r<0时,表示两变量为负相关。当|r|=1时,表示两变量为完全线性相关即函数关系。当r=1时,称为完全正相关,而当r=-1时,称为完全负相关。当r=0时,表示两变量间无线性相关关系。

  2. r具有对称性。X与y之间的相关系数rxy和y与x之间的相关系数ryx相等。

  3. r数值大小与x和y的数据原点及计量尺度无关。改变x和y的数据原点和计量尺度,并不改变r数值的大小。

  4. r仅仅是x与y 之间线性关系的一个度量,它不能用于描述非线性关系。

  5. r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。

  当︱r︱≥0.8时,可视为高度相关;当0.5≤︱r︱<0.8时,可视为中度相关;当0.3≤︱r︱<0.5时,视为低度相关;当︱r︱<0.3时,说明两个变量之间的相关程度极弱。

  (二)相关系数的检验:

  检验相关系数是因为两个变量均为随机变量,计算相关系数时使用的是它们的随机抽样值,因此不能断定总体变量值也存在着这样的相关关系,需要经过显著性检验加以确定。

  在实际的客观分析中,相关系数一般都是利用样本数据计算的,因而带有一定的随机性。样本容量越小其可信度就越差,因此也需要进行检验。相关系数的显著性检验问题是对总体的相关系数是否等于0进行检验。

  表明相关系数在统计上是显著的。即人均消费性支出与人均可支配收入之间存在显著的线性相关系数。

责编:liujianting
  • 会计考试
  • 建筑工程
  • 职业资格
  • 医药考试
  • 外语考试
  • 学历考试