1.在一个2×2列联表中,由其数据计算得χ2的观测值k=13.097,则其两个变量间有关系的可能性为( )
A.99% B.95% C.90% D.无关系
2.对于独立性检验,下列说法中错误的是( )
A.χ2的值越大,说明两事件相关程度越大
B.χ2的值越小,说明两事件相关程度越小
C.χ2≤3.841时,有95%的把握说事件A与B无关
D.χ2≥6.635时,有99%的把握说事件A与B有关
3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算,得xi=52,yi=228,=478,xiyi=1849,则其线性回归方程为( )
A.=11.47+2.62x B.=-11.47+2.62x
C.=2.62+11.47x D.=11.47-2.62x
4.为了研究人的胖、瘦与家庭富裕水平(贫、富)之间是否相关,调查了50000人,其中胖人5000人,下列独立性检验的方案中,较为合理有效的方案是( )
A.随机抽取100名胖人和100名瘦人
B.随机抽取0.08%的胖人和瘦人
C.随机抽取900名瘦人和100名胖人
D.随机抽取0.1%的瘦人和1%的胖人
5.工人月工资y(元)随劳动生产率x(千元)变化的回归直线方程为=60+90x,下列判断正确的是( )
A.劳动生产率为1000元时,工资为150元
B.劳动生产率提高1000元时,工资提高150元
C.劳动生产率提高1000元时,工资提高90元
D.劳动生产率为1000元时,工资为90元
6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若χ2的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个患有肺病
B.由独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病
C.若统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D.以上三种说法都不正确
7.若两个分类变量X和Y的2×2列联表如下:
y1 y2 合计 x1 5 15 20 x2 40 10 50 合计 45 25 70
则X与Y之间有关系的概率约为( )。
8.某单位为了了解用电量y千瓦时与气温x 之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
气温/ 18,13,10,-1 用电量/千瓦时24,34,38,64
由表中数据得回归直线方程x+=-2,预测当气温为-4时,用电量的度数约为( )。
9.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
积极支持改革;不太赞成改革;合计;工作积极:54,40,94,工作一般:32,63,95,合计:86,103,189。
对于人力资源部的研究项目,根据上述数据,你能得出什么结论?
10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:
房屋面积/m2:115、110、80、135、105,销售价格/万元:24.8,21.6,18.4,29.2,22
(1)求回归直线方程;
(2)根据(1)的结果估计当房屋面积为150m2时的销售价格。
11.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心()
C.若该大学某女生身高增加1cm,则其体重约增加0.85kg
D.若该大学某女生身高为170cm,则可断定其体重为58.79kg
12.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关的可能性最大的变量是( )
A.成绩 B.视力 C.智商 D.阅读量
13.某市居民2011~2015年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:
年份/年:2011,2012,2013,2014,2015。收入x/万元 :1.5,12.1,13,13.3,15。支出Y/万元:6.8,8,9.8,10,12。
根据统计资料,居民家庭年平均收入的中位数是( ),家庭年平均收入与年平均支出有( )线性相关关系。
14.(2014安徽,文17改编)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法。收集300位学生每周平均体育运动时间的样本数据(单位:小时)。
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12]。估计该校学生每周平均体育运动时间超过4小时的概率;
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”。
P(χ2≥k):0.10,0.05,0.01,0.05,k:2.706,3.841,6.635,7.879。
参考答案:
1.A。
2.C。
3.A。解析:利用回归系数公式计算可得≈11.47,≈2.62,故=11.47+2.62x。
4.C。解析:样本的合理程度直接影响独立性检验的结果,所以选取样本要合理,易知总体中有5000名胖人,45000名瘦人,抽取样本时应该按比例抽取。
5.C。解析:由表示回归直线=60+90x的斜率,得C正确。
6.C。解析:独立性检验只表明两个分类变量的相关程度,而不是事件是否发生的概率估计。
7.0.99。解析:χ2的观测值k≈18.822>6.635,
所以有99%的把握认为X与Y之间有关系,即X与Y之间有关系的概率约为99%。
8.68。解析:=10,=40,
回归直线方程过点(),
40=-2×10+。
∴=60。∴=-2x+60。
令x=-4,得=(-2)×(-4)+60=68。
9.解:根据列联表中的数据,得到
k=≈10.76,
因为10.76>7.879,所以有99.5%的把握说:“员工工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的。
10.解:(1)×(115+110+80+135+105)=109,
×(24.8+21.6+18.4+29.2+22)=23.2,
设所求回归直线方程为x+
则≈0.1962,
=23.2-109×≈1.8166。
∴所求回归直线方程为=0.1962x+1.8166。
(2)由(1)可知,当x=150m2时,销售价格的估计值为=0.1962×150+1.8166=31.2466(万元)。
11.D。解析:由回归方程为=0.85x-85.71知y随x的增大而增大,所以y与x具有正的线性相关关系;由最小二乘法建立的回归方程的过程知回归直线过样本点的中心(),利用回归方程可以预测估计总体,所以D不正确。
12.D。解析:根据χ2=代入题中数据计算得D选项χ2最大。故选D。
13.正。解析:根据中位数的定义,居民家庭年平均收入的中位数是13,家庭年平均收入与年平均支出有正线性相关关系。
14.解:(1)300×=90,
所以应收集90位女生的样本数据。
(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,
所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75。
(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时。又因为样本数据中有210份是关于男生的,90份是关于女生的。所以每周平均体育运动时间与性别列联表如下:
每周平均体育运动时间与性别列联表
男生,女生,总计,每周平均体育运动时间
不超过4小时:45,30,75,每周平均体育运动时间
超过4小时:165,60,225总计:210 90 300
结合列联表可算得
k≈4.762>3.841。
所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”。