题型一 频率分布直方图的应用
例1 某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段 [50,60) [60,70) [70,80) [80,90) x∶y 1∶1 2∶1 3∶4 4∶5 破题切入点 (1)根据样本频率之和为1,求出参数a的值.
(2)根据频率分布直方图和平均值的计算公式,求出样本平均值.
(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在[50,90)之间的人数,进而求解.
解 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).
(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×=20,30×=40,20×=25.
故数学成绩在[50,90)之外的人数为
100-(5+20+40+25)=10.
题型二 茎叶图的应用
例2 从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则它们的大小关系分别为________.
破题切入点 由茎叶图观察求解比较两组数据的平均数和中位数.
答案 甲<乙,m甲s,故甲更稳定,故填甲.
总结提高 (1)众数、中位数、平均数的异同
①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
②平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质.
③众数考查各数据出现的频率,当一组数据中有不少数据多次出现时,众数往往更能反映问题.
④中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
(2)茎叶图刻画数据的优点
①所有数据信息都可以在茎叶图中看到.
②茎叶图便于记录和表示,且能够展示数据的分布情况.
(3)利用频率分布直方图估计样本的数字特征
①中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.
②平均数:平均数的频率分布直方图的“重心”,等于图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
③众数:在频率分布直方图中,众数是最高的矩形底边的中点的横坐标.
1.某校对高三年级的学生进行体检,现将高三男生的体重(kg)数据进行整理后分成五组,并绘制频率分布直方图(如图).根据一般标准,高三男生的体重超过65 kg属于偏胖,低于55 kg属于偏瘦.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该校高三年级的男生总数和体重正常的频率分别为________.
答案 1 000,0.60
解析 据题意,得第二小组的频率为1-(0.25+0.20+0.10+0.05)=0.40,
且其频数为400,设高三年级男生总数为n,
则有=0.40,∴n=1 000.
体重正常的学生所占的频率为第二和第三小组频率之和,
即0.20+0.40=0.60.
2. 已知记录7名运动员选手身高(单位:cm)的茎叶图如图,其平均身高为177 cm,因有一名运动员的身高记录看不清楚,设其末位数为x,那么推断x的值为________.
答案 8
解析 据茎叶图可知
=177,
解得x=8.
3.在样本的频率分布直方图中,一共有n个小矩形.若中间一个小矩形的面积等于其余(n-1)个小矩形面积之和的,且样本容量为240,则中间一组的频数是________.
答案 40
解析 设中间小矩形的面积为S,则由题意知=,
解得S=,即频率为,
所以中间一组的频数为×240=40.
4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.
答案 2
解析 由题意知(a+0+1+2+3)=1,解得a=-1,
所以样本方差为s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
5.(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.
答案 12
解析 志愿者的总人数为=50,
所以第三组人数为50×0.36=18,
有疗效的人数为18-6=12.
6.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{an},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________.
答案 160
解析 ∵小长方形的面积由小到大构成等比数列{an},且a2=2a1,
∴样本的频率构成一个等比数列,且公比为2,
∴a1+2a1+4a1+8a1=15a1=300,∴a1=20,
∴小长方形面积最大的一组的频数为8a1=160.
7.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
答案 24
解析 底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24.
8.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数分别是________.
答案 18,23
解析 根据茎叶图分别将甲、乙得分按从小到大顺序排起来,根据中位数定义易知甲、乙中位数分别为18,23.
9.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)
品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙 9.4 10.3 10.8 9.7 9.8 其中产量比较稳定的小麦品种是________.
答案 甲
解析 甲=(9.8+9.9+10.1+10+10.2)=10.0,
乙=(9.4+10.3+10.8+9.7+9.8)=10.0;
s=(9.82+…+10.22)-102=0.02,
s=(9.42+…+9.82)-102=0.244>0.02.
10.为了解某校今年准备报考飞行员学生的体重(单位:kg)情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的总人数是________.
答案 48
解析 据频率分布直方图可得第四与第五小组的频率之和为5×(0.013+0.037)=0.25,故前三个小组的频率为1-0.25=0.75,第2小组的频率为0.75×=0.25,又其频数为12,故总人数为=48人.
11.(2014·北京)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号 分组 频数 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9 [16,18) 2 合计 100
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组.(只需写出结论)
解 (1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10(名),
所以样本中的学生课外阅读时间少于12小时的频率是1-=0.9.
从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在组[4,6) 的有17人,频率为0.17,
所以a===0.085.
课外阅读时间落在组[8,10)的有25人,频率为0.25,
所以b===0.125.
(3)样本中的100名学生课外阅读时间的平均数在第4组.
12.(2014·广东)某车间20名工人年龄数据如下表:
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解 (1)这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=21.
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:
(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;
所以这20名工人年龄的方差为:
(30-19)2+(30-28)2+(30-29)2+(30-30)2+(30-31)2+(30-32)2+(30-40)2=12.6.