题型一、频率分布直方图的应用
例1:某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100]。
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数。
分数段 [50,60)[60,70)[70,80)[80,90) x∶y 1∶1 2∶1 3∶4 4∶5
破题切入点:
(1)根据样本频率之和为1,求出参数a的值。
(2)根据频率分布直方图和平均值的计算公式,求出样本平均值。
(3)由直方图可计算语文成绩在每分段上的频数,再根据语文和数学成绩在同一段上的人数比,便可计算数学成绩在[50,90)之间的人数,进而求解。
解:(1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005。
(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分)。
(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20。
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×=20,30×=40,20×=25。
故数学成绩在[50,90)之外的人数为
100-(5+20+40+25)=10。
题型二 茎叶图的应用
例2:从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)。设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则它们的大小关系分别为________。
破题切入点:由茎叶图观察求解比较两组数据的平均数和中位数。
答案:甲<乙,m甲s,故甲更稳定,故填甲。
总结提高:(1)众数、中位数、平均数的异同
①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量。
②平均数的大小与一组数据里每个数据均有关系,任何一个数据的变动都会引起平均数的变动,而中位数和众数都不具备此性质。
③众数考查各数据出现的频率,当一组数据中有不少数据多次出现时,众数往往更能反映问题。
④中位数仅与数据的排列位置有关,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势。
(2)茎叶图刻画数据的优点
①所有数据信息都可以在茎叶图中看到。
②茎叶图便于记录和表示,且能够展示数据的分布情况。
(3)利用频率分布直方图估计样本的数字特征
①中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值。
②平均数:平均数的频率分布直方图的“重心”,等于图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
③众数:在频率分布直方图中,众数是最高的矩形底边的中点的横坐标。
1.某校对高三年级的学生进行体检,现将高三男生的体重(kg)数据进行整理后分成五组,并绘制频率分布直方图(如图)。根据一般标准,高三男生的体重超过65 kg属于偏胖,低于55 kg属于偏瘦。已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.20,0.10,0.05,第二小组的频数为400,则该校高三年级的男生总数和体重正常的频率分别为________。
答案:1 000,0.60
解析:据题意,得第二小组的频率为1-(0.25+0.20+0.10+0.05)=0.40,
且其频数为400,设高三年级男生总数为n,
则有=0.40,∴n=1 000。
体重正常的学生所占的频率为第二和第三小组频率之和,
即0.20+0.40=0.60。
2.已知记录7名运动员选手身高(单位:cm)的茎叶图如图,其平均身高为177 cm,因有一名运动员的身高记录看不清楚,设其末位数为x,那么推断x的值为________。
答案:8
解析:据茎叶图可知=177,
解得x=8。
3.在样本的频率分布直方图中,一共有n个小矩形。若中间一个小矩形的面积等于其余(n-1)个小矩形面积之和的,且样本容量为240,则中间一组的频数是________。
答案:40
解析:设中间小矩形的面积为S,则由题意知=,
解得S=,即频率为,
所以中间一组的频数为×240=40。
4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________。
答案:2
解析:由题意知(a+0+1+2+3)=1,解得a=-1,
所以样本方差为s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2。
5.(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图。已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________。
答案:12
解析:志愿者的总人数为=50,
所以第三组人数为50×0.36=18,
有疗效的人数为18-6=12。
6.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{an},已知a2=2a1,且样本容量为300,则小长方形面积最大的一组的频数为________。
答案 160
解析 ∵小长方形的面积由小到大构成等比数列{an},且a2=2a1,
∴样本的频率构成一个等比数列,且公比为2,
∴a1+2a1+4a1+8a1=15a1=300,∴a1=20,
∴小长方形面积最大的一组的频数为8a1=160。
7.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm。
答案:24
解析:底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24。
8。如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数分别是________。
答案:18,23
解析:根据茎叶图分别将甲、乙得分按从小到大顺序排起来,根据中位数定义易知甲、乙中位数分别为18,23。
9.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2)
品种:第1年、第2年、第3年、第4年、第5年:甲:9.8、9.9、10.1、10、10.2; 乙:9.4、10.3、10.8、9.7、9.8 其中产量比较稳定的小麦品种是________。
答案:甲
解析:甲=(9.8+9.9+10.1+10+10.2)=10.0,
乙=(9.4+10.3+10.8+9.7+9.8)=10.0;
s=(9.82+…+10.22)-102=0.02,
s=(9.42+…+9.82)-102=0.244>0.02。
10.为了解某校今年准备报考飞行员学生的体重(单位:kg)情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的总人数是________。
答案:48
解析:据频率分布直方图可得第四与第五小组的频率之和为5×(0.013+0.037)=0.25,故前三个小组的频率为1-0.25=0.75,第2小组的频率为0.75×=0.25,又其频数为12,故总人数为=48人。
11.(2014·北京)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号、分组、频数:1, [0,2),6, 2 ,[2,4),8 ,3, [4,6),17,4 ,[6,8),22,5, [8,10),25,6,[10,12),12,7,[12,14),6,8,[14,16),2,9,[16,18),2 合计:100。
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组。(只需写出结论)
解:(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6+2+2=10(名),
所以样本中的学生课外阅读时间少于12小时的频率是1-=0.9。
从该校随机选取一名学生,估计其课外阅读时间少于12小时的概率为0.9。
(2)课外阅读时间落在组[4,6)的有17人,频率为0.17,
所以a=0.085。
课外阅读时间落在组[8,10)的有25人,频率为0.25,
所以b=0.125。
(3)样本中的100名学生课外阅读时间的平均数在第4组。
12.(2014·广东)某车间20名工人年龄数据如下表:
(1)求这20名工人年龄的众数与极差;
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差。
解:(1)这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=21。
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:
(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;
所以这20名工人年龄的方差为:
(30-19)2+(30-28)2+(30-29)2+(30-30)2+(30-31)2+(30-32)2+(30-40)2=12.6。