【文档说明】2023高考数学科学复习创新方案(新高考题型版) 第10章 第2讲 用样本估计总体 含解析【高考】.doc,共(31)页,793.500 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-c4c7e09d7dd8234fc0a672c1122cc375.html
以下为本文档部分文字说明:
1第2讲用样本估计总体1.频率分布表、频率分布直方图的制作步骤及意义2.频率分布折线图用线段连接频率分布直方图中各个矩形上面一边的01中点,就得到频率分布折线图.3.其他统计图表(1)不同的统计图在表示数据上的特点扇形图主要用于直观描述各类数据占总数的0
2比例,条形图和直方图主要用于直观描述不同类别或分组数据的03频数和04频率,折线图主要用于描述数据随05时间的变化趋势.(2)不同的统计图适用的数据类型条形图适用于描述06离散型的数据,直方图适用于描述07连续型数据.4.百分位数2(1)定义:一般地,一组数据的第p百分位数是这样一个值,
它使得这组数据中至少有p%的数据08小于或等于这个值,且至少有(100-p)%的数据09大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按10从小到大排列原始数据.第2步,
计算i=11n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第12j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的13平均数.5.总体集中趋势的估计(1)平均数、中
位数和众数等都是刻画“14中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.(2)一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用15平均数、16中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用17众数.
6.频率分布直方图中平均数、中位数、众数的求法(1)样本平均数:可以用每个小矩形底边中点的18横坐标与小矩形面积的乘积之和近似代替.(2)在频率分布直方图中,中位数左边和右边的直方图的面积应该19相等.(3)将最高小矩形所在的区间20中点作为众数的估计值.7.方差、标准
差(1)假设一组数据为x1,x2,…,xn,则①平均数x-=x1+x2+…+xnn,②方差s2=211n∑ni=1(xi-x-)2,③标准差s=221n∑ni=1(xi-x-)2.3(2)如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为Y,则称
S2=1N∑Ni=1(Yi-Y)2为总体方差,S=S2为总体标准差.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=1N∑ki=1fi(Yi-Y)2.(3)如果一个样本中
个体的变量值分别为y1,y2,…,yn,样本平均数为y-,则称s2=1n∑ni=1(yi-y-)2为样本方差,s=s2为样本标准差.(4)标准差刻画了数据的离散程度或波动幅度,标准差23越大,数据的离散程度越
大;标准差24越小,数据的离散程度越小.(5)分层随机抽样的均值与方差分层随机抽样中,如果样本量是按比例分配,记总的样本平均数为w-,样本方差为s2.以分两层抽样的情况为例,假设第一层有m个数,分别为x1,x2,…,
xm,平均数为x-,方差为s21;第二层有n个数,分别为y1,y2,…,yn,平均数为y-,方差为s22.则x-=1m∑mi=1xi,s21=1m∑mi=1(xi-x-)2,y-=1n∑ni=1yi,s22=1n∑ni=1(yi-y-)2.则①w
-=25mm+nx-+nm+ny-,②s2=261m+n{m[s21+(x--w-)2]+n[s22+(y--w-)2]}=271m+n(ms21+ns22)+mnm+n(x--y-)2.平均数、方差
的公式推广(1)若数据x1,x2,…,xn的平均数为x-,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx-+a.(2)若数据x1,x2,…,xn的方差为s2,则:4①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax
1,ax2,…,axn的方差为a2s2.1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中,可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.
x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数答案B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.某课外小组的同学们从社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度120140
160180200户数23582则这20户家庭该月用电量的众数和中位数分别是()A.180,170B.160,180C.160,170D.180,160答案A解析用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B,C;将用电量按从小到大的顺序排列
后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1
5C.1D.10答案C解析因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据的方差为102×0.01=1.故选C.4.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别
给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案A解析中位数是将9个数据从小到大或从大
到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.5.(2021·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[
66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是()A.20B.40C.64D.80答案D解析由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80
.故选D.6.90,92,92,93,93,94,95,96,99,100的75%分位数为________,80%分位数为6________.答案9697.5解析10×75%=7.5,10×80%=8,所以75%分位数为x8=96,80%分位数为x8+x92=96+
992=97.5.多角度探究突破考向一统计图表及应用角度扇形图例1(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的
经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案A解析设新农村建设前的收入为M,
则新农村建设后的收入为2M,新农村7建设前种植收入为0.6M,新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A不正确;新农村建设前其他收入为0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,增加了
一倍,所以C正确;新农村建设后,养殖收入与第三产业收入的总和占经济收入的30%+28%=58%>50%,所以超过了经济收入的一半,所以D正确.故选A.角度折线图例2(多选)(2021·济南一中模拟)2021年3月12日是全国第44个植树节,为提
高大家爱劳动的意识,某中学组织开展植树活动,并收集了高三年级1~11班植树量的数据(单位:棵),绘制了下面的折线图.根据折线图,下列结论正确的是()A.各班植树的棵数不是逐班增加的B.4班植树的棵数低
于11个班的平均值C.各班植树棵数的中位数为6班对应的植树棵数D.1至5班植树的棵数相对于6至11班,波动更小,变化比较平稳答案ABD解析从题图可知,2班的植树量少于1班,8班的植树量少于7班,故A正确;4班的植数棵数为10,11个班中只有2,3,8班三个班的植树棵数
少于10棵,且大于5棵,其余7个班的植树棵数都超过10棵,且有6,7,9,10,11班五个班的植树棵数都不少于15棵,将这五个班中的植树棵数各取出5棵,加到2,3,8班中去,除4班外,其余各班的植树棵数都超过了4班,所以4班植树的棵数
低于11个班的平均值,故B正确;比6班植树多的只有9,10,11三个班,其余七个班都比6班少,故6班所对应的植树棵数不是中位数,故C错误;1至5班的植树棵数的极差在10以内,6至11班的植树棵数的极差超过了15,另外从题图明显看出,18至5班植树的棵数相对于6至11班,波动更小
,变化比较平稳,故D正确.故选ABD.角度频率分布直方图例3(1)(2020·天津高考)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图
,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为()A.10B.18C.20D.36答案B解析根据频率分布直方图可知,直径落在区间[5.43,5.47)之间的频率为(6.25+5.00)×0.02=0
.225,则直径落在区间[5.43,5.47)内零件的个数为80×0.225=18.故选B.(2)(多选)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中正确的有()A.
成绩在[70,80]分的考生人数最多9B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分答案ABC解析根据频率分布直方图得,成绩出现在[70,80]的频率
最大,故A正确;不及格的考生人数为10×(0.010+0.015)×4000=1000,故B正确;根据频率分布直方图估计考生竞赛成绩的平均分为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5分,故C正确;0.1+0.15+0.2=0
.45<0.5,0.1+0.15+0.2+0.3=0.75>0.5,所以考生竞赛成绩的中位数为70+0.5-0.450.3×10≈71.67分,故D错误.故选ABC.常见统计图的特点(1)通过扇形统计图可以很清楚的表示出各部
分数量同总数之间的关系.(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.(3)准确理解频率分布直方图的数据特点①频率分布直方图中纵轴上的数据是各
组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.1.(多选)比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高
者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象能力指标值为4,乙的数学抽象能力指标值为5,则下面叙述正确的是()10A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值B.甲的数学建模能力指标值优于乙的直观想象能力指标值C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水
平D.甲的数学运算能力指标值优于甲的直观想象能力指标值答案AC解析对于A,甲的逻辑推理能力指标值为4,乙的逻辑推理能力指标值为3,所以甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值,故A正确;对于B,甲的数学建模能力指标值为3,乙的
直观想象能力指标值为5,所以乙的直观想象能力指标值优于甲的数学建模能力指标值,故B错误;对于C,甲的六维能力指标值的平均值为16×(4+3+4+5+3+4)=236,乙的六维能力指标值的平均值为16×(5+4+3+
5+4+3)=4>236,所以乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平,故C正确;对于D,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,所以甲的数学运算能力指标值不优于甲的直观想象能力指标值,故D错误.故选AC.2.新型冠状病毒
疫情发生后,口罩的需求量大增,某口罩工厂为提高生产效率,开展技术创新活动,提出两种新的生产方式,为比较两种生产方式的效率,选取80名工人,将他们随机分成两组,每组40人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.第一种生产
方式40名工人完成同一生产任务所用时间(单位:min)如表:68728577838290838984888776917990879186928887817695946387857196637485929987827569第二种生产方式40名工人完成同一生产任务所用时间
(单位:min)如扇形图所示:11(1)请填写第一种生产方式完成任务所用时间的频数分布表,并作出频率分布直方图;生产时间[60,70)[70,80)[80,90)[90,100]频数(2)试从扇形图中估计第二种生产方式的平均数;(3)根据频
率分布直方图和扇形图判断哪种生产方式的效率更高,并说明理由.解(1)第一种生产方式完成任务所用时间的频数分布表如下:生产时间[60,70)[70,80)[80,90)[90,100]频数481810频率分布直方图如下:
(2)从扇形图中估计第二种生产方式的平均数为65×0.25+75×0.5+85×0.2+95×0.05=75.5min.(3)从频率分布直方图中估计第一种生产方式的平均数为65×0.1+75×0.2+1285×0.45+
95×0.25=83.5min,从平均数的角度发现:用第一种生产方式的工人完成生产任务所需要的时间高于80分钟;用第二种生产方式的工人完成生产任务所需要的时间低于80分钟,因此第二种生产方式的效率更高.多角度探究突破考向二用样本估计总体角度总体百分位数的估计例4(1)一组数据为6
,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是()A.15B.25C.50D.75答案A解析由小到大排列的结果:6,7,15,36,39,40,41,42,43,47,49,一共11项,由11×25%=2.75,11×
50%=5.5,11×75%=8.25,故第25百分位数是15,第50百分位数是40,第75百分位数是43.故选A.(2)如图是将高三某班80名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出的频率分布直方图,则此班的模拟考试成绩的80%分
位数是________.(结果保留两位小数)答案124.44解析由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.0225)×10
×100%=92.5%,因此,80%分位数一定位于[120,130)内.由120+0.80-0.700.925-0.70×10≈124.44,故此班的模拟考试成绩的1380%分位数约为124.44.角度分层随机抽样的均值与方差例5(2
022·广东珠海模拟)某学校在上报《国家学生体质健康标准》高三年级学生的肺活量单项数据中,采用样本量按比例分配的分层随机抽样方法.如果不知道样本数据,只知道抽取了男生20人,其肺活量平均数为3000mL,方差为10;抽取了女生30人,其肺活量平均数为2500mL,方差为20,则可估计高三年级
全体学生肺活量的平均数为________,方差为________.答案270060280解析把男生样本记为x1,x2,…,x20,其平均数记为x-,方差记为s2x;把女生样本记为y1,y2,…,y30,其平均数记为y-,方差记为s2y;把总样本数据的平均数记为z-,方差记为
s2.由x-=3000,y-=2500,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为z-=2020+30x-+3020+30y-=25×3000+35×2500=2700.根据方差的定义,总样本方差为s2=150[∑20
i=1(xi-z-)2+∑30j=1(yj-z-)2]=150[∑20i=1(xi-x-+x--z-)2+∑30j=1(yj-y-+y--z-)2].由∑20i=1(xi-x-)=∑20i=1xi-20x-=0,可得∑20i=12(xi-x-)(x
--z-)=2(x--z-)·∑20i=1(xi-x-)=0.同理可得∑30j=12(yj-y-)(y--z-)=0.因此s2=150[∑20i=1(xi-x-)2+∑20i=1(x--z-)2+∑30j=1(yj-y-)2+∑30j=1(y--z
-)2]=150{20[s2x+(x--z-)2]+30[s2y+(y--z-)2]}=150{20[102+(3000-2700)2]+30[202+(2500-2700)2]}=60280.据此可
估计高三年级全体学生肺活量的平均数为2700,方差为60280.角度均值方差的应用例6(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备14生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10
件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.9新设备10.110.410.110.010.1旧设备9.810.010.110.29.7新设备10.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x-和y-,样本方差分别记为s2
1和s22.(1)求x-,y-,s21,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y--x-≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否
则不认为有显著提高).解(1)由表中的数据可得:x-=9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.710=10,y-=10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+1
0.510=10.3,s21=110×[(9.8-10)2+(10.3-10)2+(10.0-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10.0-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036,s22=11
0×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)
2]=0.04.(2)由(1)中的数据可得y--x-=10.3-10=0.3,152s21+s2210=20.036+0.0410=20.0076=0.0304,因为0.3=0.09>0.0304,所以y--x->2s21+
s2210.所以可以认为新设备生产产品的该项指标的均值较旧设备有显著提高.1.频率分布直方图中第p百分位数的计算(1)确定百分位数所在的区间[a,b].(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则
第p百分位数为a+p%-fa%fb%-fa%×(b-a).2.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,
方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s2=1n[(x21+x22+…+x2n)-nx-2],或写成s2=1n(x21+x22+…+x2n)-x-2,即方差等于原始数据平方的平均数减去平均数的平方.3.有13位同学参加学校组织的才艺表演比赛,已知他们
所得的分数互不相同,共设7个获奖名额,某同学知道自己的比赛分数后,要判断自己能否获奖,在这13名同学成绩的统计量中只需知道一个量,它是________(填“众数”“中位数”或“平均数”).答案中位数解析因为7
位获奖者的分数肯定是13名参赛选手中最高的,所以把13个不同的分数按从小到大排序,只要知道自己的分数和中位数就可以知道是否获奖了.4.某学校共有学生2000人,其中高一800人,高二、高三各600人,学校对
学生在暑假期间每天的读书时间做了调查统计,全体学生每天的读书时间的平16均数为x-=3小时,方差为s2=1.966,其中三个年级学生每天读书时间的平均数分别为x-1=2.7,x-2=3.1,x-3=3.3,又已知高一学生、高二学生每天读书时间的方差分别为s21=1,s22=2,则高三学生
每天读书时间的方差s23=________.答案3解析由题意可得,1.966=8002000×[1+(2.7-3)2]+6002000×[2+(3.1-3)2]+6002000×[s23+(3.3-3)2],解得s23=3.5.(2021·天津河西区期末
)某校为了解全校高中学生五一假期参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.(1)求这100名学生中参加实践活动时间在6~10小时的人数;(2)估计这100名学生参加实践活动时间的众数、中位数和平均数.解(1)100×[1-(0.
04+0.12+0.05)×2]=58,即这100名学生中参加实践活动时间在6~10小时的人数为58.(2)由频率分布直方图可以看出,最高矩形底边中点的横坐标为7,故这100名学生参加实践活动时间的众数的估计值为7小时.(0.04+0.12)×2=0.32;(0.04
+0.12+0.15)×2=0.62,中位数t满足6<t<8.由0.32+(t-6)×0.15=0.5,得t=7.2,即这100名学生参加实践活动时间的中位数的估计值为7.2小时.由(0.04+0.12+0.15+a+0.05)×2=1,解得a=0.14.这100
名学生参加实践活动时间的平均数的估计值为0.04×2×3+0.12×2×5+0.15×2×7+0.14×2×9+0.05×2×11=7.16(小时).17一、单项选择题1.(2021·广东深圳模拟)已知数据x1,x2,x3,x4,x5,x6的平均数是5,方差是9,则x21+x22
+x23+x24+x25+x26=()A.159B.204C.231D.636答案B解析根据题意,数据x1,x2,x3,x4,x5,x6中平均数x-=5,方差s2=9,则s2=16(x21+x22+x
23+x24+x25+x26)-x-2=9,变形可得x21+x22+x23+x24+x25+x26=204,故选B.2.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x-A和x-B,样本标准差分别为sA和sB,则()A.x-A
>x-B,sA>sBB.x-A<x-B,sA>sBC.x-A>x-B,sA<sBD.x-A<x-B,sA<sB答案B解析由图可得样本A的数据都在10及以下,样本B的数据都在10及以上,所以x-A<x-B,样
本B的数据比样本A的数据波动幅度小,所以sA>sB.故选B.3.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:班级人数平均数方差18甲20x-甲2乙30x-乙3其中x-甲=x-乙,则两个班数学成绩的方差为()A.3B.2C.2.6D.2.5答案C解析
由题意可知两个班的数学成绩的平均数为x-=x-甲=x-乙,则两个班数学成绩的方差为s2=2020+30×[2+(x-甲-x-)2]+3020+30[3+(x-乙-x-)2]=2020+30×2+3020+30×3=2.6.4.如图给出的是某小区居民一段时间内访问网站的比例
图,则下列选项中不超过21%的为()A.腾讯与百度的访问量所占比例之和B.网易与搜狗的访问量所占比例之和C.淘宝与论坛的访问量所占比例之和D.新浪与小说的访问量所占比例之和答案B解析由于网易与搜狗的访问量所占比例之和为18%,不超过21%.故选B.5.(2021·全国甲卷
)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:19根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率
估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间答案C解析由频率分布直方图,知该地农户家庭年收入低于4.5万元的农户比率估计为(0.02+0.04)×1
×100%=6%,故A正确;由频率分布直方图,知该地农户家庭年收入不低于10.5万元的农户比率估计为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;由频率分布直方图,知该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×
0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;由频率分布直方图,知该地农户家庭年收入介于4.5万元至8.5万元之间
的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确.故选C.6.恩格尔系数是食品支出总额占个人消费支出总额的比重,其数值越小说明生活富裕程度越高.统计改革开放40年来我国历年城镇和农村居民家庭恩格尔系数,绘制了如图的折线图.根据该折线图,下列结论错误的
是()20A.城镇居民家庭生活富裕程度不低于农村居民家庭B.随着改革开放的不断深入,城镇和农村居民家庭生活富裕程度越来越高C.1996年开始城镇和农村居民家庭恩格尔系数都低于50%D.随着城乡一体化进程的推进,城镇和农村
居民家庭生活富裕程度差别越来越小答案C解析由折线图可知,对于A,因为城镇的恩格尔系数较小,故城镇居民家庭生活富裕程度不低于农村居民,A正确;对于B,城镇和农村的恩格尔系数整体上都在下降,说明城镇和农村
居民家庭生活富裕程度越来越高,B正确;对于C,1996~2000年我国农村居民家庭恩格尔系数不低于50%,C错误;对于D,结合图形得到城镇和农村家庭恩格尔系数之间的差距越来越小,说明城镇和农村家庭生活富裕程度差别越来越小,D正确.故选C.7.某旅游城市为向游客介绍本
地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温
差大21C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案D解析由图形可得各月的平均最低气温都在0℃以上,A正确;七月的平均温差约为10℃,而一月的平均温差约为5℃,故B正确;三月和十一月的平均最高气温都在10℃左右,基本相同,C正确
;平均最高气温高于20℃的月份为六月、七月、八月,只有3个,D错误.8.某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布扇形图和90后从事互联网行业者岗位分布条形图,则下列结论中不一定正确的是()注:90后指1990年及以后出生,80后指1980~1989年之间出生
,80前指1979年及以前出生.A.互联网行业从业人员中90后占一半以上B.互联网行业中从事技术岗位的人数超过总人数的20%C.互联网行业中从事运营岗位的人数90后比80前多D.互联网行业中从事技术岗位的人数90后比
80后多答案D解析由题图易知互联网行业从业人员90后占56%,A正确;仅90后从事技术岗位的人数占总人数的56%×39.6%=22.176%,超过20%,B正确;90后从事运营岗位的人数占总人数的56%×17%=9.52%>3%,C正确;90后从事技术岗位的人数占
总人数的22.176%<41%,而题中未给出80后从事互联网行业岗位分布情况,故D不一定正确.二、多项选择题229.(2021·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,xn的离散程度的是()A.样本x1,x
2,…,xn的标准差B.样本x1,x2,…,xn的中位数C.样本x1,x2,…,xn的极差D.样本x1,x2,…,xn的平均数答案AC解析由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据
的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.10.(2021·衡水中学模拟)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;
丁,定期寿险;戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图例:用该样本估计总体,以下四个说法正确的是()A.54周岁及以上人群参保人数最少B.18~29周岁人群参保总费用最少2
3C.丁险种更受参保人青睐D.30周岁及以上的人群约占参保人群的20%答案AC解析对于A,由扇形图可知,54周岁及以上人群参保人数最少,故A正确;对于B,由折线图可知,18~29周岁人群人均参保费用略低于4000,这类人占参保人群的2
0%,而54周岁及以上人群人均参保费用约为6000,这类人仅占参保人群的8%,易知18~29周岁人群参保总费用不是最少的,故B错误;对于C,由柱状图可知,丁险种参保比例最高,故C正确;对于D,由扇形图可知,3
0周岁及以上的人群约占参保人群的80%,故D错误.故选AC.11.为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论正确的是()A.该校九年级学生1分钟仰卧起坐的次数的中位数为26
.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为32答案ABC解
析由题图可知众数是27.5次,第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,所以中位数在第三组,设中位数为x,则由0.1+0.3+(x-25)×0.08=0.5,
解得x=26.25,故中位数是26.25次,1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐
的次数少于2024次的人数约为160.故A,B,C正确,D错误.故选ABC.12.在发生某公共卫生事件期间,我国有关机构规定:“该事件在一段时间没有发生规模群体感染的标志为连续10天,每天新增加疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑
似病例数据,不一定符合该标志的是()A.甲地总体均值为3,中位数为4B.乙地总体均值为2,总体方差大于0C.丙地中位数为3,众数为3D.丁地总体均值为2,总体方差为3答案ABC解析平均数和中位数不能确定某一天的病例不超过7人,A不一定符合该标志;当总体方差大于0时,不知道总体方差的具体数值,因此不
能确定数据的波动大小,B不一定符合该标志;中位数和众数也不能确定某一天的病例不超过7人,C不一定符合该标志;当总体均值为2时,若有一个数据超过7,则方差就超过3,D一定符合该标志.故选ABC.三、填空题13.为了调查某厂工人生产
某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到的频率分布直方图如图.则产品数量位于[55,65)范围内的频率为________;这20名工人中
一天生产该产品数量在[55,75)的人数是________.答案0.413解析由直方图可知,产品数量在[55,65)的频率为1-(0.005+0.010+0.020+0.025)×10=0.4,这20名工人中一天生产该产品数
量在[55,75)的人数为20×(0.040+0.025)×10=13.14.已知30个数据的60%分位数是8.2,这30个数据从小到大排列后第1825个数据是7.8,则第19个数据是________.答案8.6解析由30×60%=18,设第19个数据为x,则7.8+x
2=8.2,解得x=8.6,即第19个数据是8.6.15.从甲、乙、丙三个厂家生产的同一种产品中各抽取8件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该
产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲________,乙________,丙________.答案众数平均数中位数解析甲、乙、丙三个厂家从不同角度描述了一组数据的特征,甲:该组数据8出现的次数最多;
乙:该组数据的平均数x-=4+6×3+8+9+12+138=8;丙:该组数据的中位数是7+92=8.16.甲、乙两支田径队体检结果为:甲队体重的平均数为60kg,方差为200,乙队体重的平均数为70kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,则甲、
乙两队全部队员的平均体重为________,方差为________.答案68kg296解析由题意可知x-甲=60,甲队队员在所有队员中所占权重为w甲=11+4=15,x-乙=70,乙队队员在所有队员中所占权重为w乙=41+4=45
,则甲、乙两队全部队员的平均体重为x-=w甲x-甲+w乙x-乙=15×60+45×70=68(kg),甲、乙两队全部队员的体重的方差为s2=w甲[s2甲+(x-甲-x-)2]+w乙[s2乙+(x-乙-x-)2]=1526×[200+(6
0-68)2]+45×[300+(70-68)2]=296.四、解答题17.(2019·全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离
子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中
a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0
.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.18.某市为了鼓励居民节约用电
,实行“阶梯式”电价,将该市每户居民的27月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位
:千瓦时)的函数解析式;(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;(3)根据(2)中求得的数
据计算用电量的75%分位数.解(1)当0≤x≤200时,y=0.5x;当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;当x>400时,y=0.5×200+0.8×20
0+1.0×(x-400)=x-140.所以y与x之间的函数解析式为y=0.5x,0≤x≤200,0.8x-60,200<x≤400,x-140,x>400.(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,结合频率分布直方图可知0.0010×
100+2×100b+0.0030×100=0.8,100a+0.0005×100=0.2,解得a=0.0015,b=0.0020.28(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.0010+0.0020+0.0030)×100=60%,用电量低于400千瓦时的占80%
,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.0020=0.75,解得m=375,即用电量的75%分位数为375千瓦时.19.我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市为了节约生活用水,计划
在本市试行居民生活用水定额管理(即确定一个居民月均用水量标准,用水量不超过a的部分按照平价收费,超过a的部分按照议价收费).为了较为合理地确定出这个标准,通过抽样获得了100位居民某年的月均用水量(单位:t),制作了频率分布直方图.(1)由于某种原因频率分布直方图部分数据丢失
,请在图中将其补充完整;(2)用样本估计总体,如果希望80%的居民每月的用水量不超过标准,则月均用水量的最低标准定为多少吨?并说明理由;(3)从频率分布直方图中估计该100位居民月均用水量的平均数.(同一组中的数据用该区间的中点值代
表)解(1)29(2)月均用水量的最低标准应定为2.5t.样本中月均用水量不低于2.5t的居民占样本总体的20%,由样本估计总体,要保证80%的居民每月的用水量不超出标准,月均用水量的最低标准应定为2.5t.
(3)这100位居民的月均用水量的平均数为0.5×(0.25×0.10+0.75×0.20+1.25×0.30+1.75×0.40+2.25×0.60+2.75×0.30+3.25×0.10)=1.875(t).20.(2021·厦门期末)某校有高中生2000人,其中男女生比例约为5∶4,为
了获得该校全体高中生的身高信息,采取了以下两种方案:方案一:采用比例分配的分层随机抽样方法,抽取了样本容量为n的样本,得到频数分布表和频率分布直方图.身高(单位:cm)[145,155)[155,165)[165,175)[175,
185)[185,195]频数mpq64方案二:采用分层随机抽样方法,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20.(1)根据图表信息,求n,q并补充完整频率分布直方图,估计该校高中生的身高均值;(同一组
中的数据以这组数据所在区间中点的值为代表)(2)计算方案二中总样本的均值及方差;(3)计算两种方案总样本均值的差,并说明用方案二总样本的均值作为总体均值的估计合适吗?为什么?解(1)因为身高在区间[185,195]的频率
为0.008×10=0.08,频数为4,所以样本容量为n=40.08=50,m=0.008×10×50=4,30p=0.04×10×50=20,q=50-4-20-6-4=16,所以身高在[165,175)的频率为1650=0.32,小矩形的高为0.032;身高
在[175,185)的频率为650=0.12,小矩形的高为0.012,由此补全频率分布直方图:由频率分布直方图可知,样本的身高均值为(150×0.008+160×0.040+170×0.032+180×0.012+190×0.0
08)×10=167.2,所以由样本估计总体可知,估计该校高中生的身高均值为167.2.(2)把男生样本记为x1,x2,x3,…,x25,其均值为x-,方差为s2x,把女生样本记为y1,y2,y3,…,y25,其均值为y-,方差为s2y,总样本均值记为z-,方差记为s2,所以z-
=2525+25x-+2525+25y-=25×170+25×16050=165,又因为∑25i=1(xi-x-)=∑25i=1xi-25x-=0,所以∑25i=12(xi-x-)(x--z-)=2(x--z-)∑25i=1(xi-x-)=0,同理可得∑25j=12(yj-
y-)(y--z-)=0,所以s2=150∑25i=1(xi-z-)2+∑25j=1(yj-z-)231=150∑25i=1(xi-x-+x--z-)2+∑25j=1(yj-y-+y--z-)2=150{25[
s2x+(x--z-)2]+25[s2y+(y--z-)2]}=150{25[16+(170-165)2]+25[20+(160-165)2]}=43.(3)两种方案总样本均值的差为167.2-165=2.2,所以用方案二总样本的均值作为总体均值的估计不合适,原因
是没有进行等比例的分层随机抽样,每个个体被抽到的可能性不同,因此代表性较差.