【文档说明】高中数学培优讲义练习(人教A版2019必修二)专题9.3 用样本估计总体(重难点题型精讲)(学生版).docx,共(15)页,1.169 MB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-6687adfe5ee0b172bb5c1fcf5ee382fd.html
以下为本文档部分文字说明:
专题9.3用样本估计总体(重难点题型精讲)1.频率分布直方图(1)频率分布表与频率分布直方图的意义为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此
能使我们清楚地知道数据分布在各个小组的个数.有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.(2)频率分布表与频率分布直方图的制作步骤与画频数分布直方图类似,我
们可以按以下步骤制作频率分布表、画频率分布直方图.第一步,求极差极差为一组数据中最大值与最小值的差.第二步,决定组距与组数第三步,将数据分组通常对组内数据取左闭右开区间,最后一组数据取闭区间.第四步,列频率分布表计
算各小组的频率,作出频率分布表.第五步,画频率分布直方图画图时,以横轴表示分组,纵轴(小长方形的高度)表示.2.其他几类常用统计图——条形图、折线图、扇形图条形图折线图扇形图特点一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条
轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.作用及选用情景能清楚地表示每个项目的具体数量,便于相互比较大小.能清
楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.可以形象地表示出各部分数据在全部数据中所占的比例情况.图例3.总体百分位数的估计(1)概念一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于
或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)求解步骤可以通过下面的步骤计算一组n个数据的第p百分位数:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第
(i+1)项数据的平均数.4.总体集中趋势的估计在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:名称概念平均数如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表
示,即=(x1+x2+…+xn).中位数将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.众数一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的
众数.5.总体离散程度的估计(1)方差和标准差假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的方差.有时为了计算方差的方便,我们还把方差写成的形式.我们对方差开平方,取它的算数平方根,称为这组数据的标准差.(2)总体(
样本)方差和总体标准差①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=.②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出现的频数为(i=1,2,,k),则总体方差为=.总体标准差:S=.(3)标准差与方差的统计意义①标准差刻画了数据
的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,
则标准差为0.反之,标准差为0的样本,其中的数据都相等.6.频率分布直方图中的统计参数(1)频率分布直方图中的“众数”根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一
般用中点近似代替.(2)频率分布直方图中的“中位数”根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.(3)频率分布直方图中的“平均数”平均
数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.【题型1频率分布直方图的相关计算问题】【方法点拨】由频率分布直方图进
行相关计算时,需掌握下列关系式:(1)小长方形的面积=组距×=频率;(2)各小长方形的面积之和等于1;(3)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.【例1】(2023春·天津滨海新·高三开学考试)随着若卡塔尔世界杯的举办,全民对足球的热
爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五
组:[40,45],得到如图所示的频率分布直方图,已知第一组与第二组共有32人,第三组中女性球迷有4人,则第三组中男性球迷人数为()A.16B.18C.20D.24【变式1-1】(2023春·天津和平·高三开学考试)某单位组织全体员工登录某网络培训平台进行学习并统计
积分,得到频率分布直方图如图所示,已知学习积分在[1,1.5)(单位:万分)的人数是60人,并且学习积分超过2万分的员工可获得“学习达人”称号,则该单位可以获得该称号的员工人数为()A.15B.16C.30D.32【变式1-
2】(2023·全国·高一专题练习)如图是一学校期末考试中某班物理成绩的频率分布直方图,数据的分组依次为[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100],若成绩不低于70分的人数比成绩低于70分的人数多4人,则该班的学生人数为()A.45
B.50C.55D.60【变式1-3】(2023春·天津·高三期末)为倡导“节能减排,低碳生活”的理念,某社区对家庭的人均月用电量情况进行了调查,通过抽样,获得了某社区100个家庭的人均月用电量(单位:千瓦时),将数据按照[40,60),
[60,80),[80,100),[100,120),[120,140),[140,160]分成6组,制成了如图所示的频率分布直方图.若该社区有3000个家庭,估计全社区人均月用电量低于80千瓦时的家庭数为()A.300B.450C.4
80D.600【题型2统计图的综合应用问题】【方法点拨】条形图可以直观地表示各个项目的具体数量,扇形图能够清晰地显示各个项目占总体的百分比,折线图可以清楚地看到数据变动趋势,解决统计类问题时常需将若干种统计
图结合,不能孤立分开.【例2】(2023春·四川成都·高三开学考试)某保险公司为客户定制了A,B,C,D,E共5个险种,并对5个险种参保客户进行抽样调查,得出如下的统计图:用该样本估计总体,以下四个说法错误的是().A.57周岁以上参保人数最少B.18~30周岁人群参保总费用最少C
.C险种更受参保人青睐D.31周岁以上的人群约占参保人群80%【变式2-1】(2023·全国·高一专题练习)世界人口变化情况的三幅统计图如图所示.下列结论中错误的是()A.从折线图能看出世界人口的总量随着
年份的增加而增加B.2050年亚洲人口比其他各洲人口的总和还要多C.1957年到2050年各洲中北美洲人口增长速度最慢D.2050年南美洲及大洋洲人口之和与欧洲人口基本持平【变式2-2】(2022·山西运城·统
考模拟预测)2021年,我国各地落实粮食生产责任和耕地保护制度,加大粮食生产扶持力度,支持复垦撂荒地,连续两年实现增长.我国2020年与2021年粮食产量种类分布及占比统计图如图所示,则下列说法不正确的是()
A.我国2020年的粮食总产量约为13390亿斤B.我国2021年豆类产量比2020年减产明显,下降了约14.2%C.我国2021年的各类粮食产量中,增长量最大的是玉米D.我国2021年的各类粮食产量中,同2020年相比
,所占比例下降的只有豆类【变式2-3】(2023·全国·高二专题练习)某保险公司推出了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.现对5个险种参保客户进行抽样调查,得出如下的统计图:用样本估计总体,以下四个选项错误
的是()A.30~41周岁参保人数最多B.随着年龄的增长,人均参保费用越来越多C.54周岁以下的参保人数约占总参保人数的8%D.定期寿险最受参保人青睐【题型3百分位数的求解】【方法点拨】根据计算一组数据的第p百分位数的步骤,结合具体问题,进行求解即可.【例3】(2023·山东临沂·
统考一模)某工厂随机抽取20名工人,对他们某天生产的产品件数进行统计,数据如下表,则该组数据的第75百分位数是()件数7891011人数37541A.8.5B.9C.9.5D.10【变式3-1】(2023·全国·高一专题练习)某校从高一新生中
随机抽取了一个容量为10的身高样本,数据(单位:cm)从小到大排序如下:158,165,165,167,168,169,x,172,173,175,若样本数据的第60百分位数是170,则x=()A.169B.170C.171D.172【变式3-2】(2023·全国·高一专题练
习)一组数据如下:10,11,12,13,14,15,16,17,18,19,20,则该组数据的第30百分位数是()A.12B.12.5C.13D.13.5【变式3-3】(2023·全国·高一专题练习)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超
重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按[40,45),[45,50),[50,55),[55,60),[60,65),[65,
70]分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是()A.55B.57.25C.58.75D.60【题型4众数、中位数、平均数的应用】【方法点拨】中位数、众数分别反映了一组数据的“中等水平”、“多数水平”,平均
数反映了数据的平均水平,我们需根据实际需要选择使用.【例4】(2023·全国·高一专题练习)某企业有1000名职工,现按照总体的10%抽取样本,通过分层抽样得到如下年收入表:年收入(元)50万15万8万4万3万1.2万人数16155520
3某次工资上调中,只提高了最低收入,即从年收入1.2万元提高到2万元,其他职工的收入不变,则下列关于本企业职工年收入的说法中正确的是()A.平均数和众数都提高了B.平均数和中位数都提高了C.平均数不变,中位数提高了D.中位数和众数不变,平均数提高了【变式4-1】(
2023·全国·高三专题练习)某篮球运动员练习罚篮,共20组,每组50次,每组命中球数如下表:命中球数4647484950频数24464则这组数据的中位数和众数分别为()A.48,4B.48.5,4C.48,49D.48.5,49【变式4-2】(2023·全国·高一专题练习)经团委统计,某校申请
“志愿服务之星”的10名同学在本学期的志愿服务时长(单位:小时)分别为26、25、23、24、29、25、32、25、24、23,记这一组数据的平均数为𝑎,上四分位数为𝑏,众数为𝑐,则()A.𝑐<𝑎<𝑏B.𝑏<𝑐<𝑎C.𝑐=𝑏<𝑎D.𝑐<𝑏<𝑎【变式4-3】(2023
·青海海东·统考一模)某电子厂质检员从𝐴、𝐵两条生产线上各随机抽取7件产品进行质检,测得该产品的某一质量指数如下:𝐴(1.46,1.50,1.41,1.42,1.43,1.48,1.52);𝐵(1.46,1.51,1.46,1.43,1.49,1.41,1.53)
.若该产品的这一质量指数在[1.43,1.49]内,则该产品质量为优等品,则()A.样本中𝐴生产线生产的优等品和𝐵生产线生产的优等品的数量相同B.样本中𝐴生产线生产的产品和𝐵生产线生产的产品的这一质量指数的平均值相同C.样本中𝐴生产线生产的产品和𝐵生产
线生产的产品的这一质量指数的极差相同D.样本中𝐴生产线生产的产品和𝐵生产线生产的产品的这一质量指数的中位数相同【题型5方差、标准差的求解及应用】【方法点拨】根据方差、标准差的概念和计算公式,进行求解即可
.【例5】(2023春·山西·高三阶段练习)现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为3,方差为5,乙组数据的平均数为5,方差为3.若将这两组数据混合成一组,则新的一组数据的方差为()A.3.5B.4C.4.5D.5【变式5-1】(
2022·高一单元测试)期末考试后,高二某班50名学生物理成绩的平均分为85,方差为8.2,则下列四个数中不可能是该班物理成绩的是()A.60B.78C.85D.100【变式5-2】(2023·全国·高一专
题练习)设有n个样本𝑥1,𝑥2,…,𝑥𝑛,其标准差是𝑠𝑥,另有n个样本𝑦1,𝑦2,…,𝑦𝑛,且𝑦𝑘=3𝑥𝑘+5(𝑘=1,2,⋯,𝑛),其标准差为𝑠𝑦,则下列关系中正确的是()A.𝑠𝑦=3𝑠𝑥+5B.𝑠�
�=3𝑠𝑥C.𝑠𝑦=√3𝑠𝑥D.𝑠𝑦=√3𝑠𝑥+5【变式5-3】(2023·内蒙古·校联考模拟预测)某校举行校园歌手大赛,5名参赛选手的得分分别是9,8.7,9.3,x,y.已知这5名参赛选手的得分的平均数为9,方差
为0.1,则|𝑥−𝑦|=()A.0.5B.0.6C.0.7D.0.8【题型6频率分布直方图中集中趋势参数的计算】【方法点拨】(1)平均数:用每个小矩形底边中点的横坐标与小矩形的面积(即该小组的频率)的乘积之和近似代替平均数.(2)中位数:根据中位数左边和右边的直方图的面积
相等列式求中位数.(3)众数:可以用最高小矩形底边中点的横坐标来近似代替众数.【例6】(2022秋·辽宁辽阳·高一期末)“天宫课堂”是为发挥中国空间站的综合效益,推出的首个太空科普教育品牌.”天宫课堂”是结合载人飞行任务,贯穿中国空间站建造和在轨
运营系列化推出的,将由中国航天员担任“太空教师”,以青少年为主要对象,采取天地协同互动方式开展.2022年10月12日15时40分,“天宫课堂”第三课在中国空间站开讲.学校针对这次直播课,举办了”天宫课堂”知识竞赛
,有100名学生代表参加了竞赛,竞赛后对这100名学生的成绩(满分100分)进行统计,将数据分为[60,70),[70,80),[80,90),[90,100]这4组,画出如图所示的频率分布直方图.(1)求频率分布直方图中m的值;(2)估计这100名学生竞赛成绩的平均数(同一组
中的数据用该组区间的中点值作为代表);(3)若该校准备对本次知识竞赛成绩较好的40%的学生进行嘉奖,试问被嘉奖的学生的分数不低于多少?【变式6-1】(2022秋·内蒙古赤峰·高二期末)某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书
站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80)后得
到如图所示的频率分布直方图.(1)求在这40名读书者中年龄分布在[40,70)的人数;(2)求这40名读书者的年龄的平均数和中位数(同一组中的数据用该组区间中点值为代表).【变式6-2】(2022秋·宁夏银川·高一期末)2021年根据移动通信协会监测,某校全体教师
通讯费用(单位:元)如图所示,数据分组依次为[20,40),[40,60),[60,80),[80,100].(1)估计该校教师话费的80%分位数和中位数;(2)估计该校教师通讯费用的众数和平均数.【变式6-3】(2022秋·云南楚雄·高二
阶段练习)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方
图如图:(1)求直方图中的𝑥的值(2)估计月平均用电量的众数和中位数,第80百分位数.(3)从月平均用电量在[220,240),[240,260),[260,280),[280,300]内的四组用户中,用分层抽样的方法抽取11户居民,求从月平均用电量在[
220,240)内的用户中应抽取多少户?