【文档说明】2024届高中数学一轮复习练习九 统计与成对数据的统计分析 Word版含解析.docx,共(11)页,651.894 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-8415ec2e523d60f009b2bd75b22571f7.html
以下为本文档部分文字说明:
练习九统计与成对数据的统计分析一、选择题(在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2023·张家口模拟)有7名同学参加百米竞赛,预赛成绩各不相同,取前3名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道7名同学成绩的()A.平均
数B.众数C.中位数D.方差2.某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件编号为001,002,…,699,700.从中抽取70个样本,如图为随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第
4个样本编号是()A.623B.457C.253D.0073.(2023·沈阳模拟)某学校组建了合唱、朗诵、脱口秀、舞蹈、太极拳五个社团,该校共有2000名同学,每名同学依据自己的兴趣爱好最多可参加其中一个,各个社团的人数比例的扇形图如图所示
,其中参加朗诵社团的同学有8名,参加太极拳社团的有12名,则()A.这五个社团的总人数为100B.脱口秀社团的人数占五个社团总人数的20%C.这五个社团总人数占该校学生人数的8%D.从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为50%4.某校高三年级在某次数学测验中成绩不低于8
0分的所有考生的成绩统计表如下:成绩[80,90](90,100](100,110](110,120](120,130](130,140](140,150]频数304015121252则以上考生成绩的
中位数()A.在(90,100]内B.在(100,110]内C.在(110,120]内D.在(120,130]内5.为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x与y之间有线
性关系,设其经验回归方程为y^=b^x+a^,已知i=120xi=400,i=120yi=1580,a^=-1,若该班某学生的听力成绩为26分,据此估计其笔试成绩约为()A.99分B.101分C.103分D.105分6.(2023·株州模拟)已知一组数据2x1-3,2x2-3,2x
3-3,2x4-3,2x5-3的平均数是1,那么另一组数据x1,x2,x3,x4,x5的平均数为()A.4B.3C.2D.17.(2022·武汉模拟)2021年7月至2022年7月,我国居民消费价格保
持平稳,居民消费价格涨跌幅如图所示,则()注:同比增长率=当月消费价格-去年同期消费价格去年同期消费价格×100%,环比增长率=当月消费价格-上月同期消费价格上月同期消费价格×100%.A.2022年1月全国居民消费价
格比2021年1月全国居民消费价格有所下降B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%D.2021年10月至2022年7
月全国居民消费价格环比增长率的平均数为0.25%8.某地不同身高的未成年男性体重的平均值如下表:身高(cm)60708090100110120130140150160170平均体重(kg)6.137.91012.21517.520.926.931.138.64
7.355.1表格中的数据形成如图所示的散点图.则在以下函数模型中,描述这个地区未成年男性平均体重y(单位:kg)与身高x(单位:cm)的函数关系最合适的是()A.y=0.5x-25B.y=2(1.02)xC.y=10lgx-5D.y=0.01x2-0.
5x二、选择题(在每小题给出的选项中,有多项符合题目要求)9.甲、乙两人进行飞镖游戏,甲的10次成绩分别为8,6,7,7,8,10,10,9,7,8,乙的10次成绩的平均数为8,方差为0.4,则()A.甲的10次成绩的极差为4B.甲的10
次成绩的75%分位数为8C.甲和乙的20次成绩的平均数为8D.甲和乙的20次成绩的方差为110.(2023·郴州模拟)教育部办公厅“关于进一步加强中小学生体质健康管理工作的通知”中指出,各地要加强对学生体
质健康重要性的宣传,中小学校要通过体育与健康课程、大课间、课外体育锻炼、体育竞赛、班级团队活动,家校协同联动等多种形式加强教育引导,让家长和中小学生科学认识体质健康的影响因素,了解运动在增强体质、促进健康、预防肥胖与近视、锤炼意志、健全人格等方面的重要作用,提高学生体育与健康素养,
增强体质健康管理的意识和能力.某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生的体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则()A.样本的众数为67.5B.样本的80%分位数为72.5C.样本的平均数为66D.该校男生体重中低于60kg的学生大约为
300人11.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其经验回归方程为y^
=1.16x-30.75,以下结论中正确的为()A.15名志愿者身高的极差小于臂展的极差B.15名志愿者身高和臂展成正相关关系C.身高相差10厘米的两人臂展都相差11.6厘米D.可估计身高为190厘米的人臂展大约为189.65厘米12.某市为了研究该市空气中的PM2.5浓
度和SO2浓度之间的关系,环境监测部门对该市空气质量进行调研,随机抽查了100天空气中的PM2.5浓度和SO2浓度(单位:μg/m3),得到如下所示的2×2列联表:SO2浓度PM2.5浓度[0,150]
(150,475][0,75]6416(75,115]1010经计算χ2=100×(64×10-16×10)280×20×74×26≈7.4844,则可以推断出()附:χ2=n(ad-bc)2(a+b)(c
+d)(a+c)(b+d),n=a+b+c+d.临界值表:α0.0500.0100.001xα3.8416.63510.828A.该市一天空气中PM2.5浓度不超过75μg/m3,且SO2浓度不超过150μg/m3的概率估计值是0.64B.若2×2列联表中的天数都扩大到原来的10倍,χ2
的观测值不会发生变化C.依据小概率值α=0.01独立性检验可以认为该市一天空气中PM2.5浓度与SO2浓度有关D.依据小概率值α=0.01独立性检验可以认为该市一天空气中PM2.5浓度与SO2浓度无关三、填空题(本题共4小题)13.某校有选修物化、物生、
政史三种不同类别课程的学生共900人(假设每人只选修一种类别的课程),按照比例分配的分层随机抽样方法从中抽取20人参加数学调研检测.已知在这次检测中20人的数学平均成绩为119分,其中选修物化和物生类别课程学生的数学平均成绩为120分,选修政史类别课程学生的数学平均成绩为115分,则该校选修政史
类别课程的学生人数为________.14.已知我国某省二、三、四线城市数量之比为1∶3∶6,2022年3月份调查得知该省二、三、四线城市房产均价为0.8万元/平方米,方差为11.其中三、四线城市房产均价分别为1万元/平方米,0.5
万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房产均价为________万元/平方米,二线城市房价的方差为________.15.根据下列数据:x99.51010.511y1110865求得y关于x的经验回归方程为y^=-3.2x+a^.则
这组数据相对于所求的经验回归方程的5个残差的方差为________.(注:残差是观测值减去预测值)16.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=lny,其变换后得到经验回归方程为z^=0.3x+4.则c=_______
_.四、解答题(本题共6小题)17.从甲、乙两名学生中选拔一人参加射击比赛,现对他们的射击水平进行测试,两人在相同条件下各射靶10次,每次命中的环数如下:甲:7,8,6,8,6,5,9,10,7,4;乙:9,5,7,8,7,6,8,6,7,7.(1)求x
甲,x乙,s2甲,s2乙;(2)你认为应该选哪名学生参加比赛?为什么?18.某校100名学生期中考试化学成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)请根据频率分布
直方图,估计这100名学生化学成绩的平均数(同一组中的数据用该组区间中点值代替)及中位数.19.某工厂对200个电子元件的使用寿命进行检查,按照使用寿命(单位:h),可以把这批电子元件分成第一组[100,200),第二组[200
,300),第三组[300,400),第四组[400,500),第五组[500,600),第六组[600,700].由于工作中不慎将部分数据丢失,现有以下部分图表:图1图2使用寿命[100,200)[200,300)[300,400)[400,
500)[500,600)[600,700]频数3020频率0.20.4(1)求图2中A的值;(2)补全表格和图2中的频率分布直方图,并求图2中阴影部分的面积;(3)为了某次展销会,用比例分配的分层随机抽样方法在使用寿命位
于[400,600)内的产品中抽取5个作为样本,那么在[400,500)内应抽取多少个?20.某学校为了调查学生运动情况,抽取了100名学生调查学生是否喜欢体育锻炼,调查结果统计如表:喜欢不喜欢合计男生10女生20合计100已知在全部100人中随机抽取1人,抽到不喜欢体育锻炼的人的
概率为0.4.(1)请将上面的列联表补充完整;(2)依据小概率值α=0.001的独立性检验,分析喜欢体育锻炼是否与性别有关?说明你的理由.附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a
+b+c+d.临界值表:α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.82821.(2023·南京模拟)某网络电视剧已开播一段时间,其每日播放量如下表:开播天数x(单位:天
)12345当天播放量y(单位:百万次)335910(1)请用一元线性回归模型拟合y与x的关系,并用样本相关系数加以说明;(2)假设开播后的两周内(除前5天),当天播放量y与开播天数x服从(1)中的线性关系.若每百万次播放量可为制作方带来0.7万元的收益,且每开播一天需支出1万元
的广告费,估计制作方在该剧开播两周内获得的利润.注:①一般地,样本相关系数r的绝对值在0.95以上(含0.95)认为线性相关性较强,否则,线性相关性较弱.②利润=收益-广告费.参考公式:r=i=1n(xi-x)(yi-y)i=1n(xi-x)2i=1n(yi-y)2,b
^=i=1n(xi-x)(yi-y)i=1n(xi-x)2,a^=y-b^x.参考数据:110≈10.5.22.噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了解声音强度D(单位:dB)与声音能量I(单位:W·cm-2)之间的关系,将测量得到的声音强度D和声音能量I的数据
作了初步处理,得到如图所示的散点图.(1)根据散点图判断D=a1+b1I与D=a2+b2lgI哪一个适合作为声音强度D关于声音能量I的回归模型(给出判断即可,不必说明理由);(2)求声音强度D关于声音
能量I的非线性经验回归方程;(3)假定当声音强度大于60dB时,会产生噪声污染.城市中某点P处共受到两个声源的影响,这两个声源的声音能量分别是Ia和Ib,且1Ia+4Ib=1010.已知点P处的声音能量等于Ia与Ib之和.请根据(2)中的非线性经验回归方程
,判断点P处是否受到噪声污染,并说明理由.参考数据:D=45.7,W=-11.5,i=110(Wi-W)2=0.51,i=110(Wi-W)·(Di-D)=5.1,其中Wi=lgIi,W=110i=110Wi.参考答案1.答案C解析由题设知,
7名同学参加百米竞赛,要取前3名参加决赛,则成绩从高到低排列,确定7名同学成绩的中位数,即第4名的成绩便可判断他自己是否能进入决赛.2.答案D解析从表中第5行第6列开始向右读取数据,依次为253,313,4
57,860(舍去),736(舍去),253(舍去),007,故得到的第4个样本编号是007.3.答案B解析这五个社团的总人数为810%=80,占该校学生人数的802000=4%,A错误,C错误;因为太极拳社团人数的占比为1280×100%=15%,所以脱口秀社团人数的占比为1-1
0%-15%-30%-25%=20%,B正确;从这五个社团中任选一人,其来自脱口秀社团或舞蹈社团的概率为25%+20%=45%,D错误.4.答案A解析由统计表知,成绩不低于80分的考生共有30+40+15+12+12+5+2=116(人),在[80,90]内有30人,在(90,100]内
有40人,所以不低于80分的所有考生成绩的中位数在(90,100]内.5.答案C解析i=120xi=400,故x=40020=20;i=120yi=1580,故y=158020=79,故点(20,79)在经验回归直线上,即79=20b^-1,解得b^=4,即经验回归方程为
y^=4x-1,当x=26时,代入计算得到y^=103.6.答案C解析因为一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数是1,所以15(2x1-3+2x2-3+2x3-3+2x4-3+2x5-3)=1
,即25(x1+x2+x3+x4+x5)-3=1,所以15(x1+x2+x3+x4+x5)=2,即一组数据x1,x2,x3,x4,x5的平均数为2.7.答案D解析对于A,从图中可以看出2022年1月全国居民消费价格的同比增长率为0.9%>0,所以2022年1月全国居民消费价格比2
021年1月有所上升,故A错误;对于B,由题图知2022年5月全国居民消费价格环比增长率为-0.2%<0,所以2022年5月全国居民消费价格比2022年4月有所下降,故B错误;对于C,将C选项中的数据由小
到大排列得,0.7%,0.8%,0.9%,0.9%,1%,1.5%,1.5%,1.5%,2.1%,2.1%,2.3%,2.5%,2.7%,因为13×40%=5.2,则同比增长率的40%分位数为第6个数1.5%,故C错误;对于D,所求环比增长率的平均数为1
10×(0.7%+0.4%-0.3%+0.4%+0.6%+0.4%-0.2%+0.5%)=0.25%,故D正确.8.答案B解析根据所给散点图,结合一次函数、对数函数的图象可知,选项A,C不合适;取x=100时,
由y=0.01x2-0.5x可得y=50,当x=170时,由y=0.01x2-0.5x可得y=204,与实际值差距很大,故选项D不合适.9.答案ACD解析甲的10次成绩中,最大值为10,最小值为6,极差等于4,故A正确;因为10×75%=7.5,所以将甲的10次成绩从小到大排列后,
第8个数为75%分位数,即75%分位数等于9,故B不正确;经计算,甲的10次成绩的平均数等于8,又已知乙的10次成绩的平均数等于8,则甲和乙的20次成绩的平均数为8,故C正确;s2甲=110×[(6-8)
2+3×(7-8)2+(9-8)2+2×(10-8)2]=1.6,s2=10×1.6+10×0.410+10=1,故D正确.(方差也可以用s2=1ni=1n(xi-x)2=1ni=1n(x2i-nx2)=1ni=1nx2i-x
2进行求解,即s2甲=110i=110x2i-x2=110i=110x2i-64=1.6,s2乙=110i=1120x2i-x2=110i=1120x2i-64=0.4,所以110i=120x2i-128=2,即120i=120x2i-64=1,故D正确)10.答案ABD解析对于A
,样本的众数为65+702=67.5,故A正确;对于B,由频率分布直方图可知样本的80%分位数为70+0.10.2×5=72.5,故B正确;对于C,由频率分布直方图估计样本的平均数为57.5×0.15+62.5×0.2
5+67.5×0.3+72.5×0.2+77.5×0.1=66.75,故C错误;对于D,2000名男生中体重低于60kg的人数大约为2000×5×0.03=300,故D正确.11.答案ABD解析对于A,身高的极差大约为21,臂展的极差大约为26,
故结论A正确;对于B,根据散点图以及经验回归直线得到,身高矮一些,臂展就会短一些,身高高一些,臂展就长一些,故结论B正确;对于C,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,经验回归直线上的点并不都是准确的样本点,故结论C不正确;对于D,身高为190厘米,代入经验回归
方程可得到臂展估计值等于189.65厘米,故结论D正确.12.答案AC解析对于A选项,该市一天空气中PM2.5浓度不超过75μg/m3,且SO2浓度不超过150μg/m3的概率估计值为64100=0.64,故A正确;对于B选项,χ2
=1000×(640×100-160×100)2800×200×740×260≈74.844≠7.4844,故B不正确;因为7.4844>6.635=x0.01,所以依据小概率值α=0.01的独立性检验可以认为该市
一天空气中PM2.5浓度与SO2浓度有关,故C正确,D错误.13.答案180解析设这20人中选修政史类别课程的学生人数为x,则115x+120×(20-x)=20×119,解得x=4,由比例分配的分层随机抽样可知,该校选修政史类别课程的
学生人数为420×900=180.14.答案229.9解析设二线城市房产均价为x万元/平方米,方差为y,因为二、三、四线城市数量之比为1∶3∶6,二、三、四线城市房产均价为0.8万元/平方米,三、四线城市的房产均价分别为1万元/平方米,0.5万元
/平方米,所以110x+310×1+610×0.5=0.8,解得x=2,由题意可得11=110×[y+(2-0.8)2]+310×[10+(1-0.8)2]+610×[8+(0.5-0.8)2],解得y=29.9.15.答案0.08解析根据数据,可得x=10,y=8,代入y^=-3.2x+a^,可
得a^=40,即y^=-3.2x+40,经计算得这组数据的残差为-0.2,0.4,0,-0.4,0.2,因此残差的方差为15×(0.22+0.42+0+0.42+0.22)=0.08.16.答案e4解析对y=cekx两边取对数得,lny=ln
(cekx)=kx+lnc,所以k^=0.3,lnc=4⇒c=e4.17.解(1)由数据得,x甲=7+8+6+8+6+5+9+10+7+410=7,x乙=9+5+7+8+7+6+8+6+7+710=7,s2甲=110×[(7-7)2×2+(8-7
)2×2+(6-7)2×2+(5-7)2+(9-7)2+(4-7)2+(10-7)2]=3,s2乙=110×[(9-7)2+(5-7)2+(7-7)2×4+(8-7)2×2+(6-7)2×2]=1.2.(2)由(1)可知,甲、乙两人的平均成绩一样,乙的方差小于甲的方
差,说明乙的成绩更稳定,应该选乙参加比赛.18.解(1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.(2)估计这100名学生化学成绩的平均数为55×0.005×10+65×0.04×
10+75×0.03×10+85×0.02×10+95×0.005×10=73,设中位数为x,则0.005×10+0.04×10+0.03×(x-70)=0.5,解得x≈71.67,故估计中位数为71.
67.19.解(1)由题意可知0.1=A×100,所以A=0.001.(2)补全表格.使用寿命[100,200)[200,300)[300,400)[400,500)[500,600)[600,700]频数203040802010频率0.10.15
0.20.40.10.05补全后的频率分布直方图如图所示,阴影部分的面积为0.004×100+0.001×100=0.5.(3)由比例分配的分层随机抽样的性质知,在[400,500)内应抽取5×0.40.4+0.1=4(个).20.解(1)根据在
全部100人中随机抽取1人,抽到不喜欢体育锻炼的人的概率为0.4,可得不喜欢体育锻炼的有40人,故可将列联表补充如下.喜欢不喜欢合计男生401050女生203050合计6040100(2)零假设为H0:喜欢体育锻炼与性别无关.因为χ2=100×(40×30-10×20)250×50
×60×40≈16.667>10.828=x0.001,所以根据小概率值α=0.001的独立性检验,推断H0不成立,即认为喜欢体育锻炼与性别有关.21.解(1)由题得x=15×(1+2+3+4+5)=3,y=15×(
3+3+5+9+10)=6.所以b^=i=15(xi-x)(yi-y)i=15(xi-x)2=6+3+3+8(1-3)2+(2-3)2+(4-3)2+(5-3)2=2.所以a^=y-b^x=6-2×3=0.所以经验回归方程为y^=2x.样本相关系数r=2010×44=10110≈0.9
52>0.95,所以每日的播放量和开播天数线性相关性较强.(2)设利润为p,则p=[30+2×(6+7+8+9+10+11+12+13+14)]×0.7-14=133(万元),所以估计制作方在该剧开播两周内获得的利润
为133万元.22.解(1)D=a2+b2lgI更适合.(2)设D^=b^W+a^,则b^=i=110(Wi-W)(Di-D)i=110(Wi-W)2=5.10.51=10,∴a^=D-b^W=160.7,∴D关于W的经验回归方程是D^=10W+160.7,则D关于I的非线性经验回归方程是D^
=10lgI+160.7.(3)设点P处的声音能量为I1,则I1=Ia+Ib.∵1Ia+4Ib=1010,∴I1=Ia+Ib=10-101Ia+4Ib(Ia+Ib)=10-105+IbIa+4IaIb≥9×10-10当且仅当Ia=31010,Ib=35×109时等号成立
,根据(2)中非线性经验回归方程,知点P处的声音强度D的预测值的最小值D^min=10lg(9×10-10)+160.7=10lg9+60.7>60,∴点P处会受到噪声污染.