【文档说明】2024年新高考数学一轮复习题型归纳与达标检测 第63讲 变量间的相关关系、统计案例(达标检测) Word版含解析.docx,共(18)页,225.957 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-eef28695f8f113ec947fa37e566d90d6.html
以下为本文档部分文字说明:
《变量间的相关关系、统计案例》达标检测[A组]—应知应会1.(2020春•河南月考)已知呈线性相关的变量x与y的部分数据如表所示()x24568y34.5m7.59若其回归直线方程是y=1.05x+0.85,则m=()A.5.5B.6C.6.5D.7【分析】由已知求得样本点的中心的坐标,代入
线性回归方程即可求得m值.【解答】解:由题意可得,,则样本点的中心为(5,),则,解得m=6.5.故选:C.2.(2020•新课标Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(
xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx【分析】直
接由散点图结合给出的选项得答案.【解答】解:由散点图可知,在10℃至40℃之间,发芽率y和温度x所对应的点(x,y)在一段对数函数的曲线附近,结合选项可知,y=a+blnx可作为发芽率y和温度x的回归方程类型.故选:D.3.(2020春
•龙凤区校级期中)一组数据如表所示:x1234yee3e4e6已知变量y关于x的回归方程为,若x=5,则预测y的值可能为()A.e5B.C.D.e7【分析】令z=ln,求得x,z间的数据对照表,结合样本点的中心满足线性回归方程求得b,再令x=5即可预测y的值.【解答】解:由,得ln=bx+0.5,
令z=ln,得z=bx+0.5.根据已知表格中的数据,得到x,z的取值对应如下:x1234z1346由上述表格可知:,.则3.5=2.5b+0.5,即b=1.2.∴z=1.2x+0.5.进而得到,将x=5代入,可得y=.故选:C.4.(2020春•
安徽期末)某车间加工零件的数量x与加工时间y的统计数据如表.现已求得如表数据的回归方程中的值为0.9,则据此回归模型可以预测,加工80个零件所需要的加工时间约为()零件数x(个)102030加工时间y(分钟)213039A.84分钟B.94分钟C.102分钟
D.112分钟【分析】求出样本数据的中心坐标,代入回归直线方程,求出,得到回归直线方程,然后求解加工80个零件所需要的加工时间.【解答】解:由题意得:=(10+20+30)=20,=(21+30+39)=30,故=﹣=
30﹣0.9×20=12,故=0.9x+12,x=80时:=84,故选:A.5.(2020春•越秀区期末)设某大学的女生身高y(单位:cm)与体重x(单位:kg)之间具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回
归直线经过样本点的中心(,)C.若该大学某女生体重为50kg,则其身高必为160cmD.若该大学某女生体重每增加1kg,则其身高平均增加1.18cm【分析】结合回归直线方程,判断线性关系判断A;回归直线的性质判断B;回归方程只能进行预测,但不
可断定,判断C的正误;回归直线的估计值,判断D;【解答】解:设某大学的女生身高y(单位:cm)与体重x(单位:kg)之间具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归方程为,y与x具有正的线性相关关系,所以A正确;回归直线经过样本点的中心(,),所以B正确;若该大学某女
生体重为50kg,则其身高约为160cm,不是一定,所以C不正确;若该大学某女生体重每增加1kg,则其身高平均增加1.18cm,满足回归直线的性质,所以D正确;故选:C.6.(2020•河南模拟)某生物研究所在新冠病毒(COVID﹣19)疫苗的研制过程
中,为验证疫苗的治疗效果,进行了动物的对比试验,现对200只小白鼠进行试验,得到如表数据:未发病发病合计未接种疫苗206080接种疫苗8040120合计100100200附:.P(K2≥k0)0.050.0
10.0050.001k03.8416.6357.87910.828则下列说法正确的是()A.至少有99.9%的把握认为“发病与没接种疫苗有关“B.至多有99%的把握认为“发病与没接种疫苗有关”C.至多有99.9%的把握认为“发病与没接种疫苗有关”D.“发
病与没接种疫苗有关”的错误率至少有0.01%【分析】根据所给表格的数据,计算观测值,对照附表得出结论.【解答】解:根据所给表格的数据,结合K2计算公式,可得其观测值为,所以至少有99.9%的把握认为“发病与没接种疫苗有关”.故选:A.7.(2020•衡水
模拟)某公司某型号无人机以其小巧轻便、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如表所示.年份20152016201720182019年份代码x01234年销量y/万件1015203035根据表中的数据用最小二乘法求得y关于x的线性回归
方程为,则可以预测2020年该型号无人机的销量大约为()A.40万件B.41.5万件C.45万件D.48万件【分析】求出样本中心坐标,代入回归直线方程,求出t,然后预测2020年该型号无人机的销量.【解答】解:=,.又因为直线过点(2,22),故6.5×2+t=22,解得t=
9.故预测2020年该型号无人机的销量大约为(万件),故选:B.8.(2020春•兴庆区校级期末)“十一”期间,邢台市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到了如表列联表,下列结论正确的是()做不到“光盘”行动能做到“光盘”运动男4510
女3015k2=A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’行动与性别无关”C.有90%以上的把
握认为“该市居民能否做到‘光盘’行动与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’行动与性别无关”【分析】根据题目所给的数据填写2×2列联表,计算K的观测值K2,对照题目中的表格,得出统计结论
.【解答】解:根据题目所给数据得到如下2×2的列联表:根据题目所给数据得到如下2×2的列联表:做不到“光盘”行动能做到“光盘”运动总计男451055女301545总计7525100所以K2=≈3.30>2.706,所以有90%以上的把握认为“该市居民能否做到‘光盘
’行动与性别有关”,故选:C.9.(多选)(2020•滨州三模)2020年3月12日,国务院新闻办公室发布会重点介绍了改革开放40年,特别是党的十八大以来我国脱贫攻坚、精准扶贫取得的显著成绩,这些成绩为全面脱贫初步建成小康社会奠定了坚实的基础
.如图是统计局公布的2010年~2019年年底的贫困人口和贫困发生率统计表.则下面结论正确的是()【年底贫困人口的线性回归方程为(其中x=年份﹣2009),贫困发生率的线性回归方程为(其中x=年份﹣2009)】A.2010年~2019年十年间脱贫人口逐年减少,贫困发生率逐年下降B.2012
年~2019年连续八年每年减贫超过1000万,且2019年贫困发生率最低C.2010年~2019年十年间超过1.65亿人脱贫,其中2015年贫困发生率低于6%D.根据图中趋势线可以预测,到2020年底我国将实现全
面脱贫【分析】根据统计表计算出每年脱贫的人口,由此判断出正确选项.【解答】解:每年脱贫的人口如下表所示:期初期末脱贫人口2009年底至2010年底165662010年底至2011年底165661223843282011年底至2012年
底12238989923392012年底至2013年底9899824916502013年底至2014年底8249701712322014年底至2015年底7017557514422015年底至2016年底5575433512402016年底至2017年底4335304612892017年底至2
018年底3046166013862018年底至2019年底16605511109由于缺少2009年年底数据,故无法统计十年间脱贫人口的数据,故A,C选项错误.根据上表可知:2012年2019年连续八年每年减贫超过1000万,且
2019年贫困发生率最低,故B选项正确.根据上表可知,2012年2019年连续八年每年减贫超过1000万,2019年年底,贫困人口551万,故预计到2020年底我国将实现全面脱贫,故D选项正确.综上所述,正确的选项为BD.故选:BD.10.(多选)(2020春•济南期末)在
一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,如表所示:晕机不晕机合计男n1115n1+女6n22n2+合计n+12846则下列说法正确的是()附:参考公式:,其中n=a+b+c+d.独立性检验临界值表:
P(K2≥k0)0.100.050.0250.010k02.7063.8415.0246.635A.>B.K2<2.706C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女性别有关D.没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关【分析】由列联表中数据计算n22、n2+、n
1+和n11、n+1,填表后分析选项中的说法是否正确.【解答】解:由列联表中数据,得n22=28﹣15=13,n2+=1+13=19,n1+=46﹣19=27,n11=27﹣15=12,n+1=12+
6=18;填表如下:晕机不晕机合计男121527女61319合计182846所以=,==,>,所以A正确;计算K2=≈0.7750<2.706,所以B正确;对照附表知,没有90%的把握认为,在恶劣气候飞行中,晕机与否跟男女
性别有关,所以C错误;由独立性检验原理知,没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关,所以D正确.故选:ABD.11.(2020春•滨海县校级期末)某公司统计了第x年(2013年是第一年)的经济效益为y(千万元),得到如表表格:x3456y2.5344.5若由表
中数据得到的线性回归方程是,则可预测2020年经济效益大约是千万元.【分析】求出样本中心坐标,代入回归直线方程,求出m,然后代入x=8,即可推出结果.【解答】解:由表格中的数据求得,.所以样本点的中心坐标为(4.5,3.5),代入,得3.5=4.5m+0.35,解得m=0
.7.∴线性回归方程为,取x=8,得.故答案为:5.95.12.(2020春•合肥期末)已知x与y之间的一组数据如表,已求得关于y与x的线性回归方程=1.2x+a,则a的值为.x0246y2357【分析】求出样本中心坐标,代入回归直线方程求解即可.【解答】解:由
题意可知=(0+2+4+6)=3,=(2+3+5+7)=,因为回归直线结果样本中心,所以:,解得a=0.65.故答案为:0.65.13.(2020春•吉林月考)为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y
2),(x3,y3),(x4,y4),(x5,y5),根据收集到的数据可知,由最小二乘法求得回归直线方程为,则x1+x2+x3+x4+x5=.【分析】回归直线经过样本点的中心,将=60代入回归方程解得=20,进而得出答案.【解答】解:将=60代入回归方程得,60=0.6+48,解得=20,所
以x1+x2+x3+x4+x5=5=100.故答案为:100.14.(2020春•吉林期末)某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表“性别与会外语”的2×2列联表中
,a+b+d=.会外语不会外语总计男ab20女6d总计1850【分析】由列联表求出a、b、d的值,再求和.【解答】解:由题意填写列联表如下,会外语不会外语总计男12820女62430总计183250所以a=12,b=8,d=24,a+b
+d=12+8+24=44.故答案为:44.15.(2020•吉林模拟)2019年末至2020年初,某在线教育公司为了适应线上教学的快速发展,近5个月加大了对该公司的网上教学使用软件的研发投入,过去5个月资金投入量x(单位:百万元)和收益y(单
位:百万元)的数据如下表:月份2019年11月2019年12月2020年1月2020年2月2020年3月资金投入量/百万元2481012收益/百万元14.2120.3131.1837.8344.67若y与x的线性回归方
程为=3x+a,则资金投入量为16百万元时,该月收益的预报值为百万元.【分析】求出样本中心,代入回归直线方程,求出a,代入x=16,得到预报值即可.【解答】解:由题意得,==7.2,=29.64,所以a=﹣=29.64﹣3×7.2=8.04.所以y关于x的回归方程为=3x+8.04.把x=1
6代入回归方程得=3×16+8.04=56.04,故预报值为56.04百万元.故答案为:56.04.16.(2020春•九江期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,
若有95%的把握认为中学生追星与性别有关,则男生至少有人.参考数据及公式如下:P(K2≥k0)0.0500.0100.001k03.8416.63510.828K2=,n=a+b+c+d.【分析】设男生人数为x,由题意得列联表,计算K2,对照临界值列出不等
式,求出x的取值范围.【解答】解:设男生人数为x,由题意得列联表如下;喜欢追星不喜欢追星合计男生xxx女生xxx合计xxx计算K2==x>3.841,解得x>;又x=6k,k∈N*,所以xmin=30,即有95%的把握
认为中学生追星与性别有关时,男生至少有30人.故答案为:30.17.(2020•新课标Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从
这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1200,(xi﹣)2=80,(yi﹣)2=9000,
(xi﹣)(yi﹣)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01
);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.【分析】(1)由已知数据求得20个样区野生动物数量的平均数,乘以200
得答案;(2)由已知直接利用相关系数公式求解;(3)由各地块间植物覆盖面积差异很大可知更合理的抽样方法是分层抽样.【解答】解:(1)由已知,,∴20个样区野生动物数量的平均数为=60,∴该地区这种野生动物数量的估计值为60×200=12000;(2)∵,
,,∴r==;(3)更合理的抽样方法是分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数
量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.18.(2020•海南)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和S
O2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2
浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.
5浓度与SO2浓度有关?附:K2=P(K2≥k)0.0500.0100.001k3.8416.63510.828【分析】(1)用频率估计概率,从而得到“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据题目所给的数据
填写2×2列联表即可;(3)计算K的观测值K2,对照题目中的表格,得出统计结论.【解答】解:(1)用频率估计概率,从而得到“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率P==0.64;(2)根据所给数据,可得下面的2×2列联表:S
O2PM2.5[0,150](150,475][0,75]6416(75,115]1010(3)根据(2)中的列联表,由==7.484>6.635,P(K2≥6.635)=0.01;故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关,19.(2020•新课标Ⅲ)某学生兴趣小组
随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估
计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好
”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:K2=P(K2≥k)0.0500.0100.001k3.84
16.63510.828【分析】(1)用频率估计概率,从而得到估计该市一天的空气质量等级为1,2,3,4的概率;(2)采用频率分布直方图估计样本平均值的方法可得得答案;(3)由公式计算k的值,从而查表即可,【解答】解:(1)该市一天的空气质量等级为1的概率
为:=;该市一天的空气质量等级为2的概率为:=;该市一天的空气质量等级为3的概率为:=;该市一天的空气质量等级为4的概率为:=;(2)由题意可得:一天中到该公园锻炼的平均人次的估计值为:=100×0.
20+300×0.35+500×0.45=350;(3)根据所给数据,可得下面的2×2列联表,人次≤400人次>400总计空气质量好333770空气质量不好22830总计5545100由表中数据可得:K2==≈5.820>3.841,所以有95%的把握认为一天中到该公园锻炼的人次与该市
当天的空气质量有关.[B组]—强基必备1.(2020•沈阳三模)已知x与y之间的几组数据如表:x1234y1mn4如表数据中y的平均值为2.5,若某同学对m赋了三个值分别为1.5,2,2.5,得到三条线性回归直线方程分别为y=b1x+a1,y=b2x+a2,y=b3x+a3,
对应的相关系数分别为r1,r2,r3,下列结论中错误的是()参考公式:线性回归方程y=中,其中,.相关系数r=.A.三条回归直线有共同交点B.相关系数中,r2最大C.b1>b2D.a1>a2【分析】由题意可得m+n=5,分别取m与n的值,得到b1,a1,b2,a2,r
1,r2,r3的值,逐一分析四个选项得答案.【解答】解:由题意,1+m+n+4=10,即m+n=5.若m=1.5,则n=3.5,此时,.=(1﹣2.5)(1﹣2.5)+(2﹣2.5)(1.5﹣2.5)+(3﹣2.5)(3.
5﹣2.5)+(4﹣2.5)(4﹣2.5)=5.5,=(﹣1.5)2+(﹣0.5)2+0.52+1.52=5,=(﹣1.5)2+(﹣1)2+12+1.52=6.5.则,a1=2.5﹣1.1×2.5=﹣0.25,;若m=2,则n=3,此时,.=(1﹣2.5)(
1﹣2.5)+(2﹣2.5)(2﹣2.5)+(3﹣2.5)(3﹣2.5)+(4﹣2.5)(4﹣2.5)=5,=5,=(﹣1.5)2+(﹣0.5)2+0.52+1.52=5.,a2=2.5﹣1×2.5=0,;若m=2.5,则n=2.5,此时,.=(1﹣2.5)(1﹣2.5)
+(2﹣2.5)(2.5﹣2.5)+(3﹣2.5)(2.5﹣2.5)+(4﹣2.5)(4﹣2.5)=4.5,=5,=(﹣1.5)2+1.52=4.5,.由样本点的中心相同,故A正确;由以上计算可得,相关系数中,r2最大,b1>b2,a1
<a2,故B,C正确,D错误.故选:D.2.(2020春•日照期末)某种疾病可分为Ⅰ、Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为z,女性人数为2z,男性患Ⅰ型病的人数占男性病人的,女性患Ⅰ型病的人数占女性病人的.Ⅰ型病Ⅱ型
病合计男女合计(1)完成2×2联表若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人
每次接种花费m(m>0)元.甲团队研发的药物每次接种后产生抗体的概率为p,根据以往试验统计,甲团队平均花费为﹣2mp2+6m;乙团队研发的药物每次接种后产生抗体的概率为q,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团
队每次接种后产生抗体与否均相互独立.若p=2q,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:K2=P(K2≥k0)0.100.050.010.0050.001k02.7063.8
416.6357.87910.828【分析】(1)根据题意填写列联表,计算K2>7.879,从而求出z的值;(2)计算甲研发试验品花费的数学期望E(X),乙研发试验品花费的数学期望E(Y),计算E(Y)﹣E(X),讨论q的取值范围,求出E(X)与E(Y)的大小.【解答】解
:(1)根据题意填写列联表如下;Ⅰ型病Ⅱ型病合计男z女2z合计3z若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,则K2==>7.879,解得z>11.8185,由∈N*,且∈N*
,所以z的最小值为12,即男性患者至少有12人;(2)设甲研发试验品花费为X,则E(X)=﹣2mp2+6m;设乙研发试验品花费为Y,则Y的可能取值为3m、6m,所以P(Y=3m)=•q2(1﹣q)+q3=﹣2q3+3q2,P(Y=6m)=1+2q3﹣3q2,所以E(Y)
=3m•(﹣2q3+3q2)+6m•(1+2q3﹣3q2)=6mq3﹣9mq2+6m;因为p=2q,所以E(Y)﹣E(X)=6mq3﹣9mq2+6m+2mp2﹣6m=6mq3﹣9mq2+2mp2=6mq3﹣mq2=mq2(6q﹣1);①当0
<q<时,6q﹣1<0,因为m>0,所以mq2(6q﹣1)<0,所以E(X)>E(Y),乙团队试验的平均花费较少,所以选择乙团队进行研发;②当<q<1时,6q﹣1>0,因为m>0,所以mq2(6q﹣1)>0,所以E(X)<E(Y
),甲团队试验的平均花费较少,所以选择甲团队进行研发;③当q=时,mq2(6q﹣1)=0,所以E(X)=E(Y),甲团队试验的平均花费和乙团队试验的平均费用相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.