【文档说明】2023届高考数学一轮复习精选用卷 第九章 概率与统计 考点测试58 成对数据的统计分析 含解析【高考】.doc,共(13)页,345.500 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-b7f793d9529811b217d8d8463e4afa9a.html
以下为本文档部分文字说明:
1考点测试58成对数据的统计分析高考概览高考在本考点的常考题型为选择题、填空题和解答题,分值为5分、12分,中、低等难度考纲研读1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的经验回归方程系数公式
建立经验回归方程3.了解独立性检验的基本思想、方法及其简单应用4.了解一元线性回归模型的基本思想、方法及其简单应用一、基础小题1.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<
r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3答案A解析易知题中图(1)和图(3)是正相关,图(2)与图(4)是负相关,且图(1)与图2(2)中的样本点集中分布在一条直线附近,则r2<r
4<0<r3<r1.故选A.2.某公司一种型号的产品近期销售情况如下表:月份(x)23456销售额y/万元15.116.317.017.218.4根据上表可得到经验回归方程y^=0.75x+a^,据此估计,该公司7月份这
种型号产品的销售额约为()A.19.5万元B.19.25万元C.19.15万元D.19.05万元答案D解析由表可知x-=15×(2+3+4+5+6)=4,y-=15×(15.1+16.3+17+17.2+18
.4)=16.8,则样本点的中心为(4,16.8),在经验回归直线上,故16.8=0.75×4+a^,得a^=13.8.故当x=7时,y^=0.75×7+13.8=19.05.故选D.3.在一组样本数据(x1,y1),(x2,y
2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.12D.1答案D解析由题设知,这组样本数据正相关
,所有样本点都在一条直线上,故其样本相关系数为1.故选D.4.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690.85m1061
151241033则试验结果体现A,B两变量有更强的线性相关性的是()A.甲B.乙C.丙D.丁答案D解析r越大,m越小,线性相关性越强,丁同学的试验结果体现A,B两变量有更强的线性相关性.故选D.5.(多选)为了解户籍、性别对生育二胎选择倾向的影响,
某地从育龄人群中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育
二胎的对应比例,则下列叙述中正确的是()A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别有关C.倾向选择生育二胎的人群中,男性人数与女性人数相同D.倾向选择不生育二胎的人群中,农村户籍人数少于城镇户籍人数答案A
BD解析由比例图可知,是否倾向选择生育二胎与户籍、性别有关.倾向选择不生育二胎的人群中,农村户籍人数为0.2×100=20,城镇户籍人数为0.6×100=60,农村户籍人数少于城镇户籍人数.倾向选择生育二胎的人群中,男性人数为0.8×120=96,女性人数为0.6×80=
48,男性人数与女性人数不相同,C错误.故选ABD.6.(多选)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年“年货节”期间的销售额(单位:亿元)并4作出散点图
,将销售额y看成年份序号x(2012年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法中正确的是()A.销售额y与年份序号x呈正相关关系B.销售额y与年
份序号x线性相关显著C.三次函数回归曲线的拟合效果好于回归直线的拟合效果D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8454亿元答案ABC解析根据图象可知,散点从左下到右上分布,销售额y与年份序号x呈正相关关系,故A正确;因为在一元线性回归模型中,
决定系数等于相关系数的平方,所以相关系数r=0.936≈0.967>0.75,靠近1,所以销售额y与年份序号x线性相关显著,故B正确;根据三次函数回归曲线的决定系数0.999>0.936,决定系数越大,拟合效果越好,所以三次函数回归
曲线的拟合效果好于回归直线的拟合效果,故C正确;由三次函数y=0.168x3+28.141x2-29.027x+6.889,得当x=10时,y=2698.719亿元,故D错误.故选ABC.7.(多选)因防疫的需要,多数大学开学后启用封
闭式管理.某大学开学后也启用封闭式管理,该校有在校学生9000人,其中男生4000人,女生5000人,为了解学生在封闭式管理期间对学校的管理和服务的满意度,随机调查了40名男生和50名女生,每位被调查的学生都对学校的管理和服务给出了满意或不满意的评价,经统计得到如下列联表:
满意不满意男20205女4010α0.1000.050.0250.0100.001xα2.7063.8415.0246.63510.828附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)以下说法正确的有()A.满意
度的调查过程采用了分层随机抽样的抽样方法B.该学校学生对学校的管理和服务满意的概率的估计值为0.6C.有99%的把握认为学生对学校的管理和服务满意与否与性别有关系D.没有99%的把握认为学生对学校的管理和服务满意与否与性别有关系答案AC解析因为男女比例为4000∶5000=4∶5,所
以A正确;满意的频率为20+4090=23≈0.667,所以该学校学生对学校的管理和服务满意的概率的估计值约为0.667,所以B错误;由列联表得χ2=90×(20×10-20×40)240×50×60
×30=9>6.635,故有99%的把握认为学生对学校的管理和服务满意与否与性别有关系,所以C正确,D错误.故选AC.8.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=lny,其变换后得到经验回归方程z=0.3x+4,则c=_____
___.答案e4解析因为y=cekx,所以两边取对数,可得lny=ln(cekx)=lnc+lnekx=lnc+kx,令z=lny,可得z=lnc+kx.因为z=0.3x+4,所以lnc=4,所以c=e4.二、高考小题9.(2020·全国Ⅰ卷)某校一个课外学习小组为研
究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:6由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+b
xB.y=a+bx2C.y=a+bexD.y=a+blnx答案D解析由散点图分布可知,散点图分布在一个对数型函数图象的附近,因此最适宜作为发芽率y和温度x的回归方程类型的是y=a+blnx.故选D.10
.(2017·山东高考)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为y^=b^x+a^.已知
i=110xi=225,i=110yi=1600,b^=4.该班某学生的脚长为24,据此估计其身高为()A.160B.163C.166D.170答案C解析∵i=110xi=225,∴x-=110i=110xi=22.5.∵i=110yi=1
600,∴y-=110i=110yi=160.又b^=4,∴a^=y--b^x-=160-4×22.5=70.∴回归直线方程为y^=4x+70.将x=24代入上式得y^=4×24+70=166.7故选C.三、模拟小题11.(多选)
(2021·河北省邯郸市高三阶段考试)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表.经计算χ2≈4.762,则可以推断出()满意不满意男
3020女4010α0.1000.0500.010xα2.7063.8416.635A.该学校男生对食堂服务满意的概率的估计值为35B.调研结果显示,该学校男生比女生对食堂服务更满意C.有95%的把握认为男、女生对该食堂服务的评价有差异D.有9
9%的把握认为男、女生对该食堂服务的评价有差异答案AC解析该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A正确;该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B错
误;因为χ2≈4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.故选AC.12.(2021·河北衡水中学模拟)2020年初,新型冠状病毒(COVID-19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地
开始使用中西医结合方法后,每周治愈的患者人数如下表所示:周数(x)12345治愈人数(y)21736931428由表格可得y关于x的非线性经验回归方程为y^=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为()A.5B.4C.1D
.0答案A解析设t=x2,即t=15×(1+4+9+16+25)=11,y-=15×(2+17+36+93+142)=58,a=58-6×11=-8.所以y^=6x2-8,令x=4,得第4周的残差e4=y4-y^4=93-6×42+
8=5.故选A.一、高考大题1.(2021·全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计2
70130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)
(b+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828解(1)设甲机床、乙机床生产的产品中一级品的频率分别为P1,P2,则P1=150200=0.75,P2=120
200=0.6.(2)根据题表中的数据,得9K2=400×(150×80-50×120)2200×200×270×130=40039≈10.256.因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.2.(2020·新高考Ⅰ
卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:SO2PM2.5[0,50](50,150](150,4
75][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:SO2PM2.5[0
,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),P(K2≥k)0.0500.01
00.001k3.8416.63510.828解(1)由表格中的数据可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数有32+6+18+8=64天,所以该市一天空气中PM2.5浓度不超过75,且
SO2浓度不超过150的概率的10估计值为64100=0.64.(2)由所给数据,可得2×2列联表为SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010(3)根据2×2列联表中的数据可得K2=n(ad-bc)2(a+b)(c
+d)(a+c)(b+d)=100×(64×10-16×10)280×20×74×26=3600481≈7.484>6.635,所以有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.二、模拟大题3.(2021·江苏省扬州中学高三月考)随
着城市规模的扩大和人们生活水平的日益提高,某市近年机动车保有量逐年递增,根据机动车管理部门的统计数据,以5年为一个研究周期,得到机动车每5年纯增数据情况为:其中i=1,2,3,…,时间变量xi对应的机动车纯增数量为yi
,且通过数据分析得到时间变量x与对应的机动车纯增数量y(单位:万辆)具有线性相关关系.(1)求机动车纯增数量y(单位:万辆)关于时间变量x的经验回归方程,并预测2025~2030年间该市机动车纯增数量
的值;附:经验回归方程y^=b^x+a^中斜率和截距的最小二乘估计公式分别为b^=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2,a^=y--b^x-.11(2)该市交通
管理部门为了了解市民对“单双号限行”的赞同情况,随机采访了220名市民,将他们的意见和是否拥有私家车情况进行了统计,得到如下的2×2列联表:赞同限行不赞同限行合计没有私家车9020110有私家车7040110合计16060220依据α=0.01的独
立性检验,能否认为对限行的意见与是否拥有私家车有关联?附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.α0.150.100.050.0250.0100.0050.001xα2.0722.7063.8415.02
46.6357.87910.828解(1)由题中数据可得x-=3,y-=12,∑5i=1xiyi=1×3+2×6+3×9+4×15+5×27=237.所以b^=∑5i=1xiyi-5x-y-∑5i=1x2i-5x
-2=237-5×3×12(12+22+32+42+52)-5×32=5755-45=5.7,a^=y--b^x-=-5.1,所以y^=5.7x-5.1.2025~2030年时,x=7,所以y=5.7×7-5.1=3
4.8.所以2025~2030年间,该市机动车纯增数量的值约为34.8万辆.(2)零假设为H0:对限行的意见与是否拥有私家车无关联.根据列联表,计算得χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)12=220
×(90×40-20×70)2110×110×160×60=556≈9.167,9.167>6.635,依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为对限行的意见与是否拥有私家车有关联,此推断犯错误的概率不大于
0.01.4.(2021·辽宁铁岭六校高三模拟)某学校共有1000名学生参加知识竞赛,其中男生400人,为了解该校学生在知识竞赛中的情况,采用分层随机抽样的方法抽取了100名学生进行调查,分数分布在450~950分之间,根据调查的结果绘制的学生分数频
率分布直方图如图所示.将分数不低于750分的学生称为“高分选手”.(1)求a的值,并估计该校学生分数的平均数、中位数和众数(同一组中的数据用该组区间的中点值作代表);(2)现采用分层随机抽样的方式从分数落在[550,650),[750,850
)内的两组学生中抽取10人,再从这10人中随机抽取3人,记被抽取的3名学生中属于“高分选手”的学生人数为随机变量X,求X的分布列及数学期望;(3)若样本中属于“高分选手”的女生有10人,完成下列2×2列联表,并判断是否有97.5%的把握认为该校学生属于“高分选手”与“性别”有关?
属于“高分选手”不属于“高分选手”合计男生女生合计参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.13α0.150.100.050.0250.0100.0050.
001xα2.0722.7063.8415.0246.6357.87910.828解(1)由题意知100×(0.0015+a+0.0025+0.0015+0.001)=1,解得a=0.0035.样本平均数为x-=500×0.15+600×0.35+700×0.25+800×0.15+900×0.1
0=670,中位数为650,众数为600.所以估计该校学生分数的平均数是670,中位数是650,众数是600.(2)由题意,从分数落在[550,650)的学生中抽取7人,从分数落在[750,850)的学生中抽取3人,随机变量X的所有可能取值有0,1,2,3.P(X=k)=Ck3C3-
k7C310(k=0,1,2,3),所以随机变量X的分布列为X0123P72421407401120随机变量X的数学期望E(X)=0×724+1×2140+2×740+3×1120=910.(3)由题可知,样本中男生40人,女生60人,属于“
高分选手”的25人,其中女生10人,得出以下2×2列联表:属于“高分选手”不属于“高分选手”合计男生152540女生105060合计2575100χ2=n(ad-bc)2(a+b)(c+d)(a+c)
(b+d)=100×(15×50-25×10)240×60×25×75=509≈5.556>5.024,所以有97.5%的把握认为该校学生属于“高分选手”与“性别”有关.