【文档说明】2023-2024学年高二数学苏教版2019选择性必修第二册同步试题 9.1.2线性回归方程 Word版含解析.docx,共(14)页,1.006 MB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-d5e19e29d7c4be2fb87afcd29d4c24de.html
以下为本文档部分文字说明:
9.1.2线性回归方程一、单选题1.下列说法错误的是()A.线性回归直线ybxa=+$$$一定过样本点中心(),xyB.在回归分析中,2R为0.91的模型比2R为0.88的模型拟合的效果好C.在残差图中,残差点分布的带状区域
的宽度越狭窄,其模型拟合的精度越高D.在线性回归分析中,相关系数r的值越大,变量间的相关性越强【答案】D【分析】根据回归方程相关知识逐项判断即可.【解析】回归直线必过样本点中心,故A正确;拟合系数越大拟合效果越好,故B正确;残差点分布区域越窄,拟合精度越高,故C正确;相
关系数r越接近于1,相关性越强,故当(1,0)r−时,r的值越大,变量间的相关性越弱,故D错误.故选:D2.下列说法错误的是()A.相关系数r越大,两个变量的线性相关性越强B.若()2~2,XN,且()130.5PX=,则()30.25PX=C.相关指数20.64R=,
表示解释变量对于预报变量变化的贡献率为64%D.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高【答案】A【分析】根据相关系数的概念,可判定A不正确;C、D正确,根据正态分布曲线的对称性,
可判定B正确.【解析】对于A中,根据相关系数的定义知:相关系数r越大且1r,两个变量的线性相关性越强,所以A不正确;对于B中,若()2~2,XN,且()130.5PX=,可得()()11330.252PXPX−==,所以B正确;对于C中,根据相关系数的概念,当相关指数20.6
4R=,表示解释变量对于预报变量变化的贡献率为64%,所以C正确;对于D中,根据数据的残差的定义,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以D正确.故选:A.3.对四组数据进行统计后,获得了如下图所示的散点图,对于其
相关系数的比较,下列说法正确的是()A.32140rrrrB.41230rrrrC.23410rrrrD.14320rrrr【答案】C【分析】根据正相关、负相关以及线性相关关系的强弱可得出结果.【解析】由题意可知,第一、四组数据正相关,第二、三组负相关,当相关系数的
绝对值越大,数据的线性相关性越强,且第一组数据的线性相关性较第四组强,则140rr,第二组数据的线性相关性较第三组强,则23rr且20r,30r,则230rr.因此,23410rrrr.故选:C.4.据一组样本数据()()()1122,,,,,,
nnxyxyxy,求得经验回归方程为1.20.4yx=+,且3x=.现发现这组样本数据中有两个样本点()1.2,0.5和()4.8,7.5误差较大,去除后重新求得的经验回归直线l的斜率为1.1,则()A.去除两个误差较大的样本点后,y的估计
值增加速度变快B.去除两个误差较大的样本点后,重新求得的回归方程对应直线一定过点()3,5C.去除两个误差较大的样本点后,重新求得的回归方程为1.10.7yx=+D.去除两个误差较大的样本点后,相应于样本点()2,2.7的残
差为0.1【答案】C【分析】根据直线l的斜率大小判断A;求出y判断B;再求出经验回归方程判断C;计算残差判断D作答.【解析】对于A,因为去除两个误差较大的样本点后,经验回归直线l的斜率变小,则y的估计值增加速度变慢,A错误;对于B,由1.20.4yx=+及3x=得:4y
=,因为去除的两个样本点()1.2,0.5和()4.8,7.5,并且1.24.80.57.53,422++==,因此去除两个样本点后,样本的中心点仍为(3,4),因此重新求得的回归方程对应直线一定过点(3,4),B
错误;对于C,设去除后重新求得的经验回归直线l的方程为ˆ1.1yxa=+,由选项B知,ˆ41.13a=+,解得ˆ0.7a=,所以重新求得的回归方程为1.10.7yx=+,C正确;对于D,由选项C知,1.10.7
yx=+,当2x=时,1.120.72.9y=+=,则2.72.90.2−=−,因此去除两个误差较大的样本点后,相应于样本点()2,2.7的残差为0.2−,D错误.故选:C5.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根
据图中所有数据,得到回归直线方程11ybxa=+,相关系数为1r;方案二:剔除点()10,32,根据剩下的数据得到回归直线方程22ybxa=+,相关系数为2r.则()A.1201rrB.2101rrC.1210rr−D.2110
rr−【答案】D【分析】根据相关系数的意义:其绝对值越接近1,说明两个变量越具有线性相关,以及负相关的意义作判断即可.【解析】由散点图可知这两个变量为负相关,所以120,0rr.因为剔除点()10
,32后,剩下点的数据更具有线性相关性,2r更接近1,所以2110rr−.故选:D.6.下表提供了某厂进行技术改造后生产产品过程中记录的产量x(单位:t)与相应的生产能耗y(单位:t标准煤)的几组对应数据:/tx3456/ty标准煤2.5344.
5已知该厂技术改造前100t产品的生产能耗为90t标准煤,试根据以上数据求出的线性回归方程,预测该厂技术改造后100t产品的生产能耗比技术改造前降低了()附:在线性回归方程ˆˆˆyabx=+中,1221ˆˆˆ,niiiniixynxybaybxxnx==−==−−
,其中,xy为样本平均值.A.19.65t标准煤B.29.65t标准煤C.70.35t标准煤D.90t标准煤【答案】A【分析】根据表中数据和回归方程公式,代入求解得回归方程,并利用方程对数据进行估计即可.【解析】34564.54x++
+==,2.5344.53.54y+++==,232.5435464.544.53.5ˆ0.791625364(4.5)b+++−==+++−,3.50.74.5.3ˆ05=−=a,所以线性回归方程为ˆ0.7
0.35yx=+,当100x=,ˆ70.35y=,9070.3519.65−=.故选:A.二、多选题7.对经验回归方程,下列正确的有()A.决定系数2R越小,模型的拟合效果越好B.经验回归方程只适用于所研究的样本的总体C.不能期望经验回归方程得到的预报值就是响
应变量的精确值D.残差平方和越小,模型的拟合效果越好【答案】BCD【分析】利用相关系数与模型的拟合效果可判断A选项;利用经验回归方程的特点可判断BC选项;利用残差平方和与模型的拟合效果可判断D选项.【解析】对于A选项,决定系数2R越小,模型的拟合效果越差,A错;对于B选项,经验回归方程只适
用于所研究的样本的总体,B对;对于C选项,经验回归方程得到的是响应变量的预报值,不是响应变量的精确值,C对;对于D选项,残差平方和越小,模型的拟合效果越好,D对.故选:BCD.8.已知由样本数据()(),1,2,3,,10iixyi=组成的一个样本,得到经验回
归方程为ˆ20.4yx=−,且2x=,去除两个样本点()2,1−和()2,1-后,得到新的经验回归方程为ˆˆ3yxb=+.在余下的8个样本数据和新的经验回归方程中().A.相关变量x,y具有正相关关系B.新的经验回归方程为ˆ33yx=−C.随着自变量x值增加,因变量y值增加
速度变小D.样本()4,8.9的残差为0.1−【答案】ABD【分析】根据线性回归方程的求法、意义可判断ABC,再由残差的概念判断D.【解析】10120iix==,x新平均数1202.58=,220.43.6y=−=.y新平均数1103.64.58=,∴ˆ4.532.5b=
+,∴ˆ3b=−.新的线性回归方程ˆˆ3yxb=+,x,y具有正相关关系,A对.新的线性回归方程:ˆ33yx=−,B对.由线性回归方程知,随着自变量x值增加,因变量y值增加速度恒定,C错;4x=,ˆ9y=,8.990.1−=−,D对.故选:ABD.9.某中学课外活动小组为了
研究经济走势,根据该市1999—2021年的GDP(国内生产总值)数据绘制出下面的散点图:该小组选择了如下2个模型来拟合GDP值y随年份x的变化情况,模型一:()0,0ykxbkx=+;模型二:()e0,
0xykbkx=+,下列说法正确的有()A.变量y与x正相关B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况C.若选择模型二,exykb=+的图象一定经过点(),xyD.当13x=时,通过模型计算得GD
P值为70,实际GDP值为71,则残差为1【答案】AD【分析】根据散点图和变量关系依次判断即可.【解析】对A,根据散点图易得变量y与x正相关,故A正确;对B,由散点图可得y与x的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年
份的变化情况,故B错误;对C,若选择模型二,exykb=+,令ext=,则图象经过点(),ty,故C错误;对D,当13x=时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1,故D正确.故选:AD.10.已知关于变量
x,y的4组数据如表所示:x681012ya1064根据表中数据计算得到x,y之间的线性回归方程为ˆ1.420.6yx=−+,x,y之间的相关系数为r(参考公式:()()()()12211niiinniiiixxyyrxxyy===−−=−−),则()A.12a
=B.变量x,y正相关C.7210r=−D.223r=−【答案】AC【分析】根据回归直线必过点(),xy解得12a=,所以选项A正确;由回归方程和表格可知选项B错误;利用相关系数求出7210r=−,所以选项C正确,选项D
错误.【解析】回归直线必过点(),xy,9x=,10641.420.684ayx+++=−+==,解得12a=,所以选项A正确;由回归方程和表格可知,变量x,y负相关,所以选项B错误;()()()()()()()()4144221134121
23472109119164416iiiiiiixxyyrxxyy===−−−+−+−+−===−++++++−−,所以选项C正确,选项D错误.故选:AC三、填空题11.以下两个变量成负相关的是__
___.①学生的学籍号与学生的数学成绩;②坚持每天吃早餐的人数与患胃病的人数;③气温与冷饮销售量;④电瓶车的重量和行驶每千米的耗电量.【答案】②【分析】根据相关关系的知识确定正确答案.【解析】①无相关关系;②负相关;③④正相关.故答案为:②12.已知某种商品的广告费支出x(单
位:万元)与销售额y(单位:万元)之间具有线性相关关系,利用下表中的五组数据可求得回归直线方程为ˆˆˆyaxb=+,根据该回归方程,预测当8x=时,ˆ84.8y=,则ˆa=___________.广告费支出x(万元)
23456销售额y(万元)2537505664【答案】9.6【分析】根据预测值以及样本中心点求得ˆa.【解析】2345625375056644,46.455xy++++++++====,所以84.8846.ˆˆˆ44ˆabab=+
=+,解得ˆ9.6a=.故答案为:9.613.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限
x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x(单位:年)1234567失效费y(单位:万元)2.903.303.604.404.805.205.90由上表数据可知,y与x的相关系数为_____
_.(精确到0.01,参考公式和数据:()()()()12211niiinniiiixxyyrxxyy===−−=−−,()()7114.00iiixxyy=−−=,()7217.08iiyy=
−=,198.2414.10)【答案】0.99【分析】分别求出x,y,()721iixx=−,再利用参考公式和数据计算即可.【解析】由题意,知123456747++++++==x,2.903.303.604.404.805.205.904.307y+++
+++==,()()()()()()()()72222222211424344454647428iixx=−=−+−+−+−+−+−+−=.所以14.0014.0014.000.9914.10287.08198.24r==.所以y与x的相关系数近似为0.99.故答案为:0.99.四
、解答题14.已知某绿豆新品种发芽的适宜温度在6℃~22℃之间,一农学实验室研究人员为研究温度x(℃)与绿豆新品种发芽数y(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:(1)由折线统计图
看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;(2)建立y关于x的回归方程,并预测在19℃的温度下,种子发芽的颗数.参考数据:24y=,()()7170iiixxyy=−−=,()721176iiyy=−=,778.77.参考公式:相关系数()()()()1
2211niiinniiiixxyyrxxyy===−−=−−,回归直线方程ybxa=+$$$中斜率和截距的最小二乘估计公式分别为()()()121niiiniixxyybxx==−−=−,aybx=−$$.【答案】(1)答案见解析;(2)44.【
分析】(1)直接套公式求出系数r,即可判断;(2)套公式求出回归方程,把19x=代入,即可求解.【解析】(1)由题意可知:()1891011121314117x=++++++=.()()()()()()()()2722222
2218119111011111112111311141128iixx=−=−+−+−+−+−+−+−=.又()721176iiyy=−=,所以相关系数()()()()12211700.99717628niiinniiiixxyy
rxxyy===−−==−−.因为相关系数0.998r,所以y与x的线性相关性较高,可以利用线性回归模型拟合y与x的关系.(2)由(1)知11x=,24y=,()27128iixx=−=,()()7170iiixxyy=−−=.所以()()()12
1702.528niiiniixxyybxx==−−===−,所以242.5113.5aybx=−=−=−$$.所以y与x的回归直线为2.53.5yx=−.当19x=时,2.5193.544y=−=.即在
19℃的温度下,种子发芽的颗数为44.15.某医疗机构承担了某城镇的新冠疫苗接种任务,现统计了前8天每天(用1,2,,8t=表示)的接种人数y(单位:百人)的相关数据,并制作成如图所示的散点图.(1)由散点图看出,可用线性回归模型拟合y与t的关系,求y关于t的线性回归方程;(系数用分数表示
)(2)预测哪一天的接种人数会首次突破2500人.(结果保留整数)参考数据:92t=,494y=,()82142iitt=−=,()()8170iiittyy=−−=.参考公式:对于一组数据()11,ty,()22,ty,…,(),nnty,其线性回归方程ˆˆˆybta=+的
斜率和截距的最小二乘法估计分别为()()()121ˆniiiniittyybtt==−−=−,ˆˆaybt=−.【答案】(1)519ˆ34yt=+(2)第13天【分析】(1)根据已知条件及参考数据,求出ˆ,ba,进而即可求出回归方程;(2)利
用(1)的回归方程及已知条件,结合不等式的解法即可求解.【解析】(1)∵()82142iitt=−=,()()8170iiittyy=−−=,∴()()()81821705ˆ423iiiiittyybtt==−−===−,又92t=,494y=,∴495919ˆˆ43
24aybt=−=−=,∴y关于t的线性回归方程为519ˆ34yt=+.(2)令519ˆ2534yt=+,得24312.1520t=,∴预测第13天的接种人数会首次突破2500人.16.秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救
下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)如下:日期第一天第二天第三天第四天第五天第六天第七天日期代码x1234567杯数y4152226293132(1)请根据以上数据,绘制散点图,并根据散点图
判断,yabx=+与lnycdx=+哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶
茶才能超过35杯?(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.参考公式和数据:其中711ln,7iiiiuxuu===回归直线方程ˆˆˆybxa=+中,
111221ˆˆˆ,niniixynxybaybxxnx==−==−−yu711iixy=711iiuy=721iiu=2.1e22.71.2759235.113.28.2【答案】(1)图见解析,lnycdx=+更适宜作为y关于x的回归方程模型;(2)ˆ
5.714.2lnyx=+,到第9天才能超过35杯;(3)分布列见解析.【分析】(1)根据散点图趋势即可判断;(2)利用非线性回归方程转化为线性回归方程的方法求解;(3)根据超几何分布求分布列.【解析】(1)根据散点图,知l
nycdx=+更适宜作为y关于x的回归方程模型;(2)令lnux=,则ycdu=+,由已知数据得71117221235.1722.71.2ˆ14.213.271.21.2iiixynxydxnx==−−==−−,ˆˆ2
2.714.21.25.7cydu=−=−,所以ˆ5.714.2yu=+,故y关于x的回归方程为ˆ5.714.2lnyx=+,进而由题意知,令5.714.2ln35x+,整理得ln2.1x,即2.1e8.2x,故当9x=时,即到第9天才能超过35杯
;(3)由题意知,这7天中销售超过25杯的有4天,则随机变量X的可能取值为0,1,2,3()034337CC10C35PX===,()124337CC121C35PX===,()214337CC182C35PX===,()304337CC43C35PX===,则随机变量X的分
布列为X0123P13512351835435