第13讲 线性回归分析(解析版)-2023年高二数学寒假衔接知识自学讲义(苏教版2019)

DOC
  • 阅读 1 次
  • 下载 0 次
  • 页数 31 页
  • 大小 2.232 MB
  • 2024-12-23 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档3.00 元 加入VIP免费下载
此文档由【envi的店铺】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
第13讲 线性回归分析(解析版)-2023年高二数学寒假衔接知识自学讲义(苏教版2019)
可在后台配置第一页与第二页中间广告代码
第13讲 线性回归分析(解析版)-2023年高二数学寒假衔接知识自学讲义(苏教版2019)
可在后台配置第二页与第三页中间广告代码
第13讲 线性回归分析(解析版)-2023年高二数学寒假衔接知识自学讲义(苏教版2019)
可在后台配置第三页与第四页中间广告代码
试读已结束,点击付费阅读剩下的5 已有1人购买 付费阅读2.40 元
/ 31
  • 收藏
  • 违规举报
  • © 版权认领
下载文档3.00 元 加入VIP免费下载
文本内容

【文档说明】第13讲 线性回归分析(解析版)-2023年高二数学寒假衔接知识自学讲义(苏教版2019).docx,共(31)页,2.232 MB,由envi的店铺上传

转载请保留链接:https://www.doc5u.com/view-09bffbdd82e38e244d6cf02cba8fd7d0.html

以下为本文档部分文字说明:

第13讲线性回归分析【题型归纳目录】题型一:相关关系的理解题型二:散点图与相关性题型三:散点图及其应用题型四:线性相关性的检验题型五:判断线性相关的强弱题型六:求回归直线方程题型七:利用回归直线方程对总体进行估计题型八:线性回归分析题型九:非线性回归分析

【知识点梳理】1、相关关系两个变量间的关系有函数关系,相关关系和不相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2、正相关、负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两

个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这个两个变量负相关.3、线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲

线相关.4、相关系数r的计算注意:相关系数是研究变量之间线性相关程度的量假设两个随机变量的数据分别为()()()1122,,,,,,nnxyxyxy,对数据作进一步的“标准化处理”处理,()211nxiisx

xn==−,()211nyiisyyn==−分别除ixx−和iyy−(1,2,,,inx=和y分别为1x,2,,nxx和12,,,nyyy的均值),得1122,,,,,,nnxyxyxyxxyyxxyyxxyyssssss−−−−−−

,为简单起见,把上述“标准化"处理后的成对数据分别记为()()()1122,,,,,,nnxyxyxy,则变量x和变量y的样本相关系数r的计算公式如下:()()()()()1112222111

niiinnnniiiixxyyrxyxyxynxxyy===−−=+++=−−.5、一元线性回归模型我们称2,()0,()YbxaeEeDe=++==为Y关于x的一元线性回归模型,其中Y称为因变量或响应变量,x称为自变量或解释变量;

a和b为模型的末知参数,a称为截距参数,b称为斜率参数;e是Y与bxa+之间的随机误差.6、线性回归方程与最小二乘法回归直线方程过样本点的中心(,)xy,是回归直线方程最常用的一个特征我们将ˆˆˆybxa=+称为Y关于x的

线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的ˆˆ,ba叫做b,a的最小二乘估计(leastsquaresestimate),其中()()()112

2211ˆˆˆ.nniiiiiinniiiixxyyxynxybxxxnxaybx====−−−==−−=−【典型例题】题型一:相关关系的理解例1.(2022·全国·高二课时练习

)下列两个变量间的关系,是相关关系的是()A.任意实数和它的平方B.圆半径和圆的周长C.正多边形的边数和内角度数之和D.天空中的云量和下雨【答案】D【解析】对于ABC,两个变量之间为确定性关系,即两个变量之

间均为函数关系,ABC错误;对于D,根据生活经验,天空中的云量和下雨之间不是确定性关系,虽然有云不一定下雨,但是如果没有云一定不下雨,说明它们之间是相关关系,D正确.故选:D.例2.(2022·全国·高二课时练习)有几组变量:①汽车的重

量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③立方体的棱长和体积.其中两个变量成正相关的是()A.①③B.②③C.②D.③【答案】C【解析】①汽车的重量和汽车每消耗1升汽油所行驶的平均路程是负相关关系;②平均日学习时间

和平均学习成绩是正相关关系;③立方体的棱长和体积是函数关系,不是相关关系.故选:C题型二:散点图与相关性例3.(2022·全国·高一课时练习)如下四个散点图中,正相关的是()A.B.C.D.【答案】A【解析】对于A,散点图中的点从左向右是上升的,且在一条直线附近,是正相关;对于B,散点图中

的点从左向右是下降的,且在一条直线附近,是负相关;对于C、D,散点图中的点不成带状分布,没有明显的相关关系;故选:A.题型三:散点图及其应用例5.(2022·全国·高二课时练习)两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出

它们相关关系的区别.表1A261813104-1B202434385064表2C05101520253035D541.67602.66672.09704.99806.71908.59975.421034.75【答案】答案见解析.【解析】散点图分别如

图(1)和图(2).从图中可以看出两图中的点各自分布在一条曲线附近,因此两对变量都具有相关关系.图(1)中,当A的值由小变大时,B的值却是由大变小,故A和B成负相关;图(2)中,当C的值由小变大时,D的值也是由小变大,故C和D成正相关.题型四

:线性相关性的检验例6.(2022·全国·高二课时练习)两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的区别.表1A261813104-1B202434385064表2C0510152

0253035D541.67602.66672.09704.99806.71908.59975.421034.75【答案】答案见解析.【解析】散点图分别如图(1)和图(2).从图中可以看出两图中的点各自分

布在一条曲线附近,因此两对变量都具有相关关系.图(1)中,当A的值由小变大时,B的值却是由大变小,故A和B成负相关;图(2)中,当C的值由小变大时,D的值也是由小变大,故C和D成正相关.例7.(2022·全国·高二课时练习)某个男孩的年龄与身高的统计数据如下表所示.年龄x(岁

)123456身高y(cm)788798108115120(1)画出散点图;(2)判断y与x是否具有线性相关关系.【解析】(1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.题型五:判断线性相关的强弱例8.(2022·全国·高二课时练习)某公司为了准确

地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销量y(单位:万件)之间的关系如表:x1234y12284256在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.附注:参考数据:()42132.6iiyy=−,52

.24,41418iiixy==.参考公式:相关系数()()()()12211niiinniiiixxyyrxxyy===−−=−−【解析】解:作出散点图如图:由散点图可知,各点大致分布在一条直线附近,由此推断x与y线性相关.由题中所给表格及参考数据得:52x=,692y=,41

418iiixy==,()42132.6iiyy=−,42130iix==,()()4411569441847322iiiiiixxyyxyxy==−−=−=−=,()244222115430452.242iiiixxxx==−=−=−=,()()()()41

442211730.99972.2432.6iiiiiiixxyyrxxyy===−−==−−.∵y与x的相关系数近似为0.9997,可以推断该公司的年销量y与第x年呈正线性相关,且线性相关程度很强.例9.(2022·吉林吉林·三模(文))2020年是决胜全面建成小康社会、决战

脱贫攻坚之年,面对新冠肺炎疫情和严重洪涝灾害的考验.党中央坚定如期完成脱贫攻坚目标决心不动摇,全党全社会戮力同心真抓实干,取得了积极成效.某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积x与相应的管理时间y的关系如下表所示:土地使用面积x(单位:

亩)12345管理时间y(单位:月)811142423并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示;愿意参与管理不愿意参与管理男性村民14060女性村民40(1)做出散点图,判断土地使用面积x与管理时间y是否线性相关;并根据相关系数r说明相关关系的强弱.(若0.75

r,认为两个变量有很强的线性相关性,r值精确到0.001).(2)若以该村的村民的性别与参与管理意风的情况估计贫困县的情况,且每位村民参与管理的意互不影响,则从该贫困县村民中任取3人,记取到不愿意参与管理的女性村民的人数为X,求X的分布列及数学期望.参考

公式:()()()12211niinniiiixxrxxyy===−=−−参考数据:()216,206,51522.7yyy=−=【解析】()1散点图如下图.由散点图可知,管理时间y与土地使用面积x线性相关依题意:1234535x++++==,又16y=

,()()()()()()51281502182743iiixxyy=−−=−+−−+−++=,()()()5222212101210iixx=−=−+−+++=,()251206iiyy=−=,则()()

()()1114343430.94745.4102062515niiinniiiixxyyrxxyy===−−===−−,由于0.9470.75,故管理时间y与土地使用面积x线性相关性较强()2由题知调查的300名村名中有不愿意参与管理的女性村民人数为()300140406

060−++=,该贫困县中任选一人,取到不愿意参与管理的女性树民的概率6013005p==,则X可取0,1,2,3,()310346405125PXC===,()21344815125PXC===,()2231412255125PXC===

,()3331135125PXC===,即:13,5XB:,()3314,0,1,2,355kkkPXKCk−===X的分布列X0123P6412548125121251125()64481213

01231251251251255EX=+++=,即()13355PEXn===.题型六:求回归直线方程例1.(2022·甘肃·临泽县第一中学高二阶段练习(文))已知变量x和y正相关,则由如下表所示的观测

数据算得的线性回归方程为x1−2−3−4−5−54321y0.9−2−31−.3.9−5.1−54.12.92.10.9A.1ˆ05yx=−.B.ˆyx=C.0ˆ23yx=+.D.ˆ1yx=+【答案】B【解析】由题得12345543210,1

0x−−−−−+++++==0.923.13.95.14.152.92.10.9010y−−−−−+++++==,所以样本中心点的坐标为(0,0),代入选项检验得选B.故答案为B【点睛】(1)本题主要考查回

归方程直线的性质,意在考查学生对该知识的掌握水平.(2)(,)xy称为样本点的中心,回归直线过样本点的中心.这是回归方程的一个重要考点,要理解掌握并灵活运用.例2.(2022·新疆·乌鲁木齐市第二十中学高二期中)随着人们经济收入的不断增长,个人购

买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(万元)有如表的数据资料:使用年限x23456总费用y2.

23.85.56.57.0(1)在给出的坐标系中作出散点图;(2)求线性回归方程ˆˆˆybxa=+中的ˆa、ˆb;(3)估计使用年限为12年时,车的使用总费用是多少?(最小二乘法求线性回归方程系数公式1221

ˆniiiniixynxybxnx==−=−,ˆˆaybx=−.)【解析】(1)散点图如图,由图知y与x间有线性相关关系.(2)∵4x=,5y=,51112.3iiixy==,52190iix==,∴2112.35

4512.31.2390541ˆ0b−===−;51.2340.ˆ0ˆˆ8aybx=−=−=.(3)线性回归直线方程是1.2308ˆ.0yx=+,当12x=(年)时,1.23120.0814.8ˆ4y=+=(万元).即估计使用12年时,支出总费用是1

4.84万元.题型七:利用回归直线方程对总体进行估计例3.(2022·江西抚州·高二期末(理))保护生态环境,提倡环保出行,节约资源和保护环境,某地区从2016年开始大力提倡新能源汽车,每年抽样1000汽车调查,得到新能源汽车y辆与年份代码x年的数据如下表:年份201620

17201820192020年份代码第x年12345新能源汽车y辆305070100110(1)建立y关于x的线性回归方程;(2)假设该地区2022年共有30万辆汽车,用样本估计总体来预测该地区2022年有多少新能源

汽车.参考公式:回归方程ybxa=+$$$斜率和截距的最小二乘估计公式分别为1221niiiniixynxybxnx==−=−,aybx=−.【解析】(1)3x=,305070+100+110=725y++=,12222222211

30+250+370+4100+5110-5372==211+2+3+4+5-53niiiniixynxybxnx==−=−,因为aybx=−,所以72213=9a=−$,所以219yx=+$(2)预测该地区2022年抽样1000汽车调查中新能源汽

车数,当7x=时,217993y=+=$,该地区2022年共有30万辆汽车,所以新能源汽车93300000279001000N==.例4.(2022·陕西·西安中学高二期中(理))偏差是指个别测定值与测定的平均值之差

,在成绩统计中,我们把某个同学的某科考试成绩与该科班平均分的差叫某科偏差(实际成绩−平均分=偏差).在某次考试成绩统计中,某老师为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机

挑选了8位同学,得到他们的两科成绩偏差数据如下:学生序号12345678数学偏差x20151332-5-10-18物理偏差y6.53.53.51.50.5-0.5-2.5-3.5(1)若x与y之间具有线性相关关

系,求y关于x的线性回归方程;(2)若该次考试该数学平均分为120分,物理平均分为91.5分,试由(1)的结论预测数学成绩为128分的同学的物理成绩.(下面是参考数据和参考公式)()()()()()()()()()8182

222222221206.5153.5133.531.520.550.5102.5183.532420151332510181256iiiiixyx===+++++−−+−−+−−==+++++−+−+−=,回归直线方程为ˆˆ

ˆybxa=+,其中()()()1122211ˆˆˆnniiiiiinniiiixynxyxxyybxnxxxaybx====−−−==−−=−【解析】(1)由题意可得,20151332(5)(10)(18)582x+++++−+−+−==,()()()

6.53.53.51.50.50.52.53.5988y+++++−+−+−==,1222159324ˆ81285412568()2niiiniixynxybxnx==−−===−−,所以9151ˆˆ8422aybx=−=−=,故线性回归方程为11ˆ42yx=

+.(2)由题意,设该同学的物理成绩为,则物理偏差为:91.5−.而数学偏差为128-120=8,∴1191.5842−=+,解得94=,所以,可以预测这位同学的物理成绩为94.题型八:线性回归分析17.(2021·陕西·府谷县第三中学高二期中(理))为了巩固脱贫成

果,某农科所实地考察,研究发现某脱贫村适合种植AB、两种经济作物,可以通过种植这两种经济作物巩固脱贫成果.通过大量考察研究得到如下统计数据:经济作物A的亩产量约为300公斤,其收购价格处于上涨趋势,最近五年的价格如下表:年份编号x12

345年份20172018201920202021单价(y元/公斤)1820232529经济作物B的收购价格始终为25元/公斤,其亩产量的频率分布直方图如图所示:(1)若经济作物A的单价y(单位:元/公斤)与年份编号x之间具

有线性相关关系,请求出y关于x的线性回归方程;(2)根据(1)中所求的线性回归方程,估计2022年经济作物A的单价;(3)用频率分布直方图估计经济作物B的平均亩产量(每组数据以区间的中点值为代表),若不考虑其他

因素,试判断2022年该村应种植经济作物A还是经济作物B?并说明理由.参考公式:1221ˆˆˆ,niiiniixynxybaybxxnx==−==−−.参考数据:5521123,372,55iiiiiyxyx=====.【解析】(1)由表中数据知,1(12345)35x

=++++=,5521123,372,55iiiiiyxyx=====515222153725323ˆˆˆ2.7,232.7314.955535iiiiixyxybaybxxx==−−====−=−=−−y关

于x的线性回归方程为2.7149ˆ.yx=+.(2)2022年对应的年份代号为6,当6x=时,ˆ2.7614.931.1y=+=,故估计2022年经济作物A的单价为31.1元/公斤.(3)利用频率和为1得(

)10.0100.01750.01252020.0120m−++==,0.005m=,经济作物B的亩产量的平均值为:3600.005203800.010204000.0175204200.0125204400.00520401+++

+=,经济作物A的收入为30031.19330=元,经济作物B的收入为2540110025=元,933010025,故2022年该村应种植经济作物B.18.(2021·陕西·府谷县第三中学高二期中(文))某企业坚持以市场需求为导向,合理配置生产资源,不

断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(吨)与相应的生产总成本y(万元)的五组对照数据.产量x(吨)12345生产总成本y(万元)3781012(1)根据上表数据,请用最小二乘法求y关于x的线性回归方程;(2)预测当x为8时,生产总成本的估计值.参考公式:()

()()121ˆˆˆ,niiiniixxyybaybxxx==−−==−−.【解析】(1)由题意可得:11(12345)3,(3781012)855xy=++++==++++=,()()()5521110,21iiiiixxxxyy==−=

−−=,则()()()51521212.1,82.131.71ˆˆˆ0iiiiixxyybaybxxx==−−====−=−=−,故y关于x的线性回归方程为2.1.7ˆ1yx=+.(2)取8x=,可得2.181..

5ˆ718y=+=,故预测当x为8时,生产总成本的估计值为18.5万元.19.(2021·陕西省米脂中学高二期中(文))机动车排气污染已经成为我国影响城市大气环境质量的重要因素,为了探究车流量与PM2.5的浓度的关系,现采集到某城市2021年5月份内连续七

天的车流量与PM2.5的数据如下表所示.车流量x(万辆)1234567PM2.5的浓度y(微克/立方米)26273237445460(1)由散点图知y与x具有线性相关关系,求y与x的线性回归方程;(2)根据(1)中所得结果,预测该市车流量为9万辆时PM2.5的浓度;(3)规定:当一天

内PM2.5的浓度平均值在(0,50内时,空气质量等级为优;当一天内PM2.5的浓度平均值在(50,100内时,空气质量等级为良.为使该市某日空气质量为优或者为良,则应控制当天车流量在多少万辆以内?参考公式:1221niiiniixynxybxnx==−=−,aybx=−

$$;参考数据:711288iiixy==,721140iix==【解析】(1)易知()1123456747x=++++++=,()126273237445460407y=++++++=.∵711288iiixy=

=,721140iix==,∴71722217128874406140747iiiiixyxybxx==−−===−−,406416aybx=−=−=.∴y关于x的线性回归方程为616yx=+;(2)当9x=时,6916

70y=+=,故车流量为9万辆时,PM2.5的浓度为70微克/立方米;(3)依题意,由616100x+„,得14x„,故要使该市某日空气质量为优或为良,则应控制当天车流量在14万辆以内.题型九:非线性回归分析20.(2022·四川外国语大学附属外国语学校高三期中)为适应高中新课程

改革,某学校在通用技术课程中开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.(1)赛前,小明进行了一段时间的强化训练,加工完成一个模具的平均速度y(秒)与训练天数x(天)有关,经统

计得到如下表数据:x(天)1234567y(秒)990990450320300240210经研究发现,可用byax=+作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过20天训练后,加工

完成一个模具的平均速度y约为多少秒?(2)小明和小红拟先举行一次模拟赛,每局比赛各加工一个模具,先加工完成模具的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为23,已知在前3局中小明胜2局,小红胜1局.若每局不存在平局,请计算小明最终

赢得比赛的概率.参考数据:(其中1iitx=)71iiity=t72217iitt=−18450.370.55参考公式:对于一组数据()11,uv,()22,uv,…,(),nnuv,其回归直线ˆvu=+的斜率和截距的最小二乘估计公

式分别为1221niiiniiuvnuvunu==−=−,vu=−.【解析】(1)由题意,()19909904503203002402105007y=++++++=,令1tx=,设y关于t的线性回归方程为ˆˆˆybta=+,则7172217184570.37500ˆ10000.55

7iiiiitytybtt==−−===−,则ˆ50010000.37130=−=a,∴100013ˆ0=+yt,∴y关于x的回归方程为100013ˆ0=+yx,当20x=时,ˆ180y=,∴预测小明经过20天训练后,加工完成一个模具的平均速度y约为180秒;(2

)设比赛再继续进行X局小明最终赢得比赛,则最后一局一定是小明获胜,由题意知,最多再进行4局就有胜负,X的可能取值为2、3、4.当2X=时,小明4∶1胜,∴()2242339PX===;当3X=时,小明4∶2胜,∴()1222283C133327P

X==−=;当4X=时,小明4∶3胜,∴()213222124C133381PX==−=.∴小明最终赢得比赛的概率为9483624129271188281+++=+=.21.(2

022·广东·高三阶段练习)红铃虫是棉花的主要害虫之一,能对农作物造成严重伤害,每只红铃虫的平均产卵数y和平均温度x有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.平均温度/℃x212325272

93133平均产卵数y/个711212466115325lnzy=1.92.43.03.24.24.75.8(1)根据散点图判断,ybxa=+与edxyc=(其中e2.718=为自然对数的底数)哪一个更适宜作为平均产卵数y关于平均温度x的回归方程类型?(给出判断即可,不必说明理由)并由

判断结果及表中数据,求出y关于x的回归方程,(计算结果精确到0.01)(2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,假设该地每年平均温度达到28℃以上的概率为13.该地今后4年中至少有两年需要人工防治的概率.参考数据72

1iix=71iiixy=71iiixz=yz52151771371781.33.6附:回归方程()1122211()()ˆˆˆˆˆˆˆ,,====−−−=+===−−−nniiiiiinniiiixxyyxynxyybxabaybxxxxnx.【

解析】(1)由散点图可以判断,edxyc=适宜作为卵数y关于温度x的回归方程类型.对edxyc=两边取自然对数,得lnlnycdx=+,令ln,lnˆˆˆ,zyacbd===,则ˆˆˆzbxa=+,由数据得21232527293133277x++++++==,7173

6.6iiixzxz=−=,()77222117112iiiixxxx==−=−=,所以717221736.6ˆ0.331127iiiiixzxzbxx==−==−,3.60.33275.31ˆˆazbx=−=−=−,所以z关于

x的线性回归方程为ˆ0.335.31zx=−,则y关于x的回归方程为0.335.31ˆexy−=;(2)若今后4年中有X年需要人工防治,且服从1(4,)3X,所以,今后4年中至少有两年需要人工防治的概率431421233111C3338127P=−−==.【

同步练习】一、单选题1.(2022·广东·新会陈经纶中学高三阶段练习)已知,xy是两个具有线性相关的两个变量,其取值如下表:x12345y4m9n11其回归直线ˆˆˆybxa=+过点()37,的一个充分不必要条件

是()A.5mn==B.6mn==C.11+=mnD.56mn==,【答案】D【解析】若回归直线ˆˆˆybxa=+过点()37,,由题知5115,3iixx===,故()37,为样本中心,所以491135mn++++=,11+=m

n,所以11+=mn的一个充分不必要条件可以是56mn==,.故选:D2.(2022·河南·高三阶段练习(文))2022年5月,居民消费价格走势为113.52点,同比增长率为2.01%,增速高于平均值1.105%,增速乐观.

下表统计了近6年的消费价格走势,令2015年12月时,0x=;2016年6月时,1x=,依次类推,得到x与居民消费价格y(点)的线性回归方程为99511..ˆyx=+.由此可估计,2022年6月份的消费价格约为()A.113.5点B.113.8点C.117.3点D.119.1点【答

案】B【解析】由题意及图表,可得当2021年12月时,12x=,故当2022年6月时,13x=.把13x=代入99511..ˆyx=+,得99.51.113113.8y=+=.故选:B.3.(2022·内蒙古·赤

峰市元宝山区第一中学高二期中)如图是根据,xy的观测数据(),iixy()1,2,,10i=L得到的散点图,可以判断变量x,y具有线性相关关系的图是()A.①②B.③④C.②③D.①④【答案】B【解析】根据变量,xy具有线性相关关系,则散点在某条直线附近,从左下至右上或从左上至右

下,所以③④图的变量,xy具有线性相关关系.故选:B4.(2021·陕西·府谷县第三中学高二阶段练习)在下列各图中的两个变量具有线性相关关系的是()A.B.C.D.【答案】C【解析】由散点图可知,C选项中的散点均匀地分布在一条直线附近,变量x、y具有线性相关关系,ABD选项中的散点

没有分布在一条直线附近,故ABD选项中变量x、y不具有线性相关关系.故选:C.5.(2022·广西·桂林市第五中学高三阶段练习(文))由变量x与y相对应的一组数据()()()()()123451,,2,,3,,4,,5,yyyyy得到的线性回归方程为ˆ245yx=+,根据样本中心(),xy满足

线性回归方程,则y=()A.45B.51C.67D.63【答案】B【解析】由题意得1(12345)35x=++++=,因为线性回归方程为ˆ245yx=+,所以234551y=+=,故选:B.6.(2022·全国·高三专题练习)某单位为了了解办公楼用电量y(度)与气温()Cx之间的关系,随机

统计了四个工作日用电量与当天平均气温,如下表:气温()oCx1813101−用电量y(度)24343864由表中数据得到线性回归方程为ˆˆ2yxa=−+,当气温为4C−时,预测用电量为()A.68度B.67度C.66度D.52度【答案】A【解析】由表中数据

可知:1813101104x++−==,24343864404y+++==,因为回归方程为ˆˆ2yxa=−+过样本中心,所以ˆ60a=,所以当4x=−时,ˆ2602(4)6068yx=−+=−−+=.故选:A.7.(2022·陕西·咸阳市高新一中

高三开学考试(文))某企业秉承“科学技术是第一生产力”的发展理念,投入大量科研经费进行技术革新,该企业统计了最近6年投入的年科研经费x(单位:百万元)和年利润y(单位:百万元)的数据,并绘制成如图所示的散点图.已知x,y的平均值分别为7x=,10y=.甲统计员得到

的回归方程为1.69yxa=+;乙统计员得到的回归方程为0.172.52exy=;若甲、乙二人计算均未出现错误,有下列四个结论:①当投入年科研经费为20(百万元)时,按乙统计员的回归方程可得年利润估计值为75.6(百万元)(取3.4e30=);②ˆ1.83a=−;③方程ˆ

ˆ1.69yxa=+比方程0.17ˆ2.52exy=拟合效果好;④y与x正相关.以上说法正确的是()A.①③④B.②③C.②④D.①②④【答案】D【解析】将20x=代入0.17ˆ2.52exy=,得ˆ75.6y=,①正确;将7x=,

10y=代入ˆˆ1.69yxa=+得ˆ1.83a=−,②正确;由散点图可知,回归方程0.17ˆ2.52exy=比ˆˆ1.69yxa=+的拟合效果更好,③错误;因为y随x的增大而增大,所以y与x正相关,④正确.故①②④正确.故选:D.8.(2022·全国·高三专题练习)某微生物科研团队为了研究某种细

菌的繁殖情况,工作人员配制了一种适合该细菌繁殖的营养基质用以培养该细菌,通过相关设备以及分析计算后得到:该细菌在前3个小时的细菌数y与时间t(单位:小时,且13t)满足回归方程1ebty+=(其中b

为常数),若ezy=,且前3个小时t与y的部分数据如下表:t123y85e2e512e3个小时后,向该营养基质中加入某种细菌抑制剂,分析计算后得到细菌数y与时间t(单位:小时,且310t)满足关系式:4224(3)e12btybt−=−+,在tt=0时刻,该细菌数达到最大,随后细菌个数逐

渐减少,则0t的值为()A.4B.92C.5D.112【答案】A【解析】依题意,12323t++==,1812(2)2355z=++=,由1ebty+=,ezy=,得1zbt=+,且1zbt=+经过点(2,2),于是得12b=,当13t时

,112ety+=单调递增,则当3t=时,52maxey=,当310t时,412(3)e12tyt−=−+,令4()12(3)e12tftt−=−+,310t,求导得:444()12e12(31

2(e4))etttfttt−−−=−=−−,当34t时,()0ft,当410t时,()0ft,即函数()ft在(3,4]上单调递增,在[4,10]上单调递减,当4t=时,max()(4)24ftf==,而5522222432333e=,因此当4t=

时,细菌数y取最大值,所以0t的值为4.故选:A二、多选题9.(2022·江苏徐州·高三期末)已知变量y与x具有线性相关关系,统计得到6组数据如下表:x247101522y8.19.41214.418.524若y关于x的线性回归方程为0.8yxa=+,则()A.变量

y与x之间正相关B.14.4y=C.6.8a=D.当12x=时,y的估计值为15.6【答案】AB【解析】由y关于x的线性回归方程为0.8yxa=+,可知变量y与x之间正相关,即A正确;由表中数据可知247101522106x+++++==8.19.412

14.418.52414.46y+++++==,故B正确;因此样本点中心为(10,14.4),将其代入回归方程0.8yxa=+可得14.40.8106.4a=−=,故C不正确;因此,y关于x的线性回归方程为0.86.4yx=+,

将12x=代入回归方程可得,0.8126.416y=+=,即当12x=时,y的估计值为16;所以D错误;故选:AB.10.(2022·全国·模拟预测)近年来考研成为许多大学生的热门选择,某研究机构为

了解大学生考研情况,对2018年至2022年研究生报考人数(单位:万人)作出统计如下表:年份20182019202020212022年份代码12345研究生报考人数/万人238290341377457根据上述统计数据求得研究生报考人数y与

年份代码x满足的线性回归方程为18.ˆ31ˆybx=+,则()A.ˆ52.5b=B.回归直线18.ˆ31ˆybx=+经过点()4,377C.2018年至2022年每年研究生报考人数约增加183.1万人D.预测2024年研究生报考人数为550.6万人【答案】A

D【解析】A选项:1234535++++=,238290341377457340.65++++=,则样本点的中心为()3,340.6,所以ˆ340.63183.1b=+,(回归直线经过样本点的中心)得ˆ52.5b=,故A正确;B选项:因为52.54183.1393.

1377+=,所以回归直线18.ˆ31ˆybx=+不经过点()4,377,B错误;C选项:由A选项知,线性回归方程为52.5831ˆ1.yx=+,所以每年研究生报考人数约增加52.5万人,C错误;D选项:令7x=

,则52.57183.1550.6ˆy=+=,故预测2024年研究生报考人数为550.6万人,D正确.故选:AD.11.(2022·广东湛江·高三阶段练习)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用:x(单位:万元)与销售利润y(单位:万元)的相关数

据,如表所示,根据表中数据,得到经验回归方程:lybxa=+,则下列结论正确的是()广告费用x3458销售利润y4578A.0bB.0aC.直线l必过点()4,7D.直线l必过点()5,6【答案】ABD【解析】由表中数据计算1(3458)54x=+++=,1(4578)64y=+

++=,所以样本中心为()5,6,所以直线l必过点()5,6,所以D正确,C错误;41()()(2)(2)(1)(1)013211iiixxyy=−−=−−+−−++=,4222221()(2)(1)0314iixx=−=

−+−++=,所以11291414baybx==−=,,所以A,B正确.故选:ABD.12.(2022·广东·高三开学考试)某企业秉承“科学技术是第一生产力”的发展理念,投入大量科研经费进行技术革新,该企业统计了最近6年投入的年科研经费x(单位:百万元)和年利

润y(单位:百万元)的数据,并绘制成如图所示的散点图.已知x,y的平均值分别为7,10xy==.甲统计员得到的回归方程为ˆˆ1.69yxa=+;乙统计员得到的回归方程为0.17ˆ2.52exy=;若甲、乙二人计算均未出现错误,则以下结论正确的为()A.

当投入年科研经费为20(百万元)时,按乙统计员的回归方程可得年利润估计值为75.6(百万元)(取3.4e30=)B.ˆ1.83a=−C.方程ˆˆ1.69yxa=+比方程0.17ˆ2.52exy=拟合效果好D.y

与x正相关【答案】ABD【解析】将20x=代入0.17ˆ2.52exy=得ˆ75.6y=,A正确;将7,10xy==代入ˆˆ1.69yxa=+得ˆ1.83a=−,B正确;由散点图可知,回归方程0.17ˆ2.52exy=比ˆˆ1.69yxa=+的拟合效果更好,

C错误;因为y随x的增大而增大,所以y与x正相关,D正确.故选:ABD.三、填空题13.(2022·安徽·高三阶段练习)功能性饮料是指通过调整饮料中天然营养素的成分和含量比例,以适应某些特殊人群营养需要的饮品.数据显示,从2014年

开始,中国功能性饮料市场年均复合增长率均不低于10%.某同学若根据20142021年(年份代码x分别为18)中国功能性饮料年市场规模y(单位:百亿元)求得回归方程为1.2.5ˆ4yx=+,则2022年预测规模与20142021年平均规模的差为______百亿元.【答案】5.4【解析】因为1

238982x++++==,又点(),xy在回归直线上,故91.24.59.92y=+=,2022年预测规模为1.294..3ˆ515y=+=,所以2022年预测规模与20142021年平均规模的差为15.39.95.4−=(百

亿元).故答案为:5.4.14.(2022·上海市大同中学高二期末)某设备的使用年限与所支出的维修费用的统计数据如下表:使用年限x(单位:年)23456维修费用y(单位:万元)1.54.55.56.57.0根据上表可得回归直

线方程为:1.3ˆˆyxa=+,据此模型预测,若使用年限为10年,估计维修费用约为___________.【答案】12.8【解析】因为234561.54.55.56.574,555++++++++==,所以样本中心点为(4,5),因此有51.340.ˆˆ2aa

=+=−1.30.ˆ2yx=−,当10x=时,1.3100.2.ˆ218y=−=,故答案为:12.815.(2022·湖北黄冈·高三阶段练习)某公司为了调查某商品的销售利润,统计该商品近5年的利润情况如下表:第x年12345利润y/亿元23a46若已

知变量y与x之间具有线性关系,由最小二乘法建立的回归直线方程为1.1.7ˆ0yx=+,则该公司这5年利润的标准差是___________.【答案】2【解析】由题,()11234535x=++++=,代入回归方程得1.

130.74y=+=,即()1234645a++++=,得5a=,所以利润标准差()()()()()222221243454446425s=−+−+−+−+−=,故答案为:2.16.(2023·上海·高三专题练习)已知变量x,y的关系可以用模型ekxyc=拟

合,设lnzy=,其变换后得到一组数据如下:x46810z2356由上表可得线性回归方程0.7zxa=+,则c=______.【答案】0.9e−【解析】由表格数据知:4681023567,444xz++++++====.由0.7zxa=+,得4ˆ70.7a+=,则ˆ0.9a=−.∴0.70

.9zx=−,由kxyce=,得lnln()lnlnlnkxkxzycececkx===+=+,∴ln0.9c=−,即0.9ec−=.故答案为:0.9e−.四、解答题17.(2022·重庆巴蜀中学高三阶段练习)随着对新能源

汽车的大力推广,其使用量逐年增加,加大了对新能源汽车充电基础设施的建设,统计该市近5年新能源汽车充电桩的数量(单位:千个),得到如下表格:年份20172018201920202021年份代号t12345新能源汽车充电桩数址y(千个)1719232630(1)若y与t成线性

相关关系,求y关于t的线性回归方程ˆˆˆybta=+;(2)预测2024年该新能源汽车充电桩的数量.参考公式:()()()121ˆˆˆ,niiiniittyybaybttt==−−==−−.【解析】(1)由表中数据,123451719

2326303,2355ty++++++++====,t12345y1719232630itt−2−1−012iyy−6−4−037()()iittyy−−1240314()2itt−41014所以()()()5521133,10iiiiittyytt==−−=−=,()()()5

152133ˆ3.310iiiiittyybtt==−−===−,ˆˆ2333.313.1aybt=−=−=,y关于t的线性回归方程ˆ3.313.1yt=+.(2)2024年的年份代号为8,即8t=,则将8t=代入线性回归方程得:3.3813.139.5y=+=

(千个),预测2024年该省新能源汽车充电桩的数量为39.5千个,即39500个.18.(2022·四川·成都七中高二阶段练习(文))已知某同学的物理成绩y(单位:分,满分100分)与数学成绩x(单位:分,满分150分)之间具有线性相关关系,在连续的五次月考中,该生的物理成绩与数

学成绩统计如下表:数学成绩x120110125130115物理成绩y9283909689(1)根据该同学的数学与物理成绩,若都以100分值计算,判断哪一科更稳定;(2)利用上表中的五组数据求回归直线方程ybxa=+.若在第六次月考中该生数学成绩为

135x=,利用该回归直线方程预测第六次月考的物理成绩.参考公式:222211221()()1=[()()()],,()niiinniixxyysxxxxxxbaybxnxx==−−−+−++−=

=−−【解析】(1)根据表中数据可得:1201101251301159283909689120,90,55xy++++++++====按100分值计算,数学学科的方差为:2222222111002

00(0105105)51509s=++++=,物理学科的方差为22222221(27061)185s=++++=,200189,所以均以100分值计算,该同学物理成绩更加稳定;(2)51()()135iiixxyy=−−=521()250iixx=

−=51521()()0.54()iiiiixxyybxx==−−==−.900.54120aybx=−=−25.2a=,故所求回归直线的方程为0.5425.2yx=+当135x=,98.1y=(分)故第六次月考物理成绩预测值为98.1分.19.(2022·贵州贵阳·

高三阶段练习(理))据统计我国2016年~2022年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2016年~2022年的年份代码x分别为1~7).(1)根据散点图分析y与x之间的相关关系;(2)根据散点图相应数据计算得711078iiy==,714508

iiixy==,求y关于x的线性回归方程(数据精确到0.01);(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.附:回归方程ˆˆˆybxa=+中的斜率和截距的最小二乘法估计公式分别()121()(),

ˆ.ˆˆniiiniixxyybaybxxx==−−==−−【解析】(1)根据散点图可知,y与x成正线性相关关系.(2)由题中的数据可知1(1234567)47x=++++++=,110781547y==,()177112272177ˆ()()7450871544196140762718i

iiiiiiiiixxyyxyxybxxxx====−−−−=====−−−,15474126ˆˆaybx=−=−=.所以7126ybxax=+=+.(3)由残差图可以看出,残差对应的点均匀的落在-2到2的水平带状区域内,且宽度较窄,说明拟合效果较好

.20.(2022·全国·高三专题练习)国庆期间,某市文旅部门在落实防控举措的同时,推出了多款套票文旅产品,得到消费者的积极回应.下面是文旅部门在某地区推出六款不同价位的旅游套票,每款的套票价格x(单位:元)与购买人数y(单位:万人)的数据如下表:旅游类别城市展馆科技

游乡村特色游红色景点游登山套票游园套票观海套票套票价格x(元)394958677786购买数量y(万人)16.718.720.622.524.125.6在分析数据、描点绘图中,发现散点(),(16)iivi集中在一条直线附近,其中lniivx=,lni

iy=.根据所给数据,求y关于x的回归方程;附:①可能用到的数据:6175.3iiiv==,6124.6iiv==,6118.3ii==,621101.4iiv==.②对于一组数据()11,v,()22,v,…,

(),nnv,其回归直线bva=+的斜率和截距的最小二乘估计值分别为1221niiiniivnvbvnv==−=−,abv=−.【解析】因为散点(),(16)iivi集中在一条直线附近,设回归直线方程

为bva=+,由6114.16iivv===,6113.056ii===,则1222175.364.13.051101.464.12niiiniivnvbvnv==−−===−−,13.054.112abv=−=−

=,所以变量关于v的回归方程为112v=+,因为lniivx=,lniiy=,所以1lnln12yx=+,故12eyx=,综上,y关于x的回归方程为12eyx=;21.(2021·陕西省米脂中学高二期中(理))某高中生参加社会实践活动,对某公司1月份至6月份销售某种机器配

件的销售量及销售单价进行了调查,销售单价x和销售量y之间的一组数据如下表所示:月份123456销售单价x(元/件)99.51010.5118销售量y(件)111086514.2(1)根据1至5月份的数据,求出y关于x的线性回归方程;(2)若由线性回归方程得到的估计数据与剩下的检

验数据的误差不超过0.5,则认为所得到的线性回归方程是理想的,试问(1)中所得到的线性回归方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价

应定为多少元/件,才能获得最大利润?(注:销售利润=销售收人-成本).参考公式1221ˆniiiniixynxybxnx==−=−,ˆˆaybx=−.参考数据:51392iiixy==,5215

02.5iix==.【解析】(1)根据1至5月份的数据,()199.51010.511105x=++++=,()1111086585y=++++=,又51392iiixy==,521502.5iix==,所以251215253925108ˆ

3.2502.55105iiiiixyxybxx==−−===−−−,()ˆˆ83.21040aybx=−=−−=.所以,y关于x的线性回归方程为3.240ˆyx=−+.(2)当8x=时,ˆ

3.284014.4y=−+=,则ˆ14.414.20.20.5yy−=−=,所以,可以认为(1)中所得到的线性回归方程是理想的.(3)由题意可知,3.240yx=−+,显然0y,则12.5x.设销售利润

为W,则()()22.53.2403.248100Wxxxx=−−+=−+−(2.5125)x.,()23.27.580Wx=−−+(2.5125)x..当7.5x=时,W取得最大值80.故该配件的销售单价应定为7.5元/件,才能获

得最大利润.22.(2021·陕西·榆林市横山中学高二阶段练习)某种工程车随着使用年限的增加,每年的维修费用也相应增加,根据相关资料可知该种工程车自购人使用之日起,前5年中每年的维修费用如下表所示.已知y与x具有线性相关关系.年

份序号x12345维修费用y(万元)1.11.622.52.8参考数据:52155iix==,5134.3iiixy==.参考公式:线性回归方程ˆˆˆybxa=+的斜率和截距的最小二乘法估计分别为1221ˆniii

niixynxybxnx==−=−,ˆˆaybx=−(1)求y关于x的线性回归方程;(2)根据实际用车情况,若某辆工程车每年维修费用超过4万元时,可以申请报备更换新车,请根据回归方程预估一辆该种工程车一般使用几年后可以申请报备更换新车.【解析】(1)依题意,()11234535x=++++=

,()11.11.622.52.825y=++++=,52155iix==,5134.3iiixy==,5152221534.3532ˆ0.4355535iiiiixyxybxx==−−===−

−.ˆ20.4330.71a=−=.所求线性回归方程为ˆ0.430.71yx=+.(2)由题意可得,0.430.714x+,即32943x.因为3297843,所以,预计一辆该种工程车一般使用8年后可以申请报备更换新车.

envi的店铺
envi的店铺
欢迎来到我的店铺
  • 文档 128536
  • 被下载 7
  • 被收藏 0
相关资源
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:12345678 电话:400-000-0000 (支持时间:9:00-17:00) 公众号
Powered by 太赞文库
×
确认删除?