高中数学培优讲义练习(人教A版2019选择性必修三)专题8.3 一元线性回归模型及其应用(重难点题型精讲) Word版含解析

DOC
  • 阅读 0 次
  • 下载 0 次
  • 页数 21 页
  • 大小 347.896 KB
  • 2024-10-06 上传
  • 收藏
  • 违规举报
  • © 版权认领
下载文档8.00 元 加入VIP免费下载
此文档由【小赞的店铺】提供上传,收益归文档提供者,本网站只提供存储服务。若此文档侵犯了您的版权,欢迎进行违规举报版权认领
高中数学培优讲义练习(人教A版2019选择性必修三)专题8.3 一元线性回归模型及其应用(重难点题型精讲) Word版含解析
可在后台配置第一页与第二页中间广告代码
高中数学培优讲义练习(人教A版2019选择性必修三)专题8.3 一元线性回归模型及其应用(重难点题型精讲) Word版含解析
可在后台配置第二页与第三页中间广告代码
高中数学培优讲义练习(人教A版2019选择性必修三)专题8.3 一元线性回归模型及其应用(重难点题型精讲) Word版含解析
可在后台配置第三页与第四页中间广告代码
试读已结束,点击付费阅读剩下的18 已有0人购买 付费阅读6.40 元
/ 21
  • 收藏
  • 违规举报
  • © 版权认领
下载文档8.00 元 加入VIP免费下载
文本内容

【文档说明】高中数学培优讲义练习(人教A版2019选择性必修三)专题8.3 一元线性回归模型及其应用(重难点题型精讲) Word版含解析.docx,共(21)页,347.896 KB,由小赞的店铺上传

转载请保留链接:https://www.doc5u.com/view-ad1f17080dda9f0064343a537dbd4354.html

以下为本文档部分文字说明:

专题8.3一元线性回归模型及其应用(重难点题型精讲)1.一元线性回归模型把式子为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.2.线性经验回归方程与最小二乘法设

满足一元线性回归模型的两个变量的n对样本数据为(,),(,),,(,),由=+a+(i=1,2,,n),得|-(+a)|=||,显然||越小,表示样本数据点离直线y=bx+a的竖直距离越小.通常用各散点到直线的竖直距离的平方之和Q=来刻画各样本观测数据与直线y=bx+a的“整体接

近程度”.当a,b的取值为时,Q达到最小.将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.经验回归直线一定过点(,).3.残差分析对于响应变量Y,通过观测得

到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.4.刻画回归效果的方式(1)

残差图法作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精

度越高.(2)残差平方和法残差平方和为,残差平方和越小,模型拟合效果越好.(3)利用刻画拟合效果=.越大,模型的拟合效果越好,越小,模型的拟合效果越差.(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(,),(,),,(,),利用相关系数r来衡量两个

变量之间线性关系的强弱,相关系数r的计算公式:(其中,,,和,,,的均值分别为和).①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.②当r<0时,称成

对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.【题型1一元线性回归模型】【方法点拨】根据一元线性回归模型的定义,结合具体题目条件

,进行求解即可.【例1】(2022·高二单元测试)根据如下样本数据,得到线性回归方程为𝑌=𝑛𝑋+𝑚,若样本点的中心(𝑥,𝑦)为(5,0.9),则当X每增加1个单位时,Y平均()X34567Y4.0𝑚−5.4-0.50.5𝑛−0.6A.增加1.4个单位B.减少1.4个

单位C.增加7.9个单位D.减少7.9个单位【解题思路】根据已知条件解出m和n,得到线性回归方程,即可得到答案.【解答过程】样本点的中心(𝑥,𝑦)为(5,0.9),则𝑚+𝑛−25=0.9,故�

�+𝑛=6.5,且0.9=5𝑛+𝑚,解得𝑛=−1.4,𝑚=7.9,则𝑌=−1.4𝑋+7.9,可知当X每增加1个单位时,Y平均减少1.4个单位.故选:B.【变式1-1】(2022春·黑龙江大庆·高二期末)给出下列说法中错误的是()A.回归直线𝑦̂=𝑏̂𝑥+𝑎̂恒过样本点的中心

(𝑥̅,𝑦̅)B.两个变量相关性越强,则相关系数|𝑟|就越接近1C.某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差不变D.在回归直线方程𝑦̂=2−0.5𝑥中,当变量x增加一个单位时,𝑦̂平均减少0.5

个单位【解题思路】A中,根据回归直线方程的特征,可判定是否正确;B中,根据相关系数的意义,可判定是否正确;C中,根据方差的计算公式,可判定是否正确;D中,根据回归系数的含义,可判定是否正确.【解答过程】对于A中,回归直线�

�̂=𝑏̂𝑥+𝑎̂恒过样本点的中心(𝑥,𝑦),所以正确;对于B中,根据相关系数的意义,可得两个变量相关性越强,则相关系数|𝑟|就越接近1,所以是正确的;对于C中,根据平均数的计算公式可得𝑥=7×4+

47+1=4,根据方差的计算公式𝑠2=18[7×2+(4−4)2]=1.75≠2,所以是不正确的;对于D中,根据回归系数的含义,可得在回归直线方程𝑦̂=2−0.5𝑥中,当解释变量𝑥增加一个单位时,预报变量𝑦̂平均减少0.5个单位,所以是正

确的.故选:C.【变式1-2】(2022春·河南南阳·高二期中)已知变量x和y的回归直线方程为𝑦̂=0.2021𝑥+0.202,变量y与z负相关.下列结论中正确的是()A.x与y正相关,x与z正相

关B.x与y正相关,x与z负相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关【解题思路】根据变量x和y的回归直线方程判断.【解答过程】解:因为变量x和y的回归直线方程为𝑦̂=0.2021𝑥+0.202,且0.2021>0,所以变量x与y

正相关,又变量y与z负相关,所以x与z负相关,故选:B.【变式1-3】(2022春·陕西渭南·高一期末)根据如下样本数据:𝑥345678𝑦4.02.50.50.50.40.1得到线性回归方程为𝑦=𝑏𝑥+𝑎

,则()A.𝑎>0,𝑏>0B.𝑎>0,𝑏<0C.𝑎<0,𝑏>0D.𝑎<0,𝑏<0【解题思路】根据𝑥与𝑦负相关且样本点集中在第一象限可判断出结果.【解答过程】由样本数据知:𝑥与𝑦负相关,∴𝑏<0;又样本点位于第一象限,∴𝑦=𝑏𝑥+

𝑎(𝑏<0)在𝑦轴截距为正,∴𝑎>0.故选:B.【题型2残差的计算】【方法点拨】根据题目条件,得出经验回归方程,再进行残差的计算.【例2】(2022春·湖北·高二期末)某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些

数据如下表所示:第x天1234567高度y/cm1469111213由表格中数据可得y关于x的经验回归方程为𝑦̂=2.04𝑥+𝑎̂,则第7天的残差为()A.1.12B.2.12C.−1.12D.−2.12【解题思路】依题意求出𝑥、𝑦,根据回归直线方程必

过样本中心点(𝑥,𝑦)求出𝑎̂,即可得到回归直线方程,再根据残差公式计算可得;【解答过程】解:通过表格计算得,𝑥=17(1+2+3+4+5+6+7)=4,𝑦=17(1+4+6+9+11+12+13)=8,因为

经验回归直线𝑦̂=2.04𝑥+𝑎̂过点(𝑥,𝑦),所以𝑎̂=𝑦−2.04𝑥=−0.16,所以𝑦关于𝑥的经验回归方程为𝑦̂=2.04𝑥−0.16.所以回归模型第7天的残差13−(2.04×7−0.16)=−1.12.故选:C.【变式2-1】(

2023春·河南开封·高三开学考试)某部门统计了某地区今年前7个月在线外卖的规模如下表:月份代号x1234567在线外卖规模y(百万元)111318★28★35其中4、6两个月的在线外卖规模数据模糊,但这7个月的平均值为23.若利

用回归直线方程𝑦̂=𝑏̂𝑥+𝑎̂来拟合预测,且7月相应于点(7,35)的残差为−0.6,则𝑎̂−𝑏̂=()A.1.0B.2.0C.3.0D.4.0【解题思路】根据给定条件,求出𝑥,再借助回归直线的特征及残差列出方程组即可求解作答.【解答过程】依题意,𝑥=17(1+

2+3+4+5+6+7)=4,而𝑦=23,于是得4𝑏̂+𝑎̂=23,而当𝑥=7时,35−(7𝑏̂+𝑎̂)=−0.6,即7𝑏̂+𝑎̂=35.6,联立解得𝑎̂=6.2,𝑏̂=4.2,所以𝑎̂−𝑏̂=2.0.故选:B.【变式2-2】(2022春·河南许昌·高二期末)为研究变量x

,y的相关关系,收集得到下面五个样本点(x,y):x5.56.577.58.5y98643若由最小二乘法求得y关于x的回归直线方程为𝑦̂=−1.8𝑥+𝑎̂,则据此计算残差为1.1的样本点是()A.(5.5,9

)B.(6.5,8)C.(7,6)D.(7.5,4)【解题思路】先求出回归方程的样本中心点,从而可求得𝑦̂=−1.8𝑥+18.6,再根据残差的定义可判断.【解答过程】由题意可知,𝑥=5.5+6.5+7+7.5+8.55=7,𝑦=9+8+6+4+35=6,所以回归方程的样本中心点为(7,

6),因此有6=−1.8×7+𝑎̂⇒𝑎̂=18.6,所以𝑦̂=−1.8𝑥+18.6,当𝑥=5.5时,𝑦̂=(−1.8)×5.5+18.6=8.7,𝑦−𝑦̂=9−8.7=0.3;当𝑥=6.5时,𝑦̂=(−1.8)×6.5+18.6=6.9,

𝑦−𝑦̂=8−6.9=1.1;当𝑥=7时,𝑦̂=(−1.8)×7+18.6=6,𝑦−𝑦̂=6−6=0;当𝑥=7.5时,𝑦̂=(−1.8)×7.5+18.6=5.1,𝑦−𝑦̂=4−5.1=−1.1;故选:B.【变式2-3】(2022春·江苏宿迁·高二阶段练习)在对具有线性相关的两

个变量𝑥和𝑦进行统计分析时,得到如下数据:𝑥4𝑚81012𝑦12356由表中数据求得𝑦关于𝑥的回归方程为𝑦̂=0.65𝑥−1.8,则(4,1),(𝑚,2),(8,3)这三个样本数据中,残差的绝对值最小的

是()A.(4,1)B.(𝑚,2)C.(8,3)D.(4,1)和(𝑚,2)【解题思路】根据样本中心点一定在线性回归方程上,求出𝑚=6,分别计算出三个样本数据的残差的绝对值,比较得到结果.【解答过程】𝑥=4+𝑚+8+10+125=34+𝑚5,𝑦=1+2+3+5+65=175,因为样本中

心点(34+𝑚5,175)一定在𝑦̂=0.65𝑥−1.8上,代入解得:𝑚=6,当𝑥=4时,𝑦̂=0.65×4−1.8=0.8,1−0.8=0.2;当𝑥=6时,𝑦̂=0.65×6−1.8=2.1,2.1−2=0.1,

当𝑥=8时,𝑦̂=0.65×8−1.8=3.4,3.4−3=0.4,因为0.1<0.2<0.4,所以残差的绝对值最小的是(𝑚,2)故选:B.【题型3刻画回归效果的方式】【方法点拨】根据刻画回归效果的三种方式,结合具体题目条件,选

取适当的方式来刻画模型的拟合效果,即可得解.【例3】(2022秋·宁夏银川·高三开学考试)下列说法正确的个数是()(1)在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越差(2)某地气象局预报:6月9日

本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学(3)回归分析模型中,残差平方和越小,说明模型的拟合效果越好(4)在回归直线方程𝑦̂=0.1𝑥+10,当解释变量每增加1个单位时,预报变量多增加0

.1个单位A.2B.3C.4D.1【解题思路】根据残差分析的性质判断(1),(3)选项,由概率的意义判断(2)选项,根据回归直线方程的意义判断(4).【解答过程】解:对(1),在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越

好,故错误;对(2),概率只说明事件发生的可能性,某次事件不一定发生,所以并不能说明天气预报不科学,故错误;对(3),在回归分析模型中,残差平方和越小,说明模型的拟合效果越好,故正确;对(4),在回归直线方程𝑦̂=0.1𝑥+10,当解释变量每增

加1个单位时,预报变量增加0.1个单位,故正确.故选:A.【变式3-1】(2022春·山东菏泽·高二期末)关于线性回归的描述,下列命题错误的是()A.回归直线一定经过样本点的中心B.残差平方和越小,拟合

效果越好C.决定系数𝑅2越接近1,拟合效果越好D.残差平方和越小,决定系数𝑅2越小【解题思路】根据线性回归的性质判断即可【解答过程】对A,回归直线一定经过样本点的中心正确;对B,残差平方和越小,拟合效果越好正确;对C,决定系数𝑅2越接近1,拟合效果越好正确;对D,

残差平方和越小,拟合效果越好,决定系数𝑅2越接近1,故D错误;故选:D.【变式3-2】(2022秋·广东广州·高三阶段练习)对两个变量𝑦和𝑥进行回归分析,得到一组样本数据(𝑥1,𝑦1),(𝑥2,𝑦2),…(𝑥𝑛,𝑦𝑛),则下列说法不正确的是()A.若变量𝑦和

𝑥之间的相关系数为𝑟=−0.9462,则变量𝑦和𝑥之间具有较强的线性相关关系B.残差平方和越小的模型,拟合的效果越好C.用决定系数𝑅2来刻画回归效果,𝑅2越小说明拟合效果越好D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方

程的预报精确度越高【解题思路】变量𝑦和𝑥之间的相关系数为|𝑟|越大,则变量𝑦和𝑥之间具有较强的线性相关关系可判断A;残差平方和越小的模型,拟合的效果越好可判断B;用决定系数𝑅2来刻画回归效果,𝑅2越大说明拟合效果越好可判断C;在残差图

中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高可判断D.【解答过程】变量𝑦和𝑥之间的相关系数为|𝑟|越大,则变量𝑦和𝑥之间具有较强的线性相关关系,故A正确;残差平方和越小的模型,拟合的效果越好,故B正确;用决定系数𝑅2来刻画回归效果,

𝑅2越大说明拟合效果越好,故C错误;在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,故D正确.故选:C.【变式3-3】(2022春·甘肃天水·高二阶段练习)关于线性回归的描述,有下列命题:①回归直线一定经过样本中心点;②相关系数𝑟的绝对值越大,拟合效果越好;③相

关指数𝑅2越接近1拟合效果越好;④残差平方和越小,拟合效果越好.其中正确的命题个数为()A.1B.2C.3D.4【解题思路】根据回归直线方程的性质,相关系数、相关系数及残差平方和的意义判断各项的正误即可.【解答过程】对于①,回归直线一定经过样本中心点,故正确;对于②,相关系数�

�的绝对值越接近于1,相关性越强,故错误;对于③,相关指数𝑅2越接近1拟合效果越好,故正确;对于④,残差平方和越小,拟合效果越好,故正确.故选:C.【题型4代入法求线性经验回归方程】【方法点拨】经验回归直线一定经过样本点的中心(,),求出样本点的中心后代入线性回归方程求解相应字母

.【例4】(2023秋·四川广安·高二阶段练习)已知两个变量𝑥和𝑦之间存在线性相关关系,某兴趣小组收集了一组𝑥,𝑦的样本数据如下表所示:𝑥12345𝑦0.50.611.41.5根据表中数据利用最小二乘法得到的回归方程是(

)A.𝑦=0.21𝑥+0.53B.𝑦=0.25𝑥+0.21C.𝑦=0.28𝑥+0.16D.𝑦=0.31𝑥+0.11【解题思路】求出𝑥,𝑦,由回归直线必过样本中心,将点(𝑥,𝑦)依次代入各项检验是否成立可得结果.【解答过程】∵

𝑥=15×(1+2+3+4+5)=3,𝑦=15×(0.5+0.6+1+1.4+1.5)=1∴回归直线必过样本中心(3,1),而A、B、D项中的回归直线方程不过点(3,1),C项的回归直线方程过点(3,1),故选:C.【变式4-1】(2022秋·陕西

榆林·高二期中)已知𝑥,𝑦的取值如下表所示:x0134y2.24.34.86.7若𝑦与𝑥线性相关,且𝑦=0.95𝑥+𝑎,则𝑎=()A.2.2B.2.9C.2.8D.2.6【解题思路】利用平均数可得样本的中心点为(2,4.5),将中心点对应的值代入题目中的等式即可求出𝑎的值.【解答

过程】由表格,得𝑥̅=14(0+1+3+4)=2,𝑦̅=14(2.2+4.3+4.8+6.7)=4.5,线性回归直线过样本中心点(2,4.5),所以4.5=0.95×2+𝑎,所以𝑎=2.6.故选:D.【变式4-2】(202

3秋·河南焦作·高二期末)某产品的广告费用x与销售额y的统计数据如表:广告费用x(万元)3456销售额y(万元)25304045根据如表可得回归方程𝑦̂=𝑏̂𝑥+𝑎̂中的𝑏̂为7.根据此模型预测广告费用为10万元时销售额为()万元A.63.

6B.75.5C.73.5D.72.0【解题思路】线性回归方程.根据回归方程必过样本中心点,求出回归系数,再将𝑥=10代入,即可得到预报销售额.【解答过程】解:由题意,𝑥̅=3+4+5+64=4.5,𝑦̅=25+30+40+454=35,由回归方程𝑦̂=𝑏̂𝑥+𝑎̂中

的𝑏̂为7可得,35=7×4.5+𝑎̂,解得𝑎̂=3.5,所以,回归方程为𝑦̂=7𝑥+3.5,所以𝑥=10时,𝑦̂=7×10+3.5=73.5元.故选:C.【变式4-3】(2023秋·四

川宜宾·高二期末)某小区流感大爆发,当地医疗机构使用中西医结合的方法取得了不错的成效,每周治愈的患者人数如表所示,由表格可得y关于x的线性经验回归方程为𝑦̂=36𝑥−48,则测此回归模型第4周的治愈人数为()周数(x)12345治愈人数(y)51535?1

40A.106B.105C.104D.103【解题思路】设第4周的治愈人数为𝑚,表示出样本中心点(𝑥̅,𝑦̅),代入到回归方程中,进而可求出答案.【解答过程】根据题意,设第4周的治愈人数为𝑚,则有𝑥̅=1+2+3+4+54=3,𝑦̅=5+15+3

5+𝑚+1405=195+𝑚5,所以样本中心点为(3,195+𝑚5),代入到回归方程𝑦̂=36𝑥−48中,得𝑚=105,故选:B.【题型5经验回归模型的应用】【方法点拨】(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量;(2)画出解释变量和响

应变量的散点图,观察它们之间的关系(如是否存在线性关系等);(3)确定经验回归方程的类型(如我们观察到数据呈线性关系,则选用线性经验回归方程);(4)按一定规则(如最小二乘法)估计经验回归方程中的参数;(5)得出结果后分析残差图是否有异常(如个别数据对应残差过

大,残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等.【例5】(2023秋·四川雅安·高二期末)某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.商店名称ABCDE

销售额x(千万元)35679利润额y(千万元)23345(1)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x的回归直线方程.(参考公式𝑏̂=∑𝑥𝑖𝑦𝑖−𝑛⋅𝑥⋅𝑦𝑛𝑖=1∑𝑥𝑖2−𝑛⋅𝑥2𝑛𝑖=1,𝑎̂=𝑦−𝑏

̂𝑥)(2)若该公司计划再开一个店想达到预期利润为8百万,请预估销售额需要达到多少?【解题思路】(1)根据已知条件,结合最小二乘法和回归直线方程的公式,即可求解.(2)将𝑦̂=0.8代入回归直线方程中,即可求解.【解答过程

】(1)由表中的数据可得,𝑥=15×(3+5+6+7+9)=6,𝑦=15×(2+3+3+4+5)=3.4,𝑏̂=∑𝑥𝑖𝑦𝑖−5⋅𝑥⋅𝑦5𝑖=1∑𝑥𝑖2−5⋅𝑥25𝑖=1=112−5×6×3.4200−5×62=0.5,

𝑎̂=3.4−0.5×6=0.4,故利润额y对销售额x的回归直线方程为𝑦̂=0.5𝑥+0.4.(2)∵该公司计划再开一个店想达到预期利润为8百万,即0.8千万,∴0.8=0.5𝑥+0.4,解得𝑥=0.8

,故预计销售额需要达到8百万.【变式5-1】(2023·全国·模拟预测)目前手机已经成为人们生活中的必需品,国内市场已经进入成熟期,下表是2016—2021年某市手机总体出货量(单位:万部)统计表.年份2016年2017年2018年2019年2020年

2021年年份代码𝑥123456手机总体出货量𝑦/万部5.64.94.13.93.23.5(1)已知该市手机总体出货量y与年份代码x之间可用线性回归模型拟合,求y关于x的线性回归方程(系数精确到0.01);(2)预测2022年该市手机总体出货量

.附:线性回归方程𝑦̂=𝑎̂+𝑏̂𝑥中斜率与截距的最小二乘估计公式分别为𝑏̂=∑(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)𝑛𝑖=1∑(𝑥𝑖−𝑥)2𝑛𝑖=1,𝑎̂=𝑦−𝑏̂𝑥.【解题思路】(1)根据题中所给数据,利用最小二乘法求出𝑎̂,𝑏

̂,即可得解;(2)将𝑥=7代入(1)中回归方程,即可得解.【解答过程】(1)由题中统计表得𝑥=16×(1+2+3+4+5+6)=3.5,𝑦̅=16×(5.6+4.9+4.1+3.9+3.2+3.5)=4.2,所以∑(𝑥𝑖−𝑥̅)(𝑦𝑖−𝑦̅)6𝑖=1=−2.5

×1.4−1.5×0.7−0.5×(−0.1)+0.5×(−0.3)+1.5×(−1)+2.5×(−0.7)=−7.9,∑(𝑥𝑖−𝑥̅)26𝑖=1=6.25+2.25+0.25+0.25+2.

25+6.25=17.5,则𝑏̂=∑(𝑥𝑖−𝑥̅)(𝑦𝑖−𝑦̅)6𝑖=1∑(𝑥𝑖−𝑥̅)26𝑖=1=−7.917.5≈−0.451,𝑎̂=𝑦̅−𝑏̂𝑥̅≈4.2−(−0.451)×3.5≈5.78,所以y关于x的线性回归方程为𝑦̂=−0.45𝑥+5.78;(2

)由题意得2022年对应的年份代码𝑥=7,代入𝑦̂=−0.45𝑥+5.78,得𝑦̂=2.63,所以预测2022年该市手机总体出货量为2.63万部.【变式5-2】(2023秋·四川成都·高二期末)

某工厂统计2022年销售网点数量与售卖出的产品件数的数据如下表:销售网点数x(单位:个)1719202123售卖出的产品件数y(单位:万件)2122252730假定该工厂销售网点的个数与售卖出的产品件数呈线

性相关关系,(1)求2022年售卖出的产品件数y(单位:万件)关于销售网点数x(单位:个)的线性回归方程;(2)根据(1)中求出的线性回归方程,预测2022年该工厂建立40个销售网点时售卖出的产品件数

.参考公式:𝑏̂=∑(𝑥𝑖−𝑥̅)𝑛𝑖=1(𝑦𝑖−𝑦̅)∑(𝑥𝑖−𝑥̅)2𝑛𝑖=1=∑𝑥𝑖𝑛𝑖=1𝑦𝑖−𝑛𝑥̅𝑦̅∑𝑥𝑖2𝑛𝑖=1−𝑛𝑥̅2,𝑎̂=𝑦̅−𝑏̂

𝑥̅.【解题思路】(1)由参考公式可算出销售网点数x(单位:个)的线性回归方程;(2)将𝑥=40代入由(1)算得的回归方程可得答案.【解答过程】(1)由题,可得𝑥=17+19+20+21+235=20,𝑦=21+22+

25+27+305=25,∑𝑥𝑖𝑦𝑖5𝑖=1=17×21+19×22+20×25+21×27+23×30=2532,∑𝑥𝑖25𝑖=1=172+192+202+212+232=2020.则𝑏̂=2532−5×20×252020−5×202=3220=1.6,𝑎̂=25−

20×1.6=−7.故回归方程为:𝑦̂=1.6𝑥−7.(2)将𝑥=40代入回归方程,则𝑦̂=64−7=57.故2022年该工厂建立40个销售网点时售卖出的产品件数约57万件.【变式5-3】(2023·山东·模拟预测)我国5G技术给直播行业带来了很多发展空间,加上

受疫情影响,直播这种成本较低的获客渠道备受商家青睐,某商场统计了2022年1~5月某商品的线上月销售量y(单位:千件)与售价x(单位:元/件)的情况如下表示.月份12345售价x(元/件)6056585754月销售量y(千

件)597109(1)求相关系数𝑟,并说明是否可以用线性回归模型拟合𝑦与𝑥的关系(当|𝑟|∈[0.75,1]时,可以认为两个变量有很强的线性相关性;否则,没有很强的线性相关性)(精确到0.01);(2)建立𝑦关于𝑥的线性回归方程,并

估计当售价为55元/件时,该商品的线上月销售量估计为多少千件?(3)若每件商品的购进价格为(0.5𝑥+25)元/件,如果不考虑其他费用,由(2)中结论,当商品售价为多少时,可使得该商品的月利润最大?(该结果保留整数

)参考公式:对于一组数据(𝑥𝑖,𝑦𝑖)(𝑖=1,2,3,⋯,𝑛),相关系数𝑟=∑(𝑥𝑖−𝑥̅)𝑛𝑖=1(𝑦𝑖−𝑦̅)√∑(𝑥𝑖−𝑥̅)2𝑛𝑖=1√∑(𝑦𝑖−𝑦̅)2𝑛𝑖=1,其回归直线𝑦̂=𝑏̂𝑥+𝑎̂的斜率和截距的

最小二乘估计分别为:𝑏̂=∑(𝑥𝑖−𝑥̅)𝑛𝑖=1(𝑦𝑖−𝑦̅)∑(𝑥𝑖−𝑥̅)2𝑛𝑖=1,𝑎̂=𝑦̅−𝑏̂𝑥̅.参考数据:√5≈2.236.【解题思路】(1)根据数据计算𝑥̅,𝑦

̅,从而分别代入计算出√∑(𝑥𝑖−𝑥̅)25𝑖=1,√∑(𝑦𝑖−𝑦̅)25𝑖=1,∑(𝑥𝑖−𝑥̅)5𝑖=1(𝑦𝑖−𝑦̅),由公式计算相关系数𝑟并判断相关性;(2)代入公式求解𝑏̂,𝑎̂,从而写出回归方

程,再代入𝑥=55,计算𝑦̂;(3)设每月的利润为𝑍元,写出𝑍关于𝑥的函数解析式,根据二次函数的性质,求解对称轴即可.【解答过程】(1)由已知数据可得𝑥̅=60+56+58+57+545=57,𝑦̅=5+9+7+10+95=8,√∑(𝑥𝑖−𝑥̅)25𝑖=1=√32+

(−1)2+12+02+(−3)2=2√5,√∑(𝑦𝑖−𝑦̅)25𝑖=1=√(−3)2+12+(−1)2+22+12=4,∑(𝑥𝑖−𝑥̅)5𝑖=1(𝑦𝑖−𝑦̅)=3×(−3)+(−1)×1+

1×(−1)+0×2+(−3)×1=−14,所以相关系数=∑(𝑥𝑖−𝑥̅)5𝑖=1(𝑦𝑖−𝑦̅)√∑(𝑥𝑖−𝑥̅)25𝑖=1√∑(𝑦𝑖−𝑦̅)25𝑖=1=−142√5×4≈−0.78,因为|𝑟|>0.75

,所以𝑦与𝑥有很强的线性相关性,可以用线性回归模型拟合.(2)由于𝑏̂=∑(𝑥𝑖−𝑥̅)5𝑖=1(𝑦𝑖−𝑦̅)∑(𝑥𝑖−𝑥̅)25𝑖=1=−1420=−0.7,𝑎̂=𝑦

̅−𝑏̂𝑥̅=8−(−0.7)×57=47.9,所以𝑦关于𝑥的线性回归方程为𝑦̂=−0.7𝑥+47.9,当𝑥=55时,𝑦̂=−0.7×55+47.9=9.4,故当售价为𝑥=55元/件时,该商品的线上月销售量估计为9.4千件.(3)设每月的利润为𝑍元,则

𝑍=1000(𝑥−0.5𝑥−25)(−0.7𝑥+47.9)=50(−7𝑥2+829𝑥−23950),当𝑥=82914≈59时,Z取得最大值.即当商品售价为59元/件时,可使得该商品的月利润最大.

【题型6非线性经验回归方程的求法】【方法点拨】(1)作散点图确定曲线模型:曲线所对应的函数种类繁多,这就要求我们充分想象,大胆猜测拟合函数类型,粗略估计使用哪个函数拟合.(2)非线性转化为线性:先通过适当变换化非线性关系为线性关系,然后按照线性检验回归方程的求解

步骤进行求解.(3)分析模型的拟合效果,得出结论.【例6】(2023·陕西西安·统考一模)为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下:天数x123456繁殖个数y36132545100(1)判断𝑦̂=𝑏̂𝑥+𝑎̂(𝑎̂,𝑏̂为常数)与𝑦̂=𝑐̂1

e𝑐̂2𝑥(𝑐̂1,𝑐̂2为常数,且𝑐̂1>0,𝑐̂2≠0)哪一个适宜作为繁殖个数y关于天数x变化的回归方程类型?(给出判断即可,不必说明理由)(2)对于非线性回归方程𝑦̂=𝑐̂1e𝑐̂2𝑥(𝑐̂1,𝑐̂2为常数,且𝑐̂1>0

,𝑐̂2≠0),令𝑧=ln𝑦,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值,𝑥𝑦𝑧∑(𝑥𝑖−𝑥̅)26𝑖=1∑(𝑥𝑖−𝑥̅)6𝑖=1(𝑦𝑖−𝑦̅)∑(𝑥𝑖−𝑥̅)6𝑖=1(𝑧𝑖−𝑧̅)

3.50322.8517.530712.12(ⅰ)证明:对于非线性回归方程𝑦̂=𝑐̂1e𝑐̂2𝑥,令𝑧=ln𝑦,可以得到繁殖个数的对数z关于天数x具有线性关系(即𝑧̂=𝛽̂𝑥+𝛼̂,𝛽̂,𝛼̂为常数);(ⅱ)根据(ⅰ)的判断结果及表中数据,建立y关于x的回归方

程(系数保留2位小数).附:对于一组数据(𝑢1,𝑣1),(𝑢2,𝑣2),⋯,(𝑢𝑛,𝑣𝑛)其回归直线方程𝑣̂=𝛽̂𝑢+𝛼̂的斜率和截距的最小二乘估计分别为𝛽̂=∑𝑢𝑖𝑛𝑖

=1𝑣𝑖−𝑛𝑢𝑣∑𝑢𝑖2𝑛𝑖=1−𝑛𝑢2,𝛼̂=𝑣−𝛽̂𝑢.【解题思路】(1)根据给定数据作出散点图,再借助散点图即可判断作答.(2)(ⅰ)由(1)选定的回归方程类型,取对数即可得关于x的直线方程作

答;(ⅱ)由(ⅰ)的结果,利用最小二乘法求解作答.【解答过程】(1)作出繁殖个数y关于天数x变化的散点图,如图,观察散点图知,样本点分布在一条指数型曲线周围,所以𝑦^=𝑐^1e𝑐^2𝑥更适宜作为繁殖个数y关于天数x变化的回归方程类型.(2)(ⅰ)由(1)知,𝑦

̂=𝑐̂1e𝑐̂2𝑥(𝑐̂1,𝑐̂2为常数,且𝑐̂1>0,𝑐̂2≠0),又𝑧=ln𝑦,因此ln𝑦̂=ln(𝑐̂1e𝑐̂2𝑥)=ln𝑐̂1+lne𝑐̂2𝑥=ln𝑐̂1+𝑐̂2𝑥,令𝛼̂=ln𝑐̂1,𝛽̂

=𝑐̂2,即有𝑧̂=𝛽̂𝑥+𝛼̂,𝛽̂,𝛼̂为常数,所以繁殖个数的对数z关于天数x具有线性关系.(ⅱ)𝑥=3.50,𝑧=2.85,由(ⅰ)知,𝑐^2=𝛽^=∑⬚6𝑖=1𝑥𝑖𝑧𝑖−6𝑥𝑧

∑⬚6𝑖=1𝑥𝑖2−6𝑥2=∑⬚6𝑖=1(𝑥𝑖−𝑥)(𝑧𝑖−𝑧)∑⬚6𝑖=1(𝑥𝑖−𝑥)2=12.1217.5≈0.69,ln𝑐̂1=𝛼̂=𝑧−𝛽̂𝑥=2.85−0.69×3.50≈0.44,因此𝑧̂=0.69𝑥+

0.44,所以y关于x的回归方程为𝑦̂=e0.69𝑥+0.44.【变式6-1】(2023·云南·高三阶段练习)近年来,云南省保山市龙陵县紧紧围绕打造“中国石斛之乡”的发展定位,大力发展石斛产业,该产业带动龙陵县近四分之一人口脱贫致富.2

022年8月,龙陵紫皮石斛获国家地理标志运用促进工程重点项目,并被评为优秀等次.在政府的大力扶持下,龙陵紫皮石斛产量逐年增长,2017年底到2022年底龙陵县石斛产量统计如下及散点图如图.年份201720182019202020212022年份代码x123456紫皮石斛

产量y(吨)320034003600420075009000(1)根据散点图判断,𝑦=𝑎𝑥+𝑏与𝑦=𝑐e𝑑𝑥(a,b,c,d均为常数)哪一个更适合作为龙陵县紫皮石斛产量y关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)(2)经计算得下表中数据,根据(1)中结果,求出y关

于x的回归方程;𝑥𝑦𝑢∑(𝑥𝑖−𝑥̅)26𝑖=1∑(𝑥𝑖−𝑥̅)6𝑖=1(𝑦𝑖−𝑦̅)∑(𝑥𝑖−𝑥̅)6𝑖=1(𝑢𝑖−𝑢̅)3.551508.4617.5209503.85其中𝑢=ln𝑦,𝑢𝑖=

ln𝑦𝑖(𝑖=1,2,3,4,5,6).(3)龙陵县计划到2025年底实现紫皮石斛年产量达1.5万吨,根据(2)所求得的回归方程,预测该目标是否能完成?(参考数据:e9.45≈12708,e9.67≈15835)

附:𝑏̂=∑(𝑥𝑖−𝑥̅)𝑛𝑖=1(𝑦𝑖−𝑦̅)∑(𝑥𝑖−𝑥̅)2𝑛𝑖=1,𝑎̂=𝑦̅−𝑏̂𝑥̅.【解题思路】(1)根据判断即可;(2)根据表中数据和参考数据,利用公

式求解即可;(3)根据(2)中所得的回归方程即可预测到2025年底该目标值,从而即可判断.【解答过程】(1)由散点图可知,𝑦=𝑐e𝑑𝑥更适合作为龙陵县紫皮石斛产量y关于年份代码x的回归方程类型.(2)对𝑦=𝑐e𝑑𝑥两边取自然对数,得ln𝑦=ln𝑐+𝑑𝑥.令𝑢=ln𝑦,

𝑣=ln𝑐,所以𝑢=𝑣+𝑑𝑥.因为𝑥̅=3.5,𝑢̅=8.46,∑(𝑥𝑖−𝑥̅)26𝑖=1=17.5,∑(𝑥𝑖−𝑥̅)6𝑖=1(𝑢𝑖−𝑢̅)=3.85,所以𝑑̂=∑(𝑥𝑖−𝑥̅)6𝑖=1(𝑢𝑖−𝑢̅)∑(𝑥𝑖−𝑥̅)26𝑖=

1=3.8517.5=0.22.所以𝑣̂=𝑢̅−𝑑̂𝑥̅=8.46−0.22×3.5=7.69,所以𝑢̂=0.22𝑥+7.69.所以龙陵县紫皮石斛产量y关于年份代码x的回归方程为𝑦̂=e0.22𝑥+7.69.(3)当𝑥=9时,𝑦̂=e0.22

×9+7.69=e9.67≈15835>15000,故预测该目标可以完成.【变式6-2】(2023·江西抚州·高三开学考试)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018—2022

年中国车载音乐市场规模(单位:十亿元),其中年份2018—2022对应的代码分别为1—5.年份代码x12345车载音乐市场规模y2.83.97.312.017.0(1)由上表数据知,可用指数函数模型𝑦=𝑎⋅𝑏𝑥拟合y与x的关系,请建立

y关于x的回归方程(a,b的值精确到0.1);(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把𝑏−1.3作为2023年与2024年这

两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.参考数据:𝑣̅∑𝑥𝑖𝑣𝑖5𝑖=1e0.524e0.4721.9433.821.71.6其中𝑣𝑖=ln�

�𝑖,𝑣̅=15∑𝑣𝑖5𝑖=1.参考公式:对于一组数据(𝑢1,𝑣1),(𝑢2,𝑣2),…,(𝑢𝑛,𝑣𝑛),其回归直线𝑣̂=𝛼̂+𝛽̂𝑢的斜率和截距的最小二乘估计公式分别为𝛽̂=∑𝑢𝑖𝑣𝑖−𝑛𝑢𝑣𝑛𝑖=1∑𝑢𝑖2−𝑛

𝑢2𝑛𝑖=1,𝛼̂=𝑣−𝛽̂𝑢.【解题思路】(1)由𝑦=𝑎⋅𝑏𝑥得ln𝑦=ln𝑎+𝑥ln𝑏,由回归直线的斜率和截距的最小二乘估计公式求得ln𝑎̂=0.524,ln𝑏̂=0.472,从而求得y关于x的回归方程.(2)两年的年平均增长

率为0.3,故2024年的中国车载音乐市场规模为1.7(1+0.3)2【解答过程】(1)因为𝑦=𝑎⋅𝑏𝑥,所以两边同时取常用对数,得ln𝑦=ln𝑎+𝑥ln𝑏,设𝑣=ln𝑦,所以𝑣=ln𝑎+𝑥ln�

�,设𝛼=ln𝑎,𝛽=ln𝑏,因为𝑥̅=3,𝑣̅=1.94,所以𝛽̂=∑𝑥𝑖𝑣𝑖−5𝑥̅⋅𝑣̅5𝑖=1∑𝑥𝑖2−5𝑥̅25𝑖=1=33.82−5×3×1.9455−5×32=0.472,𝛼̂=𝑣̅−𝛽̂𝑥̅=1.94−0.472×3=0.524

,所以ln𝑎̂=0.524,ln𝑏̂=0.472所以𝑎̂=e0.524=1.7,𝑏̂=e0.472=1.6所以𝑦̂=1.7×1.6𝑥(2)由题意知2023年与2024年这两年的年平均增长率1.6−1.3=0.3,

2022年中国车载音乐市场规模为1.7,故预测2024年的中国车载音乐市场规模1.7(1+0.3)2=2.873(十亿元).【变式6-3】(2023·全国·高三专题练习)某企业为改进生产,现某产品及成本相

关数据进行统计.现收集了该产品的成本费y(单位:万元/吨)及同批次产品生产数量x(单位:吨)的20组数据.现分别用两种模型①𝑦=𝑏𝑥+𝑎,②𝑦=𝑑𝑥+𝑐进行拟合,据收集到的数据,计算得到如下值:𝑥̅𝑦̅�

�̅∑(𝑥𝑖20𝑖=1−𝑥̅)2∑(𝑡𝑖20𝑖=1−𝑡̅)2∑(𝑦𝑖−𝑦̅)(𝑥𝑖−𝑥̅)20𝑖=1∑(𝑦𝑖−𝑦̅)(𝑡𝑖−𝑡̅)20𝑖=114.5100.086650.04-4504表中𝑡𝑖=1𝑥𝑖,𝑡

̅=120∑𝑡𝑖20𝑖=1.若用𝑅2=1−∑(𝑦𝑖−𝑦̂)2𝑛𝑖=1∑(𝑦𝑖−𝑦̅)2𝑛𝑖=1刻画回归效果,得到模型①、②的𝑅2值分别为𝑅1⬚2=0.7891,𝑅2⬚2=0.9485.(1)利用𝑅

1⬚2和𝑅2⬚2比较模型①、②的拟合效果,应选择哪个模型?并说明理由;(2)根据(1)中所选择的模型,求y关于x的回归方程;并求同批次产品生产数量为25(吨)时y的预报值.附:对于一组数据(𝑥1,𝑦1),(�

�2,𝑦2),…,(𝑥𝑛,𝑦𝑛),其回归直线𝑦̂=𝑎̂+𝛽̂𝑥的斜率和截距的最小二乘法估计分别为𝛽̂=∑(𝑥𝑖−𝑥̅)(𝑦𝑖−𝑦̅)𝑛𝑖=1∑(𝑥𝑖−𝑥̅)2𝑛𝑖=1,𝑎

̂=𝑦̅−𝛽̂𝑥̅.【解题思路】(1)根据已知𝑅2⬚2>𝑅1⬚2,根据𝑅2的意义,即可得出模型②的拟合效果好,选择模型②;(2)𝑦与𝑡可用线性回归来拟合,有𝑦̂=𝑑̂𝑡+𝑐̂,求出系数𝑑̂,𝑐̂,得到

回归方程𝑦̂=100𝑡+2,即可得到成本费𝑦与同批次产品生产数量𝑥的回归方程为𝑦̂=100𝑥+2,代入𝑥=25,即可求出结果.【解答过程】(1)应该选择模型②.由题意可知,𝑅2⬚2>𝑅1⬚2,则模型②中样本数据的残差平方和∑(�

�𝑖−𝑦̂)2𝑛𝑖=1比模型①中样本数据的残差平方和小,即模型②拟合效果好.(2)由已知𝑡=1𝑥,成本费𝑦与𝑡可用线性回归来拟合,有𝑦̂=𝑑̂𝑡+𝑐̂.由已知可得,𝑑^=∑(𝑦𝑖−𝑦)20𝑖=1(𝑡𝑖−𝑡)∑⬚20𝑖=1(𝑡�

�−𝑡)2=40.04=100,所以𝑐̂=𝑦̅−𝑑̂𝑡̅=10−100×0.08=2,则𝑦关于𝑡的线性回归方程为𝑦̂=100𝑡+2.成本费𝑦与同批次产品生产数量𝑥的回归方程为𝑦̂=

100𝑥+2,当𝑥=25(吨)时,𝑦̂=10025+2=6(万元/吨).所以,同批次产品生产数量为25(吨)时y的预报值为6万元/吨.

小赞的店铺
小赞的店铺
天天写文档,写文档,文档
  • 文档 244974
  • 被下载 21
  • 被收藏 0
相关资源
若发现您的权益受到侵害,请立即联系客服,我们会尽快为您处理。侵权客服QQ:12345678 电话:400-000-0000 (支持时间:9:00-17:00) 公众号
Powered by 太赞文库
×
确认删除?