【文档说明】2023-2024学年高中数学人教A版2019 选择性必修第三册课后习题 第八章 8-2-1 一元线性回归模型 8-2-2 一元线性回归模型参数的最小二乘估计 Word版含答案.docx,共(13)页,370.934 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-e1c5ea3364256f96ff430caa35f04db6.html
以下为本文档部分文字说明:
8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2一元线性回归模型参数的最小二乘估计A级必备知识基础练1.为了研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据,并分析可得经验回归方程为𝑦^=0.85x-0.25.由以
上信息,得到下表中c的值为()天数x/天34567繁殖个数y/千个2.5344.5cA.5B.6C.7D.82.红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观测数据,用4种模型分别进行拟
合.由此得到相应的回归方程并进行残差分析,进一步得到如图4幅残差图,根据残差图,拟合效果最好的模型是()A.模型一B.模型二C.模型三D.模型四3.某咖啡厅为了解热饮的销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:
气温/℃181310-1销售量/杯24343864由表中数据分析,可得经验回归方程𝑦^=-2x+a.当气温为-4℃时,预测销售量约为()A.68杯B.66杯C.72杯D.77杯4.关于残差图的描述错误的是()A.残差图的横坐标可以
是样本编号B.残差图的横坐标也可以是解释变量或响应变量C.残差分布的带状区域的宽度越窄R2越小D.残差分布的带状区域的宽度越窄残差平方和越小5.由一组观测数据(x1,y1),(x2,y2),…,(xn,y
n),经分析可得经验回归方程为y^=3x+𝑎^,若𝑥=1.5,𝑦=2,则𝑎^=.6.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元88.28.48.
68.89销量y/件908483807568(1)求销量y关于单价x的经验回归方程𝑦^=b^x+𝑎^,其中𝑏^=-20,𝑎^=𝑦−𝑏^𝑥;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元
?(利润=销售收入-成本)7.在一段时间内,某网店一种商品的销售价格x(单位:元)和日销售量y(单位:件)之间的一组数据如下表:价格x/元2220181614日销售量y/件3741435056求出y关
于x的经验回归方程,并用R2说明拟合效果.参考数据:∑𝑖=15xiyi=3992,∑i=15𝑥𝑖2=1660.B级关键能力提升练8.研究表明蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了
y关于x的经验回归方程𝑦^=0.25x+k,则下列说法不正确的是()x/(次数/分钟)2030405060y/℃2527.52932.536A.k的值是20B.变量x,y正相关C.若x的值增加1,则y
的值约增加0.25D.当蟋蟀52次/分钟鸣叫时,该地当时的气温预测值为33.5℃9.(多选题)下列说法正确的是()A.经验回归直线一定经过点(𝑥,𝑦)B.若两个具有线性相关关系的变量的相关程度越强,则样本相关系数r的值越接近于1C.在残差图中,
残差点分布的水平带状区域越窄,说明模型的拟合精度越高D.在线性回归模型中,决定系数R2越接近于1,说明回归模型的拟合效果越好10.(2022甘肃兰州期末)某研究所为了研究近几年留学生回国人数的情况,对2017至2021年留学生回国人数进行了统计,数据如表:年份2017201
8201920202021年份代码12345留学生回国人数/万36.540.943.348.151.9根据上述统计数据求得留学生回国人数y(单位:万)与年份代码x满足的经验回归方程为𝑦^=b^x+32.74,利用经验回归方程预测2022年留学生回国人数为()A.
63.14万B.64.72万C.66.81万D.55.54万11.已知蝗虫的产卵量y与温度x的关系可以用模型y=c1e𝑐2𝑥拟合,设z=lny,其变换后得到一组数据:x2023252730z22.4334.6由上表可得经验回归方程z=0
.2x+a,则c1=()A.-2B.e-2C.3D.e312.某工厂为研究某种产品产量x(单位:吨)与所需某种原材料y(单位:吨)的相关关系,在生产过程中收集了4组对应数据(x,y)如下表所示:x3456y2.534m根据表中数据,得
出y关于x的经验回归方程为𝑦^=0.7x+a.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为.13.某品牌服装专卖店为了解保暖衬衣的销售量y(单位:件)与平均气温x(单位:℃)之间的关系,随
机统计了连续四旬的销售量与当旬平均气温,其数据如下表:时间二月上旬二月中旬二月下旬三月上旬旬平均气温x/℃381217旬销售量y/件55m3324由表中数据算出经验回归方程𝑦^=b^x+𝑎^中的𝑏^=-2,𝑥=10,𝑦=38.(1)表
中数据m=.(2)气象部门预测三月中旬的平均气温约为22℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为件.14.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰
.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:年龄x23456患病人数y2222171410(1)求y关于x的经验回归方程;(2)计算样本相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强?(若|r|∈[0.75,1]
,则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.25],则x,y相关性较弱)参考数据:√30≈5.477.参考公式:𝑏^=∑i=1n(𝑥𝑖-𝑥)(𝑦𝑖-𝑦)∑𝑖=1𝑛(𝑥𝑖-𝑥)2=∑𝑖=1𝑛𝑥𝑖𝑦𝑖-𝑛𝑥𝑦∑
𝑖=1𝑛𝑥𝑖2-𝑛𝑥2,样本相关系数r=∑𝑖=1𝑛(𝑥𝑖-𝑥)(𝑦𝑖-𝑦)√∑𝑖=1𝑛(𝑥𝑖-𝑥)2·∑𝑖=1𝑛(𝑦𝑖-𝑦)2.15.为了防控疫情,某医疗科研团队攻坚克难研发出一种新型防疫产品,该产品的成本由原料成本及非原料成本组成,每件产品的非
原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,根据已经生产的统计数据,绘制了如右的散点图:观察散点图,两个变量不具有线性相关关系,现考虑用函数y=a+𝑏𝑥对两个变量的关系进行拟合.参考数据如下其中ui=1𝑥𝑖:uu2∑i=16ui2∑i=16yi∑i=16yi2∑
i=16uiyi√0.4834×5252.440.410.16811.49230620858.44173.850.39(1)求y关于x的经验回归方程,并求y关于u的样本相关系数(精确到0.01);(2)该产品采取订单生产模式(根据订单数量进行生产,即产品全部售出
).根据市场调研数据,若该产品单价定为80元,则签订9千件订单的概率为0.7,签订10千件订单的概率为0.3;若单价定为70元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为30
元,根据(1)的结果,要想获得更高利润,产品单价应选择80元还是70元?请说明理由.参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程v=α+βu的斜率和截距的最小二乘估计分别为𝛽^=∑i=1n𝑢𝑖�
�𝑖-𝑛𝑢𝑣∑𝑖=1𝑛𝑢𝑖2-𝑛𝑢2,𝛼^=𝑣−𝛽^𝑢,相关系数r=∑𝑖=1𝑛𝑢𝑖𝑣𝑖-𝑛𝑢𝑣√(∑𝑖=1𝑛𝑢𝑖2-𝑛𝑢2)(∑𝑖=1𝑛𝑣𝑖2-𝑛𝑣2).C级学科素养创新练16.某市某小区2020年11月
至2021年11月期间的在售二手房均价(单位:万元/平方米)的散点图如图所示.(图中月份代码1~13分别对应2020年11月~2021年11月)根据散点图选择y=a+b√𝑥和y=c+dlnx两个模型进行拟合,经过数据处理得到两个经验回归
方程分别为𝑦^=0.9369+0.0285√x和𝑦^=0.9554+0.0306lnx,并得到以下一些统计量的值:类型y^=0.9369+0.0285√xy^=0.9554+0.0306lnx∑i=113(yi-y^i)20
.0005910.000164∑i=113(yi-y)20.006050(1)请利用R2判断哪个模型的拟合效果更好.(2)某位购房者拟于2022年4月购买这个小区m(70≤m≤160)平方米的二手房(欲购房为其家庭首套房).若购房时该小区所有住房的房产证均已满2年但未满5年,请你利用(1)中拟
合效果更好的模型解决以下问题:①估算该购房者应支付的购房金额;(购房金额=房款+税费,房屋均价精确到0.001万元/平方米)②若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精
确到1平方米)附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格=房款)进行征收的.房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为1%;首套面积90平方米以上且140平方米以内(含140平方米)为1.
5%;首套面积140平方米以上或非首套为3%.参考数据:ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,√2≈1.41,√3≈1.73,√17≈4.12,√19≈4.36.参考公式:R2=1-∑𝑖
=1𝑛(yi-y^𝑖)2∑𝑖=1𝑛(𝑦𝑖-𝑦)2.8.2.1一元线性回归模型8.2.2一元线性回归模型参数的最小二乘估计1.B∵𝑥=3+4+5+6+75=5,且(𝑥,𝑦)在经验回归直线上,∴𝑦
=0.85𝑥-0.25=0.85×5-0.25=4.∴2.5+3+4+4.5+c=4×5=20,解得c=6.故选B.2.D当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越
窄,说明拟合效果越好,对比4个残差图,可知模型四的图对应的带状区域的宽度最窄.3.A∵𝑥=18+13+10-14=10,𝑦=24+34+38+644=40,又(𝑥,𝑦)在经验回归直线上,∴𝑦=-2𝑥+a,即a=40+2×10=60.∴经验回归方程为𝑦^=-2x+6
0.∴当x=-4时,y^=68.故选A.4.C残差分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时R2的值越大,故描述错误的是选项C.5.-2.5因为𝑥=1.5,𝑦=2,经验回归方程为𝑦^=3x+a^,所以2=3×1.5+𝑎^,解得𝑎^
=-2.5.6.解(1)因为𝑥=16×(8+8.2+8.4+8.6+8.8+9)=8.5,𝑦=16×(90+84+83+80+75+68)=80.所以𝑎^=𝑦−𝑏^𝑥=80+20×8.5=250.所以经验回归方程为𝑦^=-20x+250.(2)设工厂获得的利润为L(单位:
元),依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(𝑥-334)2+361.25.当且仅当x=334=8.25时,L取得最大值.故当单价定为8.25元时
,工厂可获得最大利润.7.解作出散点图(图略),观察散点图可知这些点散布在一条直线的附近,故可知x与y线性相关.因为𝑥=22+20+18+16+145=18,𝑦=37+41+43+50+565=45.4.所以𝑏^=∑𝑖=15(𝑥𝑖-𝑥)(𝑦𝑖-𝑦
)∑𝑖=15(𝑥𝑖-𝑥)2=∑𝑖=15𝑥𝑖𝑦𝑖-5𝑥𝑦∑𝑖=15𝑥𝑖2-5𝑥2=3992-5×18×45.41660-5×182=-2.35,𝑎^=45.4-(-2.35)×18=87.7.所以经验回归方
程为𝑦^=-2.35x+87.7.yi-𝑦^𝑖与yi-𝑦的值如下表:yi-y^i10.3-2.4-0.11.2yi-y-8.4-4.4-2.44.610.6计算得∑𝑖=15(yi-y^𝑖)2=8.3,∑𝑖=15(yi-𝑦)2=22
9.2,所以R2=1-8.3229.2≈0.964.因为0.964很接近于1,所以该模型的拟合效果比较好.8.D由题意,得𝑥=15×(20+30+40+50+60)=40,𝑦=15×(25+27.5+29+32.5+36)=30,则k=𝑦-0.25𝑥=3
0-0.25×40=20,故A正确;由经验回归方程可知,𝑏^=0.25>0,变量x,y呈正相关关系,故B正确;若x的值增加1,则y的值约增加0.25,故C正确;当x=52时,𝑦^=0.25×52+20=33(℃),故D错误.9.ACD对于选
项A,因为经验回归直线一定经过点(𝑥,𝑦),故选项A正确;对于选项B,由样本相关系数的绝对值越趋近于1,相关程度越强可知,若两个变量负线性相关,其线性相关程度越强,则样本相关系数r的值越接近于-1,故选项B错误;对于选项C,因为在残差图中,残差点分布的水平带状区域越
窄,说明模型的拟合精度越高,故选项C正确;对于选项D,因为在线性回归模型中,决定系数R2越接近于1,说明线性回归模型的拟合效果越好,故选项D正确.10.D由表中数据可得,𝑥=1+2+3+4+55=3,𝑦=36.5+40.9+43.3+48.1+51.95=44.14,∵留学生回国人数y(单位
:万)与年份代码x满足的线性回归方程为𝑦^=b^x+32.74,∴44.14=𝑏^×3+32.74,解得𝑏^=3.8,故𝑦^=3.8x+32.74,2022年对应的年份代码为6,令x=6,则𝑦^=3.8×6+32.74=55.5
4,故预测2022年留学生回国人数为55.54万.故选D.11.B由已知可得,𝑥=15×(20+23+25+27+30)=25,𝑧=15×(2+2.4+3+3+4.6)=3,代入z=0.2x+a,得a=3-0.2×25=-2,z=lny=ln(c1e
𝑐2𝑥)=c2x+lnc1,则lnc1=-2,即c1=e-2.12.4.5由在样本(4,3)处的残差为-0.15,可得𝑦^=3.15.故3.15=0.7×4+a,解得a=0.35.由题意可知产量x的
平均值为x=14×(3+4+5+6)=4.5.因为经验回归直线过点(x,y),所以y=0.7x+0.35=0.7×4.5+0.35=3.5.又因为y=14(9.5+m),所以m=4.5.13.(1)40(2)14(1)由y=14(55+m+33+24)=38,解得m=40.(2)由a^=
𝑦−𝑏^𝑥,得𝑎^=58.故𝑦^=-2x+58.当x=22时,𝑦^=14.故三月中旬的销售量约为14件.14.解(1)由题意可得𝑥=2+3+4+5+65=4,𝑦=22+22+17+14+105=17,�
�^=∑𝑖=15(𝑥𝑖-𝑥)(𝑦𝑖-𝑦)∑𝑖=15(𝑥𝑖-𝑥)2=(-2)×5+(-1)×5+0×0+1×(-3)+2×(-7)(-2)2+(-1)2+02+12+22=-3.2,𝑎^=𝑦−𝑏^𝑥=17+3.2×4=29.8.故y关于x的经验回
归方程为𝑦^=-3.2x+29.8.(2)r=∑𝑖=1𝑛(𝑥𝑖-𝑥)(𝑦𝑖-𝑦)√∑𝑖=1𝑛(𝑥𝑖-𝑥)2·∑𝑖=1𝑛(𝑦𝑖-𝑦)2=-32√10×108=-163√30≈-0.
97,由r<0,可知x,y负相关.又因为|r|∈[0.75,1],所以x,y相关性很强.因此,可以认为该幼儿园去年春季患流感人数与年龄负相关很强.15.解(1)令u=1𝑥,则y=a+𝑏𝑥可转化为y=a+bu.因为𝑦=3066=51,所以𝑏^=∑𝑖=16𝑢𝑖𝑦𝑖-
6𝑢𝑦∑𝑖=16𝑢𝑖2-6𝑢2=173.8-6×0.41×511.492-6×0.1681=48.340.4834=100.所以𝑎^=𝑦−𝑏^𝑢=51-100×0.41=10.所以𝑦^=
10+100u.所以y关于x的经验回归方程为𝑦^=10+100𝑥.y关于u的样本相关系数为r=∑𝑖=16𝑢𝑖𝑦𝑖-6𝑢𝑦√(∑𝑖=16𝑢𝑖2-6𝑢2)(∑𝑖=16𝑦𝑖2-6𝑦2)=48.34√0.4834×5252.44=48.3450.39≈0.9
6.(2)(方法一)(ⅰ)若产品单价为80元,记企业利润为X(单位:元).当订单为9千件时,每件产品的成本为10+1009+30=(40+1009)(元),企业的利润为80-40+1009×9000=2600
00(元).当订单为10千件时,每件产品的成本为10+10010+30=50(元),企业的利润为(80-50)×10000=300000(元).所以企业利润X的分布列为X260000300000P0.70.3E(X)=260000×0.7+300000×0.3=27200
0.(ⅱ)若产品单价为70元,记企业利润为Y(单位:元).当订单为10千件时,每件产品的成本为10+10010+30=50(元),企业的利润为(70-50)×10000=200000(元).当订单为11千件时,每件产品的成本为10+10011+30=(40+1001
1)(元),企业的利润为70-40+10011×11000=230000(元).所以企业利润Y的分布列为Y200000230000P0.30.7E(Y)=200000×0.3+230000×0.7=22
1000.所以E(X)>E(Y),故企业要想获得更高利润,产品单价应选择80元.(方法二)(ⅰ)若产品单价为80元,记企业的产量为X(单位:千件),其分布列为X910P0.70.3所以E(X)=9×0.7+10×0.3=9.3,企业的利润为80-40+1009.3×9300=2720
00(元).(ⅱ)若产品单价为70元,记企业的产量为Y(单位:千件),其分布列为Y1011P0.30.7所以E(Y)=10×0.3+11×0.7=10.7,企业的利润为70-40+10010.7×10700=221000(元).因为272000>221000,所以企业要想获得更高利润,产品
单价应选择80元.16.解(1)𝑦^=0.9369+0.0285√x的R12=1-0.0005910.006050≈0.902;y^=0.9554+0.0306lnx的𝑅22=1-0.0001640.006050≈0.973.由𝑅12<𝑅22,可知模
型y=0.9554+0.0306lnx拟合的效果更好一些.(2)通过散点图确定2022年4月对应的x=18,代入(1)中拟合效果更好的模型的经验回归方程,可得𝑦^=0.9554+0.0306ln18=0.9554+0.0306×(ln2+2ln3)=0.9554
+0.0306×(0.69+2×1.10)≈1.044.故2022年4月份二手房均价的预测值为1.044万元/平方米.①设该购房者应支付的购房金额为h(单位:万元),因为税费中买方需缴纳契税,所以当70≤m≤90时,契税为计税价格的1%,故h=m×1.044×(1%+1)=
1.05444m;当90<m≤140时,契税为计税价格的1.5%,故h=m×1.044×(1.5%+1)=1.05966m;当140<m≤160时,契税为计税价格的3%,故h=m×1.044×(3%+1)=1.07532m.所以h={1.05444𝑚,70≤�
�≤90,1.05966𝑚,90<𝑚≤140,1.07532𝑚,140<𝑚≤160,所以当70≤m≤90时购房金额为1.05444m万元,当90<m≤140时购房金额为1.05966m万元,当140<m≤
160时购房金额为1.07532m万元.②设该购房者可购买该小区二手房的最大面积为t(单位:平方米),由①知,当70≤m≤90时,应支付的购房金额为1.05444t.又因为1.05444t≤1.05444×90<100,且房屋均价约为1.044万元/平方米,
所以t<100.所以90≤t<100.由1.05966t≤100,解得t≤1001.05966,且1001.05966≈94.