【文档说明】【精准解析】专题62变量间的相关关系、统计案例-(文理通用)【高考】.docx,共(36)页,1.508 MB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-8f577104d2725c24d3dcec5c7f0b0dd2.html
以下为本文档部分文字说明:
专题62变量间的相关关系、统计案例最新考纲1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验的基本思想、方
法及其初步应用.4.了解回归分析的基本思想、方法及简单应用.基础知识融会贯通1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)
线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(2)回归方程方程y^=b^x+a^是两个具有线性相关
关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参数.b^=∑ni=1xi-xyi-y∑ni=1xi-x2=∑ni=1xiyi-nxy∑ni=1x2i-nx2,a^=y-b^x.3.回归分析(1)定义:对具有相关关系的两个变
量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(x,y)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r
<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所
属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1a
ba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.重点难点突破【题型一】相关关系的判断【典型例题】两个变量
的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A.①②③B.②③①C.②①③D.①③②【解答】解:对于(1),图中的点成带状分布,且从左到右上升,是正相关关系①;对于(2),图中的点没有明显的带状分布,是不相关的③;对于(3),图中的点成
带状分布,且从左到右是下降的,是负相关关系②.故选:D.【再练一题】对两个变量x,y进行线性相关检验,得线性相关系数r1=0.7859,对两个变量u,v进行线性相关检验,得线性相关系数r2=﹣0.9568,
则下列判断正确的是()A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与
v正相关,变量u与v的线性相关性较强【解答】解:由线性相关系数r1=0.7859>0知x与y正相关,由线性相关系数r2=﹣0.9568<0知u,v负相关,又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.故选:C.思维升华判定两个变量正,
负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r>0时,正相关;r<0时,负相关.(3)线性回归方程中:b^>0时,正相关;
b^<0时,负相关.【题型二】线性回归分析【典型例题】已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如表对应数据根据表中数据可得回归方程,其中,据此估计,当投入6万元广告费时,销售额约为()x12345y1015304550A.60万元B.63万元C.65万元D.69万
元【解答】解:由表中数据,计算(1+2+3+4+5)=3,(10+15+30+45+50)=30,回归方程,其中,∴30﹣11×3=﹣3,∴11x﹣3,x=6,11×6﹣3=63,据此估计,当投入6万元广告费时,销售
额约为63万元.故选:B.【再练一题】某市食品药品监督管理局开展2019年春季校园餐饮安全检查,对本市的8所中学食堂进行了原料采购加工标准和卫生标准的检查和评分,其评分情况如表所示:中学编号12345678原料采购加工标准评分x100
95938382757066卫生标准评分y8784838281797775(1)已知x与y之间具有线性相关关系,求y关于x的线性回归方程;(精确到0.1)(2)现从8个被检查的中学食堂中任意抽取两个组成一组,若两个中学食堂的原料采购加工标准和卫生标准的评分均超过80分,则组成“
对比标兵食堂”,求该组被评为“对比标兵食堂”的概率.参考公式:,;参考数据:xiyi=54112,xi2=56168.【解答】解:(1)由题意,计算平均数得:(100+95+93+83+82+75+70+6
6)=83,(87+84+83+82+81+79+77+75)=81,则0.3,81﹣0.3×83=56.1;故所求的线性回归方程为:0.3x+56.1;(2)从8个中学食堂中任选两个,共有共28种结果:12,13,1
4,15,16,17,18,23,24,25,26,27,28,34,35,36,37,38,45,46,47,48,56,57,58,67,68,78;其中原料采购加工标准的评分和卫生标准的评分均超过80分的有10种结果:12,13,14,15,
23,24,25,34,35,45;所以该组被评为“对比标兵食堂”的概率为P.思维升华线性回归分析问题的类型及解题方法(1)求线性回归方程①利用公式,求出回归系数b^,a^.②待定系数法:利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,
求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.【题型三】独立性检验【典型例题】为便于对某知识竞赛的答卷进行对比研究,组委会抽取了1000名男生和1000名女生的答卷,他们
的考试成绩频率分布直方图如下:(注:试卷满分为100分,成绩≥80分的试卷为“优秀”等级)(Ⅰ)从现有1000名男生和1000名女生答卷中各取一份,分别求答卷成绩为“优秀”等级的概率;(Ⅱ)能否在犯错误的概率不超过0.025的前提下认为“答卷成绩为优秀等级与性别有关”?(Ⅲ
)根据男、女生成绩频率分布直方图,对他们成绩的优劣进行比较,并说明理由.P(K2≥K)0.0500.0250.0100.001K3.8415.0246.63510.828(,其中n=a+b+c+d)【解答】解:(Ⅰ)男生答卷成绩优秀概率为P=(0
.058+0.034+0.014+0.010)×5=0.58,…女生答卷成绩优秀概率为P=(0.046+0.034+0.016+0.010)×5=0.53;…(Ⅱ)根据题意填写列联表如下;男女总计优秀5805301110非
优秀420470890总计100010002000…经计算K2的观测值为,所以能在犯错误概率不超过0.025的前提下认为“问卷成绩为优秀等级与性别有关”;…(III)由频率分布直方图表明:男生成绩的平均分(或中位数)在80到85之间,女生成绩的平均分(中位数)在75到80分之间,且
男生的成绩分布集中程度较女生成绩集中程度高,因此,可以认为男生的成绩较好且稳定…【再练一题】某工厂A,B两条生产线生产同款产品,若产品按照(1)根据已知数据,判断是否有99%的把握认为一等级产品与生产线有关?
(2)分别计算两条生产线抽样产品获利的方差,以此作为判断依据,说明哪条生产线的获利更稳定?(3)估计该厂产量为2000件产品时的利润以及一等级产品的利润.附:K2P(K2≥k)0.0500.0100.001k3.8416.63510.828【
解答】解:(1)根据题意完成下面的2×2列联表:一等品非一等品合计A生产线2080100B生产线3565100合计55145200将2×2列联表中的数据代入公式计算得:K25.643,∵5.643<6.635,∴没有99%的把握认为一等级产
品与生产线有关;(2)A生产线随机抽取的100件产品获利的平均数为:(10×20+8×60+6×20)=8,获利方差为[(10﹣8)2×20+(8﹣8)2×60+(6﹣8)2×20]=1.6;B生产线随机抽取的1
00件产品获利的平均数为:(10×35+8×40+6×25)=8.2,获利方差为[(10﹣8.2)2×35+(8﹣8.2)2×40+(6﹣8.2)2×25]=2.36;所以,说明A生产线的获利更稳定;(3)A、B生产线共随机抽取的200件产品获利的平均数为:[10×(20+35)+
8×(60+40)+6×(20+25)]=8.1(元),由样本估计总体,当产量为2000件产品时,估计该工厂获利为2000×8.1=16200(元),又因为A、B生产线共随机抽取的200件产品中,一等品的A线产品有20件,B线产品有35件,由样本的频率估计总体的概率,则该工
厂生产产品为一等品的概率为,当产量为2000件产品时,估计该工厂一等品获利为200010=5500(元).思维升华(1)比较几个分类变量有关联的可能性大小的方法①通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.②通过计算|ad-bc|的大小判断:|ad-bc|越大,两变
量有关联的可能性越大.(2)独立性检验的一般步骤①根据样本数据制成2×2列联表.②根据公式K2=nad-bc2a+ba+cb+dc+d计算K2的观测值k.③比较k与临界值的大小关系,作统计推断.基础知识训练1.下列说法中错误的是()A.从某社区65户高收入家庭,280户中等收入
家庭,105户低收入家庭中选出100户调查社会购买力的某一项指标,应采用的最佳抽样方法是分层抽样B.线性回归直线ybxa=+$$$一定过样本中心点(,)xyC.若两个随机变量的线性相关性越强,则相关系数r的值越接近于1
D.若一组数据1、a、2、3的众数是2,则这组数据的中位数是2【答案】C【解析】对于选项A,由于样本的个体差异比较大,层次比较多,所以应采用的最佳抽样方法是分层抽样,所以该选项是正确的;对于选项B,线性回归直线ˆˆˆybxa=+一定过样本中心点(
),xy,所以该选项是正确的;对于选项C,两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1,所以该选项是错误的;对于选项D,若一组数据1、a、2、3的众数是2,则这组数据的中位数是2,所以该选项是正确的.故选:C2.根据如下样本
数据:x12345y1a−-10.51b+2.5得到的回归方程为ˆybxa=+.样本点的中心为(3,0.1),当x增加1个单位,则y近似()A.增加0.8个单位B.减少0.8个单位C.增加2.3个单位D.减少2.3个单位【答案】A【解析】由题得110.512.50.
1,1.55abab−−++++=+=−因为0.1=3b+a,所以解方程组得a=-2.3,b=0.8.所以ˆy=0.8x-2.3,所以当x增加1个单位,则y近似增加0.8个单位.故选:A3.某企业的一种商品的产量与单位成本数据如下表:产量x(万件)1416182022
单位成本y(元/件)12107a3若根据表中提供的数据,求出y关于x的线性回归方程为ˆ1.1528.1yx=−+,则a的值等于()A.4.5B.5C.5.5D.6【答案】B【解析】1416182022901855x++++===1210733255
aay+++++==()xy,在线性回归方程ˆ1.1528.1yx=−+上1.151828.1=7.4y\=-?则32=7.45a+解得5a=故选B4.下列说法错误..的是()A.在回归模型中,预报变量y的值不能由解释变量x唯一确定B.若变量x,y
满足关系0.11yx=−+,且变量y与z正相关,则x与z也正相关C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.以模型kxyce=去拟合一组数据时,为了求出回归方程,设lnzy=,将其变换后得到线性方程0.34zx=+,则4ce=,0.3
k=【答案】B【解析】对于A,y除了受自变量x的影响之外还受其他因素的影响,故A正确;对于B,变量x,y满足关系0.11yx=−+,则变量x与y负相关,又变量y与z正相关,则x与z负相关,故B错误;对于C,由残差图的意义可知正确;对于D,∵y=
cekx,∴两边取对数,可得lny=ln(cekx)=lnc+lnekx=lnc+kx,令z=lny,可得z=lnc+kx,∵z=0.3x+4,∴lnc=4,k=0.3,∴c=e4.即D正确;故选B.5.对具有线性相关关系的变量x,y,有一组观测数据(),(1,2,3,,12)iixyi=,其
回归直线方程为ˆˆ2yxa=+,且12312yyyy++++()12312324xxxx=++++=,则实数ˆa的值是()A.18−B.13C.23D.83−【答案】C【解析】由12312yyyy++++()12312324xxxx=++++=
知:82123x==,24212y==,又回归直线一定过样本点的中心(),xy,故2223a=+,2ˆ3a=.故选C6.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表对应数据根据表中数据可得回归方程ybˆˆˆxa=+其中ˆ11
b=据此估计,当投入6万元广告费时,销售额约为()x12345y1015304550A.60万元B.63万元C.65万元D.69万元【答案】B【解析】解:由表格数据可知:1234535x++++==,1015304550305y++++=
=因为回归方程过点(),?xy,所以ˆ0ˆ33ba=+,且ˆ11b=,得ˆ3a=−所以ˆy11x3=−,代入x=6,得ˆy63=故选:B7.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间
有如表对应数据根据表中数据可得回归方程ybxa=+$$$,其中11b=,据此估计,当投入6万元广告费时,销售额约为()万元x12345y1015304550A.60B.63C.65D.69【答案】B【解析】由表
中数据可得1(12345)35x=++++=,1(1015304550)305y=++++=,又回归方程ybxa=+$$$中11b=,∴ˆ301133aybx=−=−=−,∴回归方程为113yx=−.当6x=时116363y=−=,所以可估计当
投入6万元广告费时,销售额约为63万元.故选B.8.下列四个结论:①在回归分析模型中,残差平方和越大,说明模型的拟合效果越好;②某学校有男教师60名、女教师40名,为了解教师的体育爱好情况,在全体教师中抽取20名调查
,则宜采用的抽样方法是分层抽样;③线性相关系数r越大,两个变量的线性相关性越弱;反之,线性相关性越强;④在回归方程0.52yx=+中,当解释变量x每增加一个单位时,预报变量y增加0.5个单位.其中正确的结
论是()A.①②B.①④C.②③D.②④【答案】D【解析】根据残差的意义,可知当残差的平方和越小,模拟效果越好,所以①错误;当个体差异明显时,选用分层抽样法抽样,所以②正确;根据线性相关系数特征,当相关系数r越大,两个变量的线性相关性越强,所以③错误;根据回归方程的系数为0.5,所以当解释
变量x每增加一个单位时,预报变量y增加0.5个单位.综上,②④正确,故选D.9.鑫冠模具厂采用了新工艺后,原材料支出费用x与销售额y(单位:万元)之间有如下数据,由散点图可知,销售额y与原材料支出费用x有较好的线性相关关系,其
线性回归方程是ˆˆ48ybx=+,则当原材料支出费用为时,预估销售额为()A.252B.268C.272D.288【答案】C【解析】由题意得20,160xy==,将点(),xy代入回归方程48ybx=+$$中,得5.6b=$,回归方程为5.648yx=+$,当40x=时,272
y=$,故选C.10.已知变量x,y之间具有线性相关关系,其散点图如图所示,回归直线l的方程为ybxa=+,则下列说法正确的是()A.0a,0bB.0a,0bC.ˆ0a,0bD.ˆ0a,0b【答案】D【解析】由题图可知,回归直线的斜率是正
数,即ˆb>0;回归直线在y轴上的截距是负数,即ˆa<0,故选:D.11.已知变量x与y负相关,且由观测数据得到样本的平均数3x=,2.7y=,则由观测数据得到的回归方程可能是()A.0.23.3yx=−+B.
0.41.5yx=+C.23.3yx=−D.28.6yx=−+【答案】A【解析】解:因为变量x与y负相关,而B,C正相关,故排除选项B,C;因为回归直线方程经过样本中心,把3x=代入0.23.3yx=−+解得,0
.233.32.7yy=−+==故A成立,把3x=代入28.6yx=−+解得,238.62.6yy=−+=,故D不成立,故选:A.12.对于线性相关系数r,叙述正确的是()A.||(0,)r+,||r越大相关程度越大,反之相关程度越小B.(,)r−+,
r越大相关程度越大,反之相关程度越小C.||1r„,且||r越接近1相关程度越大,||r越接近0,相关程度越小D.以上说法都不对【答案】C【解析】用相关系数r可以衡量两个变量之间的相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关
性越强,r的绝对值接近于0时,表示两个变量之间几乎不存在相关关系,故选:C.13.如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时
间变量t的值依次为1,2,…,17)建立模型①30.413.5yt=−+;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②9917.5yt=+.利用这两个模型,该地区2018年的环境基础设施投资额的预测值分别为_____,_____;并且可以判断利用模型_____
得到的预测值更可靠.【答案】226.1(亿元)256.5(亿元)②【解析】①3.0413.519226.1y=−+=(亿元).②9917.59256.5y=+=(亿元).当年份为2016对于模型①:17t=,3.0413.517199.1y=−+=(亿元)对于模型②:7t
=,9917.57221.5y=+=(亿元)所以②的准确度较高,①偏差较大,所以选择②得到的预测值更可靠.本题正确结果:226.1(亿元);256.5(亿元);②14.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(
,)xy,22(,)xy,33(,)xy,44(,)xy,55(,)xy,根据收集到的数据可知12345150xxxxx++++=,由最小二乘法求得回归直线方程为0.6754.9yx=+,则12345yyyyy++++=______.【答案】375【解析】由题
意:12345305xxxxxx++++==则:0.6754.920.154.975yx=+=+=123455755375yyyyyy++++===本题正确结果:37515.某公司对2019年1~4
月份的获利情况进行了数据统计,如下表所示:月份x1234利润y/万元566.58利用线性回归分析思想,预测出2019年8月份的利润为11.6万元,则y关于x的线性回归方程为________.【答案】ˆ0.954yx=+.【解析】设线性回归方程为ˆˆ
ˆybxa=+,因为52x=,518y=,由题意可得551ˆ288ˆ11.6ˆˆbaba+=+=,解得ˆ0.95b=,ˆ4a=,即ˆ0.954yx=+.故答案为ˆ0.954yx=+16.某产品的广告费
用x(万元)与销售额y(万元)的统计数据如下表:根据上表可得回归方程中的为9.4,则:①回归方程__________;②据此模型预报广告费用为6万元时销售额为___________万元。【答案】【解析】∵回归方程中的为9.4,根据线性回
归直线过样本中心点,,则,解得,即回归方程为据此模型预报广告费用为6万元时,销售额为即答案为(1).(2)..17.下表是某地一家超市在2017年一月份某一周内周2到周6的时间x与每天获得的利润y(单位:万元)的有关数据.星期x星期2星期3星期4星期5星期6利润y23569(1)根据上表提供的
数据,用最小二乘法求线性回归直线方程ybxa=+;(2)估计星期日获得的利润为多少万元.参考公式:回归直线方程是:ybxa=+,()()()1122211ˆˆˆnniiiiiinniiiixxyyxynxybxxxnxaybx====−−−==−−=−
【答案】(1)1.71.8yx=−(2)星期日估计活动的利润为10.1万元【解析】(1)由题意可得2345645x++++==,2356955y++++==,因此,22334556695451.7491
62536516b++++−==++++−,所以56.81.8aybx=−=−=−,所以1.71.8yx=−;(2)由(1)可得,当7x=时,1.771.810.1y=−=(万元),即星期日估计活动的利润为10.1万元。18.现代研
究表明,体脂率BFR(体脂百分数)是衡量人体体重与健康程度的一个标准.为分析体脂率BFR对人体总胆固醇TC的影响,从女性志愿者中随机抽取12名志愿者测定其体脂率BFR值及总胆固醇TC指标值(单位:mmol/L),得到的数据如表所示:(1)利用表中的数据,是
否可用线性回归模型拟合y与x的关系?请用相关系数r加以说明.(若0.75r,则线性相关程度很高,可用线性回归模型拟合)(2)求出y与x的线性回归方程,并预测总胆固醇TC指标值为9.5时,对应的体脂率BFR值
x为多少?(上述数据均要精确到0.1)(3)医学研究表明,人体总胆固醇TC指标值y服从正态分布2()Nu,,若人体总胆固醇TC指标值y在区间(22)uu−+,之外,说明人体总胆固醇异常,该志愿者需作进一步医学观察.现用样本的y作为u的估
计值,用样本的标准差s作为的估计值,从这12名女志愿者中随机抽4人,记需作进一步医学观察的人数为X,求X的分布列和数学期望.附:参考公式:相关系数12211()()()()niiinniiiixxyyrxxyy===−−=−−,121()()ˆ()niiiniixxyybxx==−−=−
,ˆˆaybx=−.参考数据:121()()95.8iiixxyy=−−=,1221()342iixx=−=,1221()31.56iiyy=−=,12211()1.612iisyy==−,10793.521
03.89.【答案】(1)见解析;(2)见解析;(3)见解析【解析】(1)相关系数12211()()95.8=0.920.75103.89()()niiinniiiixxyyrxxyy===−−=−−所以线性相关程度很高,可用线性回归模型拟合.(2)121(
)()95.8ˆ0.3342()niiiniixxyybxx==−−==−,又1417181920222326272930312312x+++++++++++==,2.44.44.74.85.45.55.76.06.36.87.09.45.712
y+++++++++++==所以ˆˆ5.70.3231.2aybx=−=−=−,所以回归直线0.31.2yx=−,当9.5y=时,10735.73x=(3)12211()1.612iisyy==−,所以1.6=,5.7uy==
则(2,2)(2.58.9)uu−+=,,所以在这12人中,有2人是胆固醇异常,需要进一步作医学观察的.所以变量0,1,2X=41041214(0)33CPXC===,3110241216(1)33CCPXC===,22102412
31(2)3311CCPXC====所以X的分布列为X012P14331633111数学期望1612()1233113EX=+=19.近年来,随着我国汽车消费水平的提高,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车交易前的使用时间(以下简称“使用时间”)
进行统计,得到频率分布直方图如图1.附注:①对于一组数据()11,uv,()22,uv,…,(),nnuv,其回归直线vu=+的斜率和截距的最小二乘估计分别为()()()121niiiniiuuvvuu==−−=−,ˆavu=−;②参考数据:2.9519.1e,
1.755.75e,0.551.73e,0.650.52e−,1.850.16e−.(Ⅰ)记“在2017年成交的二手车中随机选取一辆,该车的使用年限在(8,16]”为事件A,试估计A的概率;(Ⅱ)根据该汽车交易市场的历史资料,得到散
点图如图2,其中x(单位:年)表示二手车的使用时间,y(单位:万元)表示相应的二手车的平均交易价格.由散点图看出,可采用abxye+=作为二手车平均交易价格y关于其使用年限x的回归方程,相关数据如下表(表中lniiYy=,1110niiYY==):xyY101iiixy=101iiix
Y=1021iix=5.58.71.9301.479.75385①根据回归方程类型及表中数据,建立y关于x的回归方程;②该汽车交易市场对使用8年以内(含8年)的二手车收取成交价格4%的佣金,对使用时间8年以上(不含8年)的二手车收取成交价格10%的佣金.在图1对使
用时间的分组中,以各组的区间中点值代表该组的各个值.若以2017年的数据作为决策依据,计算该汽车交易市场对成交的每辆车收取的平均佣金.【答案】(1)0.40(2)①3.550.3xye−=,②0.29万元【解析】解:(1)由题得,二
手车使用时间在(8,12]的频率为0.0740.28=,在(12,16]的频率为0.0340.12=,∴()0.280.120.40PA=+=;(2)①由题得,lnyabx=+,即Y关于x的线性回归方程为ˆYabx=+.∵101210211010iiiiixYxY
bxx==−==−279.75105.51.90.3385105.5−=−−,ˆ1.9(0.3)5.53.55aYbx=−=−−=,∴Y关于x的线性回归方程为ˆ3.550.3Yx=−,即Y关于x的回归方程为3.550.3xye−=;②根据①中的回归方程3.550.3xye
−=和图1,对成交的二手车可预测:使用时间在(0,4]的平均成交价格为3.550.322.9519.1ee−=,对应的频率为0.2;使用时间在(4,8]的平均成交价格为3.550.361.755.75ee=,对应的频率为0.36;使用时间在(8,12]的平均成交价格为3.5
50.3100.551.73ee−=,对应的频率为0.28;使用时间在(12,16]平均成交价格为3.550.3140.650.52ee−−=,对应的频率为0.12;使用时间在(16,20]的平均成交价格为3.550.3181.850.16ee
−−=,对应的频率为0.04.∴该汽车交易市场对于成交的每辆车可获得的平均佣金为(0.219.10.365.75)4%++(0.281.730.120.520.040.16)10%0.290920.2
9++=万元.20.已知某商品每件的生产成本x(元)与销售价格y(元)具有线性相关关系,对应数据如表所示:x(元)5678y(元)15172127(1)求出y关于x的线性回归方程ybxa=+;(
2)若该商品的月销售量z(千件)与生产成本x(元)的关系为221zx=−+,[2,10]x,根据(1)中求出的线性回归方程,预测当x为何值时,该商品的月销售额最大.附:121()()()niiiniixxyybxx==−−=−,a
ybx=−.【答案】(1)ˆ46yx=−;(2)预计当6x=时,该商品的销售额最大为162元【解析】(1)根据题意,56786.54x+++==,15172127204y+++==,41515617721827540iixy=++
+=,42222215678174ix=+++=,所以4142221454046.520417446.54iiixyxybxx−−===−−,所以2046.56aybx=−=−=−,所以y关于x的线性回归方程ˆ46yx=−.(2)依题意,销售额2()(221)(4
6)896126([2,10])fxxxxxx=−+−=−+−.其对称轴为9662(8)x=−=−,又因为()fx为开口向下的抛物线,故当6x=时()fx最大,最大值()836966126162fx=−+−=.答:预计当6x=时,该商品的销售额最大为16
2元.21.李克强总理在2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌.为了对研发的一批最新
款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据(),(1,2,,6)iixyi=,如表所示:单价x(千元)345678销量y(百件)7065625956t已知611606iiyy=
==.(1)若变量,xy具有线性相关关系,求产品销量y(百件)关于试销单价x(千元)的线性回归方程ˆˆˆybxa=+;(2)用(1)中所求的线性回归方程得到与ix对应的产品销量的估计值iy.当销售数据(),iixy对应的残差的绝对值ˆ
1iiyy−时,则将销售数据(),iixy称为一个“好数据”.现从6个销售数据中任取3个子,求“好数据”个数的分布列和数学期望()E.(参考公式:线性回归方程中ˆˆ,ba的估计值分别为1221ˆˆˆ,)niiiniixynxybaybxxnx=−=−
==−−.【答案】(1)ˆ482yx=−+(2)见解析【解析】(1)由611606iiyy===,可求得48t=,故11910niiixy==,=1980nxy,21199niix==,2=181.
5nx,代入可得122119101980704199181.517.5niiiniixynxybxnx==−−−====−−−,ˆˆ6045.582aybx=−=+=,所以所求的线性回归方程为ˆ482yx=
−+.(2)利用(1)中所求的线性回归方程ˆ482yx=−+可得,当13x=时,170y=;当24x=时,266y=;当35x=时,362y=;当46x=时,458y=;当57x=时,554y=;当68x=时,650y=.与销售数据对比可知满足||1
(1,2,,6)iiyyi−=的共有4个“好数据”:(3,70)、(4,65)、(5,62)、(6,59)于是的所有可能取值为1,2,31242361(1)5CCPC===,2142363(2)5CCPC===,3042361(3)5CCPC===,∴的分布列为:123P1
53515所以1311232555E=++=.22.李克强总理在2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号
召,大力研发新产品,争创世界名牌.为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据(,)(1,2,...,6)iixyi=,如表所示:单价x(千元)345678销量y(百件)7065625956t已知
611606iiyy===.(1)若变量x,y具有线性相关关系,求产品销量y(百件)关于试销单价x(千元)的线性回归方程ybxa=+$$$;(2)用(1)中所求的线性回归方程得到与ix对应的产品销量的估计值ˆiy.当销售数据(,)iixy对应的残差的绝对值ˆ1iiyy−时,则将销售数
据(,)iixy称为一个“好数据”.现从6个销售数据中任取3个,求“好数据”至少2个的概率.(参考公式:线性回归方程中b,a的估计值分别为1221niiiniixynxybxnx==−=−,aybx=−$$).【答案】(1)ˆ
482yx=−+;(2)45.【解析】(1)由611606iiyy===,可得:7065625956606t+++++=,解得:48t=11910niiixy==,=1980nxy,21199niix==,2=181.5nx代入可得1221191019807
04199181.517.5niiiniixynxybxnx==−−−====−−−ˆˆ6045.582aybx=−=+=线性回归方程为ˆ482yx=−+(2)利用(1)中所求的线性回归方程ˆ
482yx=−+可得:当13x=时,1ˆ70y=;当24x=时,2ˆ66y=;当35x=时,3ˆ62y=;当46x=时,4ˆ58y=;当57x=时,5ˆ54y=;当68x=时,6ˆ50y=与销售数据对比可知满足()ˆ||11,2,,6iiyyi−=的共有4个“好数据”:(3,70)、
(4,65)、(5,62)、(6,59)6个销售数据中任取3个共有:3620C=种取法其中只有1个好数据的取法有14C4=种取法至少2个好数据的概率为:441205P=−=能力提升训练1.如图是某地区2000年至2016年环境基础
设施投资额(单位:亿元)的折线图.则下列结论中表述不正确...的是()A.从2000年至2016年,该地区环境基础设施投资额逐年增加;B.2011年该地区环境基础设施的投资额比2000年至2004年的投资总额还多;C.2
012年该地区基础设施的投资额比2004年的投资额翻了两番;D.为了预测该地区2019年的环境基础设施投资额,根据2010年至2016年的数据(时间变量t的值依次为)建立了投资额y与时间变量t的线性回归模型,根据该模型预测该地区2019的环境基础设施投资额为256.5亿元
.【答案】D【解析】对于选项,由图像可知,投资额逐年增加是正确的.对于选项,投资总额为亿元,小于年的亿元,故描述正确.年的投资额为亿,翻两翻得到,故描述正确.对于选项,令代入回归直线方程得亿元,故选项
描述不正确.所以本题选D.2.某产品的广告费用x与销售额y的统计数据如表:广告费用万元1245销售额万元6142832根据上表中的数据可以求得线性回归方程中的,据此模型预报广告费用为10万元时销售额为A.万元B.万元C.万元D.万元【答案】A【解析】解:根
据表中数据,得;且回归方程过样本中心点,所以,解得,所以回归方程;当时,,即广告费用为10万元时销售额为万元.故选:A.3.在一组样本数据为不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的相关系数为()A.B.C.1D.-1【答案】D【解析】根据回归直线
方程是yx+2,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,且所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则有|r|=1,∴相关系数r=﹣1.故选:D.4.为了规定工时定额,需要确定加工某
种零件所需的时间,为此进行了5次试验,得到5组数据:()()()()()1122334455,,,,,,,,,xyxyxyxyxy,由最小二乘法求得回归直线方程为0.6754.9yx=+.若已知12345150xxxxx
++++=,则12345yyyyy++++=A.75B.155.4C.375D.466.2【答案】C【解析】由题意,可得150305x==,代入回归直线的方程,可得0.673054.ˆ975y=+,所以1234575ˆ53yyyyyy++++==,故选C。5.下列
说法中正确的个数是()①相关系数r用来衡量两个变量之间线性关系的强弱,||r越接近于1,相关性越弱;②回归直线^^^ybxa=+过样本点中心(,)xy;③相关指数2R用来刻画回归的效果,2R越小,说明模型的拟合效果越不好.A.0B.1C.2D.
3【答案】C【解析】①线性相关关系r是衡量两个变量之间线性关系强弱的量,r越接近于1,这两个变量线性相关关系越强,r越接近于0,线性相关关系越弱,故①错误;②回归直线ybxa=+过样本点中心(),xy,故②正确;③用相关指数2R来刻画回归的效果,2R越大,说明模型的拟合效果越好;2R越小,说
明模型的拟合效果越不好,故③正确.综上,说法中正确的个数是2.故选C.6.某研究机构在对具有线性相关的两个变量x和y进行统计分析时,得到如下数据:x1234y123223由表中数据求得y关于x的回归方程为0.8yxa=+,则在这些样本点中任取一点,该点落在回归直线上方的概率为()A.14B
.12C.34D.45【答案】B【解析】132312345722,4244xy++++++====751=0.8424ˆˆaa+=−,因此点3(4,3),(2,)2在回归直线上方,概率为21=42,选B.
7.混凝土具有原材料丰富、抗压强度高、耐久性好等特点,是目前使用量最大的土木建筑材料.抗压强度是混凝土质量控制的重要技术参数,也是实际工程对混凝土要求的基本指标.为了解某型号某批次混凝土的抗压强度(单位:MPa)随龄期(单位:天)的发展规律,质检部门在标准试验条件下
记录了10组混凝土试件在龄期(1,2,,10)ixi=分别为2,3,4,5,7,9,12,14,17,21时的抗压强度iy的值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.表中lniiwx=,10111
0iiww==.(1)根据散点图判断yabx=+与lnycdx=+哪一个适宜作为抗压强度y关于龄期x的回归方程类型?选择其中的一个模型,并根据表中数据,建立y关于x的回归方程;(2)工程中常把龄期为28天的混凝土试件的抗压强度28f视作混凝土抗压强度标准值.已知该型号混凝土设置的
最低抗压强度标准值为40MPa.(ⅰ)试预测该批次混凝土是否达标?(ⅱ)由于抗压强度标准值需要较长时间才能评定,早期预测在工程质量控制中具有重要的意义.经验表明,该型号混凝土第7天的抗压强度7f与第28天的抗压强度28f具有线性相关
关系2871.27ff=+,试估计在早期质量控制中,龄期为7天的试件需达到的抗压强度.附:()()()121ˆniiiniixxyybxx==−−=−,ˆˆaybx=−,参考数据:ln20.69,ln71.95.【答案】(1)9.71
0lnyx=+(2)(i)达标.(ii)估计龄期为7天的混凝土试件需达到的抗压强度为27.5MPa.【解析】解:(1)由散点图可以判断,lnycdx=+适宜作为抗压强度y关于龄期x的回归方程类型.令lnwx=,先建立y关于w的线性回归方程.由于1011021()()
55105.5()iiiiiwwyydww==−−===−,29.71029.7cydw=−=−=,所以y关于w的线性回归方程为9.710yw=+,因此y关于x的线性回归方程为9.710lnyx=+.(2)(i)由(1)知,当龄期为28天,即28x=时
,抗压强度y的预报值y=9.710ln289.710(2ln2ln7)43+=++.因为4340,所以预测该批次混凝土达标.(ii)令2871.2740ff=+,得727.5f.所以估计龄期为7天的混凝土试件需达到的抗压强度为27.5MPa.
8.某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动、活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元,若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200
万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1000名,每名用户赠送1000元的红包,为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机
碎屏险”的用户比例);(1)根据上面的数据求出y关于x的回归直线方程;(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.2%.已知更换一次该型号手机屏幕的费用为2000元,若该手机厂商要求在这
次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?x1020304050y0.790.590.380.230.01参考公式:回归方程ybxa=+中斜率和截距的最小二乘估计分别为1122ˆniiiniixynxybxnx==−=−,ˆˆaybx=−,参考数据:表中
x的5个值从左到右分别记为12345,,,,xxxxx,相应的y值分别记为12345,,,,yyyyy,经计算有51()()19.2iiixxyy=−−=−,其中5115iixx==,5115iiyy==.【答案】(1)0.01920.976yx=−+;
(2)能【解析】解:(1)由已知得300.4xy==,,()51()19.2iiixxyy=−−=−,521()1000iixx=−=,所以55121()ˆ0.0192()()iiiiibxyyxxx==−−−==−,ˆˆ0.976aybx=−=,
y关于x的回归直线方程为0.01920.976yx=−+;(2)能把保费x定为5元.理由如下:若保费x定为5元,则估计0.019250.9760.88y=−+=.估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的
利润为620000000.88520000000.880.2%2000100010000.7610−−=元76=(万元)70(万元).∴把保费x定为5元.9.已知某种细菌的适宜生长温度为10℃~25℃,为了研究该种细菌的繁殖数量y(单位:个)随温度x(单位
:℃)变化的规律,收集数据如下:温度x/℃12141618202224繁殖数量y/个2025332751112194对数据进行初步处理后,得到了一些统计量的值,如下表所示:xyk721()iixx=−721()iikk=−71()()iiixxyy=−−71()()iii
xxkk=−−18663.81124.3142820.5其中lniiky=,7117iikk==.(1)请绘出y关于x的散点图,并根据散点图判断ybxa=+与dxyce=哪一个更适合作为该种细菌的繁殖数量y关于温度x的回归方程类型(给出判断即可,不必说明理由);(2
)根据(1)的判断结果及表格数据,建立y关于x的回归方程(结果精确到0.1);(3)当温度为25℃时,该种细菌的繁殖数量的预报值为多少?参考公式:对于一组数据(),(1,2,3,,)iiuvin=,其回归直线vu=+的斜率和截距的最小二成估计分
别为121()()()niiiniiuuvvuu==−−=−,vu=−.参考数据:5.5245e.【答案】(1)dxyce=更适合作为y关于x的回归方程.(2)0.20.5xye+=.(3)245.【解析】(1)由题意,y关于x的散点图如下图所示.
dxyce=更适合作为y关于x的回归方程.(2)由(1)因为dxyce=,则ˆlnlnydxc=+,∴()()()7121lnlnˆiiiiixxyydxx==−−==−()()()71721iiiiixxkkxx==−−−20.50.2112=,∴lnlncydxkdx=−=−20.
53.8180.5112=−,∴y关于x的回归方程为0.20.5xye+=.(3)由(2)中的回归方程,令25x=,求得5.5245ye=,所以当温度为25C时,预报值为245.10.某手机厂商在销售200万台某型
号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机
后一年内未发生碎屏的用户中随机抽取1000名,每名用户赠送1000元的红包.为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):x1020304050y0.790.590.380.230.01(1)根据上面的
数据求出y关于x的回归直线方程;(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.2%.已知更换一次该型号手机屏幕的费用为2000元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?参
考公式:回归方程ybxa=+中斜率和截距的最小二乘估计分别为()()()121niiiniixxyybxx==−−=−,aybx=−.参考数据:表中x的5个值从左到右分别记为1x,2x,3x,4x,5x,相应的y值分别记为1y
,2y,3y,4y,5y,经计算有()()5119.2iiixxyy=−−=−,其中5115iixx==,515imyy=.【答案】(1)0.01920.976yx=−+(2)见解析【解析】(1)由30x=,0.4y=,()()5119.2iiixxyy=−
−=−,()5211000iixx=−=,得()()()51521ˆ0.0192iiiiixxyybxx==−−==−−,ˆˆ0.976aybx=−=,所以y关于x的回归直线方程为0.01920.976y
x=−+.(2)能把保费x定为5元.理由如下:若保费x定为5元,则估计0.019250.9760.88y=−+=估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为20000000.88520000000.880.2%200010001000−−60.7610=
(元)76=(万元)70(万元)所以能把保费x定为5元.获得更多资源请扫码加入享学资源网微信公众号www.xiangxue100.com