【文档说明】2022高三统考数学文北师大版一轮教师文档:第九章第七节 变量间的相关关系与统计案例含答案【高考】.doc,共(8)页,292.500 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-fcfa9270b0fd07296ec7742d6cabb772.html
以下为本文档部分文字说明:
-1-第七节变量间的相关关系与统计案例授课提示:对应学生用书第189页[基础梳理]1.相关关系与回归方程(1)相关关系的分类①正相关:从散点图上看,点分布在从左下角到右上角的区域内;②负相关:从散点图
上看,点分布在从左上角到右下角的区域内.(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫作回归直线.(3)回归方程①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘
法.②回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为y=bx+a,则b=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2=∑ni=1xiyi-nx-y-∑ni=1x2i-nx-2,a=y--bx-.
其中,b是回归方程的斜率,a是在y轴上的截距.(4)样本相关系数r=∑ni=1(xi-x-)(yi-y-)∑ni=1(xi-x-)2∑ni=1(yi-y-)2,用它来衡量两个变量间的线性相关关系.①当r>
0时,表明两个变量正相关;②当r<0时,表明两个变量负相关;③r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|>0.75时,认为两个变量有很强的线性相关关系.2.独立性检验(1)2×2列联表:假设有两个分类变量X
和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)χ2统计量χ2=n(ad-bc)2(a+
b)(c+d)(a+c)(b+d)(其中n=a+b+c+d为样本容量).1.两种关系——函数关系与相关关系(1)区别①函数关系是一种确定性关系,相关关系是一种非确定性关系.-2-②函数关系是一种因果关系,相关关系不一定是因果关系,也可能是伴随关系.(2)联系:对线性相关关系求回归方程后,可以
通过确定的函数关系对两个变量间的取值进行估计.2.回归直线方程的两个关注点(1)样本数据点不一定在回归直线上,回归直线必过(x-,y-)点.(2)在回归直线方程y=bx+a中,b>0时,两个变量呈正相关关系;b
<0时,两个变量呈负相关关系.3.回归分析的意义回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.在线性回归模型y=bx+a+e中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x
称为解释变量,因变量y称为预报变量.4.独立性检验利用独立性假设、随机变量χ2来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.两个分类变量X和Y是否有关系的判断标准:统计学研究表明:当χ
2≤2.706时,认为没有充分证据显示X与Y有关系;当χ2>3.841时,有95%的把握说X与Y有关;当χ2>6.635时,有99%的把握说X与Y有关;当χ2>10.828时,有99.9%的把握说X与Y
有关.[四基自测]1.(基础点:回归分析的相关指数)两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2为0.98B.模型2的相关
指数R2为0.80C.模型3的相关指数R2为0.50D.模型4的相关指数R2为0.25答案:A2.(基础点:回归直线方程的特征)某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:x681012y2356则y对x的线性回归直线方
程为()A.y=2.3x-0.7B.y=2.3x+0.7C.y=0.7x-2.3D.y=0.7x+2.3答案:C3.(基础点:独立性检验)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学
生,得到如下2×2列联表:理科文科男1310女720已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025.根据表中数据,得到χ2=-3-50×(13×20-10×7)223×27×20×30≈4.844.则认为选修文科与性别有关系出错的可能性为________.答案:5%4
.(基础点:散点图与线性相关)为了研究某班学生的脚长x(cm)与身高y(cm)的关系,从该班中抽取10名学生,其脚长x和身高y的散点图如图所示,则y与x间________(有、没有)相关关系.答案:有授课提示:对应学生用书第190页考点一回归分析挖掘1相关关系的判断/互动探究[例
1](1)(2020·镇江模拟)如图所示,有A,B,C,D,E5组数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.[解析]由散点图知呈带状区域时有较强的线性相关关系,故去掉D组数据.[答案]D(2)下列两变量中不存在相关关系的是()①人的身
高与视力;②曲线上的点与该点的坐标之间的关系;③某农田的水稻产量与施肥量;④某同学考试成绩与复习时间的投入量;⑤匀速行驶的汽车的行驶距离与时间;⑥商品的销售额与广告费.A.①②⑤B.①③⑥C.④⑤⑥D.②⑥[解析]①人的身高与视力无任何
关系,故①不存在相关关系;②曲线上的点与该点的坐标之间,存在一一对应的关系,故②不存在相关关系;③某农田的水稻产量与施肥量,两变量有关系,但不确定,故存在相关关系;④某同学考试成绩与复习时间的投入量,两变量有关系,但不确定
,故存在相关关系;⑤匀速行驶的汽车的行驶距离与时间,它们之间的关系是函数关系,故不存在相关关系;⑥商品的销售额与广告费,两变量有关系,但不确定,故存在相关关系.[答案]A(3)对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,
正确的是()-4-A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3[解析]易知题中图①与图③是正相关,图②与图④是负相关,且图①与图②中的样本点集中分布在一条直线
附近,则r2<r4<0<r3<r1.[答案]A[破题技法]利用散点图判断两个变量是否有相关关系是比较简便的方法.(1)在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.(2)如果所有的样本点落在某一函数的曲线附近,变量之间就有
相关关系.(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(4)若呈圆形区域且分布较乱,则不具备相关性.挖掘2求线性回归方程及应用/自主练透[例2](1)(2020·河南濮阳一模)根据下表中的数据,得到的回归
方程为y=bx+9,则b=()x45678y54321A.2B.1C.0D.-1[解析]由题意可得x-=15×(4+5+6+7+8)=6,y-=15×(5+4+3+2+1)=3.∵回归方程为y=bx+9且回归直线
过点(6,3),∴3=6b+9,解得b=-1,故选D.[答案]D(2)(2020·泰安模拟)某商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:人数xi10152025303540件数yi471215202327其中i=1,2,3,4,5,6,7.①以每天进店人数
为横轴,每天商品销售件数为纵轴,画出散点图.-5-②求回归直线方程.(结果保留到小数点后两位)(参考数据:∑7i=1xiyi=3245,x-=25,y-=15.43,∑7i=1x2i=5075,7(x-)2=4375,7x-y-=2700)③预测进
店人数为80人时,商品销售的件数.(结果保留整数)[解析]①散点图如图所示.②因为∑7i=1xiyi=3245,x-=25,y-=15.43,∑7i=1x2i=5075,7(x-)2=4375,7x-y-=2700.所以b=∑7i=1xiyi-7x-y-∑7
i=1x2i-7(x-)2≈0.78,a=y--bx-=-4.07,所以回归直线方程是y=0.78x-4.07.③进店人数为80人时,商品销售的件数y=0.78×80-4.07≈58(件).[破题技法]线性回
归分析问题的类型及解题方法(1)求线性回归方程:①利用公式,求出回归系数b,a.②待定系数法:利用回归直线过样本点中心求系数.(2)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关:决定正相关还是负相关的是系数b.挖掘3非线性回归分析/互动探究
[例3]某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.-6
-x-y-w-∑8i=1(xi-x-)2∑8i=1(wi-w-)2∑8i=1(xi-x-)(yi-y-)∑8i=1(wi-w-)(yi-y-)46.65636.8289.81.61469108.8表中wi=xi,w-=18∑8i=1wi.(1)根据散点图判断,y=a+bx与y=c+dx哪
一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣
传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β=∑ni=1(ui-u-)(vi-v-)∑ni=1(ui-u-)2,α=v--βu
-.[解析](1)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=x,先建立y关于w的线性回归方程.由于d=∑8i=1(wi-w-)(yi-y-)∑8i=1(wi-w-)2=108.81.6=68,c=y--dw-=563
-68×6.8=100.6,所以y关于w的线性回归方程为y=100.6+68w,因此y关于x的回归方程为y=100.6+68x.(3)①由(2)知,当x=49时,年销售量y的预报值y=100.6+6849=576.6,年利润z的预报值z=576.6×0.2-49=66.32.②根据(2)的结果知
,年利润z的预报值z=0.2(100.6+68x)-x=-x+13.6x+20.12.-7-所以当x=13.62=6.8,即x=46.24时,z取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.[破题技法]非线性回归分析问题的处理方法(1)描点,选模:画出已知数据的散点图,把它与已经学
过的各种函数(幂函数、指数函数、对数函数等)图像作比较,挑选一种跟这些散点拟合最好的函数.(2)解模:先对变量进行适当地变换,再利用线性回归模型来解模.(3)比较检验:通过回归分析比较所建模型的优劣.考点二独立性检验挖掘判断两个分类变
量的独立性/自主练透[例](1)(2020·南昌模拟)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.非一线一线总计愿生452065不愿生132235总计5842100附表:P(χ
2≥k0)0.0500.0100.001k03.8416.63510.828由χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)算得,χ2=100×(45×22-20×13)258×42×35×65≈9.616,参照附表,得到的正确结论是()A.在犯错误的概率不超过0.
001的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.001的前提下,认为“生育意愿与城市级别无关”C.在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别有关”D.在犯错误的概率不超过0.01的前提下,认为“生育意愿与城市级别无关”[解析]由题意x≈9.616>6.
635,所以在犯错误的概率不超过0.01的前提下认为“生育意愿与城市级别有关”.[答案]C(2)(2019·高考全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服
务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020①分别估计男、女顾客对该商场服务满意的概率;②能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:χ2=n(ad-bc)
2(a+b)(c+d)(a+c)(b+d).P(χ2≥k)0.0500.0100.001k3.8416.63510.828[解析]①由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客-8-对该商场服务满意的概
率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.②χ2=100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务
的评价有差异.[破题技法]1.独立性检验的原理独立性检验的基本思想类似于反证法,要确认“两个分类变量有关系”这一结论成立的可信度,首先假设该结论不成立.即假设结论“两个分类变量没有关系”成立.在该假设下构造的随机变量χ2应该很小.如果由观测数据计算得到的χ2的观测值k很大,
则在一定程度上说明不合理.2.独立性检验的两个关键(1)根据样本数据列出2×2列联表.(2)计算随机变量χ2.