【文档说明】人教A版选择性必修 高二年级数学下学期期末考试分类汇编 ——数据统计分析(教师版)【高考】.docx,共(21)页,1.210 MB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-7105913b5ff918b6525085d2748486bc.html
以下为本文档部分文字说明:
专题12数据统计分析一、单选题1.(2022·全国·高二单元测试)已知变量x、y、z都是正数,y与x的回归方程:ˆˆ3ybx=+,且x每增加1个单位,y减少2个单位,y与z的回归方程:2ˆ2yz=,则().A.y与x正相关,z与x
正相关B.y与x正相关,z与x负相关C.y与x负相关,z与x正相关D.y与x负相关,z与x负相关【答案】D【解析】:由题意y与x的回归方程:ˆˆ3ybx=+,且x每增加1个单位,y减少2个单位,变量x,y,z都是正数,可得:2b=−$,又2ˆ2yz=,故y与z正相关,y
与x负相关,可得z与x负相关.故选:D.2.(2022·山东临沂·高二期中)用模型1ebxya+=()0a拟合一组数据时,设lnzy=,将其变换后得到经验回归方程为ˆ2zxa=+,则ba=()A.eB.2eC.12D.2【答案】D【解析】解
:1ebxya+=()0a,两边取对数,可得()11lnlnelnlneln1bxbxyaaabx++==+=++,令lnzy=,可得ln1zbxa=++,经验回归方程ˆ2zxa=+,2b=,ln1aa+=,令()ln1fxxx
=+−,则()111xfxxx−=−=,所以01x是()0fx,当1x时()0fx,所以当1x=时()fx取得极大值,即最大值,又()10f=,所以1a=.所以2ba=故选:D3.(2022·山东临沂·高二期中)如图,在一组样本数据()2,2A,()
4,3B,()6,4C,()8,7D,()10,6E的散点图中,若去掉()8,7D后,则下列说法正确的为()A.相关系数r变小,决定系数2R变小B.相关系数r变大,决定系数2R变小C.相关系数r变大,决定系数2R变大D.相关系数r变小,决定系数2R变大【答案】C【解析】从散
点图分析可知,只有D点偏离直线较远,去掉D点后,x与y的线性相关程度变强,相关系数r变大,决定系数2R变大.故选:C4.(2022·辽宁·高二期中)某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表,现发现表中有个数据
看不清,已知回归直线方程为6.36.8yx=+,则看不清的数据★的值为()x23456y1925★4044A.32B.34C.36D.38【答案】A【解析】设看不清的数据★的值为a,则2345645x++++==,1925404
412855aay+++++==,将样本中心点的坐标代入回归直线方程可得1286.346.85a++=,解得32a=.故选:A.5.(2022·新疆·乌市八中高二期中)设某中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据()(),1,2,3,,i
ixyin=,用最小二乘法近似得到回归直线方程为ˆ0.8585.71yx=−,则下列结论中不正确的是()A.y与x具有正线性相关关系B.回归直线过样本的中心点(),xyC.若该中学某高中女生身高增加1cm,则其体重约增加0.85
kgD.若该中学某高中女生身高为160cm,则可断定其体重必为50.29kg【答案】D【解析】由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,A正确;由线性回归方程必过样本中心点(),xy,因此B正确;由线性回归方程中系数
的意义知,x每增加1cm,其体重约增加0.85kg,C正确;当某女生的身高为160cm时,其体重估计值是50.29kg,而不是确定值,因此D错误.故选:D.6.(2022·广西·钦州一中高二期中(理))下对于两个变量x和y进行回
归分析,得到一组样本数据:()11,xy,()22,xy,,(),nnxy,则下列说法正确的是()①由样本数据得到的回归直线ˆˆˆybxa=+必经过样本点中心(),xy②用2R来刻画回归效果,2R的值越小,说明模型的拟合效果越好③残差平方和越小的
模型,拟合的效果越好④用相关系数r来衡量两个变量之间线性关系的强弱时,r越接近于1,相关性越弱;A.①②B.①③④C.①②③D.①③【答案】D【解析】:由题意得:样本中心点在回归直线上,故①正确;2R越大拟合效果越好,故②不正确;残差平方和越小的模型,拟合效果越好,故③正确;用相关系数
r来衡量两个变量之间线性关系的强弱时,r越接近于1,相关性越强,故④不正确.故选:D7.(2022·河南·高二阶段练习(文))给出以下四个说法:①残差点分布的带状区域的宽度越窄相关指数越小;②若两个变量的线性相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程
0.212yx=+中,当解释变量x每增加一个单位时,预报变量y平均增加0.2个单位;④对分类变量X与Y,若它们的随机变量2K的观测值k越小,则判断“X与Y有关系”的把握程度越大.其中正确的说法是()A.①④B.②④C.①③D.②③【答案】
D【解析】对于①,残差点分布的带状区域的宽度越窄相关指数越大,所以①错误,对于②,若两个变量的线性相关性越强,则相关系数的绝对值越接近于1,所以②正确,对于③,在回归直线方程0.212yx=+中,当解释变量x每增加一个单位时,预报变量y平均增加0.2个单位
,所以③正确,对于④,对分类变量X与Y,若它们的随机变量2K的观测值k越小,则判断“X与Y有关系”的把握程度越小,所以④错误,故选:D二、解答题8.(2022·安徽·六安一中高二期中)流行性感冒(简称
流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰,某幼儿园将去年春季该园患流感小朋友按照年龄与人
数统计,得到如下数据:年龄x23456患病人数y2222171410(1)求y关于x的线性回归方程;(2)计算变量x,y的样本相关系数r(计算结果精确到0.01),并判断是否可以认为该幼儿园去年春季患流感人数与年龄负相关程度很强.(若0.75,1r,则x,y相关程度很强;
若()0.25,0.75r,则x,y相关程度一般;若0,0.25r,则x,y相关程度较弱.)参考数据:3057.47.参考公式:相关系数12211()()()()niiinniiiixxyyrxxyy===−−=−−,线
性回归方程121()()ˆˆˆˆˆˆ,,()niiiniixxyyybxabaybxxx==−−=+==−−【答案】(1)ˆ3.229.8yx=−+(2)0.97r−,y与x之间的线性相关关系很强【解析】(1)由表中数据和附注中
的参考数据,得2345645x++++==,2222171410175y++++==,()()()522222212101210iixx=−=−+−+++=,()()()5222222155037108iiyy=−=+++−+−=
,()()()()()()51251500132732iiixxyy=−−=−+−++−+−=−,所以15251()()32ˆ3.210()iiiiixxyybxx==−−−===−−,()ˆˆ173.2429.8aybx=−=−−=,所以y关于x的线性回归方程是ˆ3.229.8
yx=−+;(2)3232320.9765.47710108630r−−−==−,因为0.970.75,1r,所以y与x之间的线性相关关系很强.9.(2022·河北·高二期中)某科技公司研发了一项新产品A,经过市场调研,对公司1月份至7月份的推广
费用以及销售量进行统计,推广费用x(万元)和销售量y(万件)之间的一组数据如下表所示;月份i1234567推广费用ix23456810销售量iy2.5344.5688.5(1)试根据1月份至5月份的数据,建立.
y关于x的回归直线方程;(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差都不超过0.7万件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?参考公式:回归直线方程ˆˆˆybxa=+
,其中()()()121ˆˆ,.niiiniixxyybaybxxx==−−==−−【答案】(1)ˆ0.850.6yx=+(2)可以认为(1)中所得到的回归直线方程是理想的【解析】.(1)因为234562.5344.56
4,455xy++++++++====.()()15(2)(1.5)(1)(1)0010.5228.5iiixxyy=−−=−−+−−+++=,()5214101410iixx=−=++++=,所以()()()51521ˆˆ0.85,40.8540.6iiiiixxyybaxx==−
−===−=−,所以ˆ0.850.6yx=+,于是y关于x的回归直线方程为ˆ0.850.6yx=+.(2)当8x=时,ˆ0.8580.67.4=+=y,则ˆ87.40.60.7yy−=−=,当10x=时,ˆ0.85100.69.1y=+=,则ˆ|||9.18.5|0.60.7yy−=
−=,故可以认为(1)中所得到的回归直线方程是理想的.10.(2022·陕西·榆林市第十中学高二期中(理))“冰桶挑战赛”是一项社交网络上发起的慈善公益活动,活动规定:被邀请者要么在24小时内接受挑战,要么选择为慈善机构捐款(不接受挑战),并且不能重复参加该活动.
若被邀请者接受挑战,则他需在网络上发布自己被冰水浇遍全身的视频内容,然后便可以邀请另外3个人参与这项活动.假设每个人接受挑战与不接受挑战是等可能的,且互不影响.(1)若某参与者接受挑战后,对其他3个人发出邀请,则这3个人中至少有2个人接受挑战的概率是多少?(2)为了解冰桶挑战赛与受邀者的性别是否有
关,某调查机构进行了随机抽样调查,调查得到如下2×2列联表:接受挑战不接受挑战合计男性451560女性251540合计7030100根据表中数据,能否有90%的把握认为“冰桶挑战赛与受邀者的性别有关”?附:22()()()()()nadbcKabcdacbd−=+++
+P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828【答案】(1)3个人中至少有2个人接受挑战的概率是12;(2)没有90%的把握认为“冰桶挑战赛与受邀者的性别有关”.【解析】(1)设3个人中接受挑战的人数为,则随即变量的
所有可能值为0,1,2,33031(0)C281P===,3133(1)C281P===3233(2)C281P===,3331(3)C281P===∴随即变量的分布列是0123P18383818事件3个人
中至少有2个人接受挑战可表示为2,又311(2)882P=+=,所以事件3个人中至少有2个人接受挑战的概率为12,(2)假设冰桶挑战赛与受邀者的性别无关,根据22列联表,得到2K的观测值为:()
22100451525151.78660407030K−=,因为1.7862.706,2(2.706)0.1PK=,所以没有90%的把握认为“冰桶挑战赛与受邀者的性别有关”.11.(2022·
浙江·高二阶段练习)龙井茶的最佳饮用温度为60C,某班同学对一杯温度85C的龙井茶放置多长时间到达最佳饮用温度展开研究.用不同口径的茶杯盛放温度85C的龙井茶,记录放置10s时的水温,得下表.口径5cm5cm5.5cm5.5cm6cm6cm6.5cm6.5cm7c
m7cmt10s=6361.360.761.260.259.86059.559.860.2温度()C口径7.5cm7.5cm8cm8cm9cm9cm10cm10cm11cm11cmt10s=温度()C58.960.560.158.658.258.558.658.358.358.1(1)根据
所给数据,完成22列联表,并判断是否有90%的把握认为茶杯的口径大小与茶水的温度变化的快慢有关?()()()()()222(),2.7060.1nadbcPabcdacbd−==++++…;冷却至60C时间t10st„10st总计小口径(口
径7cm)„大口径(口径7cm)总计(2)现用口径5cm的茶杯盛放温度85C的龙井茶,记录茶水温度冷却过程中“水温”和“时间"的关系如下表,并作出散点图.根据散点图,该班两个小组的学生分别选择ybta=+和ktyced=+模型拟合“水温”和“时间”的关系,经过
数据处理和计算,得到表格信息如下.根据上述信息,求出模型一y关于t的回归方程(精确到0.1),并用决定系数分析哪个模型拟合上度更优.时间()mint012345678910口径5cm温度()Cy858379.876.873.871.369.266.965.563.76
3回归方程残差平方和()1121ˆiiiyy=−总偏差平方和()1121iiyy=−模型一11.5600模型二0.0584.58tye−=6600参考数据:111iiity=1121iit=y3735.538572.5参考公式:()()()()()22111222
2111ˆˆ,1.nnniiiiiiiiinnniiiiiittyytyntyyybRtttntyy===−===−−−−===−−−−【答案】(1)填表见解析;有90%的把握认为茶杯的口径大小与茶水的温度变化的快慢有关(2)2.384yt=−+;模型二的拟合度优
于模型一【解析】(1)冷却至60C时间t10st10st总计小口径(口径7cm)4610大口径(口径7cm)8210总计128202220(4268)102.706.12810103−==有90%的把握认为茶杯的口径大小与茶水的温度变化的快慢
有关.(2)11111221113735.511572.5ˆ5,2.3385112511iiiiitytytbtt=−=−−===−−−ˆ84aybt=−=.模型一的回归方程:2.384yt=−+.模型一决定系数2111.510.98600R=−.模型二决定系数22610.
99600R=−=.2212RR,模型二的拟合度优于模型一.一、单选题1.(2022·全国·高二课时练习)如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出错误的选项()A.2020年下半年,同城和异地快递量最高均出现在11月B.2020年10月份异地快递增长率
小于9月份的异地快递增长率(注.增长率指相对前一个月而言)C.2020年下半年,异地快递量与月份呈正相关关系D.2020年下半年,每个月的异地快递量都是同城快递量的6倍以上【答案】D【解析】对于A,由图可看出,同城和异地快递量最高都在11月份,故A正确;对于B,因为6795
56.6599604.6708642.6679556.6599604.6679556.6−−,9月异地快递增长率明显高于10月异地快递增长率,故B正确;对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显
增加,因此可以判断异地快递量与月份呈正相关关系,故C正确;对于D,2020年7月的异地快递量为572812.9万件,同城快递量为105191.1万件,异地快递量不到同城快递量的6倍,故D不正确.故选:D.2.(2022·全国·高二单元测
试)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)iixyi=得到下面的散点图:由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的
回归方程类型的是()A.yabx=+B.2yabx=+C.exyab=+D.lnyabx=+【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y和温度x的回归方程类型的是lnyabx=+.故选:D.3.
(2022·黑龙江·双鸭山一中高二期中)对两个变量y和x进行回归分析,得到一组样本数据()11,xy,()22,xy,…(),nnxy,则下列说法不正确的是()A.若变量y和x之间的相关系数为0.9462r=−
,则变量y和x之间具有较强的线性相关关系B.残差平方和越小的模型,拟合的效果越好C.用决定系数2R来刻画回归效果,2R越小说明拟合效果越好D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高【答案】C【解析】变量y和x之间的相关系数为r越大,则变量y和x之间具有
较强的线性相关关系,故A正确;残差平方和越小的模型,拟合的效果越好,故B正确;用决定系数2R来刻画回归效果,2R越大说明拟合效果越好,故C错误;在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,故D正确.故选:C.4.(2022·全国·高二课时练习)
下列关于独立性检验的叙述:①常用等高条形图展示列联表数据的频率特征;②独立性检验依据小概率原理;③样本不同,独立性检验的结论可能有差异;④对分类变量X与Y的随机变量2K的观测值k来说,k越小,X与Y有关系的把握程度就越大.其中正确的个数为A.1B.2C.3D.4【答案】C分析:根
据独立性检验的定义及思想,可得结论.详解:①常用等高条形图展示列联表数据的频率特征;正确;②独立性检验依据小概率原理;正确;③样本不同,独立性检验的结论可能有差异;正确;④对分类变量X与Y的随机变量2K的观测值k来说,k越大,X与Y有关系的把握程度就越大.故④错误.故选C.二、
多选题5.(2022·全国·高二单元测试)下列说法中,正确的命题是().A.以模型kxyce=去拟合一组数据时,为了求出回归方程,设lnzy=,将其变换后得到线性方程0.34zx=+,则c、k的值分别是4e和0.3B.设有一
个回归直线方程ˆ35yx=−,变量x增加1个单位时,ˆy平均增加5个单位C.线性回归方程ˆˆˆybxa=+必经过样本点的中心()xy,D.已知一系列样本点()iixy,(123in=,,,,)的回归直线方程ˆˆ4y
xa=+,若样本点(2)m,与(2)n,的残差相等,则410mn+=【答案】ACD【解析】∵ekxyc=,∴两边取对数,可得()lnlnelnlnelnkxkxyccckx==+=+,令lnzy=,可得lnzckx=+,∵0.34zx=+,∴ln4c=,即0.3k=,4ec=
,A选项对;若有一个回归直线方程ˆ35yx=−,随着x的增大,ˆy会减小,B选项错;线性回归方程ˆˆˆybxa=+必经过样本点的中心()xy,,C选项对;回归直线方程为ˆˆ4yxa=+,且样本点(2)m,与(2)n,的残差相等,则
()()2442ˆˆ410manamn−+=−++=,D选项对.故选:ACD.6.(2022·湖南·南县第一中学高二期中)对两组数据进行统计后得到的散点图如图所示,关于其线性相关系数的结论正确的是()A.10rB.20rC.12rrD.1r与2r的大小关系无法判断【答案】AB【解析】
由图可知,第一幅图负相关,第二幅图正相关,故A,B正确;第二幅图中的点比第一幅图中的点更趋于一直线附近,故第二幅图的相关性比第一幅图的相关性强,故12rr,CD错误.故选:AB7.(2022·浙江·高二阶段练习)某淘宝商家想通过软件广告推荐功能吸
引潜在客户.为使广告能够精准投放达到利益最大化,随机抽取了200名在本店一季度消费过的客户数据,现统计如下:按照年龄分为年轻人(<30岁)和非年轻人(30岁及以上),若一季度内购买超过三次及以上就记为优质客户,其中非年
轻人占比12,通过数据可以得到结论()附:22(),()()()()nadbcKnabcdabcdacbd−==+++++++.20()PKk0.100.050.0100.0010k2.7063.8416.63510.828A.为了增加优质客户的比例
,应向30岁以下人群投放广告B.有99.9%的把握认为是否为优质客户与年龄有关C.已知一位顾客是年轻人,则他是优质客户的概率是12D.已知一位顾客仅购买一次,则他是非年轻人的概率是12【答案】BC【解析】由题意可知抽取的年轻人为200(14.5%45.5%)120+=
人,非年轻人为200(34%5.5%0.5%)80++=人,抽取的优质客户有200(140%)120−=人,则非优质客户为80人,其中优质客户中年轻人有60人,非年轻人有60人,则列联表如下优质客户非优质
客户合计年轻人6060120非年轻人602080合计12080200对于A,优质客户中年轻人和非年轻人的人数相同,而年轻人的优质客户有12,非年轻人的优质客户有34,所以非年轻人购买力强,所以为了增加优质
客户的比例,应向30岁以上人群投放广告,所以A错误,对于B,因为22200(60606020)12.510.8281208012080K−==,所以有99.9%的把握认为是否为优质客户与年龄有关,对于C,因为年轻人共120人,其中优质客户60人,所以已知一位顾客是年轻
人,则他是优质客户的概率是12,所以C正确,对于D,因为非优质客户80人中,非年轻人20人,所以已知一位顾客仅购买一次,则他是非年轻人的概率是14,所以D错误,故选:BC8.(2022·全国·高二单元测试)某医疗研究所为
了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设:“这种血清不能起到预防感冒的作用”,利用22列联表计算得23.918K,经查临界值表知23.84()10.05PK.则下列结论中错误的是().A.在犯错误的概率不超过
0.05的前提下认为“这种血清能起到预防感冒的作用”;B.若某人未使用该血清,那么他在一年中有95%的可能性得感冒;C.这种血清预防感冒的有效率为95%;D.这种血清预防感冒的有效率为95%.【答案】BCD【解析】23.9183.841K,而23.84()10.05PK,∴在犯错误
的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”,要注意我们检验的是假设是否成立,和该血清预防感冒的有效率是没有关系的,不是同一个问题,故只有A选项正确故选:BCD.三、解答题9.(202
2·全国·高二课时练习)某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增
加量y(百斤)与使用某种液体肥料x(千克)之间对应数据为如图所示的折线图.(1)依据数据的折线图,是否可用线性回归模型拟合y与x的关系?请计算相关系数r并加以说明(精确到0.01)(若0.75r,则线性相关程度
很高,可用线性回归模型拟合)(2)蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量X限制,并有如表关系:周光照量X(单位:小时)3050X5070X70X光照控制仪最多可运行台数321若某台光照控制仪运行,则该台光照控制仪周利
润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以过去50周的周光照量的频率作为周光照量发生的概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?附:相关系数12211()(
)()()niiinniiiixxyyrxxyy===−−=−−,参考数据:51()()6iiixxyy=−−=,521()25iixx=−=,521()2,0.30.55ijyy=−=,0.
90.95【答案】(1)0.95r,可用线性回归模型拟合y与x的关系;(2)2台光照控制仪.【解析】(1)由已知数据可得2456855x++++==,3444545y++++==所以相关系数12211()()690.9510252()()niiinniiiix
xyyrxxyy===−−===−−因为0.75r,所以可用线性回归模型拟合y与x的关系.(2)记商家周总利润为Y元,由条件可知至少需要安装1台,最多安装3台光照控制仪.①安装1台光照控制仪可获得周总利润3000元;②安装2台光照控制仪
的情形:当X>70时,只有1台光照控制仪运行,此时周总利润Y=3000﹣1000=2000元,当30<X≤70时,2台光照控制仪都运行,此时周总利润Y=2×3000=6000元,故Y的分布列为:Y20006000P0.20.8所以E(Y)=1000×0.2+5
000×0.7+9000×0.1=4600元.综上可知,为使商家周利润的均值达到最大应该安装2台光照控制仪.10.(2022·全国·高二课时练习)随着西部大开发的深入,西南地区的大学越来越受到广大考生的青睐,下表是西南地区某大学近五年的录取平均
分高于省一本线分值对比表:年份20152016201720182019年份代码t12345录取平均分高于省一本线分值y2834414750(1)根据上表数据可知,y与t之间存在线性相关关系,求y关于t的线性回归方程;(2)假设2020年该省一本线为520分,利用(1)中求出的回归方程预
测2020年该大学录取平均分.参考公式:()()()121ˆniiiniittyybtt==−−=−,ˆˆaybt=−【答案】(1)ˆ5.722.9yt=+;(2)577.1【解析】(1)由题知:()11234535t=++
++=,()12834414750405y=++++=,所以得:()()()121575ˆ.710niiiniittyybtt==−−===−,ˆˆ4035.722.9aybt=−=−=,故所求回归方程为:
ˆ5.722.9yt=+(2)由(1)知:当6t=时,ˆ57.1y=,故预测该大学2020年的录取平均分为52057.1577.1+=.11.(2022·福建三明·高二期中)某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的
旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y(万人)与年份x的数据:第x年12345678910旅游人数y(万人)300283321345372435486527622800该景点为了预
测2021年的旅游人数,建立了y与x的两个回归模型:模型①:由最小二乘法公式求得y与x的线性回归方程50.8169.7yx=+;模型②:由散点图的样本点分布,可以认为样本点集中在曲线ebxya=的附近.(1)根据表中数据,求模型②的回归方程ˆebxya=.(a精确到个位,b精
确到0.01).(2)根据下列表中的数据,比较两种模型的相关指数2R,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).回归方程①50.8169.7yx=+②ˆebxya=1021(
)iiiyy=−3040714607参考公式、参考数据及说明:①对于一组数据()()()1122,,,,,,nnvwvwvw,其回归直线wv=+的斜率和截距的最小二乘法估计分别为121()(),()niiini
iwwvvwvvv==−−==−−.②刻画回归效果的相关指数22121()1()niiiniiyyRyy==−=−−;③参考数据:5.46e235,1.43e4.2.xyu1021()iixx=−()()101iiixxyy=−−()()101iii
xxuu=−−5.54496.058341959.00表中1011ln,10iiiiuyuu===.【答案】(1)0.11235exy=;(2)回归模型②的拟合效果更好,987【解析】:(1)对ebxya=取对数,得lnlnybxa=+,设lnuy=,lnca=,先建立u关于x的线性
回归方程.()()()10110219.000.10883iiiiixxuubxx==−−==−,6.050.1085.55.4565.46cubx=−−=,5.46ee235ca=,模型②的回归方程为0.11235exy
=.(2)由表格中的数据,有30407>14607,即101022113040714607()()iiiiyyyy==−−,即10102211304071460711()()iiiiyyyy==−−−−,2212RR,模型①的相关指数21R小于模型②的22R,说明回归模型②的拟合效果
更好.2021年时,13x=,预测旅游人数为0.11131.43235e235e2354.2987y===(万人).12.(2022·浙江嘉兴·高二期中)新冠肺炎疫情期间,各地均响应“停课不停学,停课不停教”的号召开展网课学习.为检验网课学习效果,某机构对2
000名学生进行了网上调查,发现有些学生上网课时有家长在旁督促,而有些没有网课结束后进行考试,根据考试结果将这2000名学生分成“成绩上升”和“成绩没有上升”两类,对应的人数如下表所示:成绩上升成绩没有上升合计有家长督促的学生500800没有家长督促的学生500没
有家长督促的学生2000(1)完成以上列联表,并通过计算(结果精确到()0.001)说明,是否有90%的把握认为家长督促学生上网课与学生的成绩上升有关联(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,再从8人中随机抽取3人做进一步调查
,记抽到3名成绩上升的学生得1分,抽到1名成绩没有上升的学生得1−分,抽到3名生的总得分用X表示,求X的分布列和数学期望.附:()()()()()22,nadbcKnabcdabcdacbd−==+++++++()20PKk0.1000.0500.0100.0010
k2.7063.8416.83510.828【答案】(1)列联表见解析,有90%的把握认为家长督促学生上网课与学生的成绩上升有关联;(2)分布列见解析,数学期望为34.【解析】(1)成绩上升成绩没有上升合计
有家长督促的学生500300800没有家长督促的学生7005001200没有家长督促的学生12008002000()2220005005003007001253.4722.7068001200120080036K−==
有90%的把握认为家长督促学生上网课与学生的成绩上升有关联.(2)从有家长督促的800名学生中按成绩是否上升,采用分层抽样的方法抽出8人,其中成绩上升的有5人,成绩没有上升的有3人,再从8人中随机抽取3人,随机变量X所有可能的取
值为3,1,1,3−−()0353381356CCPXC=−==()12533815156CCPXC=−==()21533815128CCPXC===()3053385328CCPXC===X的分
布列如下:X-3-118P15615561528528()115301033113565656564EX=−−++=