【文档说明】高中数学培优讲义练习(人教A版2019选择性必修三)专题8.9 成对数据的统计分析全章综合测试卷(提高篇) Word版含解析.docx,共(24)页,371.941 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-fbe3ab5b989215094e5a5a77569e6cc6.html
以下为本文档部分文字说明:
第八章成对数据的统计分析全章综合测试卷(提高篇)参考答案与试题解析一.选择题(共8小题,满分40分,每小题5分)1.(5分)(2022·高二课时练习)下列变量之间的关系是相关关系的是()A.正方体的表面积与体积B.光照时间与果树的产量C.匀速行驶
车辆的行驶距离与时间D.某运动会中某代表团的足球队的比赛成绩与乒乓球队的比赛成绩【解题思路】A与C是一种函数关系,D不具备相关关系,B满足相关关系.【解答过程】对于A,正方体的体积确定,则表面积随之确定,是一种确定性关系,A错误;对于B,光照时间越长
,果树的产量相对越大,是一种线性相关关系,B正确;对于C,行驶速度与时间是一种确定的函数关系,C错误;对于D,足球比赛成绩与乒乓球比赛成绩没有关系,不具有相关关系,D错误.故选:B.2.(5分)(2023·全国·高三专题练习)根据最小二乘法由一组样本点(�
�𝑖,𝑦𝑖)(其中𝑖=1,2,⋯,300),求得的回归方程是𝑦̂=𝑏̂𝑥+𝑎̂,则下列说法正确的是A.至少有一个样本点落在回归直线𝑦̂=𝑏̂𝑥+𝑎̂上B.若所有样本点都在回归直线𝑦̂=𝑏̂𝑥+𝑎̂上,则变量同的相关系数为1C.对所有
的解释变量𝑥𝑖(𝑖=1,2,⋯,300),𝑏̂𝑥𝑖+𝑎̂的值一定与𝑦i有误差D.若回归直线𝑦̂=𝑏̂𝑥+𝑎̂的斜率𝑏̂>0,则变量x与y正相关【解题思路】对每一个选项逐一分析判断得解.【解答过程】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A错误;所有
样本点都在回归直线𝑦̂=𝑏̂𝑥+𝑎̂上,则变量间的相关系数为±1,故B错误;若所有的样本点都在回归直线𝑦̂=𝑏̂𝑥+𝑎̂上,则𝑏̂𝑥+𝑎̂的值与y𝑖相等,故C错误;相关系数r与𝑏̂符号相同,若回归直线𝑦̂=𝑏̂𝑥+𝑎̂的斜率𝑏̂>
0,则𝑟>0,样本点分布应从左到右是上升的,则变量x与y正相关,故D正确.故选D.3.(5分)(2022春·新疆昌吉·高二期末)有下列说法:①若某商品的销售量𝑦(件)关于销售价格𝑥(元/件)的线性回归方程为𝑦̂=−5𝑥+350,当销售价格为10元时,销售量一定为3
00件;②线性回归直线𝑦̂=𝑏̂𝑥+𝑎̂一定过样本点中心(𝑥,𝑦);③若两个随机变量的线性相关性越强,则相关系数𝑟的值越接近于1;④在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域
的宽度无关;⑤在线性回归模型中,相关指数𝑅2表示解释变量对于预报变量变化的贡献率,𝑅2越接近于1,表示回归的效果越好;其中正确的结论有()个A.1B.2C.3D.4【解题思路】由最小二乘法求解回归直线和回归直线的性质可知①错误,②正确;随机变量为负相关时,线性相关性越强,相关系
数𝑟越接近−1,③错误;残差图中带状区域越窄,拟合度越高,④错误;𝑅2越接近1,模型拟合度越高,⑤正确;由此可得结果.【解答过程】①当销售价格为10时,销售量的预估值为300件,但预估值与实际值未必相同,①错误;②由最小二乘法可知,回归直线
必过(𝑥̅,𝑦̅),②正确;③若两个随机变量为负相关,若线性相关性越强,相关系数𝑟越接近−1,③错误;④残差图中,带状区域越窄,模型拟合度越高,④错误;⑤相关指数𝑅2越接近1,拟合度越高,则在线性回归模型中,回归效果越好,⑤正确.可知正确的结论为:②⑤,共2个故选:𝐵.4.
(5分)(2023·高二单元测试)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型y=e1+at(a∈R)对y与t的关系进行拟合,则根据该回归模
型,预测从第()个月开始该物种的繁殖数量超过5000只(参考数据:e3≈20.09,e4≈54.60)第𝑡个月123繁殖数量𝑦e1.4e2.2e2.4A.4B.5C.6D.7【解题思路】根据指数计算将回归模型两边取自然对数ln𝑦=
1+𝑎𝑡,并令𝑢=ln𝑦,由此构建一个u与t的回归直线模型,根据回归直线必过(𝑡,𝑢),可求出a值,得到回归模型解出答案.【解答过程】由题意,𝑦=e1+𝑎𝑡两边取自然对数得ln𝑦=1+𝑎𝑡,令𝑢=ln𝑦,则𝑢=1+𝑎�
�.𝑢̅=(ln𝑦1+ln𝑦2+ln𝑦3)×13=2,𝑡̅=(𝑡1+𝑡2+𝑡3)×13=2,将数值代入回归直线,得2=2𝑎+1,得𝑎=12,因此𝑢=1+𝑡2,则𝑦=e1+𝑡2.当𝑡=4时,𝑦=e3≈20.09<50;
当𝑡=5时,𝑦=e3.5=√e3⋅e4<50;当𝑡=6时,𝑦=e4≈54.60>50,∴从第6个月开始,该物种的繁殖数量超过5000只.故选:C.5.(5分)(2023·高二单元测试)某工厂为了对研发
的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x元99.29.49.69.810销量y件1009493908578(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回
归直线𝑦̂=𝑏̂𝑥+𝑎的斜率的最小二乘估计值为𝑏̂=∑𝑥𝑖𝑦𝑖−𝑛𝑥𝑦𝑛𝑖=1∑𝑥𝑖⬚2−𝑛𝑥2𝑛𝑖=1参考数值:∑𝑥𝑖𝑦𝑖6𝑖=1=5116,∑𝑥𝑖⬚26𝑖=1−6𝑥2=0.7
);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为()A.9.4元B.9.5元C.9.6元D.9.7元【解题思路】由条件求出回归直线方程,然后设该产品的售价为𝑥元,可得工厂的利润𝐿=(𝑥−5)(−20𝑥
+280),从而求出答案.【解答过程】由题意𝑥=16(9+9.2+9.4+9.6+9.8+10)=9.5,𝑦=16(100+94+93+90+85+78)=90,由𝑏^=∑⬚6i=1𝑥i𝑦i−6𝑥𝑦∑⬚6i=1𝑥i2−6𝑥2=5116−6×90×9.50.7=−20,所以𝑎
^=90+9.5×20=280,则𝑦̂=−20𝑥+280,设该产品的售价为𝑥元,工厂的利润为𝐿,则𝐿=(𝑥−5)(−20𝑥+280),由(𝑥−5)(−20𝑥+280)=20×(𝑥−5)(−𝑥+14)≤20×(𝑥−5+14−𝑥2
)2=405,当且仅当𝑥−5=14−𝑥,即𝑥=9.5时等号成立.所以𝑥=9.5时,工厂的利润的最大为405元,故选:B.6.(5分)(2022春·河南三门峡·高二校考阶段练习)在研究某高中高三年级学生的性别与是否喜欢某学科的关系时,总共调查了N个学生(𝑁=100m,�
�∈𝑁∗),其中男女学生各半,男生中60%表示喜欢该学科,其余表示不喜欢;女生中40%表示喜欢该学科,其余表示不喜欢.若有99.9%把握认为性别与是否喜欢该学科有关,则可以推测N的最小值为()附𝐾2=𝑛(𝑎𝑑−𝑏𝑐)2(𝑎+𝑏
)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),𝑃(𝐾2⩾𝑘)0.0500.0100.001𝑘3.8416.63510.828A.400B.300C.200D.100【解题思路】根据题目列出2×2列联表,再根据列联表的数据计算𝐾2值,
进而得到关于𝑚的关系式,求解即可.【解答过程】由题可知,男女各50𝑚人,列联表如下:喜欢不喜欢总计男30m20m50m女20m30m50m总计50m50m100m𝐾2=100𝑚(900𝑚2−
400𝑚2)250×50×50×50𝑚4=4𝑚,∵有99.9%把握认为性别与是否喜欢该学科有关,∴4𝑚>10.828,解得𝑚>2.707,∵𝑚∈𝑁∗,∴𝑚≥3,∴𝑁min=300.故选:B.7.(5分)(20
22春·山东临沂·高二期中)某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集3
00位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:𝐾2=𝑛(𝑎𝑑−𝑏𝑐)2(𝑎+𝑐)(𝑏+𝑑)(𝑎+𝑏)(𝑐+𝑑),其中𝑛=𝑎+𝑏+𝑐+𝑑.𝑃(𝐾2≥𝑘0)0.10
0.050.010.005𝑘02.7063.8416.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有9
5%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D.有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”【解题思路】根据题设收集的数据,得到男生学生的人数,进而得出2×2的列联表,利用计算公式,求解𝐾2的值,对比临
界值表即可作出判断.【解答过程】从5000人中,其中男生3500人,女生1500人,采用分层抽样抽取一个容量为300人的样本,其中男女各抽取的人数为300×35005000=210人,300×15005000=
90人,由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,∴在300人中每周体育锻炼时间超过4小时的人数为300×0.75=225人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,则
男生有225−60=165人,可得如下的2×2的列联表:男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得𝐾2=300×
(45×60−165×30)2210×90×75×225≈4.762>3.841,∴有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选:B.8.(5分)(2022春·陕西西安·高二期中)千百年来,我国劳动人民在生产实践中根据云
的形状、走向、速度,厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了𝐴地区的100天日落和夜晚天气,得到如下2×2列联表.单位:天日落云里走夜晚天气下
雨未下雨出现255未出现2545临界值表:𝑃(𝐾2≥𝑘0)0.050.0100.001𝑘03.8416.63510.828并计算得到𝐾2≈19.05,下列小波对𝐴地区天气的判断不正确的是()A.夜晚下雨的概率约为12B.未出现“日落云里走”
,夜晚下雨的概率约为514C.在犯错误的概率不超过0.001的前提下认为“日落云里走”是否出现与夜晚天气有关D.若出现“日落云里走”,则有99.9%的把握认为夜晚一定会下雨【解题思路】根据已知数据计算概率可判断AB,
计算𝐾2后可判断C,根据概率的意义判断D.【解答过程】根据列联表可知,100天中有50天下雨,50天未下雨,因此夜晚下雨的概率约为50100=12,A中判断正确;同样,未出现“日落云里走”,夜晚下雨的概率约为2525+45=514
,B中判断正确;𝐾2≈19.05>10.828,因此认为“日落云里走”是否出现与夜晚天气有关,C中判断正确;有关只是说可能性,不代表一定下雨,D中判断错误,故选:D.二.多选题(共4小题,满分20分,每小题5分)9.(5分)(2022春·湖北·高三阶段练习)如图,5个数据(𝑥,𝑦)
,去掉点𝐷(3,10)后,下列说法正确的是()A.相关系数r变大B.残差平方和变大C.变量x与变量y呈正相关D.变量x与变量y的相关性变强【解题思路】根据图中的点,计算去掉𝐷(3,10)前后的相关系数、残差平
方和、𝑅2,即可判断各选项的正误.【解答过程】由图,𝑥−=1+2+3+4+105=4,𝑦−=3+4+5+10+125=6.8,则∑(𝑥𝑖−𝑥−)(𝑦𝑖−𝑦−)5𝑖=1=51.4,∑(𝑥𝑖−𝑥−)
25𝑖=1=50,∑(𝑦𝑖−𝑦−)25𝑖=1=62.8,∴相关系数𝑟=51.4√50×62.8≈0.9173.令回归方程𝑦=𝑎+𝑏𝑥,则𝑏=51.450=1.028,∴𝑎=6.8−1.028×4=2.688,即回归方程
为𝑦=1.028𝑥+2.688,可得(𝑥𝑖,𝑦̂𝑖)为(1,3.716),(2,4.744),(3,5.772),(4,6.8),(10,12.968),∴残差平方和∑(𝑦̂𝑖−𝑦𝑖)25�
�=1=23.1192,故𝑅2=1−∑(𝑦̂𝑖−𝑦𝑖)25𝑖=1∑(𝑦̂𝑖−𝑦−)25𝑖=1=0.5625,去掉𝐷(3,10)后,𝑥−1=1+2+4+104=4.25,𝑦−1=3+4+5+125=4.8,则∑
(𝑥𝑖−𝑥−1)(𝑦𝑖−𝑦−1)4𝑖=1=49,∑(𝑥𝑖−𝑥−1)24𝑖=1=48.75,∑(𝑦𝑖−𝑦−1)24𝑖=1=55.76,∴相关系数𝑟1=49√48.75×55.76≈0.9398.∴𝑟1>𝑟,A、D正确;令回归方
程𝑦=𝑚+𝑛𝑥,则𝑛=4948.75≈1.005,∴𝑚=4.8−1.005×4.25≈0.5288,即回归方程为𝑦=1.005𝑥+0.5288,可得(𝑥𝑖,𝑦̂1𝑖)为(1,1.5338),(2,2.5388),(4,4.5488),(10,1
0.5788),∴残差平方和∑(𝑦̂1𝑖−𝑦𝑖)24𝑖=1≈6.5082,故𝑅12=1−∑(𝑦̂1𝑖−𝑦𝑖)24𝑖=1∑(𝑦̂1𝑖−𝑦−1)24𝑖=1=0.8679,∴𝑅12>𝑅2,B错误,C正确;故选:ACD.10.(5分)
(2023·高二单元测试)下列命题正确的是()A.若甲、乙两组数据的相关系数分别为0.66和−0.85,则乙组数据的线性相关性更强;B.在检验A与B是否有关的过程中,根据数据算得𝜒2=6.352,已知𝑃(𝜒2≥5.024)=0.025,𝑃(𝜒2≥6.635)=0
.01,则有99%的把握认为A与B有关;C.已知随机变量X服从正态分布𝑁(1,𝜎2),若𝑃(𝑋≤2)=0.68,则𝑃(𝑋<0)=0.32;D.在回归分析中,残差平方和与决定系数𝑅2都可以用
来刻画回归的效果,它们的值越小,则模型的拟合效果越好.【解题思路】A比较相关系数的绝对值大小即可判断;B由独立检验基本思想,先判断𝜒2与5.024,6.635大小关系,进而确定相关性的把握程度;C由正态分布的对称性求概率;D根据残差平方和与决定系数𝑅2的意义判断.【解答过程】
A:由|−0.85|>|0.66|知:乙组数据的线性相关性更强,正确;B:由5.024<𝜒2=6.352<6.635,即𝑃(𝜒2≥5.024)=0.025,则有97.5%的把握认为A与B有关,错误
;C:由已知:随机变量X的分布曲线关于𝑋=1对称,故𝑃(𝑋<0)=1−𝑃(𝑋≤2)=0.32,正确;D:残差平方和越小,模型的拟合效果越好,但决定系数𝑅2越大,模型的拟合效果越好,错误.故选:AC.11.(5分
)(2022春·江苏常州·高二期末)北京冬奥会成功举办后,大众对冰雪运动关注度不断上升,为研究市民对冰雪运动的喜好是否和性别有关,某校学生社团对市民进行了一次抽样调查,得到列联表如下:冰雪运动的喜好性别合计男性女性喜欢140m140+m不喜欢n8080+n合计140+n80+m220+m+
n若男性喜欢冰雪运动的人数占男性人数710,女性喜欢冰雪运动的人数占女性人数35,则()A.列联表中n的值为60,m的值为120B.随机对一位路人进行调查,有95%的可能性对方喜欢冰雪运动C.有95%的把握认为市民对冰雪运动的喜好和
性别有关D.没有99%的把握认为市民对冰雪运动的喜好和性别有关【解题思路】根据题意分别计算𝑚,𝑛的值,填写列联表,计算观测值,对照临界值即可得出结论.【解答过程】解:因为男性喜欢冰雪运动的人数占男性人数的710,所以140140+𝑛=71
0,解得𝑛=60,又因为女性喜欢冰雪运动的人数占女性人数的35,所以𝑏80+𝑚=35,解得𝑚=120,所以选项A正确;计算260400=0.65,所以随机对一路人进行调查,有65%的可能性对方喜欢冰雪运动,选项B错误;填写列联表为:
冰雪运动的喜好性别合计男性女性喜欢140120260不喜欢6080140合计200200400由表中数据,计算𝐾2=400×(140×80−120×60)2200×200×260×140≈4.396>3.841,
所以有95%的把握认为市民性别和喜欢冰雪运动有关系,选项C正确;因为𝐾2≈4.396<6.635,所以没有99%的把握认为市民性别和喜欢冰雪运动有关系,选项D正确.故选:ACD.12.(5分)(2023
·全国·高二专题练习)计算机显示的数字图像是由一个个小像素点组合而成的.处理图像时,常会通过批量调整各像素点的亮度,间接调整图像的对比度、饱和度等物理量,让图像更加美观.特别地,当图像像素点规模为1行𝑛+1列时,设第i列像素点的亮度为𝑥𝑖,则该图像对比度计算公式为𝐶{𝑥
𝑖}=1𝑛∑(𝑥𝑖−𝑥𝑖+1)2𝑛𝑖=1.已知某像素点规模为1行𝑛+1列的图像第i列像素点的亮度𝑥𝑖∈[0,9](𝑖=1,2,⋅⋅⋅,𝑛+1),现对该图像进行调整,有2种调整方案:①𝑦𝑖=𝑎𝑥𝑖+𝑏(𝑎>0,𝑏>0
,𝑖=1,2,⋅⋅⋅,𝑛+1);②𝑧𝑖=𝑐lg(𝑥𝑖+1)(𝑐>0,𝑖=1,2,⋅⋅⋅,𝑛+1),则()A.使用方案①调整,当𝑏=9时,𝑦𝑖>𝑥𝑖(𝑖=1,2,⋅⋅⋅,𝑛+1)B.使用方案②调整,当𝑐=9时,𝑧𝑖<𝑥𝑖(𝑖=1,2,⋅⋅
⋅,𝑛+1)C.使用方案①调整,当𝐶{𝑥𝑖}<𝐶{𝑦𝑖}时,𝑎>1D.使用方案②调整,当𝑥𝑖=9(𝑖−1)𝑛(𝑖=1,2,⋅⋅⋅,𝑛+1),𝑐≤ln10时,𝐶{𝑥𝑖}<𝐶{𝑧𝑖}【解题思路】方案①:根据𝑦𝑖=𝑎𝑥𝑖
+𝑏的性质,将𝑏=9、𝑎>0及𝑥𝑖∈[0,9]代入判断A;利用对比度公式可得𝐶{𝑦𝑖}=𝑎2𝐶{𝑥𝑖},即可判断C;方案②:在𝑧𝑖=9lg(𝑥𝑖+1)时代入特殊值𝑥𝑖=9判断B;根据条件判断𝐶{𝑧𝑖}∈(𝑡2l
n210𝑛10𝑛+9,𝑡2ln2𝑛𝑛+9)且𝐶{𝑥𝑖}=(9𝑛)2,特殊值𝑛=1代入判断D.【解答过程】使用方案①调整:当𝑏=9时𝑦𝑖=𝑎𝑥𝑖+9且𝑎>0,又𝑥𝑖∈[
0,9]则𝑦𝑖>𝑥𝑖,A正确;𝐶{𝑥𝑖}=1𝑛∑(𝑥𝑖−𝑥𝑖+1)2𝑛𝑖=1,𝐶{𝑦𝑖}=𝑎2𝑛∑(𝑥𝑖−𝑥𝑖+1)2𝑛𝑖=1,当𝐶{𝑥𝑖}<𝐶{𝑦𝑖},即𝑎2𝑛>1𝑛且𝑛∈N∗,又𝑎>
0,可得𝑎>1,C正确;使用方案②调整:当𝑐=9时𝑧𝑖=9lg(𝑥𝑖+1),显然若𝑥𝑖=9时𝑧𝑖=9,B错误;𝑧𝑖=𝑐⋅ln(𝑥𝑖+1)ln10,而0<𝑐≤ln10,则𝑡=𝑐ln10∈(0,1],故𝑧𝑖=𝑡ln(𝑥𝑖+1),又𝑥𝑖=9(�
�−1)𝑛(𝑖=1,2,⋅⋅⋅,𝑛+1),则𝑧𝑖=𝑡ln(9𝑖−9+𝑛𝑛),𝑧𝑖+1=𝑡ln(9𝑖+𝑛𝑛),所以𝑧𝑖−𝑧𝑖+1=𝑡[ln(9𝑖−9+𝑛𝑛)−ln(9𝑖+𝑛𝑛)]=𝑡ln(1−9
9𝑖+𝑛),而1−99𝑖+𝑛∈[𝑛𝑛+9,10𝑛10𝑛+9],𝑛=1时1−99𝑖+𝑛∈[110,1019],则(𝑧𝑖−𝑧𝑖+1)2∈[𝑡2ln21910,𝑡2ln210],则𝐶{𝑧𝑖}∈(𝑡2ln21910,
𝑡2ln210),此时𝐶{𝑥𝑖}=(9𝑛)2=81,显然存在𝐶{𝑥𝑖}>𝐶{𝑧𝑖},D错误.故选:AC.三.填空题(共4小题,满分20分,每小题5分)13.(5分)(2023·全国·高三专题练习)𝑥和𝑦的散点图如图所示,则下
列说法中所有正确命题的序号为①③.①𝑥,𝑦是负相关关系;②𝑥,𝑦之间不能建立线性回归方程;③在该相关关系中,若用𝑦=𝑐1𝑒𝑐2𝑥拟合时的相关指数为𝑅12,用𝑦̂=𝑏̂𝑥+𝑎̂拟合时
的相关指数为𝑅22,则𝑅12>𝑅22.【解题思路】由图可知,散点图呈整体下降趋势,据此判断①的正误;由试验数据得到的点将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,据此判断②的正误;根据散点图比较两个方程的拟合效果,比较那个拟合效果更好,据此判断③;.【解
答过程】在散点图中,点散布在从左上角到右下角的区域,因此𝑥,𝑦是负相关关系,故①正确;x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;由散点图知用𝑦=𝑐1𝑒𝑐2𝑥拟合比用𝑦̂=𝑏̂𝑥+𝑎̂拟合效果要好,则𝑅12>𝑅
22,故③正确.故答案为:①③.14.(5分)(2022·全国·高三专题练习)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备
的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:使用年限x(单位:年)1234567失效费y(单位:万元)2.903.303.604.404.805.205.90由上表数据可知,y与x的相关
系数为0.99.(精确到0.01,参考公式和数据:𝑟=∑⬚𝑛𝑖=1(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)√∑⬚𝑛𝑖=1(𝑥𝑖−𝑥)2∑⬚𝑛𝑖=1(𝑦𝑖−𝑦)2,∑(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)7𝑖=1=14.
00,∑(𝑦𝑖−7𝑖=1𝑦)2=7.08,√198.24≈14.10)【解题思路】分别求出𝑥,𝑦,∑⬚7𝑖=1(𝑥𝑖−𝑥)2,再利用参考公式和数据计算即可.【解答过程】由题意,知𝑥=1+2+3+4+5+6
+77=4,𝑦=2.90+3.30+3.60+4.40+4.80+5.20+5.907=4.30,∑(𝑥𝑖−𝑥)27𝑖=1=(1−4)2+(2−4)2+(3−4)2+(4−4)2+(5−4)2+(6−4)2+(
7−4)2=28.所以𝑟=14.00√28×7.08=14.00√198.24≈14.0014.10≈0.99.所以y与x的相关系数近似为0.99.故答案为:0.99.15.(5分)(2022·全国·高三专题练习)某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店
的个数,先在其中5个地区进行试点,得到试点地区加盟店个数x及单店日平均营业额y(万元)的::数据如下:x12345y10.910.29.07.87.1根据上表可得y关于x线性相关,为保证规模和效益,该公司要求在其他5个地
区需满足同一地区所有加盟店的日平均营业额预计值总和不低于35万元,则一个地区开设的加盟店个数m的所有可能取值为5,6,7.(参考数据:∑𝑥𝑖𝑦𝑖=1255𝑖=1,∑𝑥𝑖2=555𝑖=1)【解题思路】根据题意求出𝑥̅、𝑦̅,利用最小二乘法求出𝑏̂,
进而求出𝑎̂即可得出线性回归方程,根据题意列出不等式,解之即可.【解答过程】由题意可得,𝑥=1+2+3+4+55=3,𝑦=10.9+10.2+9+7.8+7.15=9,∑𝑥𝑖5𝑖=1𝑦𝑖=1×10.9+2×10.2
+3×9+4×7.8+5×7.1=125,∑𝑥𝑖25𝑖=1=12+22+32+42+52=55,设线性回归方程为𝑦̂=𝑏̂𝑥+𝑎̂,则𝑏̂=∑𝑥𝑖5𝑖=1𝑦𝑖−5𝑥𝑦∑𝑥𝑖25𝑖=1
−5𝑥2=125−13555−45=−1,𝑎̂=9−(−3)=12,故线性回归方程为𝑦̂=−𝑥+12.根据题意,𝑚(12−𝑚)≥35,解得5≤𝑚≤7,又𝑚∈𝑁∗,所以m的所有可能取值为5,6,7.故答案为:5
,6,7.16.(5分)(2022春·上海黄浦·高二期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的13,男生追星的人数占男生人数的14,女生追星的人数占女生人数的12,若有95%的把握认为
中学生追星与性别有关,则女生至少有20人.参考数据及公式如下:𝑃(𝜒2≥𝑘0)0.0500.0100.001𝑘03.8416.63510.828𝜒2=𝑛(𝑎𝑑−𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),𝑛=𝑎+𝑏+𝑐+𝑑.【
解题思路】设男生人数为x,可得列联表,由此计算𝜒2的表达式,根据有95%的把握认为中学生追星与性别有关,可得不等式455𝑥>3.841,结合𝑥=12𝑘,𝑘∈N∗,可求得答案.【解答过程】设男生人数为x,则可得列联表如下:
喜欢追星不喜欢追星合计男生14𝑥34𝑥𝑥女生16𝑥16𝑥13𝑥合计512𝑥1112𝑥43𝑥则计算𝜒2=43𝑥⋅(14𝑥×16𝑥−16𝑥⋅34𝑥)2𝑥⋅13𝑥⋅512𝑥⋅1112𝑥=
455𝑥,若有95%的把握认为中学生追星与性别有关,则需455𝑥>3.841,解得𝑥>55×3.8414≈52.81,又𝑥=12𝑘,𝑘∈N∗,故x至少为60,则女生至少有20人,即有95%的把握认为中学生追星与性别有关时,女生至少有20人,故答案为︰20
.四.解答题(共6小题,满分70分)17.(10分)(2022·高二课时练习)某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第𝑥年与年销量𝑦(单位:万件)之间的关系如表:𝑥1234𝑦12284
256在图中画出表中数据的散点图,推断两个变量是否线性相关,计算样本相关系数,并估计它们的相关程度.附注:参考数据:√∑⬚4𝑖=1(𝑦𝑖−𝑦)2≈32.6,√5≈2.24,∑𝑥𝑖𝑦𝑖4𝑖=1=418.参考公式:相关系
数𝑟=∑(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)𝑛𝑖=1√∑(𝑥𝑖−𝑥)2∑(𝑦𝑖−𝑦)2𝑛𝑖=1𝑛𝑖=1【解题思路】由已知数据作出散点图,由图像可以看出推断𝑥与𝑦线性相关,再由公式计算可得结论.【解答过程】解:作出散点
图如图:由散点图可知,各点大致分布在一条直线附近,由此推断𝑥与𝑦线性相关.由题中所给表格及参考数据得:𝑥=52,𝑦=692,∑𝑥𝑖𝑦𝑖4𝑖=1=418,√∑(𝑦𝑖−𝑦)24𝑖=1≈32.6,∑𝑥𝑖24𝑖=1=30,∑(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)=∑𝑥𝑖
𝑦𝑖−4𝑥𝑦4𝑖=14𝑖=1=418−4×52×692=73,√∑(𝑥𝑖−𝑥)24𝑖=1=√∑𝑥𝑖24𝑖=1−4𝑥2=√30−4×(52)2=√5≈2.24,𝑟=∑(𝑥𝑖−
𝑥)(𝑦𝑖−𝑦)4𝑖=1√∑(𝑥𝑖−𝑥)2∑(𝑦𝑖−𝑦)24𝑖=14𝑖=1=732.24×32.6≈0.9997.∵𝑦与𝑥的相关系数近似为0.9997,可以推断该公司的年销量𝑦与第𝑥年呈正线性相关,且线性相关程度很强.18.(12分)(202
2秋·河北沧州·高三阶段练习)某统计部门依据《中国统计年鉴——2017》提供的数据,对我国1997-2016年的国内生产总值(GDP)进行统计研究,作出了两张散点图:图1表示1997-2016年我国的国内生产总值(GDP),图2表示20
07-2016年我国的国内生产总值(GDP).(1)用𝑟𝑖(𝑖=1,2)表示第i张图中的年份与GDP的线性相关系数,𝑟𝑖∈{0.9647,0.9980},依据散点图的特征分别写出𝑟𝑖的结果;(2)分别用线性回归模型和指数回归模型对两张散点图进
行回归拟合,分别计算出统计数据——相关指数𝑅2的数值,部分结果如下表所示:年份1997-20162007-2016线性回归模型0.9306指数回归模型0.98990.978①将上表中的数据补充完整(结果保留3位小数,直接写在答题卡上);②若估计2017年的GDP,结合数据说明采用哪张图中的哪种回
归模型会更精准一些?若按此回归模型来估计,2020年的GDP能否突破100万亿元?事实上,2020年的GDP刚好突破了100万亿元,估计与事实是否吻合?结合散点图解释说明.【解题思路】(1)观察两图,根据𝑟𝑖的范围,我们只需要确定哪个图像关联系数更高,即选择较大的那个相关系数;(2
)第一小问可根据第(1)问中确定的𝑟2的值,通过𝑅2=(𝑟2)2来计算;第二小问可通过计算出来的数据跟已有的数据对比,选出最适合模拟最近的年份的回归模型,并且按照这个回归模型来模拟,预测2020年是否能够突破100万亿,并且根据回归模型的增长趋势来判断.【解答过程】(1)由散点图可知,
图2拟合效果更好、相关系数较大,所以𝑟1=0.9647,𝑟2=0.9980.(2)①0.996②由图2中的线性回归模型得到的相关指数为0.996,是所有回归模型的相关指数中数值最大的,而且2017年是最近的年份,因此选择图2中的线性回归模型来估计
2017年的GDP,是比较精准的.按照图2中的线性回归模型来估计(延长回归直线可发现),2020年不能突破100万亿元.估计与事实不吻合.综合两张图来考虑,我国的GDP随年份的增长整体上呈现指数增长的趋势,而且2020年比2016年又多发展了4年,指数回归趋于明显,因此
,按照线性回归模型得到的估计值与实际数据有偏差、不吻合,属于正常现象.19.(12分)(2023春·江西·高二开学考试)近年来,学生职业生涯规划课程逐渐进入课堂,考生选择大学就读专业时不再盲目扎堆热门专业,
报考专业分布更加广泛,之前较冷门的数学、物理、化学等专业报考的人数也逐年上升.下表是某高校数学专业近五年的录取平均分与当年该学校的最低提档线对照表:年份20172018201920202021年份代码(𝑡)12345该校最低提档分数线5
10511520512526数学专业录取平均分522527540536554提档线与数学专业录取平均分之差(𝑦)1216202428(1)根据上表数据可知,y与t之间存在线性相关关系,请用最小二乘法求y关于t的线性回归方程;(2)据以往数据可知,该大学每年数学专
业的录取分数X服从正态分布𝑁(𝜇,16),其中𝜇为当年该大学的数学录取平均分,假设2022年该校最低提档分数线为540分.①若该大学2022年数学专业录取的学生成绩在584分以上的有3人,本专业2022年录取学生共多少人?进入本专业高考成绩前46名的学生可以获得一等奖学金,则一等奖学
金分数线应该设定为多少分?②在①的条件下,若从该专业获得一等奖学金的学生中随机抽取3人,用𝜉表示其中高考成绩在584分以上的人数,求随机变量𝜉的分布列与数学期望.参考公式:𝑏̂=∑(𝑡𝑖−𝑡̅)(𝑦𝑖−𝑦̅)𝑛𝑖=1∑(𝑡𝑖−𝑡̅)2𝑛𝑖=1,𝑎̂=𝑦̅−
𝑏̂𝑡.参考数据:𝑃(𝜇−𝜎<𝑋≤𝜇+𝜎)≈0.683,𝑃(𝜇−2𝜎<𝑋≤𝜇+2𝜎)≈0.954,𝑃(𝜇−3𝜎<𝑋≤𝜇+3𝜎)≈0.997【解题思路】(1)根据表中数据,分别求得𝑡̅,𝑦,𝑏̂,𝑎̂,写出线性回归方程.(
2)①由(1)中的线性回归方程求得𝑡=6时的𝑦̂,进而得到该大学2022年的数学专业录取平均分,然后利用3𝜎原则求解,再由584分以上的有3人可计算出本专业2022年录取学生共多少人;再由前46名占比计算出一等奖学金分数线应该设定为多少分;②若从该专业
获得一等奖学金的学生中随机抽取3人,用𝜉表示其中高考成绩在584分以上的人数,其中该专业获得一等奖学金的学生为46人,其中高考成绩在584分以上的有3人,则𝜉的可能取值为0,1,2,3,再由超几何分布的概率求解计算出概率并列出分布列进而求得数学期望.【解答过程】(1)由题意知�
�̅=15×(1+2+3+4+5)=3,𝑦̅=15×(12+16+20+24+28)=20,∑(𝑡𝑖−𝑡̅)𝑛𝑖=1(𝑦𝑖−𝑦̅)=16+4+0+4+16=40,∑(𝑡𝑖−𝑡̅)2𝑛𝑖=1=4+1+0+
1+4=10,所以𝑏̂=4010=4,𝑎̂=𝑦̅−𝑏̂𝑡̅=20−4×3=8,故所求线性回归方程为𝑦̂=4𝑡+8.(2)①由(1)知,当𝑡=6时,𝑦̂=4×6+8=32,故该大学2022年的数学专业录取平
均分约为540+32=572.即𝜇=572,因为584=572+3×4=𝜇+3𝜎,又𝑃(𝑋≥584)=𝑃(𝑋≥572+3×4)=𝑃(𝑋≥𝜇+3𝜎)=12[1−𝑃(𝜇−3𝜎<𝑋≤𝜇+3𝜎)]≈12
(1−0.997)=0.0015,若该大学2022年数学专业录取的学生成绩在584分以上的有3人,则本专业2022年录取学生共30.0015=2000;进入本专业高考成绩前46名的学生占录取人数的462000=0.023,设
一等奖学金分数线应该设定为𝑥0分,则𝑃(𝑋≥𝑥0)=0.023,∴𝑃(1144−𝑥0<𝑋<𝑥0)=1−2×0.023=0.954,∴𝑃(572−2×4<𝑋<572+2×4)=1−2×0.023
=0.954,∴𝑥0=572+2×4=580,故一等奖学金分数线应该设定为580分;②若从该专业获得一等奖学金的学生中随机抽取3人,用𝜉表示其中高考成绩在584分以上的人数,其中该专业获得一等奖学金的学生为46人,其中高考成绩在584分以上的有
3人,则𝜉的可能取值为0,1,2,3;𝑃(𝜉=0)=C433C463=1234115180;𝑃(𝜉=1)=C432C31C463=270915180;𝑃(𝜉=2)=C431C32C463=12915180
;𝑃(𝜉=3)=C33C463=115180,𝜉0123𝑃123411518027091518012915180115180𝐸(𝜉)=0×1234115180+1×270915180+2×12915180+3×115180=99506.20.(12分)(2022·河南·
高三阶段练习)某机构为了了解不同年龄的人对一款智能家电的评价,随机选取了50名购买该家电的消费者,让他们根据实际使用体验进行评分.(Ⅰ)设消费者的年龄为𝑥,对该款智能家电的评分为𝑦.若根据统计数据,用最小二乘法得到𝑦关于𝑥的线性回归方程为�
�̂=1.2𝑥+40,且年龄𝑥的方差为𝑠𝑥2=14.4,评分𝑦的方差为𝑠𝑦2=22.5.求𝑦与𝑥的相关系数𝑟,并据此判断对该款智能家电的评分与年龄的相关性强弱.(Ⅱ)按照一定的标准,将50名消费者的年龄划分为“青年”和“中老年”,评分划分为“好评”和“差
评”,整理得到如下数据,请判断是否有99%的把握认为对该智能家电的评价与年龄有关.好评差评青年816中老年206附:线性回归直线𝑦̂=𝑏̂𝑥+𝑎̂的斜率𝑏̂=∑(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)𝑛𝑖=1∑(𝑥𝑖−𝑥)2
𝑛𝑖=1;相关系数𝑟=∑(𝑥𝑖−𝑥)(𝑦𝑖−𝑦)𝑛𝑖=1√∑(𝑥𝑖−𝑥)2𝑛𝑖=1∑(𝑦𝑖−𝑦)2𝑛𝑖=1,独立性检验中的𝐾2=𝑛(𝑎𝑑−𝑏𝑐)2(𝑎+𝑏)(𝑎+𝑐)(𝑏+𝑑)(𝑐+�
�),其中𝑛=𝑎+𝑏+𝑐+𝑑.临界值表:𝑃(𝐾2≥𝑘0)0.0500.0100.001𝑘03.8416.63510.828【解题思路】(Ⅰ)由r的公式计算求解即可;(Ⅱ)由列联表计算𝐾2,再对照表格判断即可【解答过程】(Ⅰ)相关系数𝑟=∑(𝑥𝑖−�
�̅)(𝑦𝑖−𝑦̅)50𝑖=1√∑(𝑥𝑖−𝑥̅)250𝑖=1∑(𝑦𝑖−𝑦̅)250𝑖=1=∑(𝑥𝑖−𝑥̅)50𝑖=1(𝑦𝑖−𝑦̅)∑(𝑥𝑖−𝑥̅)250𝑖=1⋅√∑(𝑥𝑖−𝑥̅)250𝑖=1√∑(𝑦𝑖
−𝑦̅)250𝑖=1=𝑏̂⋅√50𝑠𝑥2√50𝑠𝑦2=1.2×1215=0.96.故对该款智能家电的评分与年龄的相关性较强.(Ⅱ)由列联表可得𝐾2=50×(8×6−20×16)224×26×28×2
2≈9.624>6.635.故有99%的把握认为对该智能家电的评价与年龄有关.21.(12分)(2022·全国·高三专题练习)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期优惠力度较大,吸引越来越多的人开始使用扫码支付.某
线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用𝑥表示活动推出的天数,𝑦表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示:表1:𝑥1234567𝑦611213466101196根据以上数据,绘制了如图1所示的散点图.参考数据:𝑦̅𝑣̅∑𝑥𝑖
𝑦𝑖7𝑖=1∑𝑥𝑖𝑣𝑖7𝑖=1100.5462.141.54253550.123.47其中𝑣𝑖=lg𝑦𝑖,𝑣̅=17∑𝑣𝑖7𝑖=1.参考公式:对于一组数据(𝑢1,𝑣1),
(𝑢2,𝑣2),...,(𝑢𝑛,𝑣𝑛),其回归直线𝑣=𝛼+𝛽𝑢的斜率和截距的最小二乘估计分别为𝛽̂=∑𝑢𝑖𝑣𝑖−𝑛𝑢̅𝑣̅𝑛𝑖=1∑𝑢𝑖2−𝑛𝑢̅2𝑛𝑖=1,𝑎̂=𝑣̅−𝛽̂𝑢̅.(1)根据散点图判断,在推广期内,𝑦=𝑎+𝑏�
�与𝑦=𝑐⋅𝑑𝑥(𝑐,𝑑均为大于零的常数)哪一个适宜作为扫码支付的人次𝑦关于活动推出天数𝑥的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表1中的数据,求𝑦关于𝑥的回归方程,并预测活动推出第8天使用扫码支付的人次;【解题思路】(1)根据散点图判断𝑦=
𝑐⋅𝑑𝑥适宜作为扫码支付的人数𝑦关于活动推出天数𝑥的回归方程型;(2)通过对数运算法则,利用回归直线方程相关系数,求出回归直线方程,然后求解第八天使用扫码支付的人次.【解答过程】(1)由于表中点的走势不在任何一条直线附近
,因此应该是非线性的,故可判断𝑦=𝑐⋅𝑑𝑥适宜作为扫码支付的人数𝑦关于活动推出天数𝑥的回归方程类型;(2)∵𝑦=𝑐⋅𝑑𝑥,两边同时取常用对数得:lg𝑦=lg𝑐+𝑥lg𝑑;设lg𝑦=𝑣,∴𝑣=lg𝑐+𝑥lg𝑑∵𝑥=
4,𝑣=1.54,∑𝑥𝑖⬚27𝑖=1=140,∴lg𝑑̂=∑𝑥𝑖𝑣𝑖7𝑖=1−7𝑥𝑣∑𝑥𝑖⬚27𝑖=1−7𝑥2=50.12−7×4×1.54140−7×42=728=0.25,把样本中心点(4,1.54)代入𝑣=lg
𝑐+𝑥lg𝑑,得:𝑣̂=0.54+0.25𝑥,∴lg𝑦̂=0.54+0.25𝑥,∴𝑦关于𝑥的回归方程式:𝑦̂=100.54+0.25𝑥=100.54×(100.25)𝑥=3.47×100.25𝑥.把𝑥=8代入上式:𝑦̂=3
.47×102=347,故活动推出第8天使用扫码支付的人次为3470.22.(12分)(2022·全国·高三专题练习)受疫情的影响,各实体商铺的销售额受到了不同程度的冲击,某小商品批发市场的管理部门提出
了“线上线下两不误,打赢销售攻坚战”的口号,鼓励小商品批发市场内的所有商户开展线上销售活动.管理部门为了调查商户每天销售额与每天线上销售时间之间的相关关系,对小商品批发市场内的商户随机选取45家进行跟踪调查,其中
每日线上销售时间不少于6小时的商户有19家,余下的商户中,每天的销售额不足3万元的占813,统计后得到如下2×2列联表:销售额不少于3万元销售额不足3万元合计线上销售时间不少于6小时419线上销售时间不足6小时合计45(1)请完成上面的2×2列联表,并判断是否所有99%的把握认为“小商品批发市场内
的商户每天销售额与商户每天线上销售时间有关.”(2)(i)按分层抽样的方法,在上述样本中从销售额不少于3万元和销售额不足3万元的两组商户上抽取9家商户,设抽到销售额不足3万元且每天线上销售时间不足6小时的人数是𝑋,求𝑋的分布列(概率
用组合数算式表示);(ii)若将频率视为概率,从小商品批发市场内所有商户中每天销售额不少于3万元的商户中随机抽取20家,求这些商户中每天线上销售时间不少于6小时的商户家数的数学期望和方差.附:𝑃(𝐾2≥𝑘0)0.100.050.0250.0100.0050.001𝑘02.70
63.8415.0246.6357.87910.828参考公式:𝐾2=𝑛(𝑎𝑑−𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),其中𝑛=𝑎+𝑏+𝑐+𝑑.【解题思路】(1)根据表格先算出每日线上销售时间不足6小时的商户有45−19=26家,再利用每天的销售
额不足3万元的占813,得到线上销售不足6小时且销售额不足3万元的有26×813=16家,再利用合计结果可算出其它数据;(2)(i)由分层抽样知,需要从销售额不足3万元的商户中抽取9×2045=4(家),则𝑋的可能取值为0,1,2,3,4,分别算出事件对
应的概率,写出分布列;(ii)设从全市场销售额不少于3万元的商户中随机抽取20家,这些商户中每天线上销售时间不少于6小时的人数为𝑌,则𝑌∼𝐵(20,0.6),利用二项分布公式求期望和方程.【解答过程】(
1)销售额不少于3万元销售额不足3万元合计线上销售时间不少于6小时15419线上销售时间不足6小时101626合计252045∵𝐾2=45(15×16−10×4)219×26×25×20≈7.29>6.635,∴
有99%的把握认为“小商品批发市场内的商户每天销售额与商户每天线上销售时间有关”.(2)(i)由分层抽样知,需要从销售额不足3万元的商户中抽取9×2045=4(家),则𝑋的可能取值为0,1,2,3,4,∴𝑃(𝑋=0)=C
44C204,𝑃(𝑋=1)=C43C161C204,𝑃(𝑋=2)=C42C162C204,𝑃(𝑋=3)=C41C163C204,𝑃(𝑋=4)=C164C204,∴𝑋的分布列为𝑋01234𝑃C44C204C43C161C204C42C
162C204C41C163C204C164C204(ii)从全市场销售额不少于3万元的商户中随机抽取1家,此商户每天线上销售时间不少于6小时的概率为1525=0.6,设从全市场销售额不少于3万元的商户中随机抽取20家,这些商户中每天线上销售时间不少于6小时的人数为𝑌,则𝑌∼�
�(20,0.6),故𝐸(𝑌)=20×0.6=12,𝐷(𝑌)=20×0.6×(1−0.6)=4.8.