【文档说明】2023届高考数学优质二诊模拟试题分类汇编 专题03 概率统计 Word版含解析.docx,共(14)页,610.085 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-7bfa72e3945533e754032d21a021f50b.html
以下为本文档部分文字说明:
一.单选1.(广东省佛山市2023届高三二模)“基础学科拔尖学生培养试验计划”简称“珠峰计划”,是国家为回应“钱学森之问”而推出的一项人才培养计划,旨在培养中国自己的学术大师.已知浙江大学、复旦大学、武汉大学、中山大学均有开设数学学科拔尖学生培养基地,某班级有5位同学从中任选一所学校作为奋斗目标
,则每所学校至少有一位同学选择的不同方法数共有()A.120种B.180种C.240种D.300种【详解】将5位同学分为2,1,1,1的分组,再分配到4所学校,共有2454CA240=种方法.故选:C2.(广东省深圳市2023届高
三二模)从1,2,3,4,5中随机选取三个不同的数,若这三个数之积为偶数,则它们之和大于8的概率为()A.13B.23C.49D.59【详解】从1,2,3,4,5中随机选取三个不同的数可得基本事件为()()()()()()()()()()1,2,3,1,2,4,1,
2,5,1,3,4,1,3,5,1,4,5,2,3,4,2,3,5,2,4,5,3,4,5,10种情况,若这三个数之积为偶数有()()()()()()()()()1,2,3,1,2,4,1,2,5,1,3,4,1,4,5,2,3,4,2,3,5,2,4,5,3,4,5,9种情况
,它们之和大于8共有()()()()()1,4,5,2,3,4,2,3,5,2,4,5,3,4,5,5种情况,从1,2,3,4,5中随机选取三个不同的数,若这三个数之积为偶数,则它们之和大于8的概率为59P=.故选:D.3.(浙江省杭州市202
3届高三下学期教学质量检测(二模))某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉()10,2D后,下列说法正确的是()A.相关系数r变小B.决定系数2R变小C.残差平方和变大D.解释变量x与预报变量y的相关性变强【详
解】从图中可以看出()10,2D较其他点,偏离直线远,故去掉()10,2D后,回归效果更好,对于A,相关系数r越接近于1,模型的拟合效果越好,若去掉()10,2D后,相关系数r变大,故A错误;对于B,决定系数2R越接近于1,模型的拟合效果越好,若去掉()10,2D
后,决定系数2R变大,故B错误;对于C,残差平方和越小,模型的拟合效果越好,若去掉()10,2D后,残差平方和变小,故C错误;对于D,若去掉()10,2D后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.故选:D.二、多
选4.(广东省广州市2023届高三二模)有3台车床加工同一型号的零件,第1台加工的次品率为8%,第2台加工的次品率为3%,第3台加工的次品率为2%,加工出来的零件混放在一起.已知第1,2,3台车床加工的零件数分别占总数的
10%,40%,50%,从混放的零件中任取一个零件,则下列结论正确的是()A.该零件是第1台车床加工出来的次品的概率为0.08B.该零件是次品的概率为0.03C.如果该零件是第3台车床加工出来的,那么它不是次品的概率为0.98D
.如果该零件是次品,那么它不是第3台车床加工出来的概率为13【详解】记事件A:车床加工的零件为次品,记事件iB:第i台车床加工的零件,则1(|)8%PAB=,2(|)3%PAB=,3(|)2%PAB=,1()10%PB=,2()40%PB=,3
()50%PB=,对于A,任取一个零件是第1台生产出来的次品概率为111()(|)()8%10%0.008PABPABPB===,故A错误;对于B,任取一个零件是次品的概率为123()()()()8%10%3%40%2%50%0.03PAPABPABPAB=++=++=,故B正确;对于C,
如果该零件是第3台车床加工出来的,那么它不是次品的概率为33()1()12%0.98PABPAB=−=−=,故C正确;对于D,如果该零件是次品,那么它不是第3台车床加工出来的概率为3333()(|)()2%50%21(|)11()()0.033PABPABPBPBAPAPA−
=−==−=,故D错误.故选:BC.5.(广东省深圳市2023届高三二模)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表):x12345y0.50.811.21.5假设经验回归方程为ˆˆ0.28ybx=+,则()A.ˆ0.24b=B.当8x=时,y的预测值为
2.2C.样本数据y的40%分位数为0.8D.去掉样本点()3,1后,x与y的样本相关系数r不变【详解】对于A选项:线性回归方程ˆˆ0.28ybx=+必过点(),xy,3x=,1y=,解得ˆ0.24b=,所以选项A正确;对于B选项:当8x=时,ˆ0.240.28yx=+可以的出y的预测值为
2.2,所以B选项正确;对于C选项:从小到大排列共有5个数据,则540%2i==是整数,则第40百分位数为从小到大排列的第3个数据,即第40百分位数为3,所以C选项错误;对于D选项:因为相关系数为(
)()()()12211niiinniiiixxyyrxxyy===−−=−−,5组样本数据的相关系数为:()()()()()()()()()()()()515522222221120.510.20010.220.5410140.50.200.20.5iiiiiiixxyyrx
xyy===−−−−+−−+++==++++++++−−,去掉样本中心点()3,1后相关系数为()()()()()()()()()()()()41442222221120.510.210.220.5
41140.50.20.20.5iiiiiiixxyyrxxyy===−−−−+−−++==++++++−−,所以相关系数r不变,所以D选项正确;故选:ABD.6.(山东省济南市2023届高三二模)有6个相同的球,分别标有数字1,2,3,4,5,6,从中不放回的随机取两次
,每次取1个球,甲表示事件“第一次取出的球的数字是奇数”,乙表示事件“第二次取出的球的数字是偶数”,丙表示事件“两次取出的球的数字之和是奇数”,丁表示事件“两次取出的球的数字之和是偶数”,则()A.乙发生的概率为12B.丙发生的概率为12C.甲与丁相互独立D.丙与丁互为对
立事件【详解】设A为事件“第一次取出的球的数字是奇数”,B为事件“第二次取出的球的数字是偶数”,C为事件“两次取出的球的数字之和是奇数”,D为事件“两次取出的球的数字之和是偶数”,则()3162PA==
,()3233165652PB=+=,故A正确.()3332655PC==,()3222655PD==,故B错误.而()()()321655PADPAPD===,故C正确.两次取出的数字之和要么为奇数,要么为偶数,
故丙与丁互为对立事件,故D正确.故选:ACD.7.(浙江省杭州市2023届高三下学期教学质量检测(二模))一口袋中有除颜色外完全相同的3个红球和2个白球,从中无放回的随机取两次,每次取1个球,记事件A1:第一次取出的是红球;事件A2:第一次取出的是白球;事件B:取出的两球同色;事件C:取出
的两球中至少有一个红球,则()A.事件1A,2A为互斥事件B.事件B,C为独立事件C.()25PB=D.()234PCA=【详解】第一次取出的球是红球还是白球两个事件不可能同时发生,它们是互斥的,A正确;由于是红球有3个,白
球有2个,事件B发生时,两球同为白色或同为红色,2325223225CC()3()CC()4CPBCPCPB===+,事件B不发生,则两球一白一红,()1PC=,,BC不独立,B错;223225CC2()C5PB+==,C正确;
事件2A发生后,口袋中有3个红球1个白球,只有从中取出一个红球,事件C才发生,所以23(|)4PCA=,D正确.故选:ACD.三.填空8.(广东省佛山市2023届高三二模)佛山被誉为“南国陶都”,拥有上千年的制陶史,佛山
瓷砖享誉海内外.某企业瓷砖生产线上生产的瓷砖某项指标()2800,XN,且()8010.6PX=,现从该生产线上随机抽取10片瓷砖,记Y表示800801X的瓷砖片数,则()EY=______.【详解】因为()2800,XN
,均值为800=,且()8010.6PX=,所以()()()8008018018000.60.50.1PXPXPX=−=−=,由题可得(10,0.1)YB,所以()100.11EY==.故答案为:1.9.(广东省佛山市2023届高
三二模)有n个编号分别为1,2,…,n的盒子,第1个盒子中有2个白球1个黑球,其余盒子中均为1个白球1个黑球,现从第1个盒子中任取一球放入第2个盒子,再从第2个盒子中任取一球放入第3个盒子,以此类推,则从第2个盒子中取到白球的概率是__
____,从第n个盒子中取到白球的概率是______.【详解】记事件iA表示从第()1,2,,iin=个盒子里取出白球,则()123PA=,()()11113PAPA=−=,所以()()()()()()()
212121211212211533339PAPAAPAAPAPAAPAPAA=+=+=+=,()()()()()()()()3232232222211114333327PAPAPAAPAPAAPAPAPA=+=+=+=,()()()()()()()()43433433332111333
3PAPAPAAPAPAAPAPAPA=+=+=+,进而可得()()11133nnPAPA−=+,()()1111232nnPAPA−−=−,又()11126PA−=,()211218PA−=,()()21111232PAP
A−=−,所以()12nPA−是首项为16,公比为13的等比数列,所以()11111126323nnnPA−−==,即()111232nnPA=+,故答案为:59;111232n+.10.(广东省广
州市2023届高三二模)某班有48名学生,一次考试的数学成绩X(单位:分)服从正态分布()280,N,且成绩在80,90上的学生人数为16,则成绩在90分以上的学生人数为____________.【详解】由X(单位:
分)服从正态分布()280,N,知正态密度曲线的对称轴为80x=,成绩在80,90上的学生人数为16,由对称性知成绩在80分上的学生人数为24人,所以90分以上的学生人数为24168−=.故答案为:811.(广东省广州市2023届高三二
模)已知*nN,21nxx−的展开式中存在常数项,写出n的一个值为____________.【详解】二项式21nxx−的展开式的通项为()3121C1C,0,1,2,,rrrnrrnrrnn
Txxrnx−−+=−=−=,因为二项式21nxx−的展开式中存在常数项,所以30nr−=有解,即3nr=,可得n的一个值为3.故答案为:3(答案不唯一)12.(广东省深圳市2023届高三二模)若()29
,2XN,则()713PX=__________(精确到0.01).参考数据:若()2,XN,则()0.683x−,()20.955PX−.【详解】因为2(9,2)XN,根据参考数据()1(713)(2)0.6830
.9550.822PXPX=−+=+.故答案为:0.82.13.(湖北省武汉市2023届高三下学期四月调研)()()6121xx−+的展开式中含2x项的系数为______.【详解】()621x+的通项公式为6
61666=C(2)1C2rrrrrrrTxx−−−+=,所以()()6121xx−+的展开式中含2x项为()()()2452266-C2C2126048xxxxx+=−=−,所以()()6121xx−+展开式中含2x项的
系数为48−.故答案为:48−.14.(山东省济南市2023届高三二模)已知abc表示一个三位数,如果满足ab且cb,那么我们称该三位数为“凹数”,则没有重复数字的三位“凹数”共______个(用数字作答).【详解】,,abc
为取自0,1,2,3,4,5,6,7,8,9中的不同的三个数字,最小的数字放置在中间,余下两数可排百位或个位,故共有“凹数”的个数为3102C2120240==,故答案为:240.15.(浙江省杭州市2023届高三
下学期教学质量检测(二模))在1nxx−的展开式中,只有第5项的二项式系数最大,则展开式中含2x项的系数为___________【详解】由只有第5项的二项式系数最大可得:8n=.∴通项公式()38821881C1CrrrrrrrTxxx−−+=−=−
,令3822r−=,解得4r=.∴展开式中含2x项的系数为()4481C=70−.故答案为:70.四.解答16.(广东省佛山市2023届高三二模)2023年3月5日,国务院总理李克强在政府工作报告中指出“着力扩大消
费和有效投资.面对需求不足甚至出现收缩,推动消费尽快恢复.帮扶旅游业发展.围绕补短板、调结构、增后劲扩大有效投资.”某旅游公司为确定接下来五年的发展规划,对2013~2022这十年的国内旅客人数作了初步处理,用ix和iy分别表示第i年的年
份代号和国内游客人数(单位:百万人次),得到下面的表格与散点图.年份2013201420152016201720182019202020212022年份代码x12345678910国内游客数y3262361
139904432500055426006287932462530(1)2020年~2022年疫情特殊时期,旅游业受到重挫,现剔除这三年的数据,再根据剩余样本数据(),iixy(1i=,2,3,…,7)建立国内游客人数y关于
年份代号x的一元线性回归模型;(2)2023年春节期间旅游市场繁荣火爆,预计2023年国内旅游人数约4550百万人次,假若2024年∼2027年能延续2013年∼2019年的增长势头,请结合以上信息预测2
027年国内游客人数.附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()121ˆniiiniixxyybxx==−−=−,ˆaybx=−参考数据:7131843iiy==,()()714454913104ii
ixy=−−=【详解】(1)由题可得1(1234567)47x=++++++=,()7214941014928iix=−=++++++=,71145431843797iiyy====,所以()()
()717214454913104ˆ468284iiiiixybx==−−===−,454946842677a=−=,所以根据样本数据(),iixy(1i=,2,3,…,7)建立一元线性回归模型为4682677yx=+;(2)由468
2677yx=+可知,年份每增加1年国内旅游人数将增加468百万人次,所以预测2027年国内游客人数为468445506422+=百万人次.17.(广东省广州市2023届高三二模)一企业生产某种产品,通过加大技术创新投入降低了每件产品成本,为了调查年技术创新投入x(单位:千万元)对每件产品成本
y(单位:元)的影响,对近10年的年技术创新投入ix和每件产品成本()1,2,3,,10iyi=的数据进行分析,得到如下散点图,并计算得:6.8x=,70y=,10113iix==,102111.6iix==,101350i
iiyx==.(1)根据散点图可知,可用函数模型byax=+拟合y与x的关系,试建立y关于x的回归方程;(2)已知该产品的年销售额m(单位:千万元)与每件产品成本y的关系为222001005002510yymy=−+++−.该企业的年
投入成本除了年技术创新投入,还要投入其他成本10千万元,根据(1)的结果回答:当年技术创新投入x为何值时,年利润的预报值最大?(注:年利润=年销售额一年投入成本)参考公式:对于一组数据()11,uv、()22,uv、L、(),nnuv,其回归直线vu=+的斜率和截距的最小乘估计分别
为:1221niiiniiuvnuvunu==−=−,ˆvu=−.【详解】(1)解:令1ux=,则y关于u的线性回归方程为yu=+,由题意可得1221103502102001.60.910niniiiiuyuyuu==−−===−−,
702000.310yx=−=−=,则10200yu=+,所以,y关于x的回归方程为20010yx=+.(2)解:由20010yx=+可得20010xy=−,年利润222002001010010500251010yyMmxyy=−−=−+++−−−−()212090.85
00y=−−+,当20y=时,年利润M取得最大值,此时20020020102010xy===−−,所以,当年技术创新投入为20千万元时,年利润的预报值取最大值.18.(广东省深圳市2023届高三二模)飞盘运动是一项入门简单,又具有极强的趣味性和社交性的体育运动,目前已经成为了
年轻人运动的新潮流.某俱乐部为了解年轻人爱好飞盘运动是否与性别有关,对该地区的年轻人进行了简单随机抽样,得到如下列联表:性别飞盘运动合计不爱好爱好男61622女42428合计104050(1)在上述爱好飞盘运动的年轻人中按照性别采用分层抽样的方法抽取10人,再从这10人中随机
选取3人访谈,记参与访谈的男性人数为X,求X的分布列和数学期望;(2)依据小概率值0.01=的独立性检验,能否认为爱好飞盘运动与性别有关联?如果把上表中所有数据都扩大到原来的10倍,在相同的检验标准下,再用独立性检验推断爱好飞盘运
动与性别之间的关联性,结论还一样吗?请解释其中的原因.附:()()()()()22nadbcabcdacbd−=++++,其中nabcd=+++.0.10.010.001x2.7066.63510.828【详解】(1)样本
中爱好飞盘运动的年轻人中男性16人,女性24人,比例为4:6,按照性别采用分层抽样的方法抽取10人,则抽取男性4人,女性6人.随机变量X的取值为:0,1,2,3.()36310C10C6PX===,()2614310CC11C2PX===,(
)2146310CC32,C10PX===()34310C13,C30PX===随机变量X的分布列为X0123P1612310130随机变量X的数学期望()1131601236210305EX=+++=.(2)零假设为0H:爱好飞盘运动与性别无关
联.根据列联表重的数据,经计算得到()220.01506244161.2996.635,10402228x−==根据小概率值0.01=的独立性检验,没有充分证据推断0H不成立,因此可以认
为0H成立,即认为爱好飞盘运动与性别无关联.列联表中所有数据都扩大到原来的10倍后,()220.01500602404016012.996.635,100400220280x−==根据小概率值0.
01=的独立性检验,推断0H成立,即认为爱好飞盘运动与性别有关联.所以结论不一样,原因是每个数据都扩大为原来的10倍,相当于样本量变大为原来的10倍,导致推断结论发生了变化.19.(湖北省武汉市20
23届高三下学期四月调研)中学阶段,数学中的“对称性”不仅体现在平面几何、立体几何、解析几何和函数图象中,还体现在概率问题中.例如,甲乙两人进行比赛,若甲每场比赛获胜概率均为12,且每场比赛结果相互独立,则由对称性可知,在5场比赛后,甲获胜次数不低于3场的概率为1
2.现甲乙两人分别进行独立重复试验,每人抛掷一枚质地均匀的硬币.(1)若两人各抛掷3次,求抛掷结果中甲正面朝上次数大于乙正面朝上次数的概率;(2)若甲抛掷()1n+次,乙抛掷n次,*nN,求抛掷结果中甲正面朝上次数大于乙正面朝上次数的概率.【详解】(1)设甲正
面朝上次数等于乙正面朝上次数的概率1p,0011223333333333133CCCCCCCC52216P+++==,由对称性可知则甲正面朝上次数大于乙正面朝上次数的概率和甲正面朝上次数小于乙正面朝上次数的概率相等,故1111232PP−==;(2)可以先考虑甲乙各抛赛n次的情形,①
如果出现甲正面朝上次数等于乙正面朝上次数,将该情形概率设为1p,则第1n+次甲必须再抛掷出证明朝上,才能使得最终甲正面朝上次数大于乙正面朝上次数;②如果出现甲正面朝上次数小于乙正面朝上次数,则第1n+次无论结果如
何,甲正面朝上次数仍然不大于乙正面朝上次数,将该情形概率设为2p;③如果出现甲正面朝上次数大于乙正面朝上次数,则第1n+次无论结果如何,甲正面朝上次数仍然大于乙正面朝上次数,将该情形概率设为3p,由对称性可知23pp=,故1312nPpp=+,而由2
31231ppppp=++=,可得13123132112222npppppPpp+++=+===.20.(山东省济南市2023届高三二模)根据国家统计局统计,我国2018—2022年的新生儿数量如下:
年份编号x12345年份20182019202020212022新生儿数量y(单位:万人)1523146512001062956(1)由表中数据可以看出,可用线性回归模型拟合新生儿数量y与年份编号x的关系,请用相关系数加以说明;(2)建
立y关于x的回归方程,并预测我国2023年的新生儿数量.参考公式及数据:1222211niiinniiiixynxyrxnxyny===−=−−,1221ˆniiiniixynxybxnx==−=−,ˆˆaybx=−,51
6206iiy==,5117081iiixy==,55222211551564iiiixxyy==−−.【详解】(1)因为()11234535x=++++=,5111620
61241.255iiyy====,()()()()()()52222221132333435310iixx=−=−+−+−+−+−=,又55222211551564iiiixxyy==−−,5151
7081362061537iiixyxy=−=−=−,所以5155222211515370.98156455iiiiiiixyxyrxxyy===−−=−−−,因为y
与x的相关系数近似为0.98−,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.(2)由(1)可得51522151537ˆ153.7105iiiiixyxybxx==−−===−−,所以()ˆˆ1241.2153.7317
02.3aybx=−=−−=,所以y关于x的回归方程为153.71702.3yx=−+,将2023年对应的年份编号6x=代入回归方程得153.761702.3780.1y=−+=,所以我国2023年的新生儿数量约为780.1
万人.21.(浙江省杭州市2023届高三下学期教学质量检测(二模))马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用
.其数学定义为:假设我们的序列状态是…,2tX−,1tX−,tX,1tX+,…,那么1tX+时刻的状态的条件概率仅依赖前一状态tX,即()()1211,,,ttttttPXXXXPXX+−−+=.现实生活中也
存在着许多马尔科夫链,例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为50%,且每局赌赢可以赢得1元,每一局赌徒赌输的概率为50%,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预
期的B元,赌徒停止赌博.记赌徒的本金为()*N,AAAB,赌博过程如下图的数轴所示.当赌徒手中有n元(0nB,Nn)时,最终输光的概率为........()Pn,请回答下列问题:(1)请直接写出()0P与()PB的数值.(2)证明()P
n是一个等差数列,并写出公差d.(3)当100A=时,分别计算200B=,1000B=时,()PA的数值,并结合实际,解释当B→时,()PA的统计含义.【详解】(1)当0n=时,赌徒已经输光了,因此()01P=.当nB=时,赌徒到了终止赌博的条件,不再赌了,因此输
光的概率()0PB=.(2)记M:赌徒有n元最后输光的事件,N:赌徒有n元上一场赢的事件,()()(|)()(|)PMPNPMNPNPMN=+,即11()(1)(1)22PnPnPn=−++,所以()()()()11PnPnPnPn−−=+−
,所以(){}Pn是一个等差数列,设()()1PnPnd−−=,则()()()()1210PnPndPPd−−−=−=,,,累加得()(0)PnnPd−=,故()(0)PBPBd−=,得1dB=−,(3)100A=,由()()0PnPnd−=得()()0PAPAd−=,即()1APAB=−
,当200B=时,()50%PA=,当1000B=时,()90%PA=,当B→时,()1PA→,因此可知久赌无赢家,即便是一个这样看似公平的游戏,只要赌徒一直玩下去就会100%的概率输光.