【文档说明】2024年新高考数学一轮复习题型归纳与达标检测 第61讲 离散型随机变量的均值与方差、正态分布(讲) Word版含解析.docx,共(14)页,155.900 KB,由小赞的店铺上传
转载请保留链接:https://www.doc5u.com/view-748c886ad09f3494f053a701064f9bfb.html
以下为本文档部分文字说明:
第61讲离散型随机变量的均值与方差、正态分布思维导图知识梳理1.均值一般地,若离散型随机变量X的分布列为:Xx1x2…xi…xnPp1p2…pi…pn则称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望.它反映了离散型随机变量取值的平均水
平.2.方差设离散型随机变量X的分布列为:Xx1x2…xi…xnPp1p2…pi…pn则(xi-E(X))2描述了xi(i=1,2,…,n)相对于均值E(X)的偏离程度.而D(X)=i=1n(xi-E(X))2pi为这些偏离程度的加权平均,刻画了随机变量X与其均值E(X)的平
均偏离程度.称D(X)为随机变量X的方差,并称其算术平方根D(X)为随机变量X的标准差.3.两个特殊分布的期望与方差分布期望方差两点分布E(X)=pD(X)=p(1-p)二项分布E(X)=npD(X)=np(1-p)4.正态分布(1)正态曲线的特点①曲线位于x轴上方,与x轴不相交;②曲线是单峰的
,它关于直线x=μ对称;③曲线在x=μ处达到峰值1σ2π;④曲线与x轴之间的面积为1;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的
分布越分散.(2)正态分布的三个常用数据①P(μ-σ<X≤μ+σ)≈0.6826;②P(μ-2σ<X≤μ+2σ)≈0.9544;③P(μ-3σ<X≤μ+3σ)≈0.9974.题型归纳题型1离散型随机变量的均值与方差【例1-1】为迎接2022年北京冬奥会,推
广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为14,16;1小时以上且不超过2
小时离开的概率分别为12,23;两人滑雪时间都不会超过3小时.(1)求甲、乙两人所付滑雪费用相同的概率;(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E(ξ),方差D(ξ).【解】(1)两人所付费用相同,相同的费用可能为0,40,80元,两人都付0元的
概率为P1=14×16=124,两人都付40元的概率为P2=12×23=13,两人都付80元的概率为P3=1-14-12×1-16-23=14×16=124,故两人所付费用相同的概率为P=P1+P2+P3=124+
13+124=512.(2)由题设甲、乙所付费用之和为ξ,ξ可能取值为0,40,80,120,160,则:P(ξ=0)=14×16=124,P(ξ=40)=14×23+12×16=14,P(ξ=80)=14×16+12×23+16×14=512,P(ξ=120)=
12×16+14×23=14,P(ξ=160)=14×16=124.ξ的分布列为ξ04080120160P1241451214124E(ξ)=0×124+40×14+80×512+120×14+160×124=8
0.D(ξ)=(0-80)2×124+(40-80)2×14+(80-80)2×512+(120-80)2×14+(160-80)2×124=40003.【跟踪训练1-1】(2019·浙江高考)设0<a<1,随机变量X的分布列是X0a1P131313则当a在(0,1)内增大时,
()A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大【解析】选D由题意知E(X)=0×13+a×13+1×13=a+13,因此,D(X)=a+13-02×13+a+13-a2×13+a+13-12×13=127[(a+1)2
+(1-2a)2+(a-2)2]=127(6a2-6a+6)=29a-122+34.当0<a<12时,D(X)单调递减;当12<a<1时,D(X)单调递增.即当a在(0,1)内增大时,D(X)先减小后增大.故选D.【跟踪训练1-2】为了研究一种新药的疗效,选100名
患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x和y的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y的值小于60的概率;(2)从图中A,B,C,D四人中随机选出两人,记ξ为
选出的两人中指标x的值大于1.7的人数,求ξ的分布列和数学期望E(ξ);(3)试判断这100名患者中服药者指标y数据的方差与未服药者指标y数据的方差的大小.(只需写出结论)【解】(1)由题图知,在服药的
50名患者中,指标y的值小于60的有15人,所以从服药的50名患者中随机选出一人,此人指标y的值小于60的概率P=1550=0.3.(2)由题图知,A,B,C,D四人中,指标x的值大于1.7的有2人:A和C.所以ξ的所有可能取值为0,1,2.P(ξ=0)=C22C24=16,P(ξ=1)
=C12C12C24=23,P(ξ=2)=C22C24=16.所以ξ的分布列为ξ012P162316故ξ的数学期望E(ξ)=0×16+1×23+2×16=1.(3)在这100名患者中,服药者指标y数据的方差大于未服药者指标y数据的方
差.题型2二项分布的均值与方差【例2-1】(2019·成都检测)某部门为了解一企业在生产过程中的用水量情况,对其每天的用水量做了记录,得到了大量该企业的日用水量的统计数据,从这些统计数据中随机抽取12天的数据作为样本,得
到如图所示的茎叶图(单位:吨).若用水量不低于95吨,则称这一天的用水量超标.(1)从这12天的数据中随机抽取3个,求至多有1天的用水量超标的概率;(2)以这12天的样本数据中用水量超标的频率作为概率,
估计该企业未来3天中用水量超标的天数,记随机变量X为未来这3天中用水量超标的天数,求X的分布列、数学期望和方差.【解】(1)记“从这12天的数据中随机抽取3个,至多有1天的用水量超标”为事件A,则P(A)
=C14C28C312+C38C312=168220=4255.(2)以这12天的样本数据中用水量超标的频率作为概率,易知用水量超标的概率为13.X的所有可能取值为0,1,2,3,易知X~B3,13,P(X=k)=Ck313k233-k,k=0,1,2,3,则P(X=
0)=827,P(X=1)=49,P(X=2)=29,P(X=3)=127.∴随机变量X的分布列为X0123P8274929127数学期望E(X)=3×13=1,方差D(X)=3×13×1-1
3=23.【跟踪训练2-1】设X为随机变量,且X~B(n,p),若随机变量X的数学期望E(X)=4,D(X)=43,则P(X=2)=________.(结果用分数表示)【解析】∵X为随机变量,且X~B(n,p),∴E
(X)=np=4,D(X)=np(1-p)=43,解得n=6,p=23,∴P(X=2)=C26×232×1-234=20243.【答案】20243【跟踪训练2-2】(2020·西安模拟)一个盒子中装有大量形状、大小一样但重量不尽相同的小球,从中随机抽取5
0个作为样本,称出它们的重量(单位:克),重量分组区间为[5,15],(15,25],(25,35],(35,45],由此得到样本的重量频率分布直方图(如图).(1)求a的值,并根据样本数据,试估计盒子中小球重量的众数与平均值;(2)从盒
子中随机抽取3个小球,其中重量在[5,15]内的小球个数为X,求X的分布列和数学期望(以直方图中的频率作为概率).【解】(1)由题意,得(0.02+0.032+a+0.018)×10=1,解得a=0.03.由频率分布直方图可估计盒子中小球重量的众数为20克,而50个样本中小球重量的平均值x=0.
2×10+0.32×20+0.3×30+0.18×40=24.6(克).故由样本估计总体,可估计盒子中小球重量的平均值为24.6克.(2)该盒子中小球重量在[5,15]内的概率为15,则X~B3,15.X的可能取值为
0,1,2,3,则P(X=0)=C03150×453=64125,P(X=1)=C1315×452=48125,P(X=2)=C23152×45=12125,P(X=3)=C33153×450=112
5.∴X的分布列为X0123P6412548125121251125∴E(X)=0×64125+1×48125+2×12125+3×1125=35或者E(X)=3×15=35.【名师指导】二项分布的期望与方差(1)如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ
)=np(1-p)求解,可大大减少计算量.(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同
样还可求出D(aξ+b).题型3均值与方差在决策中的应用【例3-1】(2019·洛阳尖子生第二次联考)现有两种投资方案,一年后投资盈亏的情况如下表:投资股市:投资结果获利40%不赔不赚亏损20%概率121838购买基金:投资结果获利20%不赔不赚亏损10%
概率p13q(1)当p=14时,求q的值;(2)已知甲、乙两人分别选择了“投资股市”和“购买基金”进行投资,如果一年后他们中至少有一人获利的概率大于45,求p的取值范围;(3)丙要将家中闲置的10万元钱进行投资,决定在“投资股市”和“购买基金”这两种方案中选择一种,已知p=12,q=16,那么丙
选择哪种投资方案,才能使得一年后投资收益的数学期望较大?请说明理由.【解】(1)∵“购买基金”后,投资结果只有“获利”、“不赔不赚”、“亏损”三种,且三种投资结果相互独立,∴p+13+q=1.又p=14,∴q=512.(2)记事件A为“甲投资股市且获利”,事件B为“乙购买基金且获
利”,事件C为“一年后甲、乙两人中至少有一人投资获利”,则C=AB∪AB∪AB,且A,B独立.由题意可知,P(A)=12,P(B)=p,∴P(C)=P(AB)+P(AB)+P(AB)=12(1-p)+12p+12p
=12+12p.∵P(C)=12+12p>45,∴p>35.又p+13+q=1,q≥0,∴p≤23.∴p的取值范围为35,23.(3)假设丙选择“投资股市”的方案进行投资,记X为丙投资股市的获利金额(单位:万元),∴随机变量X的分布列
为X40-2P121838则E(X)=4×12+0×18+(-2)×38=54.假设丙选择“购买基金”的方案进行投资,记Y为丙购买基金的获利金额(单位:万元),∴随机变量Y的分布列为Y20-1P121316则E(Y)=2×12+0×13+(-1)×16=56.∵
E(X)>E(Y),∴丙选择“投资股市”,才能使得一年后的投资收益的数学期望较大.【跟踪训练3-1】(2019·广东省七校联考)某工厂的检验员为了检测生产线上生产零件的情况,现从产品中随机抽取了80个零件进
行测量,根据测量的数据作出如图所示的频率分布直方图.注:尺寸数据在[63.0,64.5)内的零件为合格品,频率作为概率.(1)从产品中随机抽取4个,记合格品的个数为ξ,求ξ的分布列与期望;(2)从产品中随机抽取n个,全是合格品的概率不小于0.3,求n的最大值;(3)为了
提高产品合格率,现提出A,B两种不同的改进方案进行试验.若按A方案进行试验后,随机抽取15个产品,不合格品个数X的期望是2;若按B方案进行试验后,随机抽取25个产品,不合格品个数Y的期望是4.你会选择
哪种改进方案?【解】(1)由频率分布直方图可知,抽取的产品为合格品的频率为(0.75+0.65+0.2)×0.5=0.8,即抽取1个产品为合格品的概率为45,从产品中随机抽取4个,合格品的个数ξ的所有可能取值为0,1,2,3,4,则P(ξ=0)
=154=1625,P(ξ=1)=C14×45×153=16625,P(ξ=2)=C24×452×152=96625,P(ξ=3)=C34×453×15=256625,P(ξ=4)=
454=256625.所以ξ的分布列为ξ01234P16251662596625256625256625ξ的数学期望E(ξ)=4×45=165.(2)从产品中随机抽取n个产品,全是合格品的概率为45
n,依题意得45n≥0.3,故n的最大值为5.(3)设按A方案进行试验后,随机抽取1个产品是不合格品的概率是a,则随机抽取15个产品,不合格品个数X~B(15,a);设按B方案进行试验后,随机抽取1个产品是不合
格品的概率是b,则随机抽取25个产品,不合格品个数Y~B(25,b).依题意得E(X)=15a=2,E(Y)=25b=4,所以a=215,b=425.因为215<425,所以应选择方案A.【跟踪训练3-2】(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付
用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格
品的概率为f(p),求f(p)的最大值点p0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用
.①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【解】(1)因为20件产品中恰有2件不合格品的概率为f(p)=C220p2·(1-p)18,所以f′(p)=C220[2p(1
-p)18-18p2(1-p)17]=2C220p(1-p)17(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f(p)的最大值点为p0=0.1.(2)由(1)知,p=0.
1.①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以EX=E(40+25Y)=40+25EY=490.②若对余下的产品作检验,则这一箱产品所需要的检验费用为400元.由于EX>400,故应该对余下的产品作检
验.【名师指导】离散型随机变量的期望和方差应用问题的解题策略(1)求离散型随机变量的期望与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用期望、方差公式进行计算.(2)要注意观察随机变量的
概率分布特征,若属于二项分布,可用二项分布的期望与方差公式计算,则更为简单.(3)在实际问题中,若两个随机变量ξ1,ξ2,有E(ξ1)=E(ξ2)或E(ξ1)与E(ξ2)较为接近时,就需要用D(ξ1)与D(ξ2)来比较两个随机变量的稳定
程度.即一般地将期望最大(或最小)的方案作为最优方案,若各方案的期望相同,则选择方差最小(或最大)的方案作为最优方案.题型4正态分布及其应用【例4-1】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件
,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;(2)一天内抽检零件中,如果
出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①试说明上述监控生产过程方法的合理性;②下面是检验员在一天内抽取的16个零件的尺寸:9.9510.129.969.9610.019.929
.9810.0410.269.9110.1310.029.2210.0410.059.95经计算得x=116i=116xi=9.97,s=116i=116(xi-x)2=116i=116x2i-16x2≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16
.用样本平均数x作为μ的估计值μ^,用样本标准差s作为σ的估计值σ^,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ^-3σ^,μ^+3σ^)之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ<Z<μ+3σ)=0.99
74,0.997416≈0.9592,0.008≈0.09.【解】(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.9974,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.00
26,故X~B(16,0.0026).因此P(X≥1)=1-P(X=0)=1-0.997416≈0.0408.X的数学期望为E(X)=16×0.0026=0.0416.(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在
(μ-3σ,μ+3σ)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合
理的.②由x=9.97,s≈0.212,得μ的估计值为μ^=9.97,σ的估计值为σ^=0.212,由样本数据可以看出有一个零件的尺寸在(μ^-3σ^,μ^+3σ^)之外,因此需对当天的生产过程进行检查.剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的平均数为115(1
6×9.97-9.22)=10.02,因此μ的估计值为10.02.i=116x2i=16×0.2122+16×9.972≈1591.134,剔除(μ^-3σ^,μ^+3σ^)之外的数据9.22,剩下数据的样本方差为115(1591.1
34-9.222-15×10.022)≈0.008,因此σ的估计值为0.008≈0.09.【跟踪训练4-1】(2020·开封模拟)某商场经营的某种包装的大米质量ξ(单位:kg)服从正态分布N(10,σ2),根据检测结果可知P(9.
9≤ξ≤10.1)=0.96,某公司为每位职工购买一袋这种包装的大米作为福利,若该公司有1000名职工,则分发到的大米质量在9.9kg以下的职工数大约为()A.10B.20C.20D.40【解析】选B由已知得P(ξ<9.9)=1-P(9.9≤ξ≤10.1
)2=1-0.962=0.02,所以分发到的大米质量在9.9kg以下的职工数大约为1000×0.02=20.故选B.【跟踪训练4-2】(2019·济南市学习质量评估)某医药公司研发生产一种新的保健产品,从一批产品中随机抽取200盒作为样本,测量产品的一项质量指标值,该指标值越高
越好.由测量结果得到如下频率分布直方图:(1)求a,并试估计这200盒产品的该项指标值的平均值.(2)①由样本估计总体,结合频率分布直方图认为该产品的该项质量指标值ξ服从正态分布N(μ,102),计算该批产品该项指
标值落在(180,220]上的概率;②国家有关部门规定每盒产品该项指标值不低于150均为合格,且按该项指标值从低到高依次分为:合格、优良、优秀三个等级,其中(180,220]为优良,不高于180为合格,高于200为优秀,
在①的条件下,设该公司生产该产品1万盒的成本为15万元,市场上各等级每盒该产品的售价(单位:元)如表,求该公司每万盒的平均利润.等级合格优良优秀售价102030附:若ξ~N(μ,δ2),则P(μ-δ<ξ≤μ+δ)≈0.6827,P(μ-2δ<ξ≤μ+2δ)≈0.9545.【解】(1)由10
×(2×0.002+0.008+0.009+0.022+0.024+a)=1,解得a=0.033,则平均值x=10×0.002×170+10×0.009×180+10×0.022×190+10×0.033×200+10×0.024×210+10×0.008×220
+10×0.002×230=200,即这200盒产品的该项指标值的平均值约为200.(2)①由题意可得μ=x=200,δ=10,则P(μ-2δ<ξ≤μ+2δ)=P(180<ξ≤220)≈0.9545,
则该批产品指标值落在(180,220]上的概率为0.9545.②设每盒该产品的售价为X元,由①可得X的分布列为X102030P0.022750.95450.02275则每盒该产品的平均售价为E(X)=10×0.0227
5+20×0.9545+30×0.02275=20,故每万盒的平均利润为20-15=5(万元).【名师指导】正态分布下2类常见的概率计算(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正
态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.