专题03 统计和概率-【大题精做】冲刺2023年高考大题突破训练

试卷更新日期:2023-05-09 类型:高考模拟

一、解答题

  • 1. 盲盒,是指消费者不能提前得知具体产品款式的玩具盒子,具有随机属性.某品牌推出2款盲盒套餐,A款盲盒套餐包含4款不同单品,且必包含隐藏款X;B款盲盒套餐包含2款不同单品,有50%的可能性出现隐藏款X.为避免盲目购买与黄牛囤积,每人每天只能购买1件盲盒套餐.开售第二日,销售门店对80名购买了套餐的消费者进行了问卷调查,得到如下列联表:


    A款盲盒套餐

    B款盲盒套餐

    合计

    年龄低于30岁

    18

    30

    48

    年龄不低于30岁

    22

    10

    32

    合计

    40

    40

    80

    附:K2=n(adbc)2(a+b)(c+d)(a+c)(b+d) , 其中n=a+b+c+d

    P(K2k0

    0.100

    0.050

    0.025

    0.010

    0.001

    k0

    2.706

    3.841

    5.024

    6.635

    0.828

    (1)、根据2×2列联表,判断是否有99%的把握认为A,B款盲盒套餐的选择与年龄有关;
    (2)、甲、乙、丙三人每人购买1件B款盲盒套餐,记随机变量ξ为其中隐藏款X的个数,求ξ的分布列和数学期望;
    (3)、某消费者在开售首日与次日分别购买了A款盲盒套餐与B款盲盒套餐各1件,并将6件单品全部打乱放在一起,从中随机抽取1件打开后发现为隐藏款X,求该隐藏款来自于B款盲盒套餐的概率.
  • 2. 为了解J市某疾病的发病情况与年龄的关系,从J市疾控中心得到以下数据:

    年龄段(岁)

    [2030)

    [3040)

    [4050)

    [5060)

    [6070)

    发病率(‰)

    0.09

    0.18

    0.30

    0.40

    0.53

    (1)、若将每个区间的中点数据记为xi , 对应的发病率记为yi(i=12345) , 根据这些数据可以建立发病率y(‰)关于年龄x(岁)的经验回归方程y^=b^x+a^ , 求a^

    附:b^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=15xi2=11125i=15xiyi=78.5

    (2)、医学研究表明,化验结果有可能出现差错.现有J市某位居民,年龄在[5060).A表示事件“该居民化验结果呈阳性”,B表示事件“该居民患有某疾病”.已知P(AB)=0.99P(A¯B¯)=0.999 , 求P(BA)(结果精确到0.001).
  • 3. 向日葵是常见的一种经济作物,种子常炒制为零食食用,也可榨葵花籽油.但种植向日葵时会频繁地遇到空壳问题,其中开花期大气湿度是导致向日葵空壳的一大主因.为找到向日葵空壳率与开花期大气湿度的关系,研究人员做了观察试验,结果如下:

    大气湿度x

    45%

    59%

    66%

    68%

    69%

    70%

    72%

    77%

    80%

    88%

    空壳率y

    18%

    21%

    25%

    27%

    26%

    29%

    31%

    32%

    33%

    37%

    附:经验回归方程系数:b^=i=1kxiyikx¯y¯i=1kxi2kx¯2a^=y¯b^x¯x¯=0.69y¯=0.28i=110xiyi=1.9951i=110xi2=4.9404.

    (1)、试求向日葵空壳率与大气湿度之间的回归直线方程;(回归直线方程的系数均保留两位有效数字)
    (2)、某地大气湿度约为40%时,试根据(1)中的回归直线方程推测空壳率大约为多少?
  • 4. 2023年是全面贯彻落实党二十大精神的开局之年,也是实施“十四五”规划承上启下的关键之年,今年春季以来,各地出台了促进经济发展的各种措施,经济增长呈现稳中有进的可喜现象.服务业的消费越来越火爆,绍兴一些超市也纷纷加大了广告促销.现随机抽取7家超市,得到其广告支出x(单位:万元)与销售额y(单位:万元)数据如下:

    超市

    A

    B

    C

    D

    E

    F

    G

    广告支出

    1

    2

    4

    6

    10

    13

    20

    销售额

    19

    32

    44

    40

    52

    53

    54

    附注:参考数据i=17xiyi=2788i=17xi2=726i=17yi2=13350 , 回归方程y^=a^+b^x中斜率和截距的最小二乘估计公式分别为:b^=i=1nxiyinxy¯i=1nxi2nx¯2a^=y¯b^x¯.

    (1)、建立y关于x的一元线性回归方程(系数精确到0.01);
    (2)、若将超市的销售额y与广告支出x的比值称为该超市的广告效率值μ , 当μ10时,称该超市的广告为“好广告”.从这7家超市中随机抽取4家超市,记这4家超市中“好广告”的超市数为X , 求X的分布列与期望.
  • 5. 全国 “两会”召开的一项重要意义在于将“两会代表”从人民中得来的信息和要求进行收集及整理,传达给中央,“两会代表”代表着广大选民的利益,代表选民在“两会”期间向政府有关部门提出选民的意见和要求.下表是2011年至2020年历年全国政协提案的数量统计.

    年份

    2011

    2012

    2013

    2014

    2015

    2016

    2017

    2018

    2019

    2020

    年份代码x

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    提案数量y(单位:千件)

    5.762

    6.069

    5.641

    5.875

    5.857

    5.769

    5.21

    5.36

    5.488

    5.044

    参考公式:相关系数r=i=1n(xix¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2=i=1nxiyinx¯y¯(i=1nxi2nx¯2)(i=1nyi2ny¯2)b^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2a^=y¯b^x

    参考数据:i=110xiyi301.410x¯y¯308.4i=110yi210y¯20.95y¯5.6182.5×0.958.85

    (1)、请用相关系数说明y与x之间的关系可否用线性回归模型拟合?若能,求y关于x的一元线性回归方程;(运算结果精确到0.01)(若|r|075 , 则线性相关程度很高,可用直线拟合)
    (2)、中央政府回应2020年“两会”的热点议题“战胜疫情”,以令世界惊叹的中国速度、中国效率和中国奇迹,社会各阶层、各行各业迅速投身战“疫”行动,团结共进、众志成城.其中一个关键举措是2021年全国各地全面展开的疫苗接种.为方便市民合理安排疫苗接种,城市便民电子系统即时提供接种点相关信息,若某疫苗接种点上午和下午接种疫苗分别需要等待20分钟和40分钟,而甲、乙市民均在某日接种疫苗,且上午去接种疫苗的概率分别为p2p1(12<p<1) , 要使两市民需要等待时间的总和的期望值不超过60分钟,求实数p的取值范围.
  • 6. 为了庆祝党的二十大顺利召开,某学校特举办主题为“重温光辉历史 展现坚定信心”的百科知识小测试比赛.比赛分抢答和必答两个环节,两个环节均设置10道题,其中5道人文历史题和5道地理环境题.
    (1)、在抢答环节,某代表队非常积极,抢到4次答题机会,求该代表队至少抢到1道地理环境题的概率;
    (2)、在必答环节,每个班级从5道人文历史题和5道地理环境题各选2题,各题答对与否相互独立,每个代表队可以先选择人文历史题,也可以先选择地理环境题开始答题.若中间有一题答错就退出必答环节,仅当第一类问题中2题均答对,才有资格开始第二类问题答题.已知答对1道人文历史题得2分,答对1道地理环境题得3分.假设某代表队答对人文历史题的概率都是35 , 答对地理环境题的概率都是13 . 请你为该代表队作出答题顺序的选择,使其得分期望值更大,并说明理由.
  • 7. 李先生是一名上班族,为了比较上下班的通勤时间,记录了20天个工作日内,家里到单位的上班时间以及同路线返程的下班时间(单位:分钟),如下茎叶图显示两类时间的共40个记录:

    附:χ2=n(adbc)2(a+b)(c+d)(a+c)(b+d)n=a+b+c+dP(χ23.841)0.05

    (1)、求出这40个通勤记录的中位数M,并完成下列2×2列联表:


    超过M

    不超过M

    上班时间

    下班时间

    (2)、根据列联表中的数据,请问上下班的通勤时间是否有显著差异?并说明理由.
  • 8. 将某工厂的工人按年龄分成两组:“35周岁及以上”、“35周岁以下”,从每组中随机抽取80人,将他们的绩效分数分成5组:[5060)[6070)[7080)[8090)[90100] , 分别加以统计,得到下列频率分布直方图.该工厂规定绩效分数不少于80者为生产标兵.

    附:χ2=n(adbc)2(a+b)(c+d)(a+c)(b+d)

    P(x2k)

    0.100

    0.050

    0.010

    0.001

    k

    2.706

    3.841

    6.635

    10.828

    (1)、请列出2×2列联表,并判断能否有95%的把握认为是否为生产标兵与工人所在的年龄组有关:
    (2)、若已知该工厂工人中生产标兵的占比为30% , 试估计该厂35周岁以下的工人所占的百分比以及生产标兵中35周岁以下的工人所占的百分比.
  • 9. 国学小组有编号为1,2,3,…,nn位同学,现在有两个选择题,每人答对第一题的概率为23、答对第二题的概率为12 , 每个同学的答题过程都是相互独立的,比赛规则如下:①按编号由小到大的顺序依次进行,第1号同学开始第1轮出赛,先答第一题;②若第i(i=123n1)号同学未答对第一题,则第i轮比赛失败,由第i+1号同学继继续比赛;③若第i(i=123n1)号同学答对第一题,则再答第二题,若该生答对第二题,则比赛在第i轮结枣;若该生未答对第二题,则第i轮比赛失败,由第i+1号同学继续答第二题,且以后比赛的同学不答第一题;④若比赛进行到了第n轮,则不管第n号同学答题情况,比赛结束.
    (1)、令随机变量Xn表示n名同学在第Xn轮比赛结束,当n=3时,求随机变量X3的分布列;
    (2)、若把比赛规则③改为:若第i(i=123n1)号同学未答对第二题,则第i轮比赛失败,第i+1号同学重新从第一题开始作答.令随机变量Yn表示n名挑战者在第Yn轮比赛结束.

    ①求随机变量Yn(nN*n2)的分布列;

    ②证明:E(Yn)单调递增,且小于3.

  • 10. 马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第n+1次状态的概率分布只跟第n次的状态有关,与第n1n2n3次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行n(nN*)次操作后,记甲盒子中黑球个数为Xn , 甲盒中恰有1个黑球的概率为an , 恰有2个黑球的概率为bn.
    (1)、求X1的分布列;
    (2)、求数列{an}的通项公式;
    (3)、求Xn的期望.
  • 11. 电解电容是常见的电子元件之一.检测组在85C的温度条件下对电解电容进行质量检测,按检测结果将其分为次品、正品,其中正品分合格品、优等品两类
    (1)、铝䈹是组成电解电容必不可少的材料.现检测组在85C的温度条件下,对铝箵质量与电解电容质量进行测试,得到如下2×2列联表,那么他们是否有99.9%的把握认为电解电容质量与铝䇚质量有关?请说明理由;


    电解电容为次品

    电解电容为正品

    铝箔为次品

    174

    76

    铝箔为正品

    108

    142

    (2)、电解电容经检验为正品后才能装箱,已知两箱电解电容(每箱50个),第一箱和第二箱中分别有优等品8件与9件.现用户从两箱中随机挑选出一箱,并从该箱中先后随机抽取两个元件,求在第一次取出的是优等品的情况下,第二次取出的是合格品的概率.
  • 12. 某网站计划4月份订购草莓在网络销售,每天的进货量相同,成本价为每盒15元.假设当天进货能全部售完,决定每晚七点前(含七点)售价为每盒20元,每晚七点后售价为每盒10元.根据销售经验,每天的购买量与网站每天的浏览量(单位:万次)有关.为确定草莓的进货量,相关人员统计了前两年4月份(共60天)网站每天的浏览量(单位:万次)、购买草莓的数量(单位:盒)以及达到该流量的天数,如下表所示:

    每天的浏览量

    (01)

    [1+)

    每天的购买量

    300

    900

    天数

    36

    24

    以每天的浏览量位于各区间的频率代替浏览量位于该区间的概率.

    (1)、求4月份草莓一天的购买量X(单位:盒)的分布;
    (2)、设4月份销售草莓一天的利润为Y(单位:元),一天的进货量为n(单位:盒),n为正整数且n[600900] , 当n为多少时,Y的期望达到最大值,并求此最大值.
  • 13. 概率统计在生产实践和科学实验中应用广泛.请解决下列两个问题.

    参考公式及数据:χ2=n(adbc)2(a+b)(c+d)(a+c)(b+d) , 其中,n=a+b+c+dP(χ23.841)0.05

    (1)、随着中小学“双减”政策的深入人心,体育教学和各项体育锻炼迎来时间充沛的春天.某初中学校学生篮球队从开学第二周开始每周进行训练,第一次训练前共有6个篮球,其中3个是新球(即没有用过的球),3个是旧球(即至少用过一次的球).每次训练,都是从中不放回任意取出2个篮球,训练结束后放回原处. 设第一次训练时取到的新球个数为ξ,求随机变量ξ的分布和期望.
    (2)、由于手机用微波频率信号传递信息,那么长时间使用手机是否会增加得脑瘤的概率?研究者针对这个问题,对脑瘤病人进行问卷调查,询问他们是否总是习惯在固定的一侧接听电话?如果是,是哪边?结果有88人喜欢用固定的一侧接电话.其中脑瘤部位在左侧的病人习惯固定在左侧接听电话的有14人,习惯固定在右侧接听电话的有28人;脑瘤部位在右侧的病人习惯固定在左侧接听电话的有19人,习惯固定在右侧接听电话的有27人.根据上述信息写出下面这张2×2列联表中字母所表示的数据,并对患脑瘤在左右侧的部位是否与习惯在该侧接听手机电话相关进行独立性检验.(显著性水平α=0.05)


    习惯固定在左侧接听电话

    习惯固定在右侧接听电话

    总计

    脑瘤部位在左侧的病人

    a

    b

    42

    脑瘤部位在右侧的病人

    c

    d

    46

    总计

    a+c

    b+d

    88

  • 14. 在临床检测试验中,某地用某种抗原来诊断试验者是否患有某种疾病.设事件A表示试验者的检测结果为阳性,事件B表示试验者患有此疾病,据临床统计显示,P(A|B)=0.99P(A¯|B¯)=0.98 . 已知该地人群中患有此种疾病的概率为0.001 . (下列两小题计算结果中的概率值精确到0.00001
    (1)、对该地某人进行抗原检测,求事件AB¯同时发生的概率;
    (2)、对该地3个患有此疾病的患者进行抗原检测,用随机变量X表示检测结果为阳性的人数,求X的分布和期望.
  • 15. 元宵佳节,是民间最重要的民俗节日之一,我们梅州多地都会举行各种各样的民俗活动,如五华县河东镇的“迎灯”、丰顺县埔寨镇的“火龙”、大埔县百侯镇的“迎龙珠灯”等系列活动.在某庆祝活动现场,为了解观众对该活动的观感情况(“一般”或“激动”),现从该活动现场的观众中随机抽取200名,得到下表:


    一般

    激动

    总计

    男性

    90

    120

    女性

    25

    总计

    200

    附:χ2=n(adbc)2(a+b)(c+d)(a+c)(b+d) , 其中n=a+b+c+d

    α

    0.100

    0.050

    0.010

    0.001

    xα

    2.706

    3.841

    6.635

    10.828

    (1)、填补上面的2×2列联表,并依据小概率值α=0.1的独立性检验,能否认为性别与对该活动的观感程度有关?
    (2)、该活动现场还举行了有奖促销活动,凡当天消费每满300元,可抽奖一次.抽奖方案是:从装有3个红球和3个白球(形状、大小、质地完全相同)的抽奖箱里一次性摸出2个球,若摸出2个红球,则可获得100元现金的返现;若摸出1个红球,则可获得50元现金的返现;若没摸出红球,则不能获得任何现金返现.若某观众当天消费600元,记该观众参加抽奖获得的返现金额为X,求随机变量X的分布列和数学期望.
  • 16. 我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.该企业为了了解研发资金的投入额x(单位:百万元)对年收入的附加额y(单位:百万元)的影响,对往年研发资金投入额xi和年收入的附加额yi进行研究,得到相关数据如下:

    投入额xi

    2

    3

    4

    5

    6

    8

    9

    11

    年收入的附加额yi

    3.6

    4.1

    4.8

    5.4

    6.2

    7.5

    7.9

    9.1

    【参考数据】i=18xiyi=334.1i=18yi=48.6i=18xi2=356

    【附】在经验回归方程y^=b^x+a^中,b^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2=i=1nxiyinxy¯i=1nxi2nx¯2a^=y¯b^x¯

    (1)、求年收入的附加额y与投入额x的经验回归方程;
    (2)、若年收入的附加额与投入额的比值大于1,则称对应的投入额为“优秀投资额”,现从上面8个投入额中任意取3个,用X表示这3个投入额为“优秀投资额”的个数,求X的分布列及数学期望.
  • 17. 某商店销售某种产品,为了解客户对该产品的评价,现随机调查了200名客户,其评价结果为“一般”或“良好”,并得到如下列联表:


    一般

    良好

    合计

    20

    100

    120

    30

    50

    80

    合计

    50

    150

    200

    附表及公式:

    P(K2k0)

    0.15

    0.10

    0.05

    0.025

    0.010

    k0

    2.072

    2.706

    3.841

    5.024

    6.635

    其中K2=n(adbc)2(a+b)(c+d)(a+c)(b+d)n=a+b+c+d.

    (1)、通过计算判断,有没有99%的把握认为客户对该产品的评价结果与性别有关系?
    (2)、该商店在春节期间开展促销活动,该产品共有如下两个销售方案.方案一:按原价的8折销售;方案二:顾客购买该产品时,可在一个装有4张“每满200元少80元”,6张“每满200元少40元”共10张优惠券的不透明箱子中,随机抽取1张,购买时按照所抽取的优惠券进行优惠.已知该产品原价为260(元/件).顾客甲若想采用方案二的方式购买一件产品,估计顾客甲需支付的金额;你认为顾客甲选择哪种购买方案较为合理?
  • 18. 马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…,Xt2Xt1XtXt+1 , …,那么Xt+1时刻的状态的条件概率仅依赖前一状态Xt , 即P(Xt+1|Xt2Xt1Xt)=P(Xt+1|Xt)

    现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.

    假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为50% , 且每局赌赢可以赢得1元,每一局赌徒赌输的概率为50% , 且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为A(AN*A<B) , 赌博过程如下图的数轴所示.

    当赌徒手中有n元(0nBnN)时,最终输光的概率为P(n) , 请回答下列问题:

    (1)、请直接写出P(0)P(B)的数值.
    (2)、证明{P(n)}是一个等差数列,并写出公差d.
    (3)、当A=100时,分别计算B=200B=1000时,P(A)的数值,并结合实际,解释当B时,P(A)的统计含义.
  • 19. 某校工会开展健步走活动,要求教职工上传3月1日至3月7日的微信记步数信息,下图是职工甲和职工乙微信记步数情况:

    (1)、从3月2日至3月7日中任选一天,求这一天职工甲和职工乙微信记步数都不低于10000的概率;
    (2)、从3月1日至3月7日中任选两天,记职工乙在这两天中微信记步数不低于10000的天数为X , 求X的分布列及数学期望;
    (3)、下图是校工会根据3月1日至3月7日某一天的数据制作的全校200名教职工微信记步数的频率分布直方图.已知这一天甲和乙微信记步数在单位200名教职工中排名(按照从大到小排序)分别为第68和第142,请指出这是根据哪一天的数据制作的频率分布直方图(不用说明理由).

  • 20. 某市教育行政部门为开展普及法律常识的宣传教育活动,增强学生的法律意识,提高自身保护能力,在全市中小学生范围内,组织了一次法律常识知识竞赛(满分100分),现从所有参赛学生的竞赛成绩中随机抽取200份,经统计,这200份成绩全部介于[30100]之间,将数据按照[3040)[4050) , ……,[90100]分成七组,得到如下频数分布表:

    竞赛成绩(单位:分)

    [3040)

    [4050)

    [5060)

    [6070)

    [7080)

    [8090)

    [90100]

    人数(单位:人)

    6

    14

    30

    74

    42

    23

    11

    (1)、试估计该市竞赛成绩的平均分(同一组中的数据用该组区间的中点值作代表)和第80百分位数(保留一位小数);
    (2)、以样本频率值作为概率的估计值,若从该市所有参与竞赛的学生中,随机抽取3名学生进行座谈,设抽到60分及以上的学生人数为X , 求X的分布列和数学期望.
  • 21. 2022年中国新能源汽车销量继续蝉联全球第一,以比亚迪为代表的中国汽车交出了一份漂亮的“成绩单”,比亚迪新能源汽车成为2022年全球新能源汽车市场销量冠军,在中国新能源车的销量中更是一骑绝尘,占比约为30%.为了解中国新能源车的销售价格情况,随机调查了10000辆新能源车的销售价格,得到如下的样本数据的频率分布直方图:

    (1)、估计一辆中国新能源车的销售价格位于区间[535)(单位:万元)的概率,以及中国新能源车的销售价格的众数;
    (2)、若从中国新能源车中随机地抽出3辆,设这3辆新能源车中比亚迪汽车的数量为X , 求X的分布列与数学期望.
  • 22. 在一次全市的联考中,某校高三有100位学生选择“物化生”组合,100位学生选择“物化地”组合,现从上述的学生中分层抽取100人,将他们此次联考的化学原始成绩作为样本,分为6组:[6065)[6570)[7075)[7580)[8085)[8590] , 得到如图所示的频率分布直方图.

    附:K2=n(adbc)2(a+b)(c+d)(a+c)(b+d) , 其中n=a+b+c+d

    P(K2k0)

    0.10

    0.05

    0.01

    0.001

    k0

    2.706

    3.841

    6.635

    10.828

    (1)、求直方图中a的值;
    (2)、在抽取的100位学生中,规定原始成绩不低于80分为“优秀”,低于80分为“不够优秀",请将下面的2×2列联表补充完整,并判断是否有90%的把握认为成绩是否优秀与所选的组合有关?


    优秀

    不够优秀

    总计

    “物化生”组合

    40

    “物化地”组合

    总计

    (3)、浙江省高考的选考科目采用等级赋分制,等级赋分的分差为1分,具体操作步骤如下:

    第一步:将原始成绩从高到低排列,按人数比例划分为20个赋分区间.

    第二步:对每个区间的原始成绩进行等比例转换,公式为:s2sss1=t2ttt1

    其中s1s2分别是该区间原始成绩的最低分、最高分;t1t2分别是该区间等级分的最低分、最高分;S为某考生原始成绩,t为转换结果.

    第三步:将转换结果t四舍五入,确定为该考生的最终等级分.

    本次联考采用浙江选考等级赋分制,已知全市所有的考生原始成绩从高到低前3%(最低分为80分)的考生被划分至[97100]的赋分区间,甲、乙两位考生的化学原始成绩分别为8590 , 最终的等级分为98、99.试问:本次联考全市化学原始成绩的最高分是否可能是91分?请说明理由.

  • 23. 在某次现场招聘会上,某公司计划从甲和乙两位应聘人员中录用一位,规定从6个问题中随机抽取3个问题作答.假设甲能答对的题目有4道,乙每道题目能答对的概率为23
    (1)、求甲在第一次答错的情况下,第二次和第三次均答对的概率;
    (2)、请从期望和方差的角度分析,甲、乙谁被录用的可能性更大?
  • 24. 某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益(单位:万元)的数据如下表:

    月份

    1

    2

    3

    4

    5

    6

    广告投入量

    2

    4

    6

    8

    10

    12

    收益

    14.21

    20.31

    31.8

    31.18

    37.83

    44.67

    他们分别用两种模型①y=bx+a , ②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如下图所示的残差图及一些统计量的值.

    x¯

    y¯

    i=16xiyi

    i=16xi2

    7

    30

    1464.24

    364

    附:回归方程y^=b^x+a^中斜率和截距的最小二乘估计公式分别为:b^=i=1nxiyinx¯y¯i1nxi2nx¯2=i=1n(xix¯)(yiy¯)i=1n(xix¯)2a^=y¯b^x¯

    (1)、根据残差图,比较模型①②的拟合效果,应该选择哪个模型?请说明理由.
    (2)、残差绝对值大于2的数据认为是异常数据,需要剔除.

    (i)剔除异常数据后求出(1)中所选模型的回归方程;

    (ii)若广告投入量x=18 , 求该模型收益的预报值是多少?

  • 25. 某校在一次庆祝活动中,设计了一个“套圈游戏”,规则如下:每人3个套圈,向MN两个目标投掷,先向目标M掷一次,套中得1分,没有套中不得分,再向目标N连续掷两次,每套中一次得2分,没套中不得分,根据累计得分发放奖品.已知小明每投掷一次,套中目标M的概率为56 , 套中目标N的概率为45 , 假设小明每次投掷的结果相互独立,累计得分记为X
    (1)、求小明恰好套中2次的概率;
    (2)、求X的分布列及数学期望.
  • 26. 某食品公司在八月十五来临之际开发了一种月饼礼盒,礼盒中共有7个两种口味的月饼,其中4个五仁月饼和3个枣泥月饼.
    (1)、一次取出两个月饼,求两个月饼为同一种口味的概率;
    (2)、依次不放回地从礼盒中取2个月饼,求第1次、第2次取到的都是五仁月饼的概率;
    (3)、依次不放回地从礼盒中取2个月饼,求第2次取到枣泥月饼的概率.
  • 27. 2016~2020年广西城乡居民人均可支配收入的柱形图如下图所示.

    参考数据:1.71×i=15(xi12522)221732390i=15(yiy¯)26140127090356

    附:样本的相关系数r=i=1n(x1x¯)(yiy¯)i=1n(xix¯)2i=1n(yiy¯)2

    线性回归方程y^=b^x+a^中的系数b^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2a^=y¯b^x¯

    (1)、不考虑价格因素,求广西2020年农村居民人均可支配收入的年增长率(结果精确到0.1%).
    (2)、现欲了解广西各年城镇居民人均可支配收入y(单位:元)与农村居民人均可支配收入x(单位:元)是否存在较好的线性关系.设广西2016年城镇居民人均可支配收入为y1元,农村居民人均可支配收入为x1元,2017年对应的数据分别为y2x2 , 2018年对应的数据分别为y3x3 , 2019年对应的数据分别为y4x4 , 2020年对应的数据分别为y5x5 . 根据图中的五组数据,得到y关于x的线性回归方程为y^=1.71x+m . 试问y关于x的线性相关系数r是否大于0.95,并判断y与x之间是否存在较好的线性关系.
  • 28. 随着中国实施制造强国战略以来,中国制造(Made in china)逐渐成为世界上认知度最高的标签之一,企业也越来越重视产品质量的全程控制.某企业从生产的一批产品中抽取40件作为样本,检测其质量指标值,质量指标的范围为[50100] , 经过数据处理后得到如下频率分布直方图.

    (1)、求频率分布直方图中质量指标值的平均数和中位数(结果精确到0.1);
    (2)、为了进一步检验产品质量,在样本中从质量指标在[5060)[90100]的两组中抽取2件产品,记取自[5060)的产品件数为ξ , 求ξ的分布列和数学期望.
  • 29. 某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:


    喜欢足球

    不喜欢足球

    合计

    男生

    40

    女生

    30

    合计

    附:χ2=n(adbc)2(a+b)(c+d)(a+c)(b+d)

    α

    0.1

    0.05

    0.01

    0.005

    0.001

    xα

    2.706

    3.841

    6.635

    7.879

    10.828

    (1)、根据所给数据完成上表,依据α=0.001的独立性检验,能否认为该校学生喜欢足球与性别有关?
    (2)、社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为23 , 这名女生进球的概率为12 , 每人射门一次,假设各人射门相互独立,求3人进球总次数X的分布列和数学期望.
  • 30. 某商场为了回馈广大顾客,设计了一个抽奖活动,在抽奖箱中放10个大小相同的小球,其中5个为红色,5个为白色.抽奖方式为:每名顾客进行两次抽奖,每次抽奖从抽奖箱中一次性摸出两个小球.如果每次抽奖摸出的两个小球颜色相同即为中奖,两个小球颜色不同即为不中奖.
    (1)、若规定第一次抽奖后将球放回抽奖箱,再进行第二次抽奖,求中奖次数X的分布列和数学期望.
    (2)、若规定第一次抽奖后不将球放回抽奖箱,直接进行第二次抽奖,求中奖次数Y的分布列和数学期望.
    (3)、如果你是商场老板,如何在上述问两种抽奖方式中进行选择?请写出你的选择及简要理由.
  • 31. 2022年11月20日,卡塔尔足球世界杯正式开幕,世界杯上的中国元素随处可见.从体育场建设到电力保障,从赛场内的裁判到赛场外的吉祥物都是中国制造,为卡塔尔世界杯提供了强有力的支持.国内也再次掀起足球热潮.某地足球协会组建球队参加业余比赛,该足球队教练组为了考查球员甲对球队的贡献,作出如下数据统计(甲参加过的比赛均分出了输赢):


    球队输球

    球队赢球

    总计

    甲参加

    2

    30

    32

    甲未参加

    8

    10

    18

    总计

    10

    40

    50

    附:χ2=n(adbc)2(a+b)(c+d)(a+c)(b+d)

    参考数据:

    a

    0.05

    0.01

    0.005

    0.001

    xa

    3.841

    6.635

    7.879

    10.828

    (1)、根据小概率值α=0.005的独立性检验,能否认为该球队赢球与甲球员参赛有关联;
    (2)、从该球队中任选一人,A表示事件“选中的球员参赛”,B表示事件“球队输球”.P(B|A)P(B¯|A)P(B|A¯)P(B¯|A¯)的比值是选中的球员参赛对球队贡献程度的一项度量指标,记该指标为R.

    ①证明:R=P(A|B)P(A¯|B)P(A¯|B¯)P(A|B¯)

    ②利用球员甲数据统计,给出P(A|B)P(A|B¯)的估计值,并求出R的估计值.

  • 32. 近年来,我国加速推行垃圾分类制度,全国垃圾分类工作取得积极进展.某城市推出了两套方案,并分别在AB两个大型居民小区内试行.方案一:进行广泛的宣传活动,通过设立宣传点、发放宣传单等方式,向小区居民和社会各界宣传垃圾分类的意义,讲解分类垃圾桶的使用方式,垃圾投放时间等,定期召开垃圾分类会议和知识宣传教育活动;方案二:智能化垃圾分类,在小区内分别设立分类垃圾桶,垃圾回收前端分类智能化,智能垃圾桶操作简单,居民可以通过设备进行自动登录、自动称重、自动积分等一系列操作.建立垃圾分类激励机制,比如,垃圾分类换积分,积分可兑换礼品等,激发了居民参与垃圾分类的热情,带动居民积极主动地参与垃圾分类.经过一段时间试行之后,在这两个小区内各随机抽取了100名居民进行问卷调查,记录他们对试行方案的满意度得分(满分100分),将数据分成6组:[4050)[5060)[6070)[7080)[8090)[90100] , 并整理得到如下频率分布直方图:

    (1)、请通过频率分布直方图分别估计两种方案满意度的平均得分,判断哪种方案的垃圾分类推广措施更受居民欢迎(同一组中的数据用该组中间的中点值作代表);
    (2)、以样本频率估计概率,若满意度得分不低于70分说明居民赞成推行此方案,低于70分说明居民不太赞成推行此方案.现从B小区内随机抽取5个人,用X表示赞成该小区推行方案的人数,求X的分布列及数学期望.
  • 33. 某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)

    (1)、应收集多少位女生样本数据?
    (2)、根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:[02](24](46](68](810](1012] . 估计该校学生每周平均体育运动时间超过4个小时的概率.
    (3)、视样本数据的频率为概率,现从全校取4名学生,记X为这四名学生中运动时间超过4小时的人数,求X的分布列以及数学期望.
  • 34. 甲、乙、丙三人,为了研究某地区高中男生的体重y(单位:kg)与身高x(单位:cm)是否存在较好的线性关系,他们随机调查了6名高中男生身高和体重的数据,得到如下表格:

    身高/cm

    160

    166

    172

    173

    173

    182

    体重/kg

    44

    50

    55

    55

    56

    64

    根据表中数据计算得到y关于x的线性回归方程对应的直线的斜率为0.89.

    (1)、求y关于x的线性回归方程y^=b^x+a^
    (2)、从该地区大量高中男生中随机抽出10位男生,他们身高(单位:cm)的数据绘制成如图的茎叶图.

    ①估计体重超过60kg的频率p

    ②视频率为概率,从该地区大量高中男生中随机选出2人,记这2人中体重超过60kg的人数为X , 求X的分布列及其数学期望(用(1)中的回归方程估测这10位男生的体重).

  • 35. 设(XY)是一个二维离散型随机变量,它们的一切可能取的值为(aibj) , 其中i,jN , 令pij=P(X=aiY=bj) , 称Pij(ijN)是二维离散型随机变量(XY)的联合分布列.与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式:现有n(nN)个相同的球等可能的放入编号为1,2,3的三个盒子中,记落下第1号盒子的球的个数为X,落入第2号盒子中的球的个数为Y.


    b1

    b2

    b3

    a1

    p1.1

    p1.2

    p1.3

    a2

    p2.1

    p2.2

    p2.3

    a3

    p3.1

    p3.2

    p3.3

    (1)、当n=2时,求(XY)的联合分布列;
    (2)、设pk=m=0nP(X=kY=m)kNkn , 求k=0nkpk.
  • 36. 学校为提升高一年级学生自主体育锻炼的意识,拟称每周自主进行体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励,为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女姓组,对每周自主体育锻炼的时间分段进行统计(单位:小时)第一段[02) , 第二段[24) , 第三段[46) , 第四段[68) , 第五段[810] . 将男生在各段的频率及女生在各段的频数用折线图表示如下:

    (1)、求折线图中m的值,并估计该校高一年级学生中“体育迷”所占的比例;
    (2)、填写下列2×2列联表,并判断是否有95%的把握认为是否为“体育迷”与学生的性别有关?


    体育迷

    非体育迷

    合计

    合计

    附:K2=n(adbc)2(a+b)(c+d)(a+c)(b+d)

    P(K2K0)

    0.050

    0.010

    0.001

    K0

    3.841

    6.635

    10.828

    (3)、若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的良好健康发展,试估计该校高一年级学生的周平均锻炼时间是否达到保持身体良好健康发展的水平?(同一段中的数据用该组区间的中点值代表)
  • 37. 新型冠状病毒疫情已经严重影响了我们正常的学习、工作和生活.某市为了遏制病毒的传播,利用各种宣传工具向市民宣传防治病毒传播的科学知识.某校为了解学生对新型冠状病毒的防护认识,对该校学生开展防疫知识有奖竞赛活动,并从女生和男生中各随机抽取30人,统计答题成绩分别制成如下频数分布表和频率分布直方图.规定:成绩在80分及以上的同学成为“防疫标兵”.

    30名女生成绩频数分布表:

    成绩

    [6070)

    [7080)

    [8090)

    [90100]

    频数

    10

    10

    6

    4

    附:K2=n(adbc)2(a+b)(c+d)(a+c)(b+d)n=a+b+c+d

    P(K2k0)

    0.100

    0.050

    0.025

    0.010

    0.005

    0.001

    k0

    2.706

    3.841

    5.024

    6.635

    7.879

    10.828

    (1)、根据以上数据,完成以下2×2列联表,并判断是否有95%的把握认为“防疫标兵”与性别有关;


    男生

    女生

    合计

    防疫标兵

    非防疫标兵

    合计

    (2)、以样本估计总体,以频率估计概率,现从该校女生中随机抽取4人,其中“防疫标兵”的人数为X , 求随机变量X的分布列与数学期望.
  • 38. 直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2022年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,且“经常使用直播销售用户”中有56是“年轻人”.

    参考数据:独立性检验临界值表

    α

    0.15

    0.10

    0.050

    0.025

    0.010

    xa

    2.072

    2.706

    3.841

    5.024

    6.635

    χ2=n(adbc)2(a+b)(c+d)(a+c)(b+d)n=a+b+c+d.

    (1)、现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,根据α=0.10的独立性检验,能否认为经常使用网络直播销售与年龄有关?

    使用直播销售情况与年龄列联表


    年轻人

    非年轻人

    合计

    经常使用直播售用户

    不常使用直播销售用户

    合计

    (2)、某投资公司在2023年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售、根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为71015110.方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为1215310.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
  • 39. 某市举行招聘考试,共有4000人参加,分为初试和复试,初试通过后参加复试.为了解考生的考试情况,随机抽取了100名考生的初试成绩,并以此为样本绘制了样本频率分布直方图,如图所示.

    附:若随机变量X服从正态分布N(μσ2) , 则:P(μσ<X<μ+σ)=0.6827P(μ2σ<X<μ+2σ)=0.9545P(μ3σ<X<μ+3σ)=0.9973

    (1)、根据频率分布直方图,试求样本平均数的估计值;
    (2)、若所有考生的初试成绩X近似服从正态分布N(μσ2) , 其中μ为样本平均数的估计值,σ13 , 试估计初试成绩不低于88分的人数;
    (3)、复试共三道题,第一题考生答对得5分,答错得0分,后两题考生每答对一道题得10分,答错得0分,答完三道题后的得分之和为考生的复试成绩.已知某考生进入复试,他在复试中第一题答对的概率为34 , 后两题答对的概率均为35 , 且每道题回答正确与否互不影响.记该考生的复试成绩为Y,求Y的分布列及均值.
  • 40. 为了“锤炼党性修养,筑牢党性根基”,党员教师小A每天自觉登录“学习强国APP”,参加各种学习活动,同时热衷于参与四人赛.每局四人赛是由网络随机匹配四人进行比赛,每题回答正确得20分,第1个达到100分的比赛者获得第1名,赢得该局比赛,该局比赛结束.每天的四人赛共有30局,前2局是有效局,根据得分情况获得相应名次,从而得到相应的学习积分,第1局获得第1名的得3分,获得第2、3名的得2分,获得第4名的得1分;第2局获得第1名的得2分,获得第2、3、4名的得1分;后28局是无效局,无论获得什么名次,均不能获得学习积分.经统计,小A每天在第1局四人赛中获得3分、2分、1分的概率分别为131216 , 在第2局四人赛中获得2分、1分的概率分别为1323.
    (1)、设小A每天获得的得分为X , 求X的分布列、数学期望和方差;
    (2)、若小A每天赛完30局,设小A在每局四人赛中获得第1名从而赢得该局比赛的概率为13 , 每局是否赢得比赛相互独立,请问在每天的30局四人赛中,小A赢得多少局的比赛概率最大?