2019-2023高考数学真题分类汇编25 统计
试卷更新日期:2023-09-02 类型:二轮复习
一、选择题
-
1. 根据身高和体重散点图,下列说法正确的是( ).A、身高越高,体重越重 B、身高越高,体重越轻 C、身高与体重成正相关 D、身高与体重成负相关2. 为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为 , 将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A、8 B、12 C、16 D、183. 某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A、讲座前问卷答题的正确率的中位数小于70% B、讲座后问卷答题的正确率的平均数大于85% C、讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差 D、讲座后问卷答题的正确率的极差大于讲座前正确率的极差4. 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A、该地农户家庭年收入低于4.5万元的农户比率估计为6% B、该地农户家庭年收入不低于10.5万元的农户比率估计为10% C、估计该地农户家庭年收入的平均值不超过6.5万元 D、估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间5. 从某网格平台推荐的影视作品中抽取400部,统计其评分分数据,将所得400个评分数据分为8组: ,并整理得到如下的费率分布直方图,则评分在区间 内的影视作品数量是( )A、20 B、40 C、64 D、806. 某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据 得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A、 B、 C、 D、7. 演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A、中位数 B、平均数 C、方差 D、极差8. 某学校为了解1000名新生的身体素质,将这些学生编号为1,2,……,1000。从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是( )
A、8号学生 B、200号学生 C、616号学生 D、815号学生9. 调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数 , 下列说法正确的是( )A、花瓣长度和花萼长度没有相关性 B、花瓣长度和花萼长度呈现负相关 C、花瓣长度和花萼长度呈现正相关 D、若从样本中抽取一部分,则这部分的相关系数一定是10. 分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是( )
A、甲同学周课外体育运动时长的样本中位数为7.4 B、乙同学周课外体育运动时长的样本平均数大于8 C、甲同学周课外体育运动时长大于8的概率的估计值大于0.4 D、乙同学周课外体育运动时长大于8的概率的估计值大于0.611. 设一组样本数据x1 , x2 , …,xn的方差为0.01,则数据10x1 , 10x2 , …,10xn的方差为( )A、0.01 B、0.1 C、1 D、1012. Logistic模型是常用数学模型之一,可应用于流行病学领城.有学者根据公布数据建立了某地区新冠肺炎累计确诊病例数I(t)(t的单位:天)的Logistic模型: ,其中K为最大确诊病例数.当I( )=0.95K时,标志着已初步遏制疫情,则 约为( )(ln19≈3)A、60 B、63 C、66 D、6913. 从一批零件中抽取80个,测量其直径(单位: ),将所得数据分为9组: ,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间 内的个数为( )
A、10 B、18 C、20 D、36二、多项选择题
-
14. 下列统计量中,能度量样本 的离散程度的是( )A、样本 的标准差 B、样本 的中位数 C、样本 的极差 D、样本 的平均数15. 有一组样本数据x1 , x2,…,xn,由这组数据得到新样本数据y1 , y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )A、两组样本数据的样本平均数相同 B、两组样本数据的样本中位数相同 C、两组样本数据的样本标准差相同 D、两组样本数据的样本极差相同
三、填空题
-
16. 已知一组数据 的平均数为4,则a的值是.17. 国内生产总值(GDP)是衡量地区经济状况的最佳指标,根据统计数据显示,某市在2020年间经济高质量增长,GDP稳步增长,第一季度和第四季度的GDP分别为231和242,且四个季度GDP的中位数与平均数相等,则2020年GDP总额为 ;18. 已知一组数据6,7,8,8,9,10,则该组数据的方差是.19. 我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为.
四、解答题
-
20. 某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为 , . 试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记 , 记的样本平均数为 , 样本方差为 .
(1)、求 , ;(2)、判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果 , 则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)21. 某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位: )和材积量(单位: ),得到如下数据:样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得 .
附:相关系数 .
(1)、估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)、求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)、现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为 .已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.22. 一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)、计算试验组的样本平均数;(2)、(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表对照组
试验组
(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
附: ,
0.100
0.050
0.010
2.706
3.841
6.635
23. 某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为 , (),试验结果如下试验序号i
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记 , 记 , , …,的样本平均数为 , 样本方差为 ,
(1)、求 , ;(2)、判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果 , 则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).24. 某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳形,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)、当漏诊率时,求临近值c和误诊率;(2)、设函数 , 当时,求的解析式,并求在区间的最小值.25. 甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)、甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)、能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:
26. 某厂研究了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记为s12和s22
(1)、求 , , s12 , s22;(2)、判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果 - ≥ ,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).27. 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi , yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 , , , , .(1)、求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)、求样本(xi , yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)、根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r= , =1.414.
28. 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同。经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)、求乙离子残留百分比直方图中a,b的值;(2)、分别估计甲,乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表)29. 某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表。y的分组 [-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80) 企业数 2 24 53 14 7 附:
(1)、分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)、求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)