人教新课标A版 选修2-3 第三章统计案例
试卷更新日期:2020-11-30 类型:单元试卷
一、单选题
-
1. 已知呈线性相关的变量x与y的部分数据如表所示:
x
2
4
5
6
8
y
3
4.5
m
7.5
9
若其回归直线方程是 ,则m=( )
A、5.5 B、6 C、6.5 D、72. 两个线性相关变量 与 的统计数据如表:x
9
9.5
10
10.5
11
y
11
10
8
6
5
其回归直线方程是 ,则相对应于点 的残差为( )
A、0.1 B、0.4 C、0.3 D、0.23. 下列说法中不正确的是( )A、独立性检验是检验两个分类变量是否有关的一种统计方法 B、独立性检验得到的结论一定是正确的 C、独立性检验的样本不同,其结论可能不同 D、独立性检验的基本思想是带有概率性质的反证法4. 已知一组样本数据点 ,用最小二乘法求得其线性回归方程为 .若 的平均数为1,则 ( )A、10 B、11 C、12 D、135. 为研究某地区中学生的性别与阅读量的关系,运用 列联表进行独立性检验,经计算 ,则所得的结论是:有______把握认为“该地区中学生的性别与阅读量有关系”( )附表:
0.10
0.025
0.01
0.001
2.706
5.024
6.635
10.828
A、0.1% B、1% C、99% D、99.9%6. 某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x
2
4
5
6
8
y
30
40
50
70
根据表提供的数据,求得y关于x的线性回归方程为 ,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A、45 B、55 C、50 D、607. 某地两防指挥部在汛期对当地一条河流连续进行监测,下表是最近几日该河流某段的水位情况.河流水位表(1)
第 日
第1日
第2日
第3日
第4日
第5日
第6日
第7日
水位 (米)
3.5
3.7
3.8
3.9
4.3
4.4
4.8
而根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全,并根据“有限保证、无限负责”的精神,对于可能出现超过保证水位的工程抢护和人员安全做好积极准备.
水位预警分级表(2)
水位
水位分类
设防水位
警戒水位
保证水位
预警颜色
黄色
橙色
红色
现已根据上表得到水位 的回归直线方程为 ,据上表估计( ).
A、第8日将要启动洪水橙色预警 B、第10日将要启动洪水红色预警 C、第11日将要启动洪水红色预警 D、第12日将要启动洪水红色预警8. Logistic模型是常用数学模型之一,可应用于流行病学领城.有学者根据公布数据建立了某地区新冠肺炎累计确诊病例数I(t)(t的单位:天)的Logistic模型: ,其中K为最大确诊病例数.当I( )=0.95K时,标志着已初步遏制疫情,则 约为( )(ln19≈3)A、60 B、63 C、66 D、699. 调查某市出租车使用年限 和该年支出维修费用 (万元),得到数据如下:使用年限
2
3
4
5
6
维修费用
2.2
3.8
5.5
6.5
7.0
则线性回归方程是( )
A、 B、 C、 D、10. 某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据 得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A、 B、 C、 D、11. 下列说法错误的是( )A、在回归分析中,回归直线始终过样本点( x1 , y1 ),( x2 , y2 ),…,( xn , yn ) 的中心( ) B、若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0 C、在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高 D、在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好12. 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀
非优秀
总计
甲班
10
b
乙班
c
30
总计105
已知在全部105人中随机抽取1人,成绩优秀的概率为 ,则下列说法正确的是( )
参考公式:
附表:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
A、列联表中c的值为30,b的值为35 B、列联表中c的值为15,b的值为50 C、根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系” D、根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”二、多选题
-
13. 为了对变量 与 的线性相关性进行检验,由样本点 、 、 、 求得两个变量的样本相关系数为 ,那么下面说法中错误的有( )A、若所有样本点都在直线 上,则 B、若所有样本点都在直线 上,则 C、若 越大,则变量 与 的线性相关性越强 D、若 越小,则变量 与 的线性相关性越强14. 在2020年3月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价 元和销售量 件之间的一组数据如表所示:
价格
9
9.5
10
10.5
11
销售量
11
10
8
6
5
根据公式计算得相关系数 ,其线性回归直线方程是: ,则下列说法正确的有( )
参考:
A、有 的把握认为变量 具有线性相关关系 B、回归直线恒过定点 C、 D、当 时, 的估计值为12.8三、填空题
-
15. 具有线性相关关系的变量 , ,满足一组数据如下表所示:若 与 的回归直线 ,则 的值是.
0
1
2
3
-1
1
8
16. 某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过该血清的人与另外500名未使用该血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”.已知利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是 .①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
17. ①回归分析中,相关指数 的值越大,说明残差平方和越大;②对于相关系数 , 越接近1,相关程度越大, 越接近0,相关程度越小;
③有一组样本数据 得到的回归直线方程为 ,那么直线 必经过点 ;
④ 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合;
以上几种说法正确的序号是 .
18. 在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取 只小鼠进行试验,得到如下联表:感染
未感染
总计
服用
10
40
50
未服用
20
30
50
总计
30
70
100
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
参照附表,在犯错误的概率最多不超过(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”.
四、解答题
-
19. 江苏省新高考方案要求考生在物理、历史科目中选择一科,我市在对某校高一年级学生的选科意愿调查中,共调查了100名学生,其中男、女生各50人,男生中选历史15人,女生中选物理10人.
附: .
0.010
0.005
0.001
6.635
7.879
10.828
(1)、请根据以上数据建立一个 列联表;(2)、判断性别与选科是否相关.20. 某新上市的电子产品举行为期一个星期(7天)的促销活动,规定购买该电子产品可免费赠送礼品一份,随着促销活动的有效开展,第五天工作人员对前五天中参加活动的人数进行统计,y表示第x天参加该活动的人数,得到统计表格如下,经计算得 .x
1
2
3
4
5
y
4
m
10
23
22
参考公式:
,
(1)、若y与x具有线性相关关系,请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 ;(2)、预测该星期最后一天参加该活动的人数(按四舍五入取到整数).21. 这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期 和全国累计报告确诊病例数量 (单位:万人)之间的关系如下表:日期
1
2
3
4
5
6
7
确诊病例数量 (万人)
1.4
1.7
2.0
2.4
2.8
3.1
3.5
参考数据如下表:
1.92
16.9
77.5
35.17
表中 , , .
参考公式:对于一组数据 , ,…, 其回归方程 中斜率和截距的最小二乘估计公式分别为:① ,② .
(1)、根据表中的数据, 与 哪一个适宜作为确诊病例数量 关于日期 的回归方程类型?(给出判断即可,不必说明理由)(2)、根据(1)的判断结果及表中数据,建立 关于 的回归方程;(精确到0.01)(3)、预测2月16日全国累计报告确诊病例数.22. 《中国诗词大会》是中央电视台于2016年推出的大型益智类节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.参考公式: ,
(1)、若将被污损的数字视为0~9中10个数字中的一个,求北方观众平均人数超过南方观众平均人数的概率;(2)、该节目的播出极大激发了观众学习诗词的热情,现在随机统计了4位观众每周学习诗词的平均时间 (单位:小时)与年龄 (单位:岁),并制作了对照表(如下表所示):年龄
20
30
40
50
每周学习诗词的平均时间
3
3.5
3.5
4
由表中数据分析, 与 呈线性相关关系,试求线性回归方程,并预测年龄为60岁的观众每周学习诗词的平均时间.
23. 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:x
2
4
5
6
8
y
30
40
60
50
70
参考公式用最小二乘法求线性回归方程系数公式: , .
(1)、画出散点图;(2)、求y关于x的线性回归方程.(3)、如果广告费支出为一千万元,预测销售额大约为多少百万元?24. 一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间 (分钟)和答对人数 的统计表格如下:时间 (分钟)
10
20
30
40
50
60
70
80
90
100
答对人数
98
70
52
36
30
20
15
11
5
5
1.99
1.85
1.72
1.56
1.48
1.30
1.18
1.04
0.7
0.7
时间 与答对人数 的散点图如图:
附: , , , , ,对于一组数据 , ,……, ,其回归直线 的斜率和截距的最小二乘估计分别为: , .请根据表格数据回答下列问题:
(1)、根据散点图判断, 与 ,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)(2)、根据(1)的判断结果,建立y与t的回归方程;(数据保留3位有效数字)(3)、根据(2)请估算要想记住 的内容,至多间隔多少分钟重新记忆一遍.(参考数据: , )