人教新课标A版 选修2-3 3.1回归分析的基本思想及其初步应用

试卷更新日期:2020-11-30 类型:同步测试

一、单选题

  • 1. 已知呈线性相关的变量x与y的部分数据如表所示:

    x

    2

    4

    5

    6

    8

    y

    3

    4.5

    m

    7.5

    9

    若其回归直线方程是 y=1.05x+0.85 ,则m=(    )

    A、5.5 B、6 C、6.5 D、7
  • 2. 两个线性相关变量 xy 的统计数据如表:

    x

    9

    9.5

    10

    10.5

    11

    y

    11

    10

    8

    6

    5

    其回归直线方程是 y^=b^x+40 ,则相对应于点 (11,5) 的残差为(    )

    A、0.1 B、0.4 C、0.3 D、0.2
  • 3. 观察下列各图形,

    其中两个变量 xy 具有相关关系的图是(    )

    A、①② B、①④ C、③④ D、
  • 4. 已知一组样本数据点 (x1,y1),(x2,y2),(x3,y3),,(x6,y6) ,用最小二乘法求得其线性回归方程为 y^=2x+4 .若 x1,x2,x3,,x6 的平均数为1,则 y1+y2+y3++y6= (    )
    A、10 B、11 C、12 D、13
  • 5. 某种产品的广告费支出与销售额之间有如下对应数据:

    广告费用 x (万元)

    0.2

    0.4

    0.5

    0.6

    0.8

    销售额 y (万元)

    3

    4

    6

    5

    7

    销售额 y (万元)与广告费用 x (万元)之间有线性相关关系,回归方程为 y^=7x+m ( m 为常数),现在要使销售额达到7.8万元,估计广告费用约为(    )万元.

    A、0.75 B、0.9 C、1.5 D、2.5
  • 6. 为了估计加工零件所花费的时间,为此进行了4次试验,测得的数据如下表:

    零件数 x (个)

    1

    3

    5

    7

    加工时间 y (分钟)

    0.5

    a

    2

    2.5

    若零件数x与加工时间y具有线性相关关系,且线性回归方程为 y^=0.36x+0.01 ,则a=(    )

    A、1 B、0.8 C、1.09 D、1.5
  • 7. 调查某市出租车使用年限 x 和该年支出维修费用 y (万元),得到数据如下:

    使用年限 x

    2

    3

    4

    5

    6

    维修费用 y

    2.2

    3.8

    5.5

    6.5

    7.0

    则线性回归方程是(    )

    A、y^=2.4x+8.1 B、y^=1.23x+0.08 C、y^=1.23x+0.82 D、y^=1.78x+1.02
  • 8. 已知关于某设各的使用年限x(单位:年)和所支出的维修费用y(单位:万元)有如下的统计资料,

    x

    2

    3

    4

    5

    6

    y

    2.2

    3.8

    5.5

    6.5

    7.0

    由上表可得线性回归方程 y^=b^x+0.08 ,若规定当维修费用y>12时该设各必须报废,据此模型预报该设各使用年限的最大值为(  )

    A、7 B、8 C、9 D、10
  • 9. 某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:

    x

    2

    4

    5

    6

    8

    y

    30

    40

    50

    70

    根据表提供的数据,求得y关于x的线性回归方程为 y^=6.5x+15.5 ,由于表中有一个数据模糊看不清,请你推断出该数据的值为(    )

    A、45 B、55 C、50 D、60
  • 10. 某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据 (xiyi)(i=1220) 得到下面的散点图:

    由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )

    A、y=a+bx B、y=a+bx2 C、y=a+bex D、y=a+blnx
  • 11. 某地两防指挥部在汛期对当地一条河流连续进行监测,下表是最近几日该河流某段的水位情况.

    河流水位表(1)

    x

    第1日

    第2日

    第3日

    第4日

    第5日

    第6日

    第7日

    水位 y (米)

    3.5

    3.7

    3.8

    3.9

    4.3

    4.4

    4.8

    而根据河流的堤防情况规定:水位超过一定高度将分别启动相应预警措施(见下表),当水位达到保证水位时,防汛进入紧急状态,防汛部门要按照紧急防汛期的权限,采取各种必要措施,确保堤防等工程的安全,并根据“有限保证、无限负责”的精神,对于可能出现超过保证水位的工程抢护和人员安全做好积极准备.

    水位预警分级表(2)

    水位

    4.7

    5.1

    5.6

    水位分类

    设防水位

    警戒水位

    保证水位

    预警颜色

    黄色

    橙色

    红色

    现已根据上表得到水位 y 的回归直线方程为 y^=0.21x+3.217 ,据上表估计(    ).

    A、第8日将要启动洪水橙色预警 B、第10日将要启动洪水红色预警 C、第11日将要启动洪水红色预警 D、第12日将要启动洪水红色预警
  • 12. 下列说法错误的是(    )
    A、在回归分析中,回归直线始终过样本点( x1 , y1 ),( x2 , y2 ),…,( xn , yn ) 的中心( x¯,y¯ B、若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0 C、在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高 D、在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好

二、多选题

  • 13. 为了对变量 xy 的线性相关性进行检验,由样本点 (x1y1)(x2y2)(x10y10) 求得两个变量的样本相关系数为 r ,那么下面说法中错误的有(    )
    A、若所有样本点都在直线 y=2x+1 上,则 r=1 B、若所有样本点都在直线 y=2x+1 上,则 r=2 C、|r| 越大,则变量 xy 的线性相关性越强 D、|r| 越小,则变量 xy 的线性相关性越强
  • 14. 在2020年3月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价 x 元和销售量 y 件之间的一组数据如表所示:

    价格 x

    9

    9.5

    10

    10.5

    11

    销售量 y

    11

    10

    8

    6

    5

    根据公式计算得相关系数 |r|=0.986 ,其线性回归直线方程是: y^=3.2x+a^ ,则下列说法正确的有( )

    参考: r0.01=0.959

    A、99% 的把握认为变量 xy 具有线性相关关系 B、回归直线恒过定点 (108) C、a^=40 D、x=8.5 时, y 的估计值为12.8

三、填空题

  • 15. 下表是降耗技术改造后,生产甲产品过程中记录的产量 x (吨)与相应的生产能耗 y (吨标准煤)的几组对应数据,根据表中提供的数据,得到 y 关于 x 的线性回归方程为 y^=0.7x+0.35 ,那么表中 m 的值为

    x

    3

    4

    5

    6

    y

    2.5

    m

    4

    4.5

  • 16. 为了了解家庭月收入 x (单位:千元)与月储蓄 y (单位:千元)的关系,从某居民区随机抽取10个家庭,根据测量数据的散点图可以看出 xy 之间具有线性相关关系,其回归直线方程为 y^=0.3x0.4 ,若该居民区某家庭月收入为7千元,据此估计该家庭的月储蓄为千元.
  • 17. 已知 xy 之间的一组数据:

    x

    2

    4

    6

    8

    y

    1

    3

    5

    7

    yx 的线性回归方程为 y^=b^x+a^ 必过点

  • 18. 以下几个命题中:

    ①线性回归直线方程 y^=b^x+a^ 恒过样本中心 (x¯,y¯)

    ②用相关指数 R2 可以刻画回归的效果,值越小说明模型的拟合效果越好;

    ③随机误差是引起预报值 y^ 和真实值 y 之间存在误差的原因之一,其大小取决于随机误差的方差;

    ④在含有一个解释变量的线性模型中,相关指数 R2 等于相关系数 r 的平方.

    其中真命题为

四、解答题

  • 19. 某新上市的电子产品举行为期一个星期(7天)的促销活动,规定购买该电子产品可免费赠送礼品一份,随着促销活动的有效开展,第五天工作人员对前五天中参加活动的人数进行统计,y表示第x天参加该活动的人数,得到统计表格如下,经计算得 y¯=13 .

    x

    1

    2

    3

    4

    5

    y

    4

    m

    10

    23

    22

    参考公式:

    b=i=1n(xix¯)(yiy¯)i=1n(xix¯)2=i=1nxiyinx¯y¯i=1nxi2nx2a^=y¯b^x¯

    (1)、若y与x具有线性相关关系,请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程 y^=b^x+a^
    (2)、预测该星期最后一天参加该活动的人数(按四舍五入取到整数).
  • 20. 这次新冠肺炎疫情,是新中国成立以来在我国发生的传播速度最快、感染范围最广防控难度最大的一次重大突发公共卫生事件.中华民族历史上经历过很多磨难,但从来没有被压垮过,而是愈挫愈勇,不断在磨难中成长,从磨难中奋起.在这次疫情中,全国人民展现出既有责任担当之勇、又有科学防控之智,某市某校学生也运用数学知识展开了对这次疫情的研究,一名同学在疫情初期数据统计中发现,从2020年2月1日至2月7日期间,日期 x 和全国累计报告确诊病例数量 y (单位:万人)之间的关系如下表:

    日期 x

    1

    2

    3

    4

    5

    6

    7

    确诊病例数量 y (万人)

    1.4

    1.7

    2.0

    2.4

    2.8

    3.1

    3.5

    参考数据如下表:

    ω¯

    i=17yi

    i=17xiyi

    i=17ωiyi

    1.92

    16.9

    77.5

    35.17

    表中 ωi=xiω¯=17i=1nωii=1nai=a1+a2+a3++an .

    参考公式:对于一组数据 (u1,v1)(u2,v2) ,…, (un,vn) 其回归方程 v=α^+β^u 中斜率和截距的最小二乘估计公式分别为:① β^=i=1nuivinu¯v¯i=1nui2nu¯2=i=1n(uiu¯)(viv¯)i=1n(uiu¯)2 ,② α^=v¯β^u¯ .

    (1)、根据表中的数据, y=a+bxy=c+dx 哪一个适宜作为确诊病例数量 y 关于日期 x 的回归方程类型?(给出判断即可,不必说明理由)
    (2)、根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方程;(精确到0.01)
    (3)、预测2月16日全国累计报告确诊病例数.
  • 21. 为了解某地区某种农产品的年产量 (单位:吨)对价格 y (单位:千元/吨)的影响,对近五年该农产品的年产量和价格统计如表:

    x

    2

    3

    4

    5

    6

    y

    8

    6

    5

    4

    2

    已知x和 y 具有线性相关关系.

    附:回归直线的斜率和截距的最小二乘法估计公式分别为 b^=i=1n(xix¯)(yiy¯)i=1n(xix¯)2a^=y¯b^x¯ .

    (1)、求 x¯y¯
    (2)、求y关于x的线性回归方程 y=b^x+a^
    (3)、若年产量为3.5吨,试预测该农产品的价格.
  • 22. 某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:

    x

    2

    4

    5

    6

    8

    y

    30

    40

    60

    50

    70

    参考公式用最小二乘法求线性回归方程系数公式: b^=i=1nxiyinx¯y¯i=1nxi2n(x¯)2a^=y¯b^x¯ .

    (1)、画出散点图;
    (2)、求y关于x的线性回归方程.
    (3)、如果广告费支出为一千万元,预测销售额大约为多少百万元?
  • 23. 《中国诗词大会》是中央电视台于2016年推出的大型益智类节目,中央电视台为了解该节目的收视情况,抽查北方与南方各5个城市,得到观看该节目的人数(单位:千人)如茎叶图所示,但其中一个数字被污损.

    参考公式: b^=i=1nxiyinx¯y¯i=1nxi2n(x¯)2a^=y¯b^x¯

    (1)、若将被污损的数字视为0~9中10个数字中的一个,求北方观众平均人数超过南方观众平均人数的概率;
    (2)、该节目的播出极大激发了观众学习诗词的热情,现在随机统计了4位观众每周学习诗词的平均时间 y (单位:小时)与年龄 x (单位:岁),并制作了对照表(如下表所示):

    年龄 x

    20

    30

    40

    50

    每周学习诗词的平均时间 y

    3

    3.5

    3.5

    4

    由表中数据分析, xy 呈线性相关关系,试求线性回归方程,并预测年龄为60岁的观众每周学习诗词的平均时间.

  • 24. 一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间 t (分钟)和答对人数 y 的统计表格如下:

    时间 t (分钟)

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    答对人数 y

    98

    70

    52

    36

    30

    20

    15

    11

    5

    5

    lgy

    1.99

    1.85

    1.72

    1.56

    1.48

    1.30

    1.18

    1.04

    0.7

    0.7

    时间 t 与答对人数 y 的散点图如图:

    附: ti2=38500yi=342lgyi=13.5tiyi=10960tilgyi=620.9 ,对于一组数据 (u1v1)(u2v2) ,……, (unvn) ,其回归直线 v=α+βu 的斜率和截距的最小二乘估计分别为: β^=i=1nuivinu¯v¯i=1nui2nu¯2α^=v¯β^u¯ .请根据表格数据回答下列问题:

    (1)、根据散点图判断, y=at+blgy=ct+d ,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)
    (2)、根据(1)的判断结果,建立y与t的回归方程;(数据保留3位有效数字)
    (3)、根据(2)请估算要想记住 75% 的内容,至多间隔多少分钟重新记忆一遍.(参考数据: lg20.3lg30.48