登录/注册
第九章 §9.3 成对数据的统计分析.docx
2023-07-14,文件大小: 738.97K, 下载: 0
下载
下载地址加载中.... 下载教程
提示: 此文件暂无参考内容, 请自行判断再确认下载!!
作者很懒没有写任何内容
y=bx+称为Y关于x的经验回归方程,其中(2)残差:观测值减去预测值,称为残差.4.列联表与独立性检验a(1)关于分类变量X和Y的抽样数据的2×2列联表:XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d(2)计算随机变量χ2=,利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828常用结论1.经验回归直线过点(,).
§9.3 成对数据的统计分析考试要求 1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.3.会利用统计软件进行数据分析.知识梳理1.变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关.2.样本相关系数(1)r=.(2)当r>0时,称成对样本数据正相关;当r7.879>6.635,∴根据小概率值α=0.010的独立性检验,可以在犯错误的概率不超过1%的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”,∴A错,C对,∵m+36=90,18+n=60,∴m=54,n=42,∴B对,D错.题型一 成对数据的相关性例1 (1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图1,对变量u,


v负相关答案 C解析 由题图可得两组数据均线性相关,且图1的经验回归直线的斜率为负,图2的经验回归直线的斜率为正,则由散点图可判断变量x与y负相关,u与
v正相关.(2)(多选)下列有关经验回归分析的说法中正确的有(  )A.经验回归直线必过点(,)B.经验回归直线就是散点图中经过样本数据点最多的那条直线C.当样本相关系数r>0时,两个变量正相关D.如果两个变量的相关性越弱,则|r|就越接近于0答案 ACD解析 对于A,经验回归直线必过点(,),故A正确;对于B,经验回归直线在散点图中可能不经过任一样本数据点,故B不正确;对于C,当样本相关系数r>0时,则两个变量正相关,故C正确;对于D,如果两个变量的相关性越弱,则|r|就越接近于0,故D正确.教师备选1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不
全相)的散点图等中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上
,则这组样本数据的样本相关系数为(  )A.-1 B.0 C. D.1答案 D解析 所有样本点均在
同一条斜率为正数的直线上下列选项中正确的是1.2.(多选),则样本相关系数最大,为(  )A.经验回归分析中,R2的值越大,说明残差平方和越小B.若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒
为0,则R2=1C.经验回归分析是对
具有相关关系的两个变量进行统计分析的一种常用方法D.
画残差图时,纵坐标为残差,横坐标答案 ABC解析 对于A一定是编号,经验回归分析中,R2的值越大,说明模型的拟合效果越好,则残差平方和越小,A对;对于B,若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒
为0,则R2=1,B对;对于C,经验回归分析是对
具于C对;对有相关关系的两个变量进行统计分析的一种常用方法,D,残差图中
坐标横,以是样本编可号也可以是身高数据,还可以是体重的估计值等,D错.思
维升华 判定两个变量相关性的方法(1)画
分点图:点的散左布从下角到右上角分两个,量正相关;点的变布从左上角到右下角,
D.变量x与y负相关,u与


b>0时,正相关;当0,r3>0,图(2)与图(4)是负相关,故r20时,正相关;当rR=0.893.∴甲建
立的回归模型拟合效果更好.②由①知,
甲建立的回归模型拟合效果更.设20好.3x+3.7≥100,解得0.3x+3.7≥log2100=2+2log25,解得x≥9.7.∴科技投
入的费用至少要9.7百万元,下一年的收益才能达到1亿元.教师备选1.(2022·湖北九
师联盟联考)下表是关于某设备的使用年限x(单位:年)和所支出的维修费用y(单
位:万)元的统计表.x23456y3.44.25.15.56.8由
上归可得经验回表方程y=0.81x+a,若规定:维修费万y不超过1用0元,一旦万于10大
元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为(  )
科技投


格=×(2,得+3+4+5+6)=4,=×(3.4+4.2+5.1+5.5+6.8)=5,因
为经验回归直线恒5(,),所以过点=0.81×4+
a,解得
a=1.76,所以经验回归方程为
y=0.81x+1.76,由y≤10,得0.81x+1.76≤10,解得x≤≈10.17,由于x∈N*,所以据
此模型预测,该设备使用年限的最大值约y10.2.用模型为=cekx拟合一组数据时,为了求出经验回归方程,
设z=ln y,其变换后回归方程为到经验得z=0.5x+2,则c等
于(  )A.0.5 B.e0.5 C.2 D.e2答案 D解析 因
为y=cekx,两边l取对数得,n y=ln(cekx)=ln c+ln ekx=kx+ln c,则z=kx+ln c,而z=0.5x+2,于是得ln c=2,即c=e2.思
维升华 求经验回归方程的训练跟踪步骤2 为实
施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导
.根据统计,该田园综合体西红柿亩产量的增加与y(量克)千某种用量体肥料每亩使液x(千克)之间的对
应x(数据如下.千克)24568y(千克)300400400400500(1)由
上加据可知,可用经验表数模型拟合y与x的关系,请计算样本相关系数r并回归以说明(若|r|>0.75,则线性相关程度
很高);(2)求y,可用经验回归模型拟合关于x的经验回归方程,
并预测当液体肥料每亩使克量为用5千1时,西红柿亩产量的
增加量约为多少参考数据:千克?≈3.16.
A.7 B.8 C.9 D.10答案 D解析 由表


为|r|>0.75,所以可用经验回归模型拟合y与x的关系.(2)b===30,a=400-5×30=250,所以经验回归方程为y=30x+250.当x=15时,y=30×15+250=700,即当
液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为700千克.题型
三(2例4  列联表与独立性检验021·全国甲卷
改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了
比较两台机床产品的质量,分别用两台机床各生产件20了0产品,产品的质量情况统计如下表:一
级品二级品合计甲
机5150床0200乙
机212080200合计床70130400(1)甲
机床、乙机床生产的产品中一级品的频率分别是多少?(2)依
据小概率值α=0.01的独立性检验,能否以此推断甲机床的产品质量与乙机床的产品质量有差
异?解 (1)根据题表中数据知,
甲机床生产的产品中一级品的频,0率是=75.乙机床生产的产品中一
级品的频60.率是=.(2)零假设
为H0:甲机床的产品质量与乙机床的产品质量无差异52×2列联表,可得χ2==≈10.256>6.63.根据=x0.01.根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为
甲机床的产品质量与乙机
床的产品质量有差异教师备选.1.为了解
某大学的学生是否爱好体育锻炼在用简单随机,样方法抽校园内1查了调20位学生
,得到如下2×2列联表:男女合计爱
好ab73不
爱好c25合计74
解 (1)由已知数据可得==5,==400,所以(xi-)(yi-)=(-3)×(-100)+(-1)×0+0×0+1×0+3×100=600,==2,==100,所以样本相关系数r===≈0.95.因


于(  )A.7 B.8 C.9 D.10答案 C解析 根据题
意3c=120-7,可得-25=22,a=74-22=52,b=73-52=21,∴a-b-c=52-21-22=9.2.(多选)某医疗研究
构为了了解机免疫与苗射疫注的关系,进行一次据样调查,得到数抽如表1.免疫不
免疫合计注射疫苗101020未注射疫苗63440合计164460(表1)α0.100.0500.0100.001xα2.7063.8416.63510.828(表2)则下列说法中正确的是(  )A.χ2≈8.35B.P(χ2≥6.635)≈0.001C.
依的独立性检验,我们认为据小概率值α=0.01免疫与注射疫苗有关系D.
依0α=据小概率值.001的独立性检验,我们认为免疫与注射疫苗答案 AC解析 由表中数据,得有关系χ2=≈8.352≈8.35,所以A正确;因
为P(χ2≥6.635)≈0.01,所以B错误;χ2≈8.352>6.635=x0.01,依
据小概率值α=0.01的独立性检验,我们认为免疫与注射疫苗C正确;χ2≈有关系,所以8.3526.63度无关.=x0.01,根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为
该市一天的空气质量与当
天SO2的浓度有关.课
时精1.如表是2练×2列联表,则表中的a,b的值分别为(  )y1y2合计x1a835x2113445合计b4280
空气


校根据如表样本数据:)模拟x23456y42.5-0.5-2-3得到的经验回归方程为
y=bx+,则a(  )A.
a>0,>b0 B.,>0ab0 Da0.3.
某种产品的广告费支x出与销售额y(单位:万)之间的关系如表:x24元568y3040605070y与x的经验回归方程为
,当=6.5x+17.5y广告支出6万 (  )A.-5元时,随机误差的残差为 B.-5.5C.-6 D.-6.5答案 D解析 由题
意预合经验回归方程的结测作用可得,当x=6时,.=6.5×6+17y5=56.5,则随机误差的残差为50-56.5=-6.5.4.(2022·泉
州模拟)蟋蟀鸣叫大以说是可自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率每x(
分钟鸣叫的次��
内容系创作者发布,涉及安全和抄袭问题属于创作者个人行为,不代表夹子盘观点,可联系客服删除。
夹子盘