分布参数的假设检验
总体分布的χ2检验
学习目标
1.假设检验,原假设,备择假设
2.两类错误
3.显著水平,拒绝域
4.正态总体均值或方差的假设检验
常把一个要检验的假设记作H0,称为原假设
(或零假设)(nullhypothesis),与H0对立的假
设记作H1,称为备择假设(alternativehypothesis).
例某工厂在正常情况下生产的电灯泡的寿命
X(小时)~N(1600,802).从该工厂生产的一批灯
泡中随机抽取10个灯泡,测得它们寿命为:
1450,1480,1640,1610.1500,
1600,1420,1530,1700.1550
如果标准差不变,试检验这批灯泡的寿命
均值μ(1)也是1600,(2)大于1600,(3)小于
1600.
记作:
⑴在原假设为真时,决定放弃原假设,
称为第一类错误,其出现的概率通常记作α;
⑵在原假设不真时,决定接受原假设,
称为第二类错误,其出现的概率通常记作β.
通常只限定犯第一类错误的最大概率α,
不考虑犯第二类错误的概率β.这样的假设
检验又称为显著性检验,
概率α称为显著性水平.
当H0为μ=μ0,假设检验的结果是放弃H0时,
如果α=0.05,则称μ与μ0有显著的差异或
差异显著;如果水平α=0.01,则称μ与μ0有
极显著的差异或差异极显著.
假设检验的步骤如下:
⑴提出H0和H1;
⑵指定概率α;
⑶寻求统计量g(X1,X2,…,Xn)及其分布;
⑸当统计量的观测值g(x1,x2,…,xn)满足
不等式时放弃H0,否则接受H0.
⑷在H0为真时构造小概率事件并推导
g()所满足的不等式;
习惯上称观测值g(x1,x2,…,xn)所
满足的不等式为假设检验方案,称这个不等式所确定的观测值g的取值范围为假设检验的放弃域.
放弃域由两个区间构成的假设检
验被形容为双侧检验,放弃域由一个
区间构成的假设检验被形容为单侧检
验.
H0为相等,H1为不相等的假设检验
为双侧检验,观测值g()较大或较小时
放弃H0;
H0为相等,H1为大于的假设检验为单
侧检验,观测值g()较大时放弃H0;
H0为相等,H1为小于的假设检验为
单侧检验,观测值g()较小时放弃H0.
2.一个正态总体均值或方差的假设检验
为,修正方差的观测值为s*2,离均差
平方和的观测值为ss,显著性水平为α,
则有:
设总体X服从N(μ,σ2)分布,X的一个
样本为X1,X2,…,Xn,均值为,修正
方差为S*2,离均差平方和为SS,样本
的观测值为x1,x2,…,xn,均值的观测值
结论1)若σ2已知,对于给定的数值μ0,
作一个正态总体均值的假设检验时,
H0为μ=μ0,而H1分别为
①μ≠μ0,②μ>μ0,③μμ0,③μ37.72
计算出u=1.818,
例《品种提纯》一个混杂的小麦品种,
其株高的标准差为14cm,经提纯后随机地
抽出10株,它们的株高(单位:cm)为90,
105,101,95,100,100,101,105,93,97,试
检验提纯后的群体是否比原来的群体较为
整齐,α=0.05.
解:提纯后的群体应该比原来的群体
较为整齐,故设
H0为σ2=196,H1为σ2μ2,③μ1μ2,③μ1<μ2.
可设
它的观测值
当H0为真时,
结论6)若μ1和μ2未知,作两个正态总体
方差的假设检验时,
可设
它的观测值
当H0为真时,
例1.6《作物裁培》根据资料测算,某品种
小麦产量(单位:Kg/m2)的σ2=0.4.收获前
在麦田的四周取12个样点,得到产量的均值
=1.2,在麦田的中心取8个样点,得到产量
的均值=1.4,试检验麦田四周及中心处每
平方米产量是否有显著的差异(α=0.05)
解:因为要检验麦田四周及中心处每平方
米产量是否有显著的差异,所以设
H0为μ1=μ2,H1为μ1≠μ2,
由α查标准正态分布的分布函数值表得到
u0.975=1.96,|u|<1.96,因此应该接受H0,
认为μ1=μ2,即麦田四周及中心处每平
方米产量没有显著的差异.
例1.8《产量调查》调查某地每亩30万苗
和50万苗的稻田各5块,分别得到亩产量800,
840,870,920,850和900,880,890,890,840,
试检验两种密度的亩产量是否有显著的差异
解:本例要检验μ1≠μ2,
例中未给出显著性水平,可认为α=0.05.设
根据容量为n=m=5的两个样本观测值算出
则由α查F分布的分位数表得到
F0.975(4,4)=9.60,
下面检验μ1≠μ2,设
H0为μ1=μ2,H1为μ1≠μ2,
根据容量为n=m=5的两个样本观测值算出
即两种密度的亩产量没有显著的差异.
结论7)一个总体百分比的假设检验
4*.百分比的假设检验
可设
它的观测值
当H0为真时,
例1.10《遗传试验》以紫花和白花的大豆
品种杂交,在F2代共得到289株,其中紫
花208株,白花81株,试检验紫花与白花
所占比率为3:1,α=0.05.
由α查标准正态分布的分布函数值表得
因此应该接受H0,认为紫花与白花所占
比率为3:1.
结论8)两个总体百分比的假设检验
可设
它的观测值
当H0为真时,
例1.11《病害调查》调查低洼地小麦
378株,其中有锈病株355株,调查高
坡地小麦396株,其中有锈病株346株,
试检验两块小麦地的锈病率有无显著
的差异(α为0.05)
根据容量为n=378和m=396的样本观测值
由α查标准正态分布的分布函数值表得到
例1.12《杀虫效果》杀虫剂A在1000只
害虫中杀死657只,杀虫剂B在1000只
害虫中杀死728只,试检验杀虫剂B的
有效率是否明显地高于杀虫剂A(α=
0.05)
解:
根据容量为n=m=1000的样本观测值
由α查标准正态分布的分布函数值表得到
5.多个总体同方差的假设检验
设有k个总体,其方差分别为
其样本容量为n1,n2,…,nk,样本修正方差
的观测值为
离均差平方和的观测值为ss1,ss2,…,ssk
所用的检验方法由Bartlett提出,通常称之
为方差齐性或同质性检验,所用的统计量
的观测值是:
§7.2总体分布的假设检验
3.总体分布的χ2检验
对总体分布作χ2检验的步骤如下:
①设H0为总体X服从某个指定的分布;
②将随机变量X的取值范围划分为k个互不
相交的区间或区域Di(i=1至k);
③由样本的观测值求随机变量X在各个
Di中取值的观测频数ni(i=1至k);
④按所指定的分布求随机变量X在各个
Di中取值的概率pi(i=1至k),如果所指
定的分布中有未知的参数时,可先用极
大似然法求出各个未知参数的估计量后
再求上述各个概率的估计值;
⑤根据样本容量n及概率pi或估计值
求随机变量X在各个Di中取值的理论频数
或理论频数的估计值n(i=1至k);
⑥计算χ2统计量的观测值
当被估计的未知参数有l个,
作χ2检验时要求样本容量n≥50.
k的大小没有严格的规定,通常取
5≤k≤16.
一般限制np或n的值大于5,如果
出现不大于5的情形,应该与邻近的区
间或区域合并.
例2.6《丢掷骰子》将一粒均匀的骰子
丢掷100次,1点朝上13次,2点朝上14
次,3点朝上20次,4点朝上17次,5点
朝上15次,6点朝上21次,试检验这粒
骰子是否均匀.
解:如果这粒骰子是均匀的,则1至6
点朝上的次数服从均匀分布,即
P{1点朝上}=P{2点朝上}=P{3点朝上}
=P{4点朝上}=P{5点朝上}=P{6点朝上}
=1/6,
根据所给的观测值,
因此接受χ2检验的原假设,认为这粒骰子
是均匀的.
例2.7《放射研究》用计数器每隔一定
时间观测一次试验铀所放射的α粒子数
x,共100次,结果有1个x=0,5个x=1,
16个x=2,17个x=3,26个x=4,11个x=5,
9个x=6,9个x=7,2个x=8,1个x=9,
2个x=10,1个x=11,试检验总体是否服
从P(λ)分布.
解:如果总体是服从P(λ)分布,则
—————————————————————
x01234567
nx151617261199
n13.2318.5219.4416.3311.436.86
x891011
nx2121
n3.601.680.710.21
6.26
查χ2分布的分位数表得到
认为总体服从P(λ)分布.