基本概念
假设
设\((\mathscr{X},\mathscr{B},\mathscr{P})\)为一统计结构,则\(\mathscr{P}\)的非空子集称为假设,在\(\mathscr{P}\)为参数分布族\(\mathscr{P}=\{P_\theta;\theta\in \Theta\}\)的情况下,\(\Theta\)的非空子集称为假设。
在一个假设检验问题中,通常涉及两个假设:所要检验的假设被称为原假设,记作\(H_0\);而与\(H_0\)不相容的假设被称为备择假设,记为\(H_1\)。关于统计结构\((\mathscr{X},\mathscr{B},\mathscr{P})\)的原假设和备择假设分分别记为: \[ H_0:P\in \mathscr{P}_0,~~H_1:P\in \mathscr{P}_1 \] \(\mathscr{P}_0\)和\(\mathscr{P}_1\)为\(\mathscr{P}\)的两个互不相交的非空子集。而
对于参数分布族的场合,原假设和备择假设又可分别写为: \[ H_0:\theta \in \Theta_0,~~H_1:\theta \in \Theta_1 \] 其中\(\Theta_0\)和\(\Theta_1\)是\(\Theta\)的两个互不相交的非空子集。
如果一个假设中只含有一个元素,则称该假设为简单假设,否则被称为复合假设。
检验
给定\(H_0\)和\(H_1\)之后,就等于给定了一个检验问题\((H_0,H_1)\)。\((\Theta_0,\Theta_1)\)称为参数假设检验问题,其它称为非参数假设检验问题。
在检验问题\((H_0,H_1)\)中,检验法则(简称检验法或检验)就是设法将样本空间划分为互不相交的两个可测集\(\mathscr{X}=W+\bar{W}\),并且规定:
- 当观测值\(x\in W\)时,就拒绝原假设,认为备择假设成立。
- 当观测值\(x\in \bar{W}\)时,不拒绝原假设。
这里的\(W\)被称为拒绝域。
为了确定拒绝域,通常从问题的背景出发,寻找一个统计量,使得在原假设\(H_0\)成立和备择假设\(H_1\)成立时,该统计量的值有差异,从而可以根据这个统计量的值的大小选定拒绝域。这个能够从样本空间中划分出拒绝域的统计量被称为检验统计量。
两类错误
在假设检验问题中,检验法可能会犯如下的两种错误:
第一类错误:原假设\(H_0\)成立时,样本观测值却落在拒绝域\(W\)中,从而拒绝了原假设。犯第一类错误的概率是: \[ \alpha=P(X\in W),~P\in \mathscr{P}_0 \\ \alpha(\theta)=P_\theta(X\in W),~\theta\in \Theta_0 \\ \]
第二类错误:原假设\(H_0\)不成立时,样本观测值却没有落在拒绝域\(W\)中,从而没有拒绝原假设。犯第二类错误的概率是: \[ \beta=P(X\notin W)=1-P(X\in W),~P\in \mathscr{P}_1 \\ \beta(\theta)=P_\theta(X\notin W)=1-P_\theta(X\in W),~\theta\in \Theta_1 \\ \]
势函数
检验的势函数指的是样本观察值落在拒绝域的概率,记为 \[ g(\theta)=P_\theta(X\in W),~\theta \in \Theta \] 在\(\theta \in \Theta_0\)时,\(g(\theta)=\alpha(\theta)\),\(g(\theta)\)对应于犯第一类错误的概率;在\(\theta \in \Theta_1\)时,\(g(\theta)=1-\beta(\theta)\),\(1-g(\theta)\)则对应于检验犯第二类错误的概率。
检验水平
在检验问题中,当样本容量\(n\)固定时,一般无法使得犯两类错误的概率都减小。因为如果要使犯第一类错误的概率减小,就要缩小拒绝域,从而使得犯第二类错误的概率增大;同理,如果要使犯第二类错误的概率增大,就要扩大拒绝域,从而使得犯第一类错误的概率增大。因此,需要采用某种妥协方案。
Neyman和Pearson的假设检验理论的基本思想,就是使得犯第一类错误的概率被限制在某一个范围内,然后寻找使犯第二类错误的概率尽可能小的检验。在这种思想的指导下,寻找一个好的检验法就是对选定的一个较小的数\(\alpha(0<\alpha<1)\),在满足 \[ g(\theta)=P_{\theta}(X\in W)\le \alpha,~~\theta\in \Theta_0 \] 的检验中,寻找这样的检验,使得在\(\theta\in \Theta_1\)时,\(g(\theta)\)尽可能的大。此时,犯第二类错误的概率\(1-g(\theta)\)尽可能地小。但是需要注意的是,由于检验犯第二类错误的概率并未受到限制,仅要求它尽可能地小,因此备择假设为真时,样本观测值没有落入拒绝域可能不是一个小概率事件(尤其是在\(\Theta_1\)和\(\Theta_2\)的边界附近)。
在\(\theta \in \Theta_0\)时,\(g(\theta)\le \alpha\)的检验被称为水平为\(\alpha\)的检验,记为\((\alpha,\Theta_0,\Theta_1)\)检验。其中,\(\alpha\)是事先选定的。由于\(\alpha\)的大小反映了检验犯第一类错误的概率的大小,所以常常选取一个较小的数,或者是依赖于假设的先验信息。
检验函数
设\(\phi(x)\)为定义在\(\mathscr{X}\)上的可测函数,满足条件\(0\le \phi(x) \le 1\),则称\(\phi(x)\)为检验函数,简称检验。在\(\phi(x)\)仅取0和1两个值时,被称为非随机化检验,反之则为随机化检验。其势函数为\(g(\theta)=E_\theta(\phi(X))\)。
充分性原则
设\(\phi_1(x)\)和\(\phi_2(x)\)都是某个检验问题\((H_0,H_1)\)的检验函数,如果它们的势函数相同,即\(E_\theta[\phi_1(X)]=E_\theta[\phi_2(X)],\theta\in \Theta\),则称检验函数\(\phi_1(x)\)和\(\phi_2(x)\)等价。也就是说,检验函数的统计性质完全取决于其势函数,势函数相同就认为两个检验函数等价。
设\(X=(X_1,\dots,X_n)\)是来自于分布族\(\mathscr{P}=\{P_\theta;\theta\in \Theta\}\)的样本,\(T(X)\)是关于\(\theta\)的充分统计量,则对于任意一个检验函数\(\phi(x)\),存在另一个只依赖于\(T(X)\)的检验函数,它与\(\phi(x)\)相互等价。(证明:条件期望\(\varphi(t)=E[\phi(X)|T=t]\)与\(\theta\)无关,且\(E_\theta[\varphi(T(X))]=E_\theta[E[\phi(X)|T]]=E_\theta(\phi(X))\),故\(\varphi(t)\)和\(\phi(x)\)具有相同的势函数,二者相互等价)。
也就是说,当\(\theta\)的充分统计量存在时,关于\(\theta\)的任何假设检验问题,都可以在充分统计量构成的检验函数中去寻找,这就是假设检验中的充分性原则。
简单假设
最优势检验
在检验问题\((\Theta_0,\Theta_1)\)中,设\(\phi(x)\)为水平为\(\alpha\)的检验,如果对任意一个水平为\(\alpha\)的检验\(\phi_1(x)\),都有\(E_{\theta_1}[\phi(X)]\ge E_{\theta_1}[\phi_1(X)]\)成立,则称检验\(\phi(x)\)是水平为\(\alpha\)的最优势检验(Most Powerful Test, MPT)。
N-P基本引理
设\(P_{\theta_0}\)和\(P_{\theta_1}\)是可测空间\((\mathscr{X},\mathscr{B})\)上两个不同的概率测度,关于某个\(\sigma\)有限的测度\(\mu\),有\(p(x;\theta_0)=\frac{dP_{\theta_0}}{d\mu}\)和\(p(x;\theta_1)=\frac{dP_{\theta_1}}{d\mu}\),则在简单原假设\(H_0:\theta=\theta_0\)对简单备择假设\(H_1:\theta=\theta_1\)的检验问题中,满足:
对于给定的\(\alpha(0<\alpha<1)\),存在一个检验函数\(\phi(x)\)及常数\(k\ge 0\),使得: \[ E_{\theta_0}[\phi(X)]=\alpha\\ \phi(x)= \begin{cases} 1, ~p(x;\theta_1)>k\cdot p(x;\theta_0) \\ 0, ~p(x;\theta_1)<k\cdot p(x;\theta_0) \\ \end{cases} \] 满足这一条件的检验函数\(\phi(x)\)通常被称为似然比检验函数,在集合\(\{x:p(x;\theta_0)>0~\text{or}~p(x;\theta_1)>0\}\)上,似然比检验函数的定义如下: \[ \lambda(x)=\frac{p(x;\theta_1)}{p(x;\theta_0)} \] 在\(\lambda(x)\)的值比较大时,\(p(x;\theta_1)\)的值比较大,此时原假设\(H_0\)为真时观察到样本点\(x\)的可能性比备择假设\(H_1\)为真时观察到样本点\(x\)的可能性小。而当\(\lambda(x)\)的值比较小则反之。因此,当\(\lambda(x)\)的值较大时,拒绝原假设;而当\(\lambda(x)\)较小的时候,接受原假设。
由上式确定的检验函数\(\phi(x)\)是水平为\(\alpha\)的MPT。反之,如果\(\phi(x)\)是水平为\(\alpha\)的MPT,则一定存在常数\(k\ge 0\)满足上式。
证明:
首先证明1,对于任一实数\(\lambda\),令 \[ G(\lambda)=P_{\theta_0}\{p(X;\theta_1)>\lambda\cdot p(X;\theta_0)\} \] 这个概率是在\(P_{\theta_0}\)下计算的,也就是在集合\(\{x:p(x;\theta_0)\}\)上(即参数为\(\theta_0\)时,随机变量\(X\)所有可能取值的集合)考虑不等式\(p(X;\theta_1)>\lambda\cdot p(X;\theta_0)\)。
\(G(\lambda)\)是非负随机变量\(\frac{p(X;\theta_1)}{p(X;\theta_0)}>\lambda\)的概率,也就是说\(1-G(\lambda)\)是随机变量\(\frac{p(X;\theta_1)}{p(X;\theta_0)}\)的分布函数。因此,\(G(\lambda)\)是一个非增、右连续的函数,且 \[ \begin{aligned} &G(+\infty)=0 \\ &G(0-0)=1 \\ &G(\lambda-0)-G(\lambda)=P_{\theta_0}\{p(X;\theta_1)=\lambda\cdot p(X;\theta_0)\} \end{aligned} \] 当给定\(\alpha \in (0,1)\)之后,有且仅有下面两种情况:
存在\(\lambda_0\ge 0\),使得\(G(\lambda_0)=\alpha\)(这通常对应于连续的情况)。定义 \[ \phi(x)= \begin{cases} 1, ~~p(x;\theta_1)>\lambda_0\cdot p(x;\theta_0) \\ 0, ~~p(x;\theta_1)\le \lambda_0\cdot p(x;\theta_0) \\ \end{cases} \] 则有\(E_{\theta_0}\phi(X)=P_{\theta_0}\{p(X;\theta_1)>\lambda\cdot p(X;\theta_0)\}=G(\lambda_0)=\alpha\)。
存在\(\lambda_0\ge 0\),使得\(G(\lambda_0)<\alpha\le G(\lambda_0-0)\)(这通常对应于离散的情况)。定义 \[ \phi(x)= \begin{cases} \begin{aligned} 1, ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~&p(x;\theta_1)>\lambda_0\cdot p(x;\theta_0) \\ \frac{\alpha-G(\lambda_0)}{G(\lambda_0-0)-G(\lambda_0)}, ~&p(x;\theta_1)=\lambda_0\cdot p(x;\theta_0) \\ 0, ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~&p(x;\theta_1)< \lambda_0\cdot p(x;\theta_0) \\ \end{aligned} \end{cases} \] 此时 \[ \begin{aligned} E_{\theta_0}\phi(x)=&P_{\theta_0}\{p(x;\theta_1)>\lambda_0\cdot p(x;\theta_0)\}+\frac{\alpha-G(\lambda_0)}{G(\lambda_0-0)-G(\lambda_0)}\cdot P_{\theta_0}\{p(x;\theta_1)=\lambda_0\cdot p(x;\theta_0)\} \\ =&G(\lambda_0)+[\alpha-G(\lambda_0)] \\ =& \alpha \end{aligned} \]
在这两种情况下,\(\lambda_0\)就可以取做非负常数\(k\),此时的\(\phi(x)\)是水平为\(\alpha\)的检验函数。
然后证明上述得到的检验函数\(\phi(x)\)为MPT。
设\(\phi^*(x)\)为其它任意一个水平为\(\alpha\)的检验函数,即\(E_{\theta_0}\phi^*(x)\le \alpha\)。根据\(\phi(x)\)的定义,有 \[ [\phi(x)-\phi^*(x)]\cdot [p(x;\theta_1)-k\cdot p(x;\theta_0)]\ge 0 \] (这是因为,当\(p(x;\theta_1)-k\cdot p(x;\theta_0)>0\)时,\(\phi(x)=1\),此时无论\(\phi^*(x)\)取何值,都有\(\phi(x)-\phi^*(x)\ge 0\)成立;而当\(p(x;\theta_1)-k\cdot p(x;\theta_0)\le 0\)时,\(\phi(x)=0\),此时总有\(\phi(x)-\phi^*(x)\le 0\)。因此在这两个区间内都有上式成立。)
因此, \[ \int [\phi(x)-\phi^*(x)]\cdot [p(x;\theta_1)-k\cdot p(x;\theta_0)] d\mu(x)\ge 0 \] 从而可得: \[ \begin{aligned} E_{\theta_1}\phi(X)-E_{\theta_1}\phi^*(X)\ge& k\cdot [E_{\theta_0}\phi(X)-E_{\theta_0}\phi^*(X)]\\ =& k\cdot [\alpha-E_{\theta_0}\phi^*(X)] \\ \ge& 0 \end{aligned} \]
最后证明,如果\(\phi^*(x)\)是水平为\(\alpha\)的MPT,则一定存在非负常数\(k\),使得\(\phi^*(x)\)满足 \[ \phi^*(x)= \begin{cases} 1, ~p(x;\theta_1)>k\cdot p(x;\theta_0) \\ 0, ~p(x;\theta_1)<k\cdot p(x;\theta_0) \\ \end{cases} \] 由于\(\phi^*(x)\)是水平为\(\alpha\)的MPT,故\(E_{\theta_1}\phi(X)=E_{\theta_1}\phi^*(X)\),此外还有\(E_{\theta_0}\phi^*(X)\le \alpha=E_{\theta_0}\phi(X)\),故有 \[ \begin{aligned} &\int [\phi(x)-\phi^*(x)]\cdot [p(x;\theta_1)-k\cdot p(x;\theta_0)] d\mu(x) \\ =& E_{\theta_1}\phi(X)-E_{\theta_1}\phi^*(X)-k\cdot [E_{\theta_0}\phi(X)-E_{\theta_0}\phi^*(X)] \\ \le & 0 \end{aligned} \] 结合上面的结论,可得 \[ [\phi(x)-\phi^*(x)]\cdot [p(x;\theta_1)-k\cdot p(x;\theta_0)]=0,~a.s. \] 因此在集合\(\{p(x;\theta_1)-k\cdot p(x;\theta_0)\ne 0\}\)上,有\(\phi(x)=\phi^*(x),~a.s.\)成立。从而证明完毕。
当似然比函数\(\lambda(x)\)为连续分布时,MPT检验函数可取为非随机化的形式: \[ \phi(x)= \begin{cases} 1,~\lambda(x)\ge k \\ 0,~\lambda(x)<k \end{cases} \] 其中\(k\)由\(E_{\theta_0}[\phi(X)]=P_{\theta_0}(\lambda(x)\ge k)=\alpha\)确定。在\(\lambda(x)\)为离散随机变量时,至多在集合\(\{x:\lambda(x)=k\}\)上实施随机化,MPT检验函数可取为: \[ \phi(x)= \begin{cases} 1,~\lambda(x)> k \\ r,~\lambda(x)= k\\ 0,~\lambda(x)<k \end{cases} \] 根据充分性原则,MPT检验函数及似然比检验函数也可以用充分统计量进行表示。
例1:设\(X=(X_1,\dots,X_n)\)是来自于正态分布族\(\{N(\mu,1):-\infty<\mu<\infty\}\)的样本,考虑检验问题:原假设\(H_0:\mu=0\)对备择假设\(\mu=\mu_1(\mu_1>0)\),取水平为\(\alpha(0<\alpha<1)\),可构造似然比统计量: \[ \lambda(x)=\frac{\prod_{i=1}^{n}p(x_i;\mu_1)}{\prod_{i=1}^{n}p(x_i;0)}=\exp \left\{n\mu_1\bar{x}- \frac{1}{2}n\mu_1^2\right\} \] 由于\(\mu_1>0\),故\(\lambda(x)\)是关于\(\bar{x}\)的增函数,因此,MPT的拒绝域具有形式: \[ W=\{x:\lambda(x)\ge k\}=\{x:\bar{x}\ge c\} \] 当假设\(H_0\)成立时,\(\bar{x}\sim N(0,\frac{1}{n})\),因此对于给定的水平\(\alpha\),\(c=\frac{U_{1-\alpha}}{\sqrt{n}}\)。也就是说,检验的拒绝域为\(W=\{x:\bar{x}\ge \frac{U_{1-\alpha}}{\sqrt{n}} \}\)。
例2:设\(X=(X_1,\dots,X_n)\)是来自于泊松分布族\(\{P(\lambda):\lambda>0\}\)的样本,考虑检验问题:原假设\(H_0:\lambda=1\)对备择假设\(H_1:\lambda=\lambda_1(\lambda_1>1)\),取水平为\(\alpha(0<\alpha<1)\),可构造似然比统计量: \[ \lambda(x)=\frac{\prod_{i=1}^{n}p(x_i;\lambda_1)}{\prod_{i=1}^{n}p(x_i;1)}=(\lambda_1)^{\sum x_i}\cdot \exp \{-n(\lambda_1-1)\} \] 由于\(\lambda_1>1\),因此\(\lambda(x)\)是\(T=\sum x_i\)的严格单增函数。根据N-P基本引理,水平为\(\alpha\)的MPT检验函数满足条件: \[ \phi(x)= \begin{cases} 1, ~T>k \\ r, ~T=k \\ 0, ~T<k \\ \end{cases} \] 根据泊松分布的可加性,当假设\(H_0\)成立时,\(T\sim P(n)\),根据\(E_0(\phi(x))=\alpha\)即可求得\(k\)的值。
关于MPT,有如下性质成立:
设\(\phi(x)\)是水平为\(\alpha\)的最优势检验函数,则\(E_{\theta_1}\phi(X)\ge \alpha\)。又设\(0<\alpha<1\),则除了\(p(x;\theta_1)=p(x;\theta_0)~a.e.[\mu]\)外,必有\(E_{\theta_1}(\phi(X))>\alpha\)。
复合假设
一致最优势检验
定义
设\((\mathscr{X},\mathscr{B},\mathscr{P}=\{P_\theta:\theta\in \Theta\})\)是一个参数统计结构,考虑检验问题\((\Theta_0,\Theta_1)\)。设\(\phi(x)\)是水平为\(\alpha\)的检验,如果对任意一个水平为\(\alpha\)的检验\(\phi_1(x)\),都有\(E_\theta[\phi(X)]\ge E_\theta[\phi_1(X)],\forall \theta\in \Theta_1\),则称检验\(\phi(x)\)是水平为\(\alpha\)的一致最优势检验(Uniformly Most Powerful Test,UMPT)。(MPT和UMPT的区别在于,MPT只是对特定参数\(\theta_1\in \Theta_1\)而言,而UMPT则要求对于任意的\(\theta\in \Theta_1\)都要成立)
在一些特殊情况下,UMPT可以从N-P基本引理推导出来,但是需要使用到下面的结论:
- 设\(\phi(x)\)是\((\alpha,\Theta_0,\Theta_1)\)检验,\(\Theta_{01}\)是\(\Theta_0\)的子集,如果\(\phi(x)\)是\((\alpha,\Theta_{01},\Theta_1)\)的UMPT,则\(\phi(x)\)是\((\alpha,\Theta_0,\Theta_1)\)的UMPT。
- 设\(\phi(x)\)是\((\alpha,\Theta_0,\Theta_1)\)检验,则\(\phi(x)\)是\((\alpha,\Theta_{0},\Theta_1)\)的UMPT的充要条件是,对于每一个\(\theta_1\in \Theta_1\),\(\phi(x)\)是\((\alpha,\Theta_0,\{\theta_1\})\)的MPT。
- 设\(\phi(x)\)是\((\alpha,\Theta_0,\Theta_1)\)检验,假如对某个\(\theta_0\in \Theta_0\)和对每一个\(\theta_1\in \Theta_1\),\(\phi(x)\)都是\((\alpha,\{\theta_0\},\{\theta_1\})\)的MPT,则\(\phi(x)\)是\((\alpha,\Theta_0,\Theta_1)\)的UMPT。
对于上文中的两个例子,可以看到它们的备择假设并不依赖于备择假设的具体数值,因此可以适当扩大备择假设的范围。此外,如果势函数\(\phi(x)\)确定,那么此时的势函数\(g(\theta)=E_\theta(\phi(X))\)也是关于\(\theta\)的单调函数,因此也可以适当地扩大原假设。通过这样,便可由MPT获得UMPT,从而扩大了N-P引理的使用范围。
单边假设检验
对于如下的两个单边假设检验问题:
- 原假设\(H_0:\theta\le \theta_0\)对备择假设\(H_1:\theta>\theta_0\)
- 原假设\(H_0:\theta\ge \theta_0\)对备择假设\(H_1:\theta<\theta_0\)
它们的UMPT存在。为了寻求它们的UMPT,首先引入单调似然比的概念:
设\(\{p(x;\theta):\theta\in \Theta\}\)是含有实参数\(\theta\)的概率密度族,其中\(\Theta\)是实直线上的一个区间。如果存在实值统计量\(T(X)\),使得对于任意的\(\theta_1<\theta_2\),都有:
- 概率分布\(P_{\theta_1}\)和\(P_{\theta_2}\)不同
- 似然比\(\lambda(x)=\frac{p(x;\theta_2)}{p(x;\theta_1)}\)是\(T(x)\)的非降函数(或者非增函数),则称概率密度族\(\{p(x;\theta):\theta\in \Theta\}\)关于\(T(X)\)具有非降(或者非增)单调似然比(Monotone Likelihood Ratio,MLR)。
对于单参数指数型分布族 \[ p(x;\theta)=c(\theta)\cdot \exp\{Q(\theta)T(x)\}\cdot h(x), ~c(\theta)> 0 \] 假设\(Q(\theta)\)是\(\theta\)的严增(或者严减)函数,则在\(\theta_1<\theta_2\)时,其似然比便相应地也是充分统计量\(T(x)\)的严增(严减)函数。因此,它关于\(T(x)\)具有非降(非增)MLR。而对于其它情况,则需要通过似然比函数来判断。
设概率密度族\(\{p(x;\theta):\theta\in \Theta\}\)关于\(T(X)\)有非降的MLR,如果\(\psi(t)\)是\(t\)的一个非降函数,那么\(E_\theta \psi(T(X))\)是\(\theta\)的非降函数;相应地,如果\(\psi(t)\)是\(t\)的一个非增函数,那么\(E_\theta \psi(T(X))\)是\(\theta\)的非增函数。当概率密度族关于\(T(X)\)有非增的MLR时,如果\(\psi(t)\)是\(t\)的一个非降函数,那么\(E_\theta \psi(T(X))\)是\(\theta\)的非增函数;如果\(\psi(t)\)是\(t\)的一个非增函数,那么\(E_\theta \psi(T(X))\)是\(\theta\)的非降函数。
证明:
以非降MLR,以及\(\psi(t)\)为非降函数来证明。其余的证明方法类似。
设\(\theta_1<\theta_2\),令\(A=\{x:p(x;\theta_1)<p(x;\theta_2)\}\),\(B=\{x:p(x;\theta_1)>p(x;\theta_2)\}\)。对于任意的\(x_1\in A\)和\(x_2\in B\),有: \[ \lambda(x_1)=\frac{p(x_1;\theta_2)}{p(x_1;\theta_1)}>1,~~\lambda(x_2)=\frac{p(x_2;\theta_2)}{p(x_2;\theta_1)}<1 \] 因为似然比\(\lambda(x)\)是\(T(x)\)的非降函数,则由\(\lambda(x_1)>\lambda(x_2)\)可以推导出\(T(x_1)\ge T(x_2)\)。又因为\(\psi(t)\)为\(t\)的非降函数,因此\(\psi(T(x_1))\ge \psi(T(x_2))\)。令 \[ a=\inf\{\psi(T(x)):x\in A\},~~b=\sup\{\psi(T(x)):x\in B\} \] 则有\(a\ge b\)。从而有: \[ \begin{aligned} E_{\theta_2}\psi(T(X))-E_{\theta_1}\psi(T(X))=&\int \psi(T(x))\cdot [p(x;\theta_2)-p(x;\theta_1)]d\mu(x) \\ \ge& a\cdot \int_{A}[p(x;\theta_2)-p(x;\theta_1)]d\mu(x)+b\cdot \int_{A}[p(x;\theta_2)-p(x;\theta_1)]d\mu(x) \\ \end{aligned} \] 由于 \[ \int_{A\cup B} [p(x;\theta_2)-p(x;\theta_1)]d\mu(x)=0 \] 因此有: \[ \int_{A}[p(x;\theta_2)-p(x;\theta_1)]d\mu(x)=-\int_{B}[p(x;\theta_2)-p(x;\theta_1)]d\mu(x) \] 从而 \[ \begin{aligned} E_{\theta_2}\psi(T(X))-E_{\theta_1}\psi(T(X)) \ge& (a-b)\cdot \int_{A}[p(x;\theta_2)-p(x;\theta_1)]d\mu(x) \ge 0 \end{aligned} \] 由此完成证明。
根据单调似然比的定义,假设概率密度族\(\{p(x;\theta):\theta\in \Theta\}\)关于\(T(X)\)有非降的MLR,则对于上述的单边假设检验问题1,有如下结论:
存在水平为\(\alpha\)的UMPT检验函数 \[ \phi(T(X))= \begin{cases} 1,~T(x)>c\\ r,~T(x)=c\\ 0,~T(x)<c \end{cases} \] 其中常数\(r(0\le r\le 1)\)和\(c\)由\(E_{\theta_0}\phi(T(X))=\alpha\)确定。
这个检验的势函数\(g(\theta)=E_\theta \phi(T(X))\)是非降的,且在集合\(\{\theta:0<g(\theta)<1\}\)上是严格增加的。
在一切使得\(E_{\theta_0}\phi(T(X))=\alpha\)的检验函数中,由上述确定的检验函数\(\phi(T(X))\),能够使得对于任意的\(\theta<\theta_0\),\(E_\theta\phi(X)\)都达到最小。
证明:
- 考虑简单原假设\(\theta=\theta_0\)对简单备择假设\(\theta=\theta_1(\theta_1>\theta_0)\)的检验问题。由N-P基本引理可知,当似然比统计量\(\lambda=\frac{p(x;\theta_1)}{p(x;\theta_0)}\)比较大的时候拒绝原假设。
由于\(\lambda\)是\(T(x)\)的非降函数,也就是说在\(T(x)\)比较大的时候拒绝原假设。因此根据N-P引理,可以构造形如上述\(\phi(T(X))\)的检验函数,它是简单原假设\(\theta=\theta_0\)对简单备择假设\(\theta=\theta_1(\theta_1>\theta_0)\)的检验问题的MPT。由于只需要满足\(\theta_1>\theta_0\),因此上述的\(\phi(T(X))\)也是原假设\(\theta=\theta_0\)对\(\theta>\theta_0\)的检验问题的水平为\(\alpha\)的UMPT。
此外,由于\(\phi(T(X))\)是关于\(T(X)\)的非降函数,因此势函数\(g(\theta)=E\phi(T(X))\)是\(T(X)\)的非降函数,因此在\(\theta\le \theta_0\)时有\(E_\theta \phi(T(X))\le E_{\theta_0}\phi(T(X))=\alpha\)。因此对于原假设\(\theta\le \theta_0\),\(\phi(T(X))\)是水平为\(\alpha\)的检验。
综上,上述的检验函数\(\phi(T(X))\)是单边假设检验问题\(H_0:\theta\le \theta_0\)对\(H_1:\theta>\theta_0\)的UMPT。
上面已经证明了势函数\(g(\theta)\)非降,接下来证明它在集合\(\{\theta:0<g(\theta)<1\}\)上严格增加。由N-P基本引理可知,\(\phi(T(X))\)也是\(H_0:\theta=\theta_1\)对\(H_1:\theta=\theta_2(\theta_2>\theta_1)\)的水平为\(\alpha_1=E_{\theta_1}\phi(T(X))\)的MPT。则在\(0<\alpha_1<1\)时,有\(E_{\theta_2}\phi(T(X))>\alpha_1\)。因此在集合\(\{\theta:0<g(\theta)<1\}\)上,\(g(\theta)\)的值严格增加。
考虑简单原假设\(H_0:\theta=\theta_0\)对简单备择假设\(H_1:\theta=\theta_2(\theta_2<\theta_0)\)的水平为\(\alpha^*=1-\alpha\)的检验问题。由N-P基本引理可知,在似然比统计量\[\lambda=\frac{p(x;\theta_2)}{p(x;\theta_0)}\]比较大的时候拒绝原假设。由于\(\theta_2<\theta_0\),因此\(\lambda\)为\(T(X)\)的非增函数,也就是说在\(T(X)\)较小的时候拒绝原假设。
用类似于上述1的证明方法可得,\(\phi^*(T(X))=1-\phi(T(X))\)为上述假设问题水平为\(\alpha^*\)的MPT。因此\(\phi^*(T(X))\)是在\(E_{\theta_0}\phi(T(X))\le \alpha^*\)的条件下,使得\(E_{\theta_2}\phi(T(X))\)达到最小。由于\(\theta_2\)是小于\(\theta_0\)的任意数,因此对于任意的\(\theta<\theta_0\),\(\phi(T(X))\)是在\(E_{\theta_0}\phi(T(X))\ge \alpha\)的条件下,使得\(E_{\theta}\phi(X)\)达到最小的检验法。
而对于单边假设检验问题2,需要将\(\phi(T(X))\)中的不等号反向,此时的势函数变为非增。如果概率密度族关于\(T(X)\)是非增的MLR,则需要将\(T(X)\)换成\(-T(X)\)。在上述问题中,如果原假设只取等号,则相同的结论也仍然成立。
例:设有\(N\)件产品,其中含\(m\)件不合格品。从中不放回地随机抽取\(n\)件进行检验。设\(n\)件中含有\(x\)件不合格品,则\(x\)服从超几何分布 \[ p(x;m)=\frac{\binom{m}{x}\cdot \binom{N-m}{n-x}}{\binom{N}{n}} \]
这一概率密度分布族不是单参数指数型指数分布族。由于 \[ \frac{p(x;m+1)}{p(x;m)}=\frac{(m+1)(N-m-n+x)}{(N-m)(m+1-x)} \] 是关于\(x\)的严增函数,因此这一概率密度族关于\(T(x)=x\)具有非降MLR。
考虑假设检验问题\(H_0:0\le m\le m_0\)对\(H_1:m_0< m\le N\)。这一检验问题存在水平为\(\alpha\)的UMPT,其检验函数为: \[ \phi(x)= \begin{cases} 1,~x>m\\ r,~x=m\\ 0,~x<m\\ \end{cases} \] 其中\(m\)和\(r\)的值由\(E_{m_0}(\phi(x))=\alpha\)确定。
一致最优势无偏检验
定义
设\(\phi(x)\)是原假设\(H_0:\theta\in \Theta_0\)对备择假设\(H_1:\theta\in \Theta_1\)的检验函数,如果其势函数\(g(\theta)=E_\theta \phi(X)\)满足如下条件: \[ g(\theta) \le \alpha,~\forall \theta\in \Theta_0 \\ g(\theta) \ge \alpha,~\forall \theta\in \Theta_1 \] 则称\(\phi(x)\)为水平为\(\alpha\)的无偏检验。显然,水平为\(\alpha\)的UMPT也一定是水平为\(\alpha\)的无偏检验。此处的无偏可以理解成一种约束条件,对于一些假设问题,它的UMPT不存在,此处的不存在是相对于所有的检验函数而言的。而如果在加上了无偏这一条件之后,在所有的无偏检验中便可以找到一个最优的检验函数。
在检验问题\((\Theta_0,\Theta_1)\)中,如果存在一个水平为\(\alpha\)的无偏检验\(\phi(x)\),对于任何水平为\(\alpha\)的无偏检验\(\phi_1(x)\),均满足下列条件: \[ E_\theta[\phi(X)]\ge E_\theta[\phi_1(X)],~\theta\in\Theta_1 \] 则称检验\(\phi(x)\)是水平为\(\alpha\)的一致最优势无偏检验(Uniformly Most Powerful Unbiased Test,UMPUT)。
一般情况下,通过构造边界相似检验比构造无偏检验更加方便。边界相似检验指的是:如果无偏检验\(\phi(x)\)的势函数\(E_\theta \phi(X)\)是\(\theta\)的连续函数,则一定有\(E_\theta \phi(X)=\alpha,~\theta\in \Gamma\),其中\(\Gamma\)是\(\Theta_0\)和\(\Theta_1\)的公共边界。因此,可以用下面的引理来构造UMPUT:
考虑原假设\(H_0:\theta\in \Theta_0\)对备择假设\(H_1:\theta\in \Theta_1\)的检验问题。设每一个检验函数的势函数都是\(\theta\)的连续函数,如果\(\phi(x)\)是水平为\(\alpha\)的检验函数,则在\(\phi(x)\)是所有边界相似检验函数类中的UMPT时,\(\phi(x)\)是水平为\(\alpha\)的UMPUT。
双边假设检验
对于单参数指数型分布族,双边假设检验问题:原假设\(H_0:\theta\le \theta_1~\text{or}~\theta\ge \theta_2\)对备择假设\(H_1:\theta_1<\theta<\theta_2\),它存在UMPT。为了求解它的UMPT,首先需要对N-P基本引理进行推广(这一推广说明了上述双边假设检验问题UMPT的存在性):
设\(\mu\)为可测空间\((\mathscr{X},\mathscr{B})\)上的测度,\(p_0(x),p_1(x),\dots,p_m(x)\)为\((\mathscr{X},\mathscr{B})\)上\(m+1\)个实可测且\(\mu\)可积函数。\(\alpha_1,\dots,\alpha_m\)为给定的\(m\)个实常数,如果存在检验函数\(\phi(x)\)满足如下两个条件:
如果有\(m\)个非负常数\(k_1,\dots,k_m\),使得: \[ \phi(x)= \begin{cases} 1,~p_0(x)>\sum_{i=1}^m k_i\cdot p_i(x) \\ 0,~p_0(x)<\sum_{i=1}^m k_i\cdot p_i(x) \\ \end{cases} \]
\(\int \phi(x)\cdot p_i(x)d\mu(x)=\alpha_i~,i=1,\dots,m\)
则对任一满足下式的检验函数\(\phi^*(x)\) \[ \int \phi^*(x)\cdot p_i(x)d\mu(x)\le \alpha_i~,i=1,\dots,m \] 都有 \[ \int \phi(x)\cdot p_0(x)d\mu(x)\ge \int \phi^*(x)\cdot p_0(x)d\mu(x) \] >证明: > >根据上述的假设,显然有下式成立: >\[ >[p_0(x)-\sum_{i=1}^{m}k_i\cdot p_i(x)]\cdot [\phi(x)-\phi^*(x)]\ge 0 >\] >因此 >\[ >\int p_0(x)\cdot [\phi(x)-\phi^*(x)] \ge \sum_{i=1}^{m} \int p_i(x)\cdot [\phi(x)-\phi^*(x)] >\] >从而有 >\[ >\int p_0(x)\cdot \phi(x) d\mu(x) -\int p_0(x)\cdot \phi^*(x)d\mu(x) \ge \sum_{i=1}^{m} [\alpha_i-\int p_i(x)\cdot \phi^*(x)] \ge 0 >\]
而对于求解如下两个双边假设检验问题:
- 原假设\(H_0:\theta=\theta_0\)对备择假设\(H_1:\theta\ne \theta_0\)
- 原假设\(H_0:\theta_1\le\theta\le\theta_2\)对备择假设\(H_1:\theta<\theta_1~\text{or}~\theta>\theta_2\)
则需要对上述N-P引理的推广进行修改,允许常数\(k_1,\dots,k_m\)可以取负值(这一结论说明上述两个双边假设问题存在UMPUT)。对于任意满足下式的检验函数\(\phi^*(x)\) \[ \int \phi^*(x)\cdot p_i(x)d\mu(x)= \alpha_i~,i=1,\dots,m \] 都有 \[ \int \phi(x)\cdot p_0(x)d\mu(x)\ge \int \phi^*(x)\cdot p_0(x)d\mu(x) \] >证明: > >证明方式与上面类似,只不过将最后的大于等于0改为等于0即可。
下面说明上述三种假设检验问题的检验函数构造:
- 原假设\(H_0:\theta\le \theta_1~\text{or}~\theta\ge \theta_2\)对备择假设\(H_1:\theta_1<\theta<\theta_2\)
设样本\(X=(X_1,\dots,X_n)\)服从单参数指数族分布 \[ p(x;\theta)=c(\theta)\cdot \exp\{Q(\theta)T(x)\}\cdot h(x), ~c(\theta)> 0 \] 其中\(\theta\)为实参数,\(Q(\theta)\)是\(\theta\)的严增函数。对于上述的双边假设检验问题,存在水平为\(\alpha(0<\alpha<1)\)的UMPT,其检验函数仅依赖于充分统计量\(T(X)\),形如: \[ \phi(T(x))= \begin{cases} 1,~~c_1<T(x)<c_2 \\ r_i,~T(x)=c_i,i=1,2 \\ 0,~~T(x)<c_1~\text{or}~T(x)>c_2 \end{cases} \] 其中常数\(r_i\)和\(c_i\)由\(E_{\theta_1}\phi(T(X))=E_{\theta_2}\phi(T(X))=\alpha\)确定。
证明:
简单起见,设\(T(X)\)的密度函数为: \[ p(t;\theta)=c(\theta)\cdot \exp\{\theta\cdot t\}\cdot h(t) \] 其中\(c(\theta)>0\)。
先考虑原假设\(H_0:\theta=\theta_1~\text{or}~\theta_2\)对备择假设\(\theta=\theta_3(\theta_1<\theta_3<\theta_2)\)的检验问题。根据N-P引理的推广,取检验函数 \[ \phi(t)= \begin{cases} 1,~p(t;\theta_3)>\sum_{i=1}^2 k_i\cdot p(t;\theta_i) \\ 0,~p(t;\theta_3)<\sum_{i=1}^2 k_i\cdot p(t;\theta_i) \\ \end{cases} \] 并满足条件 \[ \int \phi(t)\cdot p(t;\theta_1)dt=\int \phi(t)\cdot p(t;\theta_2)dt=\alpha \] 将\(T(X)\)的概率密度表达式代入\(\phi(t)\)的表达式,化简之后可得到 \[ \phi(t)= \begin{cases} 1,~a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t}<1 \\ 0,~a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t}>1 \\ \end{cases} \] 其中,\(a_i=\frac{k_i\cdot c(\theta_i)}{c(\theta_3)}\),\(b_i=\theta_i-\theta_3\)。因此有\(b_1<0<b_2\)。
如果\(a_1\)和\(a_2\)都为负,那么势函数恒等于1,不符合水平为\(\alpha\)的检测这一条件;如果一个为正一个为负,则\(a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t}\)严格单调,此时得到的检验函数形如单边假设的情形,无法满足双边假设的条件;因此只剩下二者都为正数的可能,也就是说\(k_1,k_2\)也都为正数,这也满足了N-P引理的条件。
由于\(b_1<0<b_2\),因此容易证明\(a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t}\)的值先减后增,且严格下凹(二阶导数恒大于0)。也就是说,存在两个常数\(c_1,c_2\),使得形如上述\(\phi(T(X))\)的检验函数成立,同时也是检验问题原假设\(H_0:\theta=\theta_1~\text{or}~\theta_2\)对备择假设\(\theta=\theta_3(\theta_1<\theta_3<\theta_2)\)的MPT。由于\(\phi(t)\)与\(\theta_3\)的取值无关,因此它也是原假设\(H_0:\theta=\theta_1~\text{or}~\theta_2\)对备择假设\(\theta_1<\theta<\theta_2\)的UMPT。
下面证明对于原假设\(H_0:\theta\le \theta_1 ~\text{or}~ \theta\ge \theta_2\),\(\phi(t)\)是水平为\(\alpha\)的一个检验。任取\(\theta'<\theta_1\)(另一种情况处理方法类似),考虑原假设\(\theta=\theta_1~\text{or}~\theta=\theta_2\)对备择假设\(\theta=\theta'\)的检验问题。如果存在\(k_1',k_2'\),使得: \[ 1-\phi(t)= \begin{cases} 1,~p(t;\theta')>\sum_{i=1}^2 k_i'\cdot p(t;\theta_i) \\ 0,~p(t;\theta')<\sum_{i=1}^2 k_i'\cdot p(t;\theta_i) \\ \end{cases} \] 由\(E_{\theta_1}[1-\phi(T)]=E_{\theta_2}[1-\phi(T)]=1-\alpha\),根据推广的N-P引理,可得: \[ E_{\theta'}[1-\phi(T)]\ge E_{\theta'}\phi^*(T)=1-\alpha \] 其中\(\phi^*(t)\equiv 1-\alpha\)。从而有\(E_{\theta'}\phi(T)\le \alpha\)成立。这说明,对于原假设\(\theta\le \theta_1~\text{or}~\theta\ge \theta_2\)而言,\(\phi(t)\)是水平为\(\alpha\)的一个检验。也就是说,如果能找到一组\(k_1',k_2'\),即可证明我们所需的结论。
由于 \[ 1-\phi(T(x))= \begin{cases} 0,~~c_1<T(x)<c_2 \\ r_i,~T(x)=c_i,i=1,2 \\ 1,~~T(x)<c_1~\text{or}~T(x)>c_2 \end{cases} \] 这也就是说,\(k_1',k_2'\)应当满足如下条件: \[ p(t;\theta')>\sum_{i=1}^2 k_i'\cdot p(t;\theta_i) \Leftrightarrow t<c_1~\text{or}~t>c_2 \\ p(t;\theta')<\sum_{i=1}^2 k_i'\cdot p(t;\theta_i) \Leftrightarrow c_1<t<c_2 \] 从而可得如下方程组: \[ \begin{cases} p(c_1;\theta')=k_1'\cdot p(c_1;\theta_1)+k_2'\cdot p(c_1;\theta_2) \\ p(c_2;\theta')=k_1'\cdot p(c_2;\theta_1)+k_2'\cdot p(c_2;\theta_2) \end{cases} \] 其中未知参数为\(k_1',k_2'\),从中可以解得 \[ \begin{cases} k_1'=\frac{c(\theta')}{c(\theta_1)}\cdot \frac{\exp\{\theta'\cdot c_1+\theta_2\cdot c_2\}-\exp\{\theta'\cdot c_2+\theta_2\cdot c_1\}}{\exp\{\theta_1\cdot c_1+\theta_2\cdot c_2\}-\exp\{\theta_1\cdot c_2+\theta_2\cdot c_1\}} \\ k_2'=\frac{c(\theta')}{c(\theta_2)}\cdot \frac{\exp\{\theta'\cdot c_2+\theta_1\cdot c_1\}-\exp\{\theta'\cdot c_1+\theta_1\cdot c_2\}}{\exp\{\theta_1\cdot c_1+\theta_2\cdot c_2\}-\exp\{\theta_1\cdot c_2+\theta_2\cdot c_1\}} \end{cases} \] 由于\(\theta'<\theta_1<\theta_2\)和\(c_1<c_2\),从而有: \[ \theta'\cdot c_1+\theta_2\cdot c_2-\theta'\cdot c_2-\theta_2\cdot c_1 >0 \\ \theta'\cdot c_2+\theta_1\cdot c_1-\theta'\cdot c_1-\theta_1\cdot c_2<0 \\ \theta_1\cdot c_1+\theta_2\cdot c_2-\theta_1\cdot c_2-\theta_2\cdot c_1>0 \] 因此有\(k_1'>0\),\(k_2'<0\)。令 \[ y=\frac{k_1'\cdot p(t;\theta_1)+k_2'\cdot p(t;\theta_2)}{p(t;\theta')}=a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t} \] 其中\(a_1=k_1'\cdot \frac{c(\theta_1)}{c(\theta')}>0\),\(a_2=k_2'\cdot \frac{c(\theta_2)}{c(\theta')}<0\),\(b_1=\theta_1-\theta'>0\),\(b_2=\theta_2-\theta'>0\),且\(b_1<b_2\)。
因此,\(y\)的值先增后减,在\(t\rightarrow -\infty\)时趋于0,而在\(t\rightarrow \infty\)时趋于\(-\infty\)。因此可以找到两个常数\(c_1,c_2\),使得\(y=1\),从而满足N-P引理的条件,也就是说存在这样的\(k_1',k_2'\)。
- 原假设\(H_0:\theta_1\le\theta\le\theta_2\)对备择假设\(H_1:\theta<\theta_1~\text{or}~\theta>\theta_2\)
设样本\(X=(X_1,\dots,X_n)\)服从单参数指数族分布 \[ p(x;\theta)=c(\theta)\cdot \exp\{Q(\theta)T(x)\}\cdot h(x), ~c(\theta)> 0 \] 其中\(\theta\)为实参数,\(Q(\theta)\)是\(\theta\)的严增函数。对于上述的双边假设检验问题,存在水平为\(\alpha(0<\alpha<1)\)的UMPUT,其检验函数为: \[ \phi(T(x))= \begin{cases} 1,~~T(x)<c_1~\text{or}~T(x)>c_2 \\ r_i,~T(x)=c_i,i=1,2\\ 0,~~c_1<T(x)<c_2 \end{cases} \] 其中常数\(r_i\)和\(c_i\)由\(E_{\theta_1}\phi(T(X))=E_{\theta_2}\phi(T(X))=\alpha\)确定。
证明:
类似地,设\(T(X)\)的分布密度函数为: \[ p(t;\theta)=c(\theta)\cdot \exp\{\theta \cdot t\}\cdot h(t) \] 先考虑原假设\(\theta=\theta_1~\text{or}~\theta_2\)对备择假设\(\theta=\theta_3(\theta_3<\theta_1<\theta_2)\),如果\(\theta_1<\theta_2<\theta_3\)的处理方法类似。
取检验函数 \[ \phi(t)= \begin{cases} 1,~p(t;\theta_3)>\sum_{i=1}^{2} k_i \cdot p(t;\theta_i) \\ 0,~p(t;\theta_3)<\sum_{i=1}^{2} k_i \cdot p(t;\theta_i) \end{cases} \] 化简后可得 \[ \phi(t)= \begin{cases} 1,~a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t}<1 \\ 0,~a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t}>1 \end{cases} \] 其中\(a_i=\frac{k_i\cdot c(\theta_i)}{c(\theta_3)}\),\(b_i=\theta_i-\theta_3\),故\(0<b_1<b_2\)。
如果\(a_1,a_2\)都为负,则检验总是拒绝的;如果二者都为非负,且至少一个大于0,则\(a_1\cdot e^{b_1 t}+a_2\cdot e^{b_2 t}\)严格单调,其势函数为单调函数,不可能满足\(E_{\theta_1}\phi(T(X))=E_{\theta_2}\phi(T(X))=\alpha\);如果\(a_1<0,a_2>0\),则在\(t\)轴上方函数单调递增,所得到的势函数为单调函数。因此,只可能有\(a_1>0,a_2<0\)这一种情况,此时\(k_1>0,k_2<0\),也就是说该检验只能寻找到UMPUT。此时便可以找到两个常数\(c_1,c_2\)来构造检验函数\(\phi(t)\),它是检验问题原假设\(\theta_1\le \theta \le \theta_2\)对备择假设\(\theta<\theta_1~\text{or}~\theta>\theta_2\)的一致最优势边界相似的检验。
接下来,使用与假设检验问题5类似的方法,可以证明对于原假设\(\theta_1\le \theta \le \theta_2\)而言,\(\phi(t)\)是水平为\(\alpha\)的一个检验。从而完成证明。
- 原假设\(H_0:\theta=\theta_0\)对备择假设\(H_1:\theta\ne \theta_0\)
设样本\(X=(X_1,\dots,X_n)\)服从单参数指数族分布 \[ p(x;\theta)=c(\theta)\cdot \exp\{Q(\theta)T(x)\}\cdot h(x), ~c(\theta)> 0 \] 其中\(\theta\)为实参数,\(Q(\theta)\)是\(\theta\)的严增函数。对于上述的双边假设检验问题,存在水平为\(\alpha(0<\alpha<1)\)的UMPUT,其检验函数为: \[ \phi(T(x))= \begin{cases} 1,~~T(x)<c_1~\text{or}~T(x)>c_2 \\ r_i,~T(x)=c_i,i=1,2\\ 0,~~c_1<T(x)<c_2 \end{cases} \] 其中常数\(r_i\)和\(c_i\)由\(E_{\theta_0}\phi(T(X))=\alpha\)和\(E_{\theta_0}[T(X)\cdot \phi(T(X))]=\alpha\cdot E_{\theta_0}T(X)\)(这一条件是由势函数\(g(\theta)\)在\(\theta_0\)处达到最小值而得)确定。
证明:
类似地,设\(T(X)\)的分布密度函数为: \[ p(t;\theta)=c(\theta)\cdot \exp\{\theta \cdot t\}\cdot h(t) \] 首先证明原假设\(\theta=\theta_0\)对备择假设\(\theta\ne \theta_0\)的任意一个无偏检验\(\phi(t)\)必然满足 \[ \begin{aligned} &E_{\theta_0}\phi(T(X))=\alpha \\ &E_{\theta_0}[T(X)\cdot \phi(T(X))]=\alpha \cdot E_{\theta_0}[T(X)] \end{aligned} \] 根据检验函数的无偏性可知,其势函数\(g(\theta)=E_{\theta}\phi(T)\)必然在\(\theta=\theta_0\)处取得最小值\(\alpha\),也就是说: \[ \begin{aligned} g(\theta)=\alpha ~&\rightarrow~ E_{\theta_0}\phi(T(X))=\alpha \\ g'(\theta)=0 ~&\rightarrow ~-E_{\theta}[T]\cdot E_{\theta}[\phi(T)]+E_{\theta}[\phi(T)\cdot T]=0 \end{aligned} \] 其中, \[ \begin{aligned} g(\theta)&=E_{\theta}\phi(T)=\int \phi(t)\cdot c(\theta)\cdot \exp\{\theta\cdot t\}\cdot h(t) d\mu(t) \\ g'(\theta)&=\int \phi(t)\cdot c'(\theta)\cdot \exp\{\theta\cdot t\}\cdot h(t) d\mu(t)+\int \phi(t)\cdot c(\theta)\cdot t \cdot \exp\{\theta\cdot t\}\cdot h(t) d\mu(t) \\ &=\frac{c'(\theta)}{c(\theta)}\cdot E_{\theta}[\phi(T)]+E_{\theta}[T\cdot \phi(T)] \end{aligned} \] 上式中\(\frac{c'(\theta)}{c(\theta)}=-E_{\theta}[T]\),证明如下:
对密度函数取对数,有 \[ \ln p(t;\theta)=\ln c(\theta)+\theta\cdot t+\ln h(t) \] 对参数\(\theta\)求导可得 \[ \frac{\partial \ln p(t;\theta)}{\partial \theta}=\frac{c'(\theta)}{c(\theta)}+t \] 两侧对\(t\)求期望可得 \[ E\left[\frac{\partial \ln p(t;\theta)}{\partial \theta}\right]=\frac{c'(\theta)}{c(\theta)}+E_{\theta}[T] \] 由于\(T\)的密度函数属于指数分布族,它属于C-R正则族,故等号左侧等于0。从而得证。
接下来考虑原假设\(H_0:\theta=\theta_0\)对备择假设\(H_1:\theta=\theta_1,(\theta_1\ne \theta_0)\)的检验问题,并要求势函数满足上述两个约束条件。
取检验函数 \[ \phi(t)= \begin{cases} 1,~p(t;\theta_1)> k_1 \cdot p(t;\theta_0)+k_2\cdot t\cdot p(t;\theta_0) \\ 0,~p(t;\theta_1)< k_1 \cdot p(t;\theta_0)+k_2\cdot t\cdot p(t;\theta_0) \end{cases} \] 化简后可得 \[ \phi(t)= \begin{cases} 1,~a_1+a_2\cdot t<e^{bt} \\ 0,~a_1+a_2\cdot t>e^{bt} \end{cases} \] 其中\(a_i=\frac{k_i\cdot c(\theta_0))}{c(\theta_i)}\),\(b=\theta_1-\theta_0\)。
上述不等式两侧,左侧为线性函数,右侧为指数函数。如果二者没有交点,则指数曲线总在直线上方,此时检验总是拒绝的;如果二者只有一个交点,则势函数为严格单调函数,无法满足势函数的最小值条件;因此指数曲线与直线相交于两点,也就是存在常数\(c_1,c_2\)使得检验函数成立。
这样确定的检验函数\(\phi(t)\)与\(\theta_1\)的具体取值无关。此外,对任意满足两个约束条件的检验函数\(\phi^*(t)\),都有\(E_{\theta_1}\phi(T)\ge E_{\theta_1}\phi^*(T)\),如果取\(\phi^*(t)=\alpha\),则有\(E_{\theta_1}\phi(T)\ge E_{\theta_1}\phi^*(T)=\alpha\)成立,因此该检验函数是上述假设问题的无偏检验,其势函数在\(\theta_0\)处取得最小值。因此该检验函数为水平为\(\alpha\)的UMPUT。
例:样本\(X=(X_1,\dots,X_n)\)来自于正态分布族\(\{N(0,\sigma^2):\sigma^2>0\}\),求解如下三个双边假设检验问题:
- \(H_0:\sigma^2\le \sigma^2_1\)或\(\sigma^2\ge \sigma^2_2\)对\(H_1:\sigma^2_1<\sigma^2<\sigma^2_2\)
- \(H_0:\sigma^2_1\le \sigma^2 \le \sigma^2_2\)对\(H_0:\sigma^2<\sigma^2_1\)或\(\sigma^2> \sigma^2_2\)
- \(H_0:\sigma^2= \sigma^2_0\)对\(H_1:\sigma^2\le \sigma^2_0\)
样本\(X\)的联合密度函数可以写作: \[ \begin{aligned} p(x;\sigma^2)=&\frac{1}{(\sqrt{2\pi}\sigma)^n}\exp\{-\frac{\sum_{i=1}^{n}x_i^2}{2\sigma^2}\} \\ =&c(\sigma^2)\exp\{Q(\sigma^2)T(X)\} \end{aligned} \] 其中,\(Q(\sigma^2)=-\frac{1}{2\sigma^2}\)是\(\sigma^2\)的严增函数;\(T(X)=\sum_{i=1}^{n}x_i^2\)为充分统计量,且满足\(T(X)\sim \sigma^2 \chi^2(n)\),也即\(T(X)/\sigma^2 \sim \chi^2(n)\)。
对于检验问题1,其水平为\(\alpha\)的UMPT的拒绝域为:\(W=\{x|c_1\le T(X)\le c_2\}\),其中\(c_1\)和\(c_2\)由下式确定: \[ P_{\sigma_1^2}(c_1\le T(X)\le c_2)=P_{\sigma_2^2}(c_1\le T(X)\le c_2)=\alpha \] 也即: \[ \int_{c_1/\sigma_1^2}^{c_2/\sigma_1^2}\chi^2(x|n)dx=\alpha \\ \int_{c_1/\sigma_2^2}^{c_2/\sigma_2^2}\chi^2(x|n)dx=\alpha \\ \] 对于检验问题2,其水平为\(\alpha\)的UMPUT的拒绝域为:\(W=\{x|T(X)\le c_1 \cup T(X)\ge c_2\}\),其中\(c_1\)和\(c_2\)由下式确定: \[ \int_{c_1/\sigma_1^2}^{c_2/\sigma_1^2}\chi^2(x|n)dx=1-\alpha \\ \int_{c_1/\sigma_2^2}^{c_2/\sigma_2^2}\chi^2(x|n)dx=1-\alpha \\ \] 而对于检验问题3,其水平为\(\alpha\)的UMPUT的拒绝域同样形如:\(W=\{x|T(X)\le c_1 \cup T(X)\ge c_2\}\)。由\(E_{\sigma_0^2}(T(X))=\alpha\)可得: \[ \int_{c_1/\sigma_0^2}^{c_2/\sigma_0^2}\chi^2(x|n)dx=1-\alpha \\ \] 由\(E_{\sigma_0^2}(T\phi(T))=\alpha E_{\sigma_0^2}(T)\)可得: \[ E_{\sigma_0^2}[T(1-\phi(T))]=n\sigma_0^2\cdot(1-\alpha)=n\sigma_0^2\cdot E_{\sigma_0^2}[1-\phi(T)] \] 故可得: \[ E_{\sigma_0^2}\left[\left(\frac{T}{\sigma_0^2}-n\right)\cdot(1-\phi(T))\right]=0 \] 即: \[ \int_{c_1/\sigma_0^2}^{c_2/\sigma_0^2}(x-n)\cdot\chi^2(x|n)dx=0 \] 或者是根据这类双边假设检验问题中势函数的性质,即势函数\(g(\sigma^2)=1-\int_{c_1/\sigma^2}^{c_2/\sigma^2}\chi^2(x|n)dx\)在\(\sigma^2=\sigma_0^2\)处取得最小值,从而得到: \[ c_2\cdot \chi^2\left(\frac{c_2}{\sigma_0^2}|n\right)-c_1\cdot \chi^2\left(\frac{c_1}{\sigma_0^2}|n\right)=0 \]
多参数指数型分布族
概述
对于一些检验问题,它的总体包含两个或者两个以上的未知参数,当仅对其中一个未知参数做假设检验时,其它的未知参数就变成了多余参数。一般来说,对于多参数指数型分布族的单边和双边假设检验问题,UMPT是不存在的,但是存在UMPUT。对于这类问题,寻找UMPUT需要用到指数型分布族的有关性质。
设样本\(X\)服从多参数指数型分布,其密度函数为: \[ p(x;\theta,\boldsymbol{r})=c(\theta,\boldsymbol{r})\cdot \exp \left\{\theta\cdot u(x)+\sum_{i=1}^k r_i\cdot t_i(x) \right\}\cdot h(x) \] 其中\(\theta\)代表被检验的参数,\(\boldsymbol{r}=(r_1;\dots,r_k)\)为多余参数,\((\theta,\boldsymbol{r})\in \Omega \in R^{k+1}\)。如果参数空间\(\Omega\)有内点,则\((U(X),T(X))=(U(X),T_1(X),\dots,T_k(X))\)是参数\((\theta,\boldsymbol{r})\)的充分、完备的统计量。因此,根据充分性原则,我们只需要考虑基于\((U(X),T(X))\)的检验。\((U(X),T(X))\)的分布仍然为多参数指数型分布,密度函数为: \[ p(u,t;\theta,\boldsymbol{r})=c_1(\theta,\boldsymbol{r})\cdot \exp \left\{\theta\cdot u+\sum_{i=1}^k r_i\cdot t_i \right\}\cdot h(u,t) \] 在\(T(X)=t\)的条件下,\(U(X)\)的条件分布与多余参数\(\boldsymbol{r}\)无关,且为单参数指数分布: \[ p(u|T=t)=c_t(\theta)\cdot \exp\{\theta\cdot u\}\cdot h_t(u) \] 因此,多参数指数型分布族中的假设问题便可转化为单参数指数型分布族中的假设检验问题,即在\(\{x:T(x)=t\}\)的子空间上,寻找UMPT或者UMPUT。
\(T(X)\)的边际分布为: \[ p(t)=c_\theta(\boldsymbol{r})\cdot \exp\left\{\sum_{i=1}^{k}r_i\cdot t_i \right\} \cdot h_\theta(t) \] 在\(\theta\)给定时,\(T(X)\)的边际分布为指数型分布。令\(G_\theta=\{\boldsymbol{r}:(\theta,\boldsymbol{r})\in \Omega \}\),在\(\theta\)给定之后,如果空间\(G_\theta\)有内点,则\(T(X)\)为参数\(\boldsymbol{r}\)的充分、完备的统计量。而且可以证明,在\(T(X)=t\)的条件下最优的检验,在整个样本空间上也是一致最优的检验。
假设检验
下面为几种假设检验问题的检验函数:
原假设\(H_0:\theta \le \theta_0\)对备择假设\(H_1:\theta>\theta_0\):
这一假设检验问题水平为\(\alpha\)的UMPUT为: \[ \phi(u,t)= \begin{cases} 1,~~~~~u>c(t) \\ r(t),u=c(t) \\ 0,~~~~~u<c(t) \end{cases} \] 其中\(r(t)(0\le r(t)\le 1)\)和\(c(t)\)由下式确定: \[ E_{\theta_0}[\phi(U,T)|T=t]=\alpha \] 对于这一检验问题,如果存在一个统计量\(V=V(U,T)\),给定\(T=t\)之后,\(V\)是\(U\)的单调增函数,且当\(\theta=\theta_0\)时,\(V\)与\(T\)互相独立,则此时\(r\)与\(c\)不依赖于\(t\)。检验函数变为: \[ \phi(v)= \begin{cases} 1,~v>c \\ r,~v=c \\ 0,~v<c \end{cases} \] \(r\)和\(c\)由下式确定: \[ E_{\theta_0}[\phi(V)]=\alpha \] 对于原假设\(H_0:\theta \ge \theta_0\)对备择假设\(H_1:\theta<\theta_0\)的假设检验问题,只需要将\(\phi(u,t)\)中的不等号改变方向即可。
原假设\(H_0:\theta_1\le \theta \le \theta_2\)对备择假设\(H_1:\theta<\theta_1~\text{or}~\theta>\theta_2\):
这一假设检验问题水平为\(\alpha\)的UMPUT为: \[ \phi(u,t)=\begin{cases} 0, ~~~~~~c_1(t)<u<c_2(t) \\ r_i(t), u=c_i(t),i=1,2 \\ 1,~~~~~~u<c_1(t)~\text{or}~u>c_2(t) \end{cases} \] 其中\(r_i(t)\)和\(c_i(t)\)由下式确定: \[ E_{\theta_1}[\phi(U,T)|T=t]=E_{\theta_2}[\phi(U,T)|T=t]=\alpha \] 对于这一检验问题,如果存在一个统计量\(V=V(U,T)\),给定\(T=t\)之后,\(V\)是\(U\)的单调函数,且当\(\theta=\theta_1\)和\(\theta=\theta_2\)时,\(V\)与\(T\)互相独立,则此时\(r\)与\(c\)不依赖于\(t\)。检验函数为: \[ \phi(v)=\begin{cases} 0, ~~~~~~c_1<v<c_2 \\ r_i,~~~~~ v=c_i,i=1,2 \\ 1,~~~~~~v<c_1~\text{or}~v>c_2 \end{cases} \] 其中\(r_i\)和\(c_i\)由下式确定: \[ E_{\theta_1}[\phi(V)]=E_{\theta_2}[\phi(V)]=\alpha \] 如果考虑原假设\(H_0:\theta\le \theta_1~\text{or}~\theta\ge \theta_2\)对备择假设\(H_1:\theta_1< \theta < \theta_2\)的假设检验问题,只需要将检验函数改为如下形式: \[ \phi(u,t)=\begin{cases} 0, ~~~~~~u<c_1(t)~\text{or}~u>c_2(t) \\ r_i(t), u=c_i(t),i=1,2 \\ 1,~~~~~~c_1(t)<u<c_2(t) \end{cases} \]
原假设\(H_0:\theta=\theta_0\)对备择假设\(H_1:\theta\ne \theta_0\):
这一假设检验问题的UMPUT为: \[ \phi(u,t)=\begin{cases} 0, ~~~~~~c_1(t)<u<c_2(t) \\ r_i(t), u=c_i(t),i=1,2 \\ 1,~~~~~~u<c_1(t)~\text{or}~u>c_2(t) \end{cases} \] 其中\(r_i(t)\)和\(c_i(t)\)由下式确定: \[ E_{\theta_0}[\phi(U,T)|T=t]=\alpha \\ E_{\theta_0}[U\cdot \phi(U,T)|T=t]=\alpha\cdot E_{\theta_0}[U|T=t] \]
如果存在一个统计量\(V=a(T)\cdot U+b(T)\),即给定\(T=t\)之后,\(V\)是\(U\)的线性函数,且当\(\theta=\theta_0\)时,\(V\)与\(T\)相互独立,此时的检验函数为: \[ \phi(v)=\begin{cases} 0, ~~~~~~c_1<v<c_2 \\ r_i,~~~~~ v=c_i,i=1,2 \\ 1,~~~~~~v<c_1~\text{or}~v>c_2 \end{cases} \] 其中\(r_i\)和\(c_i\)由下式确定: \[ E_{\theta_0}[\phi(V)]=\alpha \\ E_{\theta_0}[V\cdot\phi(V)]=\alpha\cdot E_{\theta_0}[V] \]
从中可以看出,这些假设检验问题的检验函数与单参数指数型分布族类似,只是此时的检验函数变为多余参数\(t\)的函数。且在一些特殊的情况下,检验函数不依赖于多余参数\(t\)。
例:设相互独立的两个总体\(x\)和\(y\)的分布分别是参数为\(\lambda\)和\(\mu\)的Poisson分布,构造假设检验问题比较这两个总体是否来自于同一个Poisson总体。
\(x\)和\(y\)的联合分布可以表示为下式: \[ \begin{aligned} p(x,y;\mu,\lambda)=&e^{-(\mu+\lambda)}\cdot \exp\{\ln \lambda\cdot x+\ln \mu\cdot y\}\cdot (x!y!)^{-1} \\ =& e^{-(\mu+\lambda)}\cdot \exp\{\ln(\mu/\lambda) \cdot y+\ln \lambda\cdot (x+y)\}\cdot (x!y!)^{-1} \\ =& e^{-(\mu+\lambda)}\cdot \exp\{\theta \cdot y+r\cdot (x+y)\}\cdot (x!y!)^{-1} \end{aligned} \] 其中,\(\theta=\ln(\mu/\lambda)\),\(r=\ln \lambda\)。此时,比较参数\(\lambda\)和\(\mu\)的差异的检验问题就变为关于参数\(\theta\)的检验问题。原假设\(H_0:\lambda\le \mu\)对备择假设\(H_1:\lambda>\mu\)的检验问题就等价于原假设\(H_0:\theta\ge 0\)对备择假设\(H_1:\theta<0\)的检验问题。因此,只需要在直线\(x+y=t\)的整数点上寻找最优势的条件检验。
在给定\(X+Y=t\)之后,\(Y\)的条件分布为: \[ \begin{aligned} p(y|x+y=t)=&\frac{p(y,x+y=t)}{p(x+y=t)} \\ =&\frac{e^{-(\mu+\lambda)}\cdot \exp\{\theta \cdot y+r\cdot t\}\cdot ((t-y)!y!)^{-1}}{\sum_{i=0}^{t} e^{-(\mu+\lambda)}\cdot \exp\{\theta \cdot i+r\cdot t\}\cdot (i!(t-i)!)^{-1}} \\ =& \frac{\binom{t}{y}(\frac{e^\theta}{1+e^\theta})^y(\frac{1}{1+e^\theta})^{t-y}}{\sum_{i=0}^{t} \binom{t}{i}(\frac{e^\theta}{1+e^\theta})^i(\frac{1}{1+e^\theta})^{t-i}} \\ =&\binom{t}{y}(\frac{e^\theta}{1+e^\theta})^y(\frac{1}{1+e^\theta})^{t-y} \\ =&\binom{t}{y} p^y(1-p)^{t-y} \end{aligned} \] 可以看出,此时的条件分布为二项分布,因此原来的假设检验问题就变为关于二项分布的参数\(p\)的假设检验问题。原来的假设检验问题其实就等价于原假设\(H_0:p\ge 0.5\)对备择假设\(H_1:p<0.5\)的假设检验问题。
正态总体参数的检验问题
要构造正态总体参数的检验问题的检验函数,首先介绍下面的引理:
设\((\mathscr{X},\mathscr{B},\mathscr{P}=\{p_\theta:\theta\in \Theta\})\)是一个参数统计结构,\(T(X)\)为\(\theta\)的充分完备统计量,如果可测统计量\(S(X)\)的分布于\(\theta\)无关,则对于所有的\(\theta\in \Theta\),\(T(X)\)和\(S(X)\)相互独立。
下面叙述正态总体参数中常用的几种检验法:
\(t\)检验
单样本\(t\)检验
设样本\(X=(X_1,\dots,X_n)\)来自于正态总体\(N(\mu,\sigma^2)\),其中\(-\infty<\mu<\infty\),\(\sigma^2>0\)。考虑关于\(\mu\)的假设检验问题:(1)\(H_0:\mu\ge 0\)对\(H_1:\mu<0\),(2)\(H_0:\mu\le 0\)对\(H_1:\mu>0\),(3)\(H_0:\mu= 0\)对\(H_1:\mu\ne 0\)。如果考虑假设检验问题\(H_0:\mu\ge \mu_0\)对\(H_1:\mu<\mu_0\),则可以通过变换\(Y=X-\mu_0\)变为上述情况之一。
样本的联合概率密度为: \[ \begin{aligned} p(x;\mu,\sigma^2)=&(\sqrt{2\pi}\sigma)^{-n}\exp \left\{-\frac{n\mu^2}{2\sigma^2} \right\}\cdot \exp \left\{\frac{\mu}{\sigma^2}\cdot \sum_{i=1}^{n}x_i-\frac{1}{2\sigma^2}\sum_{i=1}^{n}x_i^2 \right\} \\ =&(\sqrt{2\pi}\sigma)^{-n}\exp \left\{-\frac{n\mu^2}{2\sigma^2} \right\}\cdot \exp \left\{\theta\cdot u+r\cdot t \right\} \end{aligned} \] 其中,\(\theta=\frac{n\mu}{\sigma^2}\),\(r=(-2\sigma^2)^{-1}\),\(u=\bar{x}\),\(t=\sum_{i=1}^{n}x_i^2\)。此时关于\(\mu\)的检验问题就变为了关于\(\theta\)的检验问题。
接下来寻找统计量\(V=V(U,T)\),使得对于给定的\(T\),\(V\)是\(U\)的单调函数,且在\(\mu=0\)即\(\theta=0\)时,\(V\)与\(T\)相互独立。
为此,令 \[ V=\sqrt{n(n-1)}\cdot \frac{U}{\sqrt{T-nU^2}}=\sqrt{n(n-1)} \cdot \frac{\bar{X}}{\sqrt{\sum_{i=1}^n (X_i-\bar{X})^2}} \] 当\(\mu=0\)时,样本\(X=(X_1,\dots,X_n)\)来自于正态总体\(N(0,\sigma^2)\),此时\(T=\sum_{i=1}^n X_i^2\)是\(\sigma^2\)的充分、完备的统计量,且在\(\mu=0\)时,由于 \[ V=\sqrt{n(n-1)} \cdot \frac{\bar{X}}{\sqrt{\sum_{i=1}^n (X_i-\bar{X})^2}}=\sqrt{n(n-1)} \cdot \frac{\bar{Z}}{\sqrt{\sum_{i=1}^n (Z_i-\bar{Z})^2}} \] 其中\(Z_i=X_i/\sigma\sim N(0,1)\),所以\(V\)的分布与参数\(\sigma^2\)无关。故可得\(V\)与\(T\)相互独立,在\(\mu=0\)时,\(V\sim t(n-1)\)。
因此,对于检验问题(1)和(2),它们的UMPUT拒绝域分别为\(\{x:v\le t_\alpha(n-1)\}\)和\(\{x:v\ge t_{1-\alpha}(n-1)\}\)。
而对于检验问题(3),首先需要构造\(U\)的线性统计量。令 \[ W=\frac{U}{\sqrt{T}}=\frac{\bar{X}}{\sqrt{\sum_{i=1}^n X_i^2}} \] 对于固定的\(T\),\(W\)是\(U\)的线性函数;且在\(\mu=0\)时,由于\(T\)是\(\sigma^2\)的充分完备统计量,且由于\(W\)的分布与参数\(\sigma^2\)无关,因此\(W\)与\(T\)互相独立。由于\(W\)的分布关于原点对称,因此检验问题(3)的UMPUT拒绝域为\(\{x:|w|\ge c\}\)。由于 \[ V=\sqrt{n(n-1)}\frac{W}{\sqrt{1-nW^2}} \] 故\(|V|\)是\(|W|\)的单调增函数,从而可以将拒绝域等价表示为\(\{x:|v|\ge c\}\)。已知\(\mu=0\)时,\(V\sim t(n-1)\),从而该检验问题的UMPUT拒绝域为\(\{x:|v|\ge t_{1-\alpha/2}(n-1)\}\)。
两样本\(t\)检验
设样本\(X=(X_1,\dots,X_m)\)和样本\(Y=(Y_1,\dots,Y_n)\)互相独立。它们分别来自于正态总体\(N(\mu_1,\sigma^2)\)和\(N(\mu_2,\sigma^2)\),其中\(-\infty<\mu_1<\infty\),\(-\infty<\mu_2<\infty\)。考虑这两个正态总体的均值的检验问题:\(H_0:\mu_1=\mu_2\)对\(H_1:\mu_1\ne \mu_2\)。
样本的联合密度为: \[ p(x,y;\mu_1,\mu_2,\sigma^2)=(2\pi \sigma^2)^{-\frac{m+n}{2}}\exp \{-\frac{m\mu_1^2+n\mu_2^2}{2\sigma^2}\}\cdot \exp\{\theta\cdot u+r_1\cdot t_1+r_2\cdot t_2\} \] 其中,\(\theta=\frac{mn(\mu_2-\mu_1)}{(m+n)\sigma^2}\),\(r_1=\frac{m\mu_1+n\mu_2}{(m+n)\sigma^2}\),\(r_2=-\frac{1}{2\sigma^2}\),\(u=\bar{y}-\bar{x}\),\(t_1=m\bar{x}+n\bar{y}\),\(t_2=\sum_{i=1}^{m}x_i^2+\sum_{i=1}^{n}y_i^2\)。
此时,检验问题等价于\(H_0:\theta=0\)对\(H_1:\theta\ne 0\)。
首先构造统计量\(V\),使得对于固定的\(T_1\)和\(T_2\),\(V\)是\(U\)的线性函数,且在\(\theta=0\)时,\(V\)与\((T_1,T_2)\)相互独立。为此,令 \[ V=\frac{U}{\sqrt{T_2-\frac{T_1^2}{m+n}}} \] 对于固定的\(T_1\)和\(T_2\),\(V\)是\(U\)的线性函数,且在\(\theta=0\)即\(\mu_1=\mu_2=\mu\)时,合样本\((X_1,\dots,X_m,Y_1,\dots,Y_n)\)互相独立且同分布。此时,\(\sigma^2\)和\(\mu\)的充分、完备统计量为\(T_1\)和\(T_2\)。由于在\(\theta=0\)时,\(V\)的分布与参数\(\sigma^2\)和\(\mu\)无关,因此\(V\)与\((T_1,T_2)\)相互独立。并且由于在\(\theta=\theta_0\)时,\(V\)的分布关于原点对称,故此时该检验问题的UMPUT拒绝域为: \[ \{x,y:|v|\ge c\} \] 进一步,令 \[ \begin{aligned} W=& \sqrt{\frac{nm(m+n-2)}{m+n}}\frac{V}{\sqrt{1-\frac{mn}{m+n}V^2}} \\ =&\sqrt{\frac{nm(m+n-2)}{m+n}}\frac{\bar{Y}-\bar{X}}{\sqrt{\sum_{i=1}^{m}(X_i-\bar{X})^2+\sum_{i=1}^{n}(Y_i-\bar{Y})^2}} \end{aligned} \] 则\(W\)是\(V\)的单调增函数,并且在\(\theta=0\)时,\(W\sim t(m+n-2)\)。故该检验问题的UMPUT拒绝域为\(\{x,y:|w|\ge t_{1-\alpha/2}(m+n-2)\}\)。类似地,检验问题\(H_0:\mu_1\le \mu_2\)对\(H_1:\mu_1>\mu_2\)和检验问题\(H_0:\mu_1\ge \mu_2\)对\(H_1:\mu_1<\mu_2\)的UMPUT拒绝域分别为:\(\{x,y:w\le t_\alpha(m+n-2)\}\)和\(\{x,y:w\ge t_{1-\alpha}(m+n-2)\}\)。
\(\chi^2\)检验
设样本\(X=(X_1,\dots,X_n)\)来自于正态总体\(N(\mu,\sigma^2)\),其中\(-\infty<\mu<\infty\),\(\sigma^2>0\)。考虑关于\(\sigma^2\)的假设问题:(1)\(H_0:\sigma^2\ge \sigma^2_0\)对\(H_1:\sigma^2< \sigma^2_0\);(2)\(H_0:\sigma^2\le \sigma^2_0\)对\(H_1:\sigma^2> \sigma^2_0\);(3)\(H_0:\sigma^2= \sigma^2_0\)对\(H_1:\sigma^2 \ne \sigma^2_0\)。
样本的联合概率密度为: \[ \begin{aligned} p(x;\mu,\sigma^2)=&(\sqrt{2\pi}\sigma)^{-n}\exp \left\{-\frac{n\mu^2}{2\sigma^2} \right\}\cdot \exp \left\{\frac{\mu}{\sigma^2}\cdot \sum_{i=1}^{n}x_i-\frac{1}{2\sigma^2}\sum_{i=1}^{n}x_i^2 \right\} \\ =&(\sqrt{2\pi}\sigma)^{-n}\exp \left\{-\frac{n\mu^2}{2\sigma^2} \right\}\cdot \exp \left\{\theta\cdot u+r\cdot t \right\} \end{aligned} \] 其中,\(\theta=(-2\sigma^2)^{-1}\),\(r=\frac{n\mu}{\sigma^2}\),\(u=\sum_{i=1}^{n}x_i^2\),\(t=\bar{x}\)。此时关于\(\sigma^2\)的检验问题就变为关于\(\theta\)的检验问题。
令 \[ V=U-n\cdot T^2=\sum_{i=1}^{n}(X_i-\bar{X})^2 \] 则对于固定的\(T=\bar{X}\),\(V\)是\(U\)的线性增函数,且\(V\)与\(T\)相互独立。在\(\sigma^2=\sigma^2_0\)时,\(V\sim \sigma^2_0\cdot \chi^2(n-1)\)。因此,对于前两个问题,它们的UMPUT拒绝域分别为\(\{x:v\le \sigma_0^2\cdot \chi^2(n-1)\}\)和\(\{x:v\ge \sigma_0^2\cdot \chi^2(n-1)\}\)。而对于问题(3),常取\(\{x:v\le \sigma_0^2\cdot \chi^2_{\alpha/2}(n-1)~\text{or}~v\ge \sigma_0^2\cdot \chi^2_{1-\alpha/2}(n-1) \}\)。
\(F\)检验
设样本\(X=(X_1,\dots,X_m)\)和样本\(Y=(Y_1,\dots,Y_n)\)互相独立。它们分别来自于正态总体\(N(\mu_1,\sigma_1^2)\)和\(N(\mu_2,\sigma_2^2)\),其中\(-\infty<\mu_1<\infty\),\(-\infty<\mu_2<\infty\),\(\sigma^2_1\ge 0\),\(\sigma^2_2\ge 0\)。考虑比较这两个正态总体方差的检验问题:\(H_0:\sigma_1^2=\sigma^2_2\)对\(H_1:\sigma_1^2\ne \sigma_2^2\)。
样本的联合密度为: \[ p(x,y;\mu_1,\mu_2,\sigma^2_1,\sigma^2_2)=c(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2)\cdot \exp\{\theta\cdot u+r_1\cdot t_1+r_2\cdot t_2+r_3\cdot t_3\} \] 其中,\(\theta=\frac{1}{2\sigma_1^2}-\frac{1}{2\sigma_2^2}\),\(r_1=-\frac{1}{2\sigma_1^2}\),\(r_2=\frac{m\mu_1}{\sigma_1^2}\),\(r_3=\frac{m\mu_2}{\sigma_2^2}\),\(u=\sum_{i=1}^{n}y_i^2\),\(t_1=\sum_{i=1}^{m}x_i^2+\sum_{i=1}^{n}y_i^2\),\(t_2=\bar{x}\),\(t_3=\bar{y}\)。
此时,关于\(\sigma^2\)的检验问题\(H_0:\sigma_1^2=\sigma^2_2\)对\(H_1:\sigma_1^2\ne \sigma_2^2\)就变为关于\(\theta\)的检验问题\(H_0:\theta=0\)对\(H_1:\theta\ne 0\)。
首先寻找统计量\(V\),使得对于固定的\((T_1,T_2,T_3)\),\(V\)是\(U\)的线性函数,且在\(\theta=0\)时,\(V\)与\((T_1,T_2,T_3)\)互相独立。为此令 \[ V=\frac{U-nT_3^2}{T_1-mT_2^2-nT_3^2}=\frac{\sum_{i=1}^n(Y_i-\bar{Y})^2}{\sum_{i=1}^m(X_i-\bar{X})^2+\sum_{i=1}^n(Y_i-\bar{Y})^2} \] 则对于给定的\((T_1,T_2,T_3)\),\(V\)是\(U\)的线性函数。在\(\theta=0\)时,\(\mu_1\),\(\mu_2\),\(\sigma^2\)的充分完备统计量为: \[ \begin{aligned} &T_2=\bar{X} \\ &T_3=\bar{Y} \\ &T_1-mT_2^2-nT_3^2=\sum_{i=1}^m(X_i-\bar{X})^2+\sum_{i=1}^n(Y_i-\bar{Y})^2 \end{aligned} \] 由于在\(\theta=0\)时,\(V\)的分布与参数\(\mu_1\),\(\mu_2\)和\(\sigma^2\)无关,因此\(V\)与\((T_2,T_3,T_1-mT_2^2-nT_3^2)\)相互独立,即与\((T_1,T_2,T_3)\)互相独立。此时,\(V\sim Be(\frac{n-1}{2},\frac{m-1}{2})\),因此上述检验问题的UMPUT拒绝域为\(\{x,y:v\le c_1~\text{or}~v\ge c_2\}\)。其中\(c_1\)和\(c_2\)由如下两式确定: \[ \begin{aligned} & \int_{c_1}^{c_2}Be(x|\frac{n-1}{2},\frac{m-1}{2})dx=1-\alpha \\ & \int_{c_1}^{c_2} (x-\frac{n-1}{m+n-2}) Be(x|\frac{n-1}{2},\frac{m-1}{2})dx=0 \end{aligned} \] 另一种计算\(c_1\)和\(c_2\)的方法是,令 \[ F=\frac{V}{1-V}\cdot \frac{m-1}{n-1}=\frac{\sum_{i=1}^n(Y_i-\bar{Y})^2}{\sum_{i=1}^m(X_i-\bar{X})^2}\cdot \frac{m-1}{n-1} \] 则在\(\theta=0\)时,\(F\sim F(n-1,m-1)\)。由于\(F\)是\(V\)的严增函数,故该检验问题的UMPUT拒绝域可以等价写为\(\{x,y:F\le c_1 ~\text{or} F\ge c_2\}\),其中\(c_1\)和\(c_2\)由如下两式确定: \[ \begin{aligned} & \int_{c_1}^{c_2} F(x|n-1,m-1)dx=1-\alpha \\ & \int_{c_1}^{c_2} \frac{x-1}{(n-1)x+(m-1)}F(x|n-1,m-1)dx=0 \end{aligned} \] 由于这一检验的势函数与参数\(\mu_1\)和\(\mu_2\)无关,仅依赖于比值\(\rho=\frac{\sigma_1^2}{\sigma_2^2}\),它的势函数为: \[ g(\rho)=1-\int_{\rho\cdot c_1}^{\rho \cdot c_2}F(x|n-1,m-1)dx \] 由势函数在\(\rho=1\)时达到最小值可得,\(c_1\)和\(c_2\)也可以由如下两式确定: \[ \begin{aligned} & \int_{c_1}^{c_2} F(x|n-1,m-1)dx=1-\alpha \\ & c_2\cdot F(c_2|n-1,m-1)=c_1\cdot F(c_1|n-1,m-1) \end{aligned} \] 一般常取\(c_1=F_{\alpha/2}(n-1,m-1)\),\(c_2=F_{1-\alpha/2}(n-1,m-1)\)。这便是常用的\(F\)检验法。
由于\(F\)也可以改写为 \[ F=\frac{U-nT_3^2}{T_1-mT_2^2-U}\cdot \frac{m-1}{n-1} \] 故对于给定的\((T_1,T_2,T_3)\),\(F\)是\(U\)的严增函数,且与\((T_1,T_2,T_3)\)互相独立。因此,检验问题\(H_0:\sigma_1^2\le \sigma_2^2\)对\(H_1:\sigma_1^2>\sigma_2^2\),以及\(H_0:\sigma_1^2\ge \sigma_2^2\)对\(H_1:\sigma_1^2<\sigma_2^2\)的UMPUT拒绝域分别为\(\{x,y:F\le F_\alpha(n-1,m-1)\}\)和\(\{x,y:F\ge F_{1-\alpha}(n-1,m-1)\}\)。
似然比检验
定义
在许多复合假设的检验问题中,UMPT和UMPUT可能不存在,此时便可以使用似然比检验的方法,在复合假设的检验问题中构造检验。设\(X=(X_1,\dots,X_n)\)的分布函数为\(p(x;\theta)\),其中未知参数\(\theta \in \Theta\)可以是向量。考虑复合假设的检验问题:原假设\(H_0:\theta\in \Theta_0\)对备择假设\(H_1:\theta\in \Theta_1\)。在这一检验问题中,定义似然比\(\lambda(x)\)为: \[ \lambda(x)=\frac{\sup_{\theta\in \Theta_1}p(x;\theta)}{\sup_{\theta\in \Theta_0}p(x;\theta)} =\frac{p(x;\hat{\theta_1})}{p(x;\hat{\theta_0})} \] 其中,\(\hat{\theta}_0\)和\(\hat{\theta}_1\)分别是\(H_0\)和\(H_1\)成立时,\(\theta\)的MLE。\(p(x;\hat{\theta}_0)\)代表原假设成立时,观察到样本点\(x\)概率的度量;\(p(x;\hat{\theta}_1)\)代表备择假设成立时,观察到样本点\(x\)概率的度量。在\(\lambda(x)\)较大时,备择假设成立观察到样本点\(x\)的可能性比较大,因此很自然地可以在\(\lambda\)比较大的时候拒绝原假设。故检验的拒绝域取为\(\{x:\lambda(x)\ge c\}\)。
似然比检验方法常常用来区分样本来自于两类不同分布中哪一种的检验问题。
另一个很自然的推广是: \[ \lambda(x)=\frac{\sup_{\theta\in \Theta}p(x;\theta)}{\sup_{\theta\in \Theta_0}p(x;\theta)} =\frac{p(x;\hat{\theta})}{p(x;\hat{\theta_0})} \] 其中\(\hat{\theta}\)是\(\theta\in \Theta\),代表\(\theta\)没有受到限制时的MLE;而\(\hat{\theta}_0\)是原假设\(\theta\in \Theta_0\)成立时,代表\(\theta\)受到限制时的MLE。这种方法常用于参数假设检验问题。例如正态分布的\(t\)检验便是似然比检验。
简单原假设的检验问题
设样本\(X=(X_1,\dots,X_n)\)来自于密度函数族\(\{p(x;\theta):\theta\in \Theta\}\),其中未知参数\(\boldsymbol{\theta}=(\theta_1,\dots,\theta_k)\),参数空间\(\Theta\)是\(k\)维欧氏空间\(R^k\)中的一个含有内点的集合。假设参数真值\(\boldsymbol{\theta}_0\)是\(\Theta\)的一个内点。如果该密度函数族满足以下四个条件:
- \(\int_x \frac{\partial p(x;\boldsymbol{\theta})}{\partial \theta_i}d\mu(x)=\int_x \frac{\partial^2 p(x;\boldsymbol{\theta})}{\partial \theta_i \partial \theta_j}d\mu(x)=0\),\(i,j=1,\dots,k\)
- \(\boldsymbol{I}(\boldsymbol{\theta})=(I_{ij}(\boldsymbol{\theta}))_{k\times k}>0,\forall \boldsymbol{\theta} \in \Theta\)。
- 存在\(M(x)\),使得\(\int_x M(x)\cdot p(x;\boldsymbol{\theta})d\mu(x)<K,\forall \boldsymbol{\theta}\in \Theta\),其中\(K\)与\(\boldsymbol{\theta}\)无关,而且在含有参数真值\(\boldsymbol{\theta}_0\)的一个邻域内有\(|\partial^3 \ln p(x;\boldsymbol{\theta})/\partial \theta_i \partial \theta_j \partial \theta_k|\le M(x)\)成立。
- 不同的\(\boldsymbol{\theta}\)值对应于不同的概率分布。
此外,当\(\boldsymbol{\theta}\)的MLE\(\boldsymbol{\hat{\theta}}\)是似然方程\(\frac{\partial l(\boldsymbol{\theta})}{\partial \boldsymbol{\theta}}=0\)的解,并且在\(n\rightarrow \infty\)时,\(\boldsymbol{\hat{\theta}}\)以概率收敛于参数真值\(\boldsymbol{\theta}_0\)。
考虑双边假设检验问题:简单原假设\(H_0:\boldsymbol{\theta}=\boldsymbol{\theta}_0\)对简单备择假设\(H_1:\boldsymbol{\theta}\ne \boldsymbol{\theta}_0\)。该检验问题的似然统计量为: \[ \lambda(X)=\frac{\prod_{i=1}^n p(X_i;\boldsymbol{\hat{\theta}})}{\prod_{i=1}^n p(X_i;\boldsymbol{\theta}_0)} \] 那么在原假设\(H_0\)成立时,\(2\ln \lambda(X)\)随着\(n\)增大依分布收敛于\(\chi^2(k)\)。
例:Pearson拟合优度检验
根据某项指标,总体被分为\(r\)类:\(A_1,\dots,A_r\)。由经验或者是某个理论提出如下的检验问题:
原假设\(H_0\):随机抽取一个个体\(x\)进行观测,\(P(x\in A_i)\)已知且等于\(p_{0i}(i=1,\dots,r)\),其中\(\sum_{i=1}^r p_{0i}=1\)。
备择假设\(H_1\):\(P(x\in A_i)=p_{0i},i=1,\dots,r\)不全成立。
随机抽取\(n\)个个体进行观测,假设有\(n_i\)个个体属于类\(A_i\)。样本服从多项分布,其概率密度为 \[ p(n_1,\dots,n_r)=\frac{n!}{n_1!\cdots n_r!}\cdot \prod_{i=1}^r p_i^{n_i} \] 其中\(p_i\)代表类\(A_i\)所占的比例。由于约束条件\(\sum_{i=1}^{n}p_i=1\),故参数空间\(\Theta=\{(p_1,\dots,p_r):p_i\ge 0,\sum_{i=1}^{n}p_i=1\}\)中的独立参数只有\(r-1\)个,因此\(\Theta\)是\(r-1\)维欧氏空间中的一个含有内点的集合。
由于\(p_i\)的MLE为\(\hat{p}_i=n_i/n\),故这一检验问题的似然比统计量为: \[ \Lambda=\frac{\prod_{i=1}^r(\frac{n_i}{n})^{n_i}}{(p_{0i})^{n_i}} \] 根据上述定理,当\(2\ln \Lambda\ge \chi^2_{1-\alpha}(r-1)\)时拒绝原假设。
复合原假设的检验问题
设样本\(X=(X_1,\dots,X_n)\)来自于密度函数族\(\{p(x;\boldsymbol{\theta}):\boldsymbol{\theta}\in \Theta\}\),其中未知参数\(\boldsymbol{\theta}=(\theta_1,\dots,\theta_k)\),参数空间\(\Theta\)是\(k\)维欧氏空间\(R^k\)中的一个含有内点的集合,参数的真值\(\boldsymbol{\theta}_0\)是\(\Theta\)的一个内点。同样假设该密度函数族满足上述简单原假设的检验问题中的四个条件。
考虑复合原假设检验问题:原假设\(H_0:\boldsymbol{\theta}\in \Theta_0\)对备择假设\(H_1:\boldsymbol{\theta}\notin \Theta_0\)。其中\(\Theta_0\)是\(\Theta\)的一个非单点子集。一般来说,复合假设有如下三种情况:
- 原假设\(H_0:\theta_{r+1}=\cdots=\theta_k=0\)。
- 原假设\(H_0:R_i(\theta_1,\cdots,\theta_k)=0,i=1,\dots,s\),其中\(R_i\)具有一阶的连续偏导数。此时,参数\(\boldsymbol{\theta}\)受到\(s\)个条件的限制。此时,可以通过重新定义参数\(\boldsymbol{w}=(w_1,\dots,w_k)\),使得原假设变为\(H_0:w_{k-s+1}=\cdots=w_k=0\),从而情况2变为情况1.
- 原假设\(H_0:\theta_i=g_i(\varphi_1,\cdots,\varphi_r),i=1,\dots,k(r<k)\),其中\(g_i\)具有一阶连续偏导数。
而如果取\(\boldsymbol{\varphi}=(\theta_1,\cdots,\theta_r)\),则情况1可以变为情况3,从而情况2也可以变为情况3。因此只需要讨论情况3的假设检验问题即可。
对于假设问题3,定义似然比统计量 \[ \lambda(X)=\frac{\prod_{i=1}^n p(X_i;\boldsymbol{\hat{\theta}})}{\prod_{i=1}^n p(X_i;\boldsymbol{\hat{\theta}}_0)} \] 则在原假设\(H_0\)成立时,\(2\ln \lambda(X)\)随着\(n\)增大而依分布收敛于\(\chi^2(k-r)\)。其中\(r\)可以理解为约束条件的个数,\(k-r\)便代表独立参数的个数。
应用1:二维列联表的独立性检验
设有\(X,Y\)两个离散型随机变量,分别可以取\(r\)和\(c\)个值,与此相联系的有一个二维列联表\(r\times c\)。作\(n\)次观测,在\((i,j)\)格的观测频数为\(n_{ij}\)。观测值落入\((i,j)\)格的概率为\(p_{ij}\)。此时,观测频数服从多项分布,其概率密度为: \[ \frac{n!}{\prod_{i=1}^r\prod_{j=1}^c}\cdot \prod_{i=1}^r\prod_{j=1}^c p_{ij}^{n_{ij}} \] 由于\(\sum_{i=1}^r \sum_{j=1}^c p_{ij}=1\),所以参数空间\(\Theta=\{p_{ij}:i=1,\cdots,r;j=1,\cdots,c;p_{ij}\ge 0;\sum_{i=1}^r \sum_{j=1}^c p_{ij}=1\}\)中独立参数只有\(r\times c-1\)个。因此\(\Theta\)为\(r\cdot c-1\)维欧氏空间的一个含有内点的集合。\(p_{ij}\)的MLE为\(\hat{p}_{ij}=n_{ij}/n\)。
考虑独立性检验:原假设\(H_0:p_{ij}=p_{i\cdot}\cdot p_{\cdot j}\),其中\(p_{i\cdot}\)和\(p_{\cdot j}\)分别是\(X\)和\(Y\)的边缘分布。因此其参数空间\(\Theta_0\)与下述集合\(A\)一一对应: \[ A=\{(p_{i\cdot},p_{\cdot j}):i=1,\cdots,r;j=1,\cdots,c;p_{ij}\ge 0;\sum_{i=1}^r p_{i\cdot}= \sum_{j=1}^c p_{\cdot j}=1\} \] 集合\(A\)中的独立参数只有\(r+c-2\)个(\(p_{i\cdot}\)和\(p_{\cdot j}\)一共\(r+c\)个,加上两个约束条件)。此时,\(p_{ij}\)的MLE为\(\hat{p}_{i\cdot}\cdot \hat{p}_{\cdot j}=(n_{i\cdot}/n)\cdot (n_{\cdot j}/n)\),其中\(n_{i\cdot}=\sum_{j=1}^c n_{ij}\),\(n_{\cdot j}=\sum_{i=1}^k n_{ij}\)。
该检验问题的似然比统计量为: \[ \Lambda=\frac{\prod_{i=1}^r\prod_{j=1}^k (\frac{n_{ij}}{n})^{n_{ij}}}{\prod_{i=1}^r\prod_{j=1}^k(\frac{n_{i\cdot}}{n}\cdot\frac{n_{\cdot j}}{n})^{n_{ij}}} \] 由于\((r\cdot c-1)-(r+c-2)=(r-1)(c-1)\),因此在原假设成立时,\(2\ln \Lambda\)的极限分布为\(\chi^2((r-1)(c-1))\),因此在\(2\ln \Lambda \ge \chi_{1-\alpha}^2((r-1)(c-1))\)时,拒绝原假设。
应用2:三维列联表的条件独立性检验
设有\(X,Y,Z\)三个离散型随机变量,与此相联系的有一个三维列联表\(r\times c\times t\)。作\(n\)次观测,在\((i,j,k)\)格的观测频数为\(n_{ijk},i=1,\dots,r,j=1,\dots,c,k=1,\dots,t\),观测值落入\((i,j,k)\)格的概率为\(p_{ijk}\)。\(n_{ijk}\)服从多项分布,其概率密度为: \[ \frac{n!}{\prod_{i=1}^{r}\prod_{j=1}^{c}\prod_{k=1}^{t}n_{ijk}!}\cdot \prod_{i=1}^{r}\prod_{j=1}^{c}\prod_{k=1}^{t}p_{ijk}^{n_{ijk}} \] 由于\(\sum_{i=1}^{r}\sum_{j=1}^{c}\sum_{k=1}^{t}p_{ijk}=1\),所以参数空间\(\Theta=\{p_{ijk}:p_{ijk}\ge 0,\sum_{i=1}^{r}\sum_{j=1}^{c}\sum_{k=1}^{t}p_{ijk}=1\}\)中的独立参数有\(r\cdot c\cdot t-1\)个。因此\(\Theta\)是\(r\cdot c\cdot t-1\)维欧氏空间的一个含有内点的集合。\(p_{ijk}\)的MLE为\(\hat{p}_{ijk}=n_{ijk}/n\)。
对于三维列联表,共有三种不同的检验问题,原假设分别为:(1)三个随机变量相互独立,(2)一个随机变量和另外两个随机变量相互独立,(3)给定一个随机变量之后另外两个随机变量相互条件独立。对于前两个假设检验问题来说,类似于二维列联表的独立性检验问题。下面推导第三个检验问题的似然比检验。
不失一般性地,考虑给定\(Z\)之后,\(X\)和\(Y\)相互条件独立的检验问题。如果条件独立性成立,则有: \[ P(X=i,Y=j|Z=k)=P(X=i|Z=k)\cdot P(Y=j|Z=k) \] 从而有: \[ p_{ijk}=\frac{p_{i\cdot k}\cdot p_{\cdot jk}}{p_{\cdot \cdot k}} \] 当条件独立性成立时,\(p_{ijk}\)的MLE为: \[ \frac{\hat p_{i\cdot k}\cdot \hat p_{\cdot jk}}{\hat p_{\cdot \cdot k}}=\frac{n_{i\cdot k}\cdot n_{\cdot jk}}{n\cdot n_{\cdot \cdot k}} \] 此时的参数空间\(\Theta_0\)与下面的集合\(A\)一一对应: \[ A=\left\{(p_{i\cdot k}, p_{\cdot jk},p_{\cdot \cdot k}):p_{i\cdot k}\ge 0,p_{\cdot jk}\ge 0,p_{\cdot \cdot k}=\sum_{i=1}^r p_{i\cdot k}=\sum_{j=1}^{c}p_{\cdot jk},\sum_{k=1}^{t}p_{\cdot \cdot k}=1 \right\} \] 从中可得,\(A\)中的独立参数只有\(t\cdot(r+c-1)-1\)个(\(p_{i\cdot k}\)一共\(r\times t\)个,\(p_{\cdot jk}\)一共\(c\times t\)个,\(p_{\cdot \cdot t}\)一共\(t\)个,约束条件有\(1+2t\)个)。
该检验问题的似然比统计量为: \[ \Lambda=\frac{\prod_{i=1}^{r}\prod_{j=1}^{c}\prod_{k=1}^{t}(\frac{n_{ijk}}{n})^{n_{ijk}}}{\prod_{i=1}^{r}\prod_{j=1}^{c}\prod_{k=1}^{t}(\frac{n_{i\cdot k}\cdot n_{\cdot jk}}{n\cdot n_{\cdot \cdot k}})^{n_{ijk}}} \] 由于\((r\cdot c\cdot t-1)-[t\cdot(r+c-1)-1]=t\cdot(r-1)\cdot(c-1)\),因此在原假设成立时,\(2\ln \Lambda\)的极限分布为\(\chi^2(t\cdot(r-1)\cdot(c-1))\)。故在\(2\ln \Lambda\ge \chi^2_{1-\alpha}(t\cdot(r-1)\cdot(c-1))\)时拒绝原假设。