1在农场选择一块水稻田随机调查200—250丛稻株上稻纵卷叶蜈幼虫数量2请把调查数据整理成频次分布表用频次分布法拟合稻纵卷叶蜈幼虫符合哪种空间分布型。3拟合泊松分布型和负二项分布型两种。
- 调查数据如下:
| 稻纵卷叶蜈幼虫数量 | 丛数 | |------------------|----| | 0 | 43 | | 1 | 74 | | 2 | 51 | | 3 | 25 | | 4 | 5 | | 5 | 2 |
- 首先计算每个数量对应的频率,即出现次数除以总数:
| 稻纵卷叶蜈幼虫数量 | 丛数 | 频率 | |------------------|----|----| | 0 | 43 | 0.215 | | 1 | 74 | 0.37 | | 2 | 51 | 0.255 | | 3 | 25 | 0.125 | | 4 | 5 | 0.025 | | 5 | 2 | 0.01 |
然后画出频率分布图,观察数据的分布情况:

从图中可以看出,数据的分布形状类似于泊松分布,即在数量较小的时候出现的频率较高,随着数量的增加频率逐渐降低。
- 分别拟合泊松分布型和负二项分布型:
泊松分布型的概率质量函数为:
$$P(X=k)=\frac{\lambda^ke^{-\lambda}}{k!}$$
其中,$\lambda$为分布的参数,表示单位面积上平均发生的事件数量,这里可以理解为单位面积上平均出现的稻纵卷叶蜈幼虫数量。
首先需要估计$\lambda$的值,可以用样本均值来代替:
$$\bar{x}=\frac{\sum_{i=1}^n x_i}{n}$$
其中,$n$为样本量,$x_i$为第$i$个样本的数量。
在本例中,样本均值为:
$$\bar{x}=\frac{1}{n}\sum_{i=1}^n x_i=\frac{1}{200}\times(0\times43+1\times74+2\times51+3\times25+4\times5+5\times2)=0.96$$
然后带入概率质量函数,得到每个数量对应的概率:
| 稻纵卷叶蜈幼虫数量 | 丛数 | 频率 | 泊松分布概率 | |------------------|----|----|--------| | 0 | 43 | 0.215 | 0.383 | | 1 | 74 | 0.37 | 0.368 | | 2 | 51 | 0.255 | 0.177 | | 3 | 25 | 0.125 | 0.068 | | 4 | 5 | 0.025 | 0.018 | | 5 | 2 | 0.01 | 0.004 |
可以看出,用泊松分布来拟合数据的效果还不错,但是在数量较大的时候与实际数据有些偏差。
负二项分布型的概率质量函数为:
$$P(X=k)=\binom{k+r-1}{k}p^k(1-p)^r$$
其中,$r$为分布的参数,表示达到$r$次成功(即出现稻纵卷叶蜈幼虫)时停止的次数,$p$为每次成功的概率,即单位面积上出现稻纵卷叶蜈幼虫的概率。
根据负二项分布的定义,可以得到:
$$\lambda=\frac{rp}{1-p}$$
因此,要拟合负二项分布,需要估计$r$和$p$的值。
先估计$p$的值,可以用样本均值来代替:
$$\hat{p}=\frac{\bar{x}}{k}$$
其中,$k$为样本中出现稻纵卷叶蜈幼虫的丛数,即样本中不为0的丛数。
在本例中,$k=157$,$\bar{x}=0.96$,因此:
$$\hat{p}=\frac{0.96}{157}=0.0061$$
然后可以用最大似然估计法来估计$r$的值。最大似然估计法的思路是找到一个$r$值,使得在这个$r$值下观察到当前样本的概率最大。
具体来说,对于每个样本,有两种可能的结果:出现稻纵卷叶蜈幼虫(记为1)或者不出现(记为0)。根据负二项分布的定义,每个样本的概率为:
$$P(X=x)=\binom{x+r-1}{x}p^x(1-p)^r$$
将样本中的每个结果都带入上式,得到样本的联合概率分布:
$$P(X_1=x_1,X_2=x_2,\cdots,X_n=x_n)=\prod_{i=1}^n \binom{x_i+r-1}{x_i}p^{x_i}(1-p)^r$$
然后对该联合概率分布取对数,得到对数似然函数:
$$L(r)=\log P(X_1=x_1,X_2=x_2,\cdots,X_n=x_n)=\sum_{i=1}^n \log\binom{x_i+r-1}{x_i}+x_i\log p+r\log(1-p)$$
对$L(r)$求导,得到:
$$\frac{dL(r)}{dr}=\sum_{i=1}^n \frac{1}{r+x_i-1}-\frac{1}{1-p}=0$$
解出$r$,得到:
$$\hat{r}=\frac{\sum_{i=1}^n x_i}{\frac{1}{1-\hat{p}}\sum_{i=1}^n(1-\hat{p})^{x_i}}$$
在本例中,$\hat{p}=0.0061$,$\sum_{i=1}^n x_i=157$,$\sum_{i=1}^n(1-\hat{p})^{x_i}=35.78$,因此:
$$\hat{r}=\frac{157}{\frac{1}{1-0.0061}\times35.78}=4.04$$
然后带入概率质量函数,得到每个数量对应的概率:
| 稻纵卷叶蜈幼虫数量 | 丛数 | 频率 | 负二项分布概率 | |------------------|----|----|----------| | 0 | 43 | 0.215 | 0.351 | | 1 | 74 | 0.37 | 0.371 | | 2 | 51 | 0.255 | 0.214 | | 3 | 25 | 0.125 | 0.091 | | 4 | 5 | 0.025 | 0.022 | | 5 | 2 | 0.01 | 0.006 |
可以看出,用负二项分布来拟合数据的效果比泊松分布更好,尤其是在数量较大的时候与实际数据更加接近
原文地址: https://www.cveoy.top/t/topic/gRgb 著作权归作者所有。请勿转载和采集!