首先,我们可以计算出样本的平均数和方差:

$$\bar{X}=\frac{1}{n}\sum_{i=1}^n x_i=\frac{1}{200}\cdot (0\cdot102+1\cdot45+2\cdot25+3\cdot15+4\cdot9+5\cdot3+6\cdot1)=0.96$$

$$S^2=\frac{1}{n}\sum_{i=1}^n (x_i-\bar{X})^2=\frac{1}{200}\cdot [(0-0.96)^2\cdot102+(1-0.96)^2\cdot45+(2-0.96)^2\cdot25+(3-0.96)^2\cdot15+(4-0.96)^2\cdot9+(5-0.96)^2\cdot3+(6-0.96)^2\cdot1]=1.0768$$

其次,我们可以通过观察数据的分布情况来判断它是否符合泊松分布或负二项分布。对于泊松分布,它的分布特点为:发生的次数是独立的;在某个时间或空间单位内,发生的次数与该时间或空间单位内的平均发生次数成正比;发生的次数不会超过该时间或空间单位内的总次数。对于负二项分布,它的分布特点为:发生的次数是独立的;在若干次试验中,连续进行试验,直到发生了r次成功为止时所需要的试验次数服从负二项分布。

接下来,我们通过频次分布法来拟合这两种空间分布型:

  1. 拟合泊松分布型

首先,我们需要确定泊松分布的参数λ。根据泊松分布的定义,λ等于单位时间或空间内平均发生的次数。因此,我们可以用样本的平均数作为λ的估计值。即:

$$\hat{\lambda}=\bar{X}=0.96$$

然后,我们可以根据泊松分布的概率密度函数,计算出每个幼虫数量的理论频次:

$$f(k)=\frac{\lambda^k e^{-\lambda}}{k!}$$

其中,k为幼虫数量,λ为参数,e为自然对数的底数(约等于2.71828),k!为k的阶乘。根据样本的平均数,我们可以得到每个幼虫数量的理论频次如下:

| 幼虫数量 | 理论频次 | | -------- | -------- | | 0 | 93.858 | | 1 | 90.288 | | 2 | 43.476 | | 3 | 13.343 | | 4 | 3.214 | | 5 | 0.614 | | 6 | 0.098 |

接下来,我们可以计算出每个幼虫数量的频数与理论频次的偏差平方,以及所有偏差平方的总和:

| 幼虫数量 | 频次 | 理论频次 | 偏差平方 | | -------- | ---- | -------- | -------- | | 0 | 102 | 93.858 | 67.837 | | 1 | 45 | 90.288 | 19.904 | | 2 | 25 | 43.476 | 108.368 | | 3 | 15 | 13.343 | 2.692 | | 4 | 9 | 3.214 | 31.360 | | 5 | 3 | 0.614 | 4.216 | | 6 | 1 | 0.098 | 0.881 | | 总计 | 200 | | 235.259 |

最后,我们可以计算出拟合的卡方值:

$$\chi^2=\sum_{i=1}^n \frac{(O_i-E_i)^2}{E_i}=235.259$$

其中,Oi为第i个幼虫数量的频数,Ei为第i个幼虫数量的理论频次。

接下来,我们需要利用卡方分布表来查找自由度为n-1=6的卡方分布,以确定拟合的显著性水平。假设我们选择显著性水平为α=0.05,查表可得临界值为12.59。由于我们计算得到的卡方值235.259大于临界值12.59,因此我们可以拒绝原假设,即不能认为数据符合泊松分布。

  1. 拟合负二项分布型

首先,我们需要确定负二项分布的两个参数:成功的概率p和成功的次数r。根据负二项分布的定义,成功的概率p为每次试验成功的概率,成功的次数r为在r次试验中成功的次数。由于我们并不知道每个幼虫数量对应的成功概率和成功次数,因此需要通过最大似然估计法来估计这两个参数。

最大似然估计法的基本思路是:在一定的模型假设下,找到一组参数值,使得这组参数值下样本观测值出现的概率最大。对于负二项分布,它的概率质量函数为:

$$f(k;r,p)=\binom{k+r-1}{k}p^k(1-p)^r$$

其中,k为幼虫数量,r为成功的次数,p为成功的概率,$\binom{k+r-1}{k}$为组合数。我们需要找到一组r和p的值,使得这组值下样本观测值出现的概率最大。具体地,我们可以通过对数似然函数的最大化来求解最优解。对于一个样本,其对数似然函数为:

$$L(r,p)=\sum_{i=1}^n \ln f(x_i;r,p)=\sum_{i=1}^n [\ln \binom{x_i+r-1}{x_i}+x_i \ln p+r\ln(1-p)]$$

其中,$x_i$为第i个幼虫数量的观测值。我们需要求解使得L(r,p)最大的r和p值。为了方便计算,我们可以对L(r,p)关于p求偏导数,并令其等于0,得到:

$$\frac{\partial L(r,p)}{\partial p}=\frac{\sum_{i=1}^n (x_i+r)}{p}-\frac{n\cdot r}{1-p}=0$$

解得:

$$\hat{p}=\frac{\sum_{i=1}^n (x_i+\hat{r})}{n\cdot \hat{r}+\sum_{i=1}^n x_i}$$

其中,$\hat{r}$为r的最大似然估计值,$\hat{p}$为p的最大似然估计值。

接下来,我们需要求解$\hat{r}$的值。同样地,我们可以对L(r,p)关于r求偏导数,并令其等于0,得到:

$$\frac{\partial L(r,p)}{\partial r}=\sum_{i=1}^n \ln \binom{x_i+r-1}{x_i}-n\ln(1-p)=0$$

由于这个方程无法直接求解,我们可以采用数值优化方法来求解。具体地,我们可以选择Newton-Raphson方法,通过迭代来逼近最优值。对于Newton-Raphson方法,每次迭代的公式为:

$$r_{t+1}=r_t-\frac{L'(r_t)}{L''(r_t)}$$

其中,$L'(r_t)$为L(r,p)关于r的一阶导数,$L''(r_t)$为L(r,p)关于r的二阶导数。在我们的例子中,$L'(r)$和$L''(r)$分别为:

$$L'(r)=\sum_{i=1}^n \frac{x_i+r}{x_i+r-1}-\frac{n}{1-p}$$

$$L''(r)=-\sum_{i=1}^n \frac{x_i+r}{(x_i+r-1)^2}$$

我们可以选择一个初始值$r_0$,然后通过迭代来求解最优解。在每次迭代中,我们需要计算$L'(r_t)$和$L''(r_t)$的值,并根据公式计算$r_{t+1}$的值,直到收敛为止。在本例中,我们选择初始值$r_0=1$,然后进行迭代计算。经过数次迭代,我们得到最优解为:

$$\hat{p}=0.165,\hat{r}=4.6$$

最后,我们可以根据最优解,计算出每个幼虫数量的理论频次:

| 幼虫数量 | 理论频次 | | -------- | -------- | | 0 | 100.60 | | 1 | 79.62 | | 2 | 38.86 | | 3 | 16.91 | | 4 | 6.69 | | 5 | 2.45 | | 6 | 0.84 |

接下来,我们可以计算出每个幼虫数量的频数与理论频次的偏差平方,以及所有偏差平方的总和:

| 幼虫数量 | 频次 | 理论频次 | 偏差平方 | | -------- | ---- | -------- | -------- | | 0 | 102 | 100.60 | 0.203 | | 1 | 45 | 79.62 | 103.888 | | 2 | 25 | 38.86 | 60.381 | | 3 | 15 | 16.91 | 0.260 | | 4 | 9 | 6.69 | 3.375 | | 5 | 3 | 2.45 | 0.282 | | 6 | 1 | 0.84 | 0.024 | | 总计 | 200 | | 168.413 |

最后,我们可以计算出拟合的卡方值:

$$\chi^2=\sum_{i=1}^n \frac{(O_i-E_i)^2}{E_i}=168.413$$

其中,Oi为第i个幼虫数量的频数,Ei为第i个幼虫数量的理论频次。

接下来,我们需要利用卡方分布表来查找自由度为n-2=4的卡方分布,以确定拟合的显著性水平。假设我们选择显著性水平为α=0.05,查表可得临界值为9.49。由于我们计算得到的卡方值168.413大于临界值9.49,因此我们可以拒绝原假设,即不能认为数据符合负二项分布

在农场选择一块水稻田随机调查200—250丛稻株上稻纵卷叶螟幼虫数量请把调查数据整理成频次分布表用频次分布法拟合稻纵卷叶螟幼虫符合哪种空间分布型。拟合泊松分布型和拟合负二项分布型两种。包括f理论和各个卡方值假设随机调查200丛稻株得到以下数据: 幼虫数量 频次 -------- ---- 0 102 1 45 2 25 3

原文地址: https://www.cveoy.top/t/topic/gSkM 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录