泊松分布是二项式的特例

2020-11-30 03:23:46

二项分布和泊松分布是应用数据科学中最常用的两种。它们是紧密相连的。泊松分布实际上只是二项式的一种特例-试验次数很多,在任何给定试验中成功的可能性都很小。

在这篇文章中,我将通过一个简单的证明来证明泊松分布实际上只是二项式,其中n接近无穷大而p接近零。

当我们有固定数量的事件n时,二项式分布起作用,每个事件具有成功概率p的恒定值。想象一下,我们不知道将要进行的试验次数。相反,我们只知道每个时间段的平均成功次数。因此,我们知道每天的成功率,但不知道试验次数n或导致该比率的成功概率p。

让它成为每天的成功率。等于np那就是试验的数量n-不管有多少-乘以每个试验获得成功的机会p。可以这样想:如果成功的机会是p,并且我们每天进行n次试验,那么我们平均每天就会获得np次成功。这就是我们观察到的成功率λ。

如上所述,让我们定义lambda = np。求解p,我们得到p = lamda / n。我们要做的是将这个表达式替换为p到上面的二项式分布中,并随着n变为无穷大而取极限,并尝试提出一些有用的东西。那是,

取出常数,将右边(n-k)的项分解为n的项,将-k的项分解为一,

现在,让我们一次限制这个右侧的限制。我们将分三个步骤进行操作。第一步是找到以下限制:

在分子中,我们可以展开n!分为(n)(n-1)(n-2)…(1)的n个项。在分母中,我们可以将(n-k)扩展为(n-k)(n-k-1)(n-k-2)…(1)的n-k个项。那是,

这样写,很明显顶部和底部的许多术语都被抵消了。 (n-k)(n-k-1)…(1)个项同时从分子和分母中消除,从而留下以下内容:

由于我们取消了n-k个项,因此这里的分子剩下k个项,从n到n-k + 1。所以这在分子中有k个项,在分母中有k个项,因为n是k的幂。扩展分子和分母,我们可以将其重写为:

这有k个项。显然,当n接近无穷大时,这k个项中的每一个都接近1。因此,我们知道问题的这一部分只是简化为一个。因此,我们完成了第一步。

第二步是在方程的中间找到项的极限,即

看起来很像e的定义。令x = -n / lambda,我们可以将其代入上面的表达式中,并采用以下限制:

我们的第三步也是最后一步是在右边找到最后一项的极限。当n接近无穷大时,该项变为1 ^(-k),等于1。这照顾了我们的上学期。将这三个结果放在一起,我们可以将原始限制重写为

这就是Poisson分布所熟悉的概率密度函数,在给定参数lambda的情况下,我们可以得出每个周期k次成功的概率。

因此,我们证明了泊松分布只是二项式的一种特例,其中n次试验的数量增加到无穷大,并且在任何特定试验中成功的机会都接近零。这就完成了证明!