如何使用二项分布的正态近似(use the normal approximation to a binomial distribution)

二项分布包含一个离散的随机变量。通过使用二项式系数公式,可以直接计算二项式设置中的概率。虽然在理论上,这是一个简单的计算,但在实践中,计算二项式概率可能会变得相当繁琐,甚至在计算上不可能。这些问题可以通过使用正态分布来近似二项分布来回避。我们将通过计算的步骤来了解如何做到这一点。...

二项分布包含一个离散的随机变量。通过使用二项式系数公式,可以直接计算二项式设置中的概率。虽然在理论上,这是一个简单的计算,但在实践中,计算二项式概率可能会变得相当繁琐,甚至在计算上不可能。这些问题可以通过使用正态分布来近似二项分布来回避。我们将通过计算的步骤来了解如何做到这一点。

A histogram of a binomial distribution.

使用法线近似的步骤

首先,我们必须确定使用法线近似是否合适。并非每个二项分布都是相同的。有些显示出足够的偏度,我们无法使用法线近似。为了检查是否应该使用正态近似,我们需要查看p的值,p是成功的概率,n是我们的二项式变量的观察次数。

为了使用正态近似,我们考虑NP和N(1 -p)。如果这两个数字都大于或等于10,那么我们就有理由使用法线近似。这是一般的经验法则,通常np和n(1-p)的值越大,近似值越好。

二项式与正态的比较

我们将比较精确的二项式概率和通过正态近似得到的概率。我们考虑抛掷20个硬币,并想知道五个硬币或更少的头的概率。如果X是头的数量,那么我们要找到值:

P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4)+P(X=5)。

对这六个概率中的每一个使用二项式公式表明,概率为2.0695%。现在,我们将看到法线近似值与该值的接近程度。

检查条件,我们看到np和np(1-p)都等于10。这表明我们可以在这种情况下使用法线近似。我们将使用平均值为np=20(0.5)=10且标准偏差为(20(0.5)(0.5))0.5=2.236的正态分布。

为了确定X小于或等于5的概率,我们需要在我们使用的正态分布中找到5的z分数。因此z=(5-10)/2.236=-2.236。通过查阅z分数表,我们发现z小于或等于-2.236的概率为1.267%。这与实际概率不同,但在0.8%以内。

连续性校正系数

为了改进我们的估计,引入连续性校正因子是合适的。这是因为正态分布是连续的,而二项式分布是离散的。对于二项随机变量,X=5的概率直方图将包括一个从4.5到5.5的条形图,并以5为中心。

这意味着对于上述示例,二项变量X小于或等于5的概率应通过连续正态变量X小于或等于5.5的概率进行估计。因此z=(5.5-10)/2.236=-2.013。z

  • 发表于 2021-10-08 08:06
  • 阅读 ( 988 )
  • 分类:数学

你可能感兴趣的文章

二项式(binomial)和正态分布(normal distribution)的区别

...个离散的随机变量;因此,二项分布也是离散的。   The distribution is denoted as X ~B(n,p) where n is the number of experiments and p is the probability of success. According to probability theory, we can deduce that B(n,p) follows the probability mass function . From this equati...

  • 发布于 2020-10-24 22:11
  • 阅读 ( 1995 )

均匀分布

什么是均匀分布(uniform distribution)? 在统计学中,均匀分布指的是一种概率分布,其中所有结果的可能性相等。一副牌里面有均匀的分布,因为画一颗心、一根棍子、一颗钻石或一把黑桃的可能性是相同的。一枚硬币也有一个均...

  • 发布于 2021-05-30 18:53
  • 阅读 ( 236 )

离散分布

什么是离散分布(discrete distribution)? 离散分布是一种概率分布,描述了离散(个别可数)结果的发生,如1,2,3。。。或者零对一。例如,二项式分布是一种离散分布,它评估在给定次数的试验中出现“是”或“否”结果的概率...

  • 发布于 2021-05-31 21:52
  • 阅读 ( 426 )

使用普通股概率分布方法

...本文中,我们将介绍几种最流行的概率分布,并向您展示如何计算它们。 根据概率密度函数(PDF)和累积分布,分布可以分为离散分布和连续分布。 离散分布与连续分布 离散是指从一组有限的可能结果中抽取的随机变量。...

  • 发布于 2021-06-02 23:46
  • 阅读 ( 419 )

对称分布

什么是对称分布(symmetrical distribution)? 当变量的值以规则频率出现,并且通常平均值、中值和模态都出现在同一点时,就会出现对称分布。如果在图形的中间画一条线,它会显示出相互镜像的两面。 在图形形式中,对称分布可...

  • 发布于 2021-06-04 09:29
  • 阅读 ( 456 )

t分布定义

什么是a t分布(a t distribution)? T分布,又称学生T分布,是一种概率分布,与正态分布相似,呈钟形,但尾部较重。与正态分布相比,T分布出现极值的几率更大,因此尾部更肥。 关键要点 当估计的标准差用于分母而不是真正...

  • 发布于 2021-06-04 21:23
  • 阅读 ( 412 )

概率分布

什么是概率分布(a probability distribution)? 概率分布是一个统计函数,它描述了一个随机变量在给定范围内所能获得的所有可能值和可能性。该范围将限定在最小和最大可能值之间,但概率分布上可能绘制的可能值的精确位置取决...

  • 发布于 2021-06-09 07:49
  • 阅读 ( 181 )

如何计算二项式概率(calculate binomial probability)

...努利试验。现在,让我们来看看求二项式概率的方法。 如何求二项式概率 如果X是n(有**)独立伯努利试验的成功次数,成功概率为p,那么实验中X成功的概率为, nCx称为二项式系数。 X被称为参数p和n的二元分布,通常用符号B...

  • 发布于 2021-06-27 00:17
  • 阅读 ( 468 )

z-检验(z-test)和p值(p-value)的区别

...个假设。A key idea here is that the values in the middle of the normal distribution (Z scores like 0.19 or -1.2, for example), represent the expected outcome 结论P值和Z检验是两种不同目的的统计检验。如果零假设为真,P值围绕观察或实验结果相同或极端的概率...

  • 发布于 2021-07-09 14:44
  • 阅读 ( 2184 )

如何对分布的峰度进行分类(classify the kurtosis of distributions)

数据分布和概率分布的形状不尽相同。有些是不对称的,向左或向右倾斜。其他分布为双峰分布,有两个峰值。讨论分布时要考虑的另一个特征是最左侧和最右侧分布尾部的形状。峰度是分布尾部厚度或重量的度量。分布的峰...

  • 发布于 2021-09-23 21:01
  • 阅读 ( 286 )
刭肮喊枪
刭肮喊枪

0 篇文章

相关推荐