统计学中的概率分布

如果你花很多时间处理统计数据,很快你就会遇到“概率分布”这个短语。在这里,我们真正看到概率和统计数据有多少重叠。虽然这听起来可能有点技术性,但“概率分布”这个短语实际上只是一种谈论组织概率列表的方式。概率分布是为随机变量的每个值分配概率的函数或规则。在某些情况下,可能会列出分布情况。在其他情况下,它以图形的形式显示。...

如果你花很多时间处理统计数据,很快你就会遇到“概率分布”这个短语。在这里,我们真正看到概率和统计数据有多少重叠。虽然这听起来可能有点技术性,但“概率分布”这个短语实际上只是一种谈论组织概率列表的方式。概率分布是为随机变量的每个值分配概率的函数或规则。在某些情况下,可能会列出分布情况。在其他情况下,它以图形的形式显示。

Probability distribution for sum of two dice

实例

假设我们掷两个骰子,然后记录骰子的总数。从2到12的总和是可能的。每个总和都有特定的发生概率。我们可以简单地列出如下:

  • 2之和的概率为1/36
  • 3之和的概率为2/36
  • 4之和的概率为3/36
  • 5之和的概率为4/36
  • 6之和的概率为5/36
  • 7之和的概率为6/36
  • 8之和的概率为5/36
  • 9之和的概率为4/36
  • 10之和的概率为3/36
  • 11之和的概率为2/36
  • 12之和的概率为1/36

此列表是掷两个骰子的概率实验的概率分布。我们也可以将上述看作是通过观察两个骰子之和定义的随机变量的概率分布。

图表

概率分布可以用图表表示,有时这有助于向我们展示分布的特征,而这些特征仅仅通过阅读概率列表是不明显的。随机变量沿x轴绘制,相应的概率沿y轴绘制。对于离散随机变量,我们将有一个直方图。对于连续随机变量,我们将有一条平滑曲线的内部。

概率法则仍然有效,它们以几种方式表现出来。由于概率大于或等于零,概率分布图必须具有非负的y坐标。概率的另一个特征,即一个是事件概率的最大值,以另一种方式显示。

面积=概率

概率分布图是以区域表示概率的方式构造的。对于离散概率分布,我们实际上只是计算矩形的面积。在上图中,对应于四、五和六的三个条的面积对应于我们的骰子总和为四、五或六的概率。所有钢筋的面积加起来总共是一个。

在标准正态分布或钟形曲线中,我们有类似的情况。两个z值之间曲线下的面积对应于我们的变量落在这两个值之间的概率。例如,-1 z的钟形曲线下的面积。

重要分布

实际上有无限多的概率分布。下面列出了一些更重要的发行版:

  • 二项式分布–给出了一系列具有两种结果的独立实验的成功次数
  • 卡方分布-用于确定观测数量与拟议模型的拟合程度
  • F分布–用于方差分析(ANOVA)
  • 正态分布——称为钟形曲线,在整个统计中都可以找到。
  • 学生t分布-用于正态分布的小样本

  • 发表于 2021-10-09 19:27
  • 阅读 ( 263 )
  • 分类:数学

你可能感兴趣的文章

均匀分布

什么是均匀分布(uniform distribution)? 在统计学中,均匀分布指的是一种概率分布,其中所有结果的可能性相等。一副牌里面有均匀的分布,因为画一颗心、一根棍子、一颗钻石或一把黑桃的可能性是相同的。一枚硬币也有一个均...

  • 发布于 2021-05-30 18:53
  • 阅读 ( 234 )

钟形曲线

... 尽管钟形曲线是一个非常有用的统计概念,但它在金融中的应用可能会受到限制,因为金融现象(如预期的股市回报率)并不完全符合正态分布。因此,在预测这些事件时过于依赖钟形曲线会导致不可靠的结果。尽管大多数分...

  • 发布于 2021-05-31 12:50
  • 阅读 ( 461 )

离散分布

...中出现“是”或“否”结果的概率,给定事件在每次试验中的概率,例如掷硬币一百次,结果为“头”。 统计分布可以是离散的,也可以是连续的。一个连续分布是建立在一个连续的结果,如所有大于0的数字(这将包括小数...

  • 发布于 2021-05-31 21:52
  • 阅读 ( 423 )

泊松分布

什么是泊松分布(a poisson distribution)? 在统计学中,泊松分布是一种概率分布,它可以用来显示事件在指定时间段内可能发生多少次. 换句话说,它是一个计数分布。泊松分布通常用于理解在给定时间间隔内以恒定速率发生的独...

  • 发布于 2021-06-03 22:25
  • 阅读 ( 196 )

概率分布

...次数的试验中发生几次的概率,以及给定事件在每个试验中的概率。这可能是通过记录一个篮球运动员在一场比赛中罚球的次数而产生的,其中1=一个篮筐,0=一次失误。另一个典型的例子是使用一枚公平的硬币,并计算出该硬...

  • 发布于 2021-06-09 07:49
  • 阅读 ( 177 )

经验法则

... = 97.5% 常见问题 什么是经验法则(the empirical rule)? 在统计学中,经验法则指出99.7%的数据出现在正态分布的平均值的三个标准差之内。为此,68%的观测数据将出现在第一个标准差内,95%将出现在第二个标准差内,97.5%将出现...

  • 发布于 2021-06-09 16:43
  • 阅读 ( 767 )

参数化(parametric)和非参数(nonparametric)的区别

...     什么是非参数检验(a nonparametric test)? 与参数检验和统计学类似,非参数检验和统计学也是存在的。当获得的数据不符合正态分布曲线或序数数据时,使用它们。序数数据的一个很好的例子是,当你对某一产品或服务进行1...

  • 发布于 2021-06-25 05:34
  • 阅读 ( 433 )

分散(dispersion)和偏斜(skewness)的区别

...了解项目之间的差异或在平均水平附近的差异。为了理解统计学中定量分析的非常详细的概念,我们使用了离散度和偏度的度量。离散度是中心位置周围分布范围的度量,而偏度是统计分布不对称性的度量。 什么是分散(dispersi...

  • 发布于 2021-06-25 15:08
  • 阅读 ( 527 )

如何计算二项式概率(calculate binomial probability)

二项式分布是概率论和统计学中离散随机变量的基本概率分布之一。它之所以得名,是因为它的二项式系数涉及到每一个概率计算。它在每个配置的可能组合数中占权重。 考虑一个统计实验,每个事件有两种可能性(成...

  • 发布于 2021-06-27 00:17
  • 阅读 ( 465 )

z-检验(z-test)和p值(p-value)的区别

...到的结果是相同的或极端的,那么P值就说明了这一点。统计学中的Z检验是一种工具,用于确定即使变量已知,两个总体平均数是否会发生变化。它是在零假设下的一种假设检验,可以用正态分布来近似。统计学中的假设检验是...

  • 发布于 2021-07-09 14:44
  • 阅读 ( 2182 )
ux808546
ux808546

0 篇文章

相关推荐