平均值,中位数(mean, median)和模式(mode)的区别

平均数、中位数和模式是描述性统计中用来衡量集中趋势的主要指标。它们完全不同,用于汇总数据的情况也不同。...

平均值vs中值vs模式

平均数、中位数和模式是描述性统计中用来衡量集中趋势的主要指标。它们完全不同,用于汇总数据的情况也不同。

中庸

算术平均数是数据值的总和除以数据值的个数,即。

 

If the data is from a sample space it is called a sample mean (), which is a descriptive statistic of the sample. Although it is the most commonly used descriptive measure for a sample, it is not a robust statistic. It is very sensitive to the outliers and oscillati***.

例如,考虑一个特定城市市民的平均收入。由于所有的数据值都被相加,然后再除以,一个非常富有的人的收入会显著影响平均值。因此,平均值并不总是很好地表示数据。

另外,在交流信号的情况下,通过元件的电流周期性地从正方向变化到负方向,反之亦然。如果我们取单个周期内通过元件的平均电流,它将给出0,这意味着没有电流通过元件,这显然是不正确的。因此,在这种情况下,算术平均是不好的。

当数据分布均匀时,算术平均值是一个很好的指标。对于正态分布,平均值等于模态和中值。当考虑均方根误差时,它的残差最小;因此,当需要用单个数字表示数据集时,它是最好的描述性度量。

中值的

将所有数据值按升序排列后的中间数据点的值定义为数据集的中值。中位数是第2个四分位数、第5个十分位数和第50个百分位数。

•如果观测值(数据点)的数量为奇数,则中值为位于有序列表中间的观测值。

•如果观测值(数据点)为偶数,则中值为有序列表中两个中间观测值的平均值。

中值将观察结果分为两组,即一组(50%)的值高于中值,另一组(50%)的值低于中值。中位数专门用于偏态分布,并且比算术平均值更能代表数据。

模式

模态是一组观测值中出现最多的一个数。通过计算数据集中每个元素的频率来计算数据集的模式。

•如果没有值出现不止一次,则数据集没有模式。

•否则,以最大频率出现的任何值都是数据集的一种模式。

一个集合中可以存在多个模式;因此,模式不是数据集的唯一统计信息。在均匀分布中,有一种模式。离散概率分布的模式是概率质量函数达到其最高点的点。从上述解释来看,我们可以说,全局极大值是模式。

考虑对以下数据集应用所有三个度量。

数据:{1,1,2,3,5,5,5,5,6,8,8,9,9,9,9,10,10,10,14,14,15,15,15}

平均值=(1+1+2+3+5+5+5+5+6+6+8+8+9+9+9+9+10+10+10+14+14+15+15+15)/25=8.12

中值=9(第13个元素)

模式=9(频率9=5)

平均值、中位数和模态有什么区别?

•算术平均值是值(观测值)除以观测值数量的总和。它不是一个稳健的统计,并且严重依赖于所考虑的分布中的正态分布性质。一个单独的离群值可能导致平均值的显著变化,给出相对误导的值。这个概念可以推广到几何平均、调和平均、加权平均等。

•中值是观测值集的中间值,受异常值的影响相对较小。作为高度倾斜情况下的汇总统计量,它可以给出一个很好的估计。

•模式是数据集中最常见的观测值。如果分布为正偏态,则模式位于中值左侧;如果为负偏态,则模式位于中值右侧。

•如果正偏差,则平均值位于中值右侧;如果负偏差,则平均值位于中值左侧。

•在正态分布中,平均值、模式和中位数均相等。

  • 发表于 2020-10-24 00:24
  • 阅读 ( 1505 )
  • 分类:科学

你可能感兴趣的文章

中值的(median)和平均值(average (mean))的区别

中位数vs平均值(平均值) 中位数和平均数是描述性统计中集中趋势的量度。通常算术平均数被认为是一组观测值的平均值。因此,这里的平均数被认为是平均数。然而,平均数并不是算术平均数。 平均 算术平均数是数据值...

  • 发布于 2020-11-03 10:03
  • 阅读 ( 504 )

意思是(mean)和中值的(median)的区别

平均值和中值之间的关键区别在于,平均值是数据集中的总值除以值的数目,而中值是数据集的中间值。 我们使用平均值和中值来检查数据的位置,因为它们给出了一个中心值的指示,一组值将围绕这个中心值**。检查数据...

  • 发布于 2020-11-06 17:19
  • 阅读 ( 865 )

偏斜

...和过度峰度一样,更能代表数据集的极值,而不是只关注平均值。 0:58 什么是偏斜? 理解偏度 除了正偏斜和负偏斜,分布也可以说有零或未定义的偏斜。在分布曲线中,曲线右侧的数据可能与左侧的数据不同。这些...

  • 发布于 2021-06-03 07:28
  • 阅读 ( 376 )

对称分布

...trical distribution)? 当变量的值以规则频率出现,并且通常平均值、中值和模态都出现在同一点时,就会出现对称分布。如果在图形的中间画一条线,它会显示出相互镜像的两面。 在图形形式中,对称分布可能表现为正态分布(...

  • 发布于 2021-06-04 09:29
  • 阅读 ( 459 )

意思是(mean)和中值的(median)的区别

平均值与中位数平均数和中位数之间的差别不仅仅是数学上的差别。讽刺的是,mean也可以用作数字Â 说话的声音!中位数,当作为一个技术术语使用时,被定义为一系列值中间的一个值,如年龄中位数或价格中位数。中线也可...

  • 发布于 2021-06-22 10:51
  • 阅读 ( 617 )

模式(mode)和中值的(median)的区别

...人们一直教导我们,分析调查的最简单方法是确定结果的平均值、模式和中位数。与其他研究分析过程相比,这些过程涉及的计算量最小,可以给出更快的结果。 然而,大多数学生发现很难理解三者之间的差异,尤其是模式和...

  • 发布于 2021-06-23 21:38
  • 阅读 ( 712 )

意思是(mean)和中值的(median)的区别

...一组统计分数的中心趋势方面具有某种相似的作用。虽然平均值传统上是衡量样本中点的常用方法,但它的缺点是,与样本的其他部分相比,任何单个值过高或过低都会影响平均值。这就是为什么中位数有时被认为是一个更好的...

  • 发布于 2021-07-04 16:14
  • 阅读 ( 1204 )

意思是(mean)和中值的(median)的区别

...心值或最中间值**的趋势。两个最常用的中心趋势指标是平均值和中位数。平均值定义为给定数据集的“中心”值,而中位数是给定数据集的“最中间”值。 一个理想的衡量中心趋势的方法是一个定义清晰,易于理解,易于计...

  • 发布于 2021-07-09 08:02
  • 阅读 ( 664 )

偏度和峰度的区别

...的钟形曲线,即两边相等,因此不倾斜。这里所有的三个平均值,中位数和模式都在一个点上。 偏度和峰度是描述统计学中研究的两个重要分布特征。为了进一步理解这两个概念,让我们看看下面的文章。 内容:偏斜(content: ske...

  • 发布于 2021-07-09 08:09
  • 阅读 ( 276 )

算术平均数(arithmetic mean)和几何序列(geometric sequence)的区别

...Geometric sequence定义算术平均数是给定序列中的数字集合的平均值。几何序列是两个连续项之比之差为常数的项集合。由它可以通过将数字集合的总和除以数字的总数来确定。它可以通过将常数乘以或除以上一个项来确定。形式这...

  • 发布于 2021-07-09 11:27
  • 阅读 ( 283 )
hulu0316
hulu0316

0 篇文章

相关推荐