中位数vs平均值(平均值)
中位数和平均数是描述性统计中集中趋势的量度。通常算术平均数被认为是一组观测值的平均值。因此,这里的平均数被认为是平均数。然而,平均数并不是算术平均数。
平均
算术平均数是数据值的总和除以数据值的个数,即。
If the data is from a sample space it is called a sample mean (), which is a descriptive statistic of the sample. Although it is the most commonly used descriptive measure for a sample, it is not a robust statistic. It is very sensitive to the outliers and oscillati***.
例如,考虑一个特定城市市民的平均收入。由于所有的数据值都被相加,然后再除以,一个非常富有的人的收入会显著影响平均值。因此,平均值并不总是很好地表示数据。
另外,在交流信号的情况下,通过元件的电流周期性地从正方向变化到负方向,反之亦然。如果我们取单个周期内通过元件的平均电流,它将给出0,这意味着没有电流通过元件,这显然是不正确的。因此,在这种情况下,算术平均数也不是一个好的衡量标准。
当数据分布均匀时,算术平均值是一个很好的指标。对于正态分布,平均值等于模态和中值。当考虑均方根误差时,它的残差最小;因此,当需要用单个数字表示数据集时,它是最好的描述性度量。
中值的
将所有数据值按升序排列后的中间数据点的值定义为数据集的中间值。
•如果观测值(数据点)的数量为奇数,则中值为位于有序列表中间的观测值。
•如果观测值(数据点)为偶数,则中值为有序列表中两个中间观测值的平均值。
中值将观察结果分为两组,即一组(50%)的值高于中值,另一组(50%)的值低于中值。中位数专门用于偏态分布,并且比算术平均值更能代表数据。
中位数vs平均值(平均值)
•平均值和中值都是中心趋势的度量指标,并总结数据。平均值与数据点的位置无关,但中值是用位置计算的。
•平均值受异常值的严重影响,而中位数不受影响。
•因此,在高度偏态分布的情况下,中位数比平均值更好。