偏离(deviation)和标准差(standard deviation)的区别

偏差与标准偏差

在描述性和推断统计学中，用几个指标来描述一个数据集，它对应于它的中心趋势、分散性和偏斜性。在统计推断中，这些通常被称为估计量，因为它们估计总体参数值。

分散度是数据集中心周围数据分布的度量。标准差是最常用的离散度度量之一。在计算标准差时，应考虑每个数据点与平均值的偏差。因此，人们可以争辩说，标准差和平均值将提供关于数据集的几乎足够的图像。

考虑以下数据集。10个人的体重（千克）被测量为70、62、65、72、80、70、63、72、77和79。那么十个人的平均体重（公斤）是71（公斤）。

什么是偏差？

在统计学中，偏差是指单个数据点与固定值（如平均值）的差异量。一般来说，k是一个固定值，x1，x2，…，xn表示一个数据集。然后，将xj与k的偏差定义为（xj–k）。

例如，在上述数据集中，与平均值的偏差分别为（70–71）=-1，（62–71）=-9，（65–71）=-6，（72–71）=1，（80–71）=9，（70–71）=1，（63–71）=8，（72–71）=1，（77–71）=6和（79–71）=8。

什么是标准差？

当所有人口的数据都可以考虑在内时（例如在人口普查的情况下），就可以计算出人口的标准差。为了计算总体的标准差，首先计算数据值与总体平均值的偏差。偏差的均方根（二次平均值）称为总体标准差。在符号中，S=＝{{（2）/n}，其中席是人口平均数，n是人口规模。

当样本（大小为n）的数据用于估计总体参数时，计算样本标准差。首先计算数据值与样本均值的偏差。由于使用样本平均值代替总体平均值（未知），所以采用二次平均值是不合适的。为了补偿样本平均值的使用，将偏差平方和除以（n-1），而不是n。样本标准偏差是其平方根。在数学符号中，S＝{{（2）（n-1）}，其中S是样本标准偏差，即样本均值和席席是数据点。

在前面的数据集中，偏差平方和为（-1）2+（-9）2+（-6）2+12+92+（-1）2+（-8）2+12+62+82=366。因此，总体标准差为√（366/10）=6.05（千克）。（假设所考虑的人口是由10个人组成的，他们是从他们那里获得数据的）。

偏差和标准偏差有什么区别？•标准差是一种统计指标和估计量，但偏差不是。