偏差与标准偏差
偏差与标准偏差
在描述性和推断统计学中,用几个指标来描述一个数据集,它对应于它的中心趋势、分散性和偏斜性。在统计推断中,这些通常被称为估计量,因为它们估计总体参数值。
分散度是数据集中心周围数据分布的度量。标准差是最常用的离散度度量之一。在计算标准差时,应考虑每个数据点与平均值的偏差。因此,人们可以争辩说,标准差和平均值将提供关于数据集的几乎足够的图像。
考虑以下数据集。10个人的体重(千克)被测量为70、62、65、72、80、70、63、72、77和79。那么十个人的平均体重(公斤)是71(公斤)。
什么是偏差?
在统计学中,偏差是指单个数据点与固定值(如平均值)的差异量。一般来说,k是一个固定值,x1,x2,…,xn表示一个数据集。然后,将xj与k的偏差定义为(xj–k)。
例如,在上述数据集中,与平均值的偏差分别为(70–71)=-1,(62–71)=-9,(65–71)=-6,(72–71)=1,(80–71)=9,(70–71)=1,(63–71)=8,(72–71)=1,(77–71)=6和(79–71)=8。
什么是标准差?
当所有人口的数据都可以考虑在内时(例如在人口普查的情况下),就可以计算出人口的标准差。为了计算总体的标准差,首先计算数据值与总体平均值的偏差。偏差的均方根(二次平均值)称为总体标准差。在符号中,S=={{(2)/n},其中席是人口平均数,n是人口规模。
当样本(大小为n)的数据用于估计总体参数时,计算样本标准差。首先计算数据值与样本均值的偏差。由于使用样本平均值代替总体平均值(未知),所以采用二次平均值是不合适的。为了补偿样本平均值的使用,将偏差平方和除以(n-1),而不是n。样本标准偏差是其平方根。在数学符号中,S={{(2)(n-1)},其中S是样本标准偏差,即样本均值和席席是数据点。
在前面的数据集中,偏差平方和为(-1)2+(-9)2+(-6)2+12+92+(-1)2+(-8)2+12+62+82=366。因此,总体标准差为√(366/10)=6.05(千克)。(假设所考虑的人口是由10个人组成的,他们是从他们那里获得数据的)。
偏差和标准偏差有什么区别?•标准差是一种统计指标和估计量,但偏差不是。 |