方差与协方差
方差和协方差是统计学中使用的两种度量方法。方差是对数据分散性的度量,协方差表示两个随机变量的变化程度。方差是一个相当直观的概念,但协方差的定义在数学上并不那么直观。
关于方差的更多信息
方差是数据与分布平均值的离散度的度量。它显示数据点与分布平均值的距离。它是概率分布的主要描述符之一,也是分布的矩之一。另外,方差是总体的一个参数,样本的方差作为总体方差的估计量。从一个角度来看,它被定义为标准差的平方。
用通俗的语言,它可以描述为每个数据点之间距离的平方平均值和分布的平均值。以下公式用于计算方差。
Var(X)=E[(X-µ)2],用于总体,以及
Var(X)=E[(X-‾X)2]对于样本
可以进一步简化为Var(X)=E[X2]-(E[X])2。
方差有一些签名属性,通常用于统计学中,以使用法更简单。方差是非负的,因为它是距离的平方。然而,方差的范围不受限制,而且取决于特定的分布。常数随机变量的方差为零,且方差与位置参数无关。
关于协方差的更多信息
在统计理论中,协方差是两个随机变量一起变化的量度。换句话说,协方差是两个随机变量之间相关性强度的度量。同时,它也可以看作是两个随机变量方差概念的推广。
两个随机变量X和Y的协方差被称为σXY=E[(X-E[X])(Y-E[Y])。由此,方差可以看作是协方差的一个特例,其中两个变量是相同的。Cov(X,X)=变量(X)
通过归一化协方差,可以得到线性相关系数或皮尔逊相关系数,其定义为ρ=E[(X-E[X])(Y-E[Y])/(σXσY)=(Cov(X,Y))/(σXσY)
从图形上看,一对数据点之间的协方差可以看作是数据点位于相反顶点的矩形区域。它可以解释为两个数据点之间分离程度的度量。考虑到整个群体的矩形,与所有数据点对应的矩形的重叠可以被视为分离强度;两个变量的方差。协方差是二维的,因为有两个变量,但将其简化为一个变量,就可以将单个变量的方差作为一维的分离。
方差和协方差的区别是什么?
•方差是对总体中扩散/分散的度量,而协方差被视为两个随机变量的变化或相关性强度的度量。
•方差可以看作是协方差的一种特殊情况。