计算相关系数

在看散点图时,有很多问题要问。最常见的问题之一是想知道直线与数据的近似程度。为了帮助回答这个问题,有一个描述性统计称为相关系数。我们将看到如何计算这个统计数据。...

在看散点图时,有很多问题要问。最常见的问题之一是想知道直线与数据的近似程度。为了帮助回答这个问题,有一个描述性统计称为相关系数。我们将看到如何计算这个统计数据。

Graphs showing positive, negative, and no correlation Graphs showing positive, negative, and no correlation

相关系数

用r表示的相关系数告诉我们散点图中的数据沿直线下降的程度。r的绝对值越接近1,数据就越适合用线性方程来描述。如果r=1或r=-1,则数据集完全对齐。r值接近零的数据集几乎没有直线关系。

由于计算时间较长,最好使用计算器或统计软件计算r。然而,当你的计算器在计算的时候,了解它在做什么总是值得的。下面是一个主要通过手工计算相关系数的过程,其中计算器用于常规算术步骤。

计算r的步骤

我们将首先列出计算相关系数的步骤。我们正在处理的数据是成对的数据,每对数据都用(xi,yi)表示。

  1. 我们从一些初步计算开始。这些计算的量将用于我们计算R的后续步骤:计算X席,即数据XI的所有第一坐标的平均值。计算数据的所有第二坐标的平均值。计算S X数据席的所有第一坐标的样本标准偏差。计算数据yI的所有第二坐标的样本标准偏差。
  2. 使用公式(ZX)i=(Xi-X)/S X,并计算每个席席的标准化值。
  3. 使用公式(zy)i=(yi–ȳ)/s y并计算每个yi的标准值。
  4. 乘以相应的标准值:(zx)i(zy)i
  5. 将上一步的产品添加到一起。
  6. 将上一步的总和除以n–1,其中n是配对数据集中的点数总和。所有这些的结果就是相关系数r。

这个过程并不难,每个步骤都相当常规,但所有这些步骤的收集都相当复杂。标准偏差的计算本身就已经够繁琐的了。但相关系数的计算不仅涉及两个标准差,还涉及许多其他操作。

一个例子

为了确切地了解r的值是如何得到的,我们看一个例子。同样,需要注意的是,对于实际应用,我们希望使用计算器或统计软件为我们计算r。

我们从配对数据列表开始:(1,1)、(2,3)、(4,5)、(5,7)。x值的平均值,1、2、4和5的平均值是x̄=3。我们还有ȳ=4。计算结果的标准偏差

x值为sx=1.83,sy=2.58。下表总结了r所需的其他计算。最右边一列中的乘积之和为2.969848。因为总共有四个点,4–1=3,我们将乘积之和除以3。这给了我们一个相关系数r=2.969848/3=0.989949。

相关系数计算示例表

x Y zx zY zxZY
1. 1. -1.09544503 -1.161894958 1.272792057
2. 3. -0.547722515 -0.387298319 0.212132009
4. 5. 0.547722515 0.387298319 0.212132009
5. 7. 1.09544503 1.161894958 1.272792057

  • 发表于 2021-10-19 19:37
  • 阅读 ( 288 )
  • 分类:数学

你可能感兴趣的文章

如何用excel求相关系数

最简单和最常见的统计Excel计算之一是相关性。这是一个简单的统计数据,但当你想知道两个变量是否相关时,它可以提供很多信息。如果你知道正确的命令,在Excel中找到相关系数是非常容易的。 ...

  • 发布于 2021-03-11 16:27
  • 阅读 ( 569 )

贝塔系数如何衡量股票的市场风险?

...易所买卖基金 被设计成有负beta。 β系数 贝塔系数的计算方法是将股票收益率与市场收益率的协方差除以市场方差。资本资产定价模型(CAPM)的计算采用贝塔系数。此模型计算资产的所需回报与其风险。按无风险利率加上风...

  • 发布于 2021-06-06 03:11
  • 阅读 ( 203 )

如何在excel中计算beta

...同的结果,因为在估计它的变化,如不同的时间跨度用于计算数据。 microsoftexcel是一个快速组织数据和计算beta的工具。 低贝塔股票的波动性比高贝塔股票低,在动荡时期提供了更多的保护。 1:23 如何在Excel中计算Beta? ...

  • 发布于 2021-06-11 17:07
  • 阅读 ( 792 )

贝塔如何衡量系统风险

...敞口。 如果你想知道你的投资组合的系统风险,你可以计算它的贝塔系数。贝塔有效地描述了一种证券的回报活动,因为它回应了市场的波动。证券的贝塔系数是用证券收益率和市场收益率的协方差的乘积除以指定时期内市场...

  • 发布于 2021-06-19 23:07
  • 阅读 ( 354 )

相关性之间的差异(differences between correlation)和回归(regression)的区别

...英寸也不是磅,只是一个数字。 回归方程采用以下公式计算; y对x的回归方程(求y的估计)为y-y′=byx(x-x‾),byx称为y对x的回归系数。x对y的回归方程(求x的估计)为x–x′=bxy(y-y‾),bxy称为x对y的回归系数。 相关分析不...

  • 发布于 2021-06-24 15:38
  • 阅读 ( 608 )

什么是统计中的相关性?(correlation in statistics?)

...长度。从臂长的角度考虑手臂长度可能是有意义的,并且计算诸如平均值或标准偏差之类的东西。但是,如果研究人员好奇地想知道这两个测量值之间是否有关系呢?仅仅看手臂和腿是不够的。相反,古生物学家应该对每个骨骼...

  • 发布于 2021-09-08 10:41
  • 阅读 ( 322 )

回归线斜率与相关系数

...。 回归线斜率a的公式为: a=r(sy/sx) 标准偏差的计算包括取非负数的正平方根。因此,斜率公式中的两个标准偏差必须为非负。如果我们假设我们的数据中存在一些变化,我们将能够忽略这些标准偏差为零的可能性。因...

  • 发布于 2021-09-23 22:53
  • 阅读 ( 588 )

计算相关系数

...问题,有一个描述性统计称为相关系数。我们将看到如何计算这个统计数据。 相关系数 用r表示的相关系数告诉我们散点图中的数据沿直线下降的程度。r的绝对值越接近1,数据就越适合用线性方程来描述。如果r=1或r=-1,则...

  • 发布于 2021-10-19 19:37
  • 阅读 ( 288 )

什么是决定系数?(a coefficient of determination?)

... 确定系数是相关系数平方的数学计算。相关系数是对模型精度的计算。这些术语在统计分析中被用来解释合理的计算。 ...

  • 发布于 2022-02-05 08:11
  • 阅读 ( 199 )

什么是金钱因素?(a money factor?)

... 货币系数是一个计算与租赁相关的利息费用的数字;它通常是一个很长的十进制数。一些消费者误认为这是他们将要支付的年利率。将货币系数乘以2400(以十进制形式表示)将其转换为...

  • 发布于 2022-02-06 14:05
  • 阅读 ( 71 )