什么是内部和外部围栏?(inner and outer fences?)

数据集的一个重要特征是确定它是否包含任何异常值。异常值在我们的数据集中被直观地认为是与大多数其他数据有很大差异的值。当然,对异常值的这种理解是不明确的。要被视为异常值,该值与其余数据的偏差应该有多大?一位研究人员所说的离群值会与另一位研究人员的离群值相匹配吗?为了给异常值的确定提供一些一致性和定量度量,我们使用了内部和外部围栏。...

数据集的一个重要特征是确定它是否包含任何异常值。异常值在我们的数据集中被直观地认为是与大多数其他数据有很大差异的值。当然,对异常值的这种理解是不明确的。要被视为异常值,该值与其余数据的偏差应该有多大?一位研究人员所说的离群值会与另一位研究人员的离群值相匹配吗?为了给异常值的确定提供一些一致性和定量度量,我们使用了内部和外部围栏。

Boxplot with outliers

为了找出一组数据的内部和外部界限,我们首先需要一些其他描述性统计数据。我们将从计算四分位数开始。这将导致四分位范围。最后,有了这些计算,我们将能够确定内部和外部围栏。

四分位

第一和第三个四分位数是任何定量数据集的五位数汇总的一部分。在所有值按升序列出后,我们首先查找数据的中值或中间点。这些值小于大约一半数据对应的中值。我们找到这一半数据集的中位数,这是第一个四分位数。

以类似的方式,我们现在考虑数据集的上半部分。如果我们找到这一半数据的中位数,那么我们就得到了第三个四分位数。这些四分位数之所以得名,是因为它们将数据集分成四个大小相等的部分,即四分之一。换句话说,大约25%的数据值小于第一个四分位数。同样,大约75%的数据值小于第三个四分位数。

四分位区间

接下来我们需要找到四分位范围(IQR)。这比第一个四分位数q1和第三个四分位数q3更容易计算。我们需要做的就是求这两个四分位数的差。这给了我们一个公式:

IQR=Q3-Q1

IQR告诉我们数据集的中间部分是如何分布的。

找到里面的栅栏

我们现在可以找到里面的栅栏了。我们从IQR开始,将这个数字乘以1.5。然后我们从第一个四分位数中减去这个数字。我们还将此数字添加到第三个四分位数。这两个数字构成了我们的内部围墙。

找到外面的篱笆

对于外部围栏,我们从IQR开始,将这个数字乘以3。然后我们从第一个四分位数中减去这个数字,然后把它加到第三个四分位数。这两个数字是我们的外部围墙。

异常值检测

异常值的检测现在变得很容易,就像根据内部和外部界限确定数据值所在的位置一样。如果一个数据值比任何一个外部界限都更极端,那么这就是一个异常值,有时也被称为强异常值。如果我们的数据值介于相应的内部和外部界限之间,则该值为可疑异常值或轻度异常值。我们将通过下面的示例来了解它的工作原理。

例子

假设我们计算了数据的第一个四分位数和第三个四分位数,发现这些值分别为50和60。四分位间距IQR=60–50=10。接下来,我们看到1.5xIQR=15。这意味着内部围栏的位置为50–15=35和60+15=75。这比第一个四分位数小1.5倍IQR,比第三个四分位数大。

我们现在计算3x10=30。外部围栏的IQR比第一和第三个四分位数高出3倍。这意味着外部围栏为50-30=20和60+30=90。

任何小于20或大于90的数据值都被视为异常值。任何介于29和35之间或75和90之间的数据值都是可疑的异常值。

  • 发表于 2021-09-24 12:25
  • 阅读 ( 410 )
  • 分类:数学

你可能感兴趣的文章

内球面(inner sphere)和外球面机构(outer sphere mechanism)的区别

...制发生在两个不同物种之间。 目录 1. 概述和主要区别 2. 什么是内外球机制 3. 什么是外球面机构 4. 并列比较-表格式的内球面与外球面机构 5. 摘要 什么是内球面机构(inner sphere mechani**)? 内球面机制是配位配合物中最常见的电子...

  • 发布于 2020-10-13 12:35
  • 阅读 ( 742 )

内部的(inner)和外球面机构(outer sphere mechanism)的区别

...配位络合物的氧化还原反应。 目录 1. 概述和主要区别 2. 什么是内球面机构 3. 什么是外球面机构 4. 并排比较-表格形式的内部和外部球体机构 5. 摘要 什么是内球面机构(inner sphere mechani**)? 电子转移的内球机制是通过氧化剂和还...

  • 发布于 2020-10-16 20:41
  • 阅读 ( 544 )

内部的(inner)和外毛细胞(outer hair cells)的区别

...型,即内毛细胞和外毛细胞。 目录 1. 概述和主要区别 2. 什么是内毛细胞 3. 什么是外毛细胞 4. 内外毛细胞的相似性 5. 并排比较-表格式的内部和外部毛细胞 6. 摘要 什么是内毛细胞(inner hair cells)? 内毛细胞是听觉系统内耳的一...

  • 发布于 2020-10-18 02:45
  • 阅读 ( 559 )

四个关于习惯的常见神话,被揭穿

...无数名人的建议。但就像生活中的大多数事情一样,没有什么神奇的窍门适合每个人。如果你翻阅tl80的档案,你会发现无数有助于养成习惯的技巧,其中有关于这些技巧如何发挥作用的例子和轶事证据。但策略并不是万能的。...

  • 发布于 2021-05-18 20:03
  • 阅读 ( 229 )

参加(join)和内部连接(inner join)的区别

...nd establish whether they differ in their functionalities or performances. 什么是“加入”数据库? “Join”语法能够从两个或多个数据库或数据库表中检索匹配的列。数据库总是可视化为表,它们是以列和行的形式保存数据的实际单个单元。每...

  • 发布于 2021-06-24 03:08
  • 阅读 ( 220 )

内部的(inner)和外行星(outer planets)的区别

...小时(一天的时间周期是与地球上标准的24小时日相比。)内部行星绕太阳运行的时间较少,而遥远的行星需要更多的时间,因为它们必须覆盖更多的地面。例如,木星需要164个地球年才能完成一个轨道! 摘要 内部行星是那些离...

  • 发布于 2021-06-24 16:25
  • 阅读 ( 469 )

内部的(inner)和外行星(outer planets)的区别

...星温度高。本文主要讨论太阳系内外行星之间的差异。 什么是内行星(the inner planets)? 正如“内行星”一词所暗示的,内行星是离太阳最近的行星。内行星也被称为类地行星,主要由岩石和金属组成。与外行星相比,它们的体积...

  • 发布于 2021-06-27 20:02
  • 阅读 ( 358 )

内部的(inner)和外眶复合体(outer orbital complexes)的区别

...原子轨道杂化涉及最外层壳层d轨道。 覆盖的关键领域 1.什么是内轨道复合体-定义,结构解释2。什么是外眼眶复合体-定义,结构解释3。内眼眶复合体和外眼眶复合体的区别是什么-主要区别的比较 关键词:配位共价键,配位络...

  • 发布于 2021-06-29 13:10
  • 阅读 ( 255 )

内部的(inner)和外毛细胞(outer hair cells)的区别

...说,人类的外毛细胞比内毛细胞多。 覆盖的关键领域 1.什么是内毛细胞-定义、事实、功能2.什么是外毛细胞-定义、事实、功能3.内毛细胞和外毛细胞之间的相似性-共同特征概述4.内毛细胞和外毛细胞之间的差异-主要差异比较 关...

  • 发布于 2021-06-30 17:14
  • 阅读 ( 330 )

内芯(inner core)和地核(outer core of the earth)的区别

...ore of the earth) 既然我们掌握了事实,地球的内核和外核有什么区别?地球的内核是由铁、镍和其他金属组成的实心球,而外核则是由铁和镍组成的液态金属。内核的温度估计约为5400摄氏度或9800华氏度,远远超过铁的熔点。内核...

  • 发布于 2021-07-03 05:48
  • 阅读 ( 383 )
Qiao488148051
Qiao488148051

0 篇文章

相关推荐