什么是5号小结?(the 5 number summary?)

有各种各样的描述性统计。诸如平均值、中位数、模式、偏度、峰度、标准差、第一个四分位数和第三个四分位数等数字,每一个数字都告诉我们一些关于数据的信息。与单独查看这些描述性统计数据不同,有时将它们结合起来有助于我们了解完整情况。考虑到这一点,五位数摘要是结合五种描述性统计数据的便捷方法。...

有各种各样的描述性统计。诸如平均值、中位数、模式、偏度、峰度、标准差、第一个四分位数和第三个四分位数等数字,每一个数字都告诉我们一些关于数据的信息。与单独查看这些描述性统计数据不同,有时将它们结合起来有助于我们了解完整情况。考虑到这一点,五位数摘要是结合五种描述性统计数据的便捷方法。

boxplot of 5 number summary

哪五个号码?

很明显,我们的总结中有五个数字,但哪五个呢?选择这些数字是为了帮助我们了解数据的中心,以及数据点的分布情况。考虑到这一点,五个数字的摘要包括以下内容:

  • 最小值–这是数据集中的最小值。
  • 第一个四分位数–该数字表示为Q1,我们25%的数据低于第一个四分位数。
  • 中位数–这是数据的中间点。50%的数据低于中位数。
  • 第三个四分位数–该数字表示为Q3,我们75%的数据低于第三个四分位数。
  • 最大值–这是数据集中的最大值。

平均值和标准偏差也可以一起用于传递一组数据的中心和分布。然而,这两种统计数据都容易受到异常值的影响。中位数、第一个四分位数和第三个四分位数不受异常值的严重影响。

一个例子

鉴于以下数据集,我们将报告五个数字的摘要:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

数据集中总共有20个点。因此,中位数是第十个和第十一个数据值的平均值,或者:

(7 + 8)/2 = 7.5.

数据下半部分的中位数是第一个四分位数。下半部分是:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

因此,我们计算Q1=(4+6)/2=5。

原始数据集上半部分的中位数是第三个四分位数。我们需要找到以下各项的中位数:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

因此,我们计算出q3=(15+15)/2=15。

我们将上述所有结果汇总在一起,并报告上述数据集的五位数汇总为1、5、7.5、12、20。

图形表示法

五个数字摘要可以相互比较。我们会发现,两组具有相似均值和标准差的数据集可能有非常不同的五个数字摘要。为了一眼就能轻松地比较两个五位数的摘要,我们可以使用箱线图或箱线图。

  • 发表于 2021-09-24 12:27
  • 阅读 ( 235 )
  • 分类:数学

你可能感兴趣的文章

变量(variables)和java中的数据字面值(data literals in java)的区别

...固定值的符号。 目录 1.概述和主要区别 2.Java中的变量是什么 3. Java中的数据字面值是什么 4. Java中变量与数据字面值的相似性 5. 并列比较——Java中的变量与数据文本的表格形式 6. 摘要 什么是java中的变量(variables in java)? 变量...

  • 发布于 2020-10-19 08:52
  • 阅读 ( 260 )

标识符(identifier)和变量(variable)的区别

...以保存值的内存位置的名称。 目录 1. 概述和主要区别 2. 什么是标识符 3. 什么是变量 4. 标识符与变量的相似性 5. 并列比较-标识符与变量的表格形式 6. 摘要 什么是标识符(an identifier)? 标识符是指变量、函数、数组、类或结构...

  • 发布于 2020-10-19 14:52
  • 阅读 ( 918 )

除数(divisor)和股息(dividend)的区别

... remainder. Let a, b (≠0) be two real numbers, then  if and only if   什么是除数? C***ider the number b dividing the number a, i.e. . The number a is divided by the number b. Since, number b is the number by which another number is divided, it is called the divisor – the doer of the d...

  • 发布于 2020-11-04 12:47
  • 阅读 ( 554 )

5 c编程技巧你必须学会入门

... 什么是c程序设计语言(the c programming language)? ...

  • 发布于 2021-03-21 10:02
  • 阅读 ( 284 )

如何读取杂货店产品上的标签代码

...标签上的PLU代码可以告诉你:Organic produce has a 5 digit PLU number that begins with the number 9.Conventional produce has a 4 digit PLU number that begins with the number 4.Genetically modified (GMO) produce has a 5 digit PLU number that begins with the number 8.博客“有机食品优...

  • 发布于 2021-05-25 23:04
  • 阅读 ( 118 )

原子序数(atomic number)和质量数(mass number)的区别

...子中质子的数量和中子的数量之和。 覆盖的关键领域 1.什么是原子序数-定义,举例说明2.什么是质量序数-定义,举例说明3.原子序数和质量序数的区别是什么-主要区别的比较 关键词:原子、原子数、电子、同位素、质量数、中...

  • 发布于 2021-06-29 13:48
  • 阅读 ( 805 )

实数(real number)和复数(complex number)的区别

关键区别:实数是一个数字,可以在数字行上取任意值。实数可以是任意一个有理数和非理性数。复数是以a+ib形式存在的数字,其中a和b表示实数,i表示虚部。 理解数线的概念对了解实数很重要。数字线可以表示为一条实际...

  • 发布于 2021-07-13 16:39
  • 阅读 ( 873 )

实数(real number)和整数(integer)的区别

关键区别:实数是一个可以在数列上取任何值的数。它可以是任意有理数和无理数。有理数是一个可以用分数表示但分母不为零的数。整数是不以分数形式出现的整数。整数可以是正的也可以是负的。 实数包括所有有理数和无...

  • 发布于 2021-07-13 16:47
  • 阅读 ( 403 )

小学年级作业iep数学目标

...数字。这些目标强调这些技能: When presented with a random number on a card from one to nine, Johnny Student will find the correct number of counters to add to the number to make 10, in eight out of nine attempts (89 percent) for three of four consecutive trials. When randomly gi...

  • 发布于 2021-09-02 17:56
  • 阅读 ( 193 )

什么是以10为基数的数字系统?(the base-10 number system?)

...曾经从0数到9,那么你使用的是10进制,甚至不知道它是什么。简单地说,基数10是我们给数字赋值的方式。它有时被称为十进制,因为数字中的数字值取决于它相对于小数点的位置。 10的力量 在以10为基数的情况下,数字的...

  • 发布于 2021-09-12 14:32
  • 阅读 ( 634 )