数据的正态分布是指大多数数据点相对相似,这意味着它们出现在一个较小的值范围内,在数据范围的高端和低端具有较少的异常值。
当数据呈正态分布时,将其绘制在图形上会产生钟形对称图像,通常称为钟形曲线。在这样的数据分布中,平均值、中值和模式都是相同的值,并且与曲线的峰值重合。
然而,在社会科学中,正态分布更多地是一种理论理想,而不是一种普遍的现实。信息技术作为审查数据的透镜的概念和应用是通过一个有用的工具来确定和可视化数据集中的规范和趋势。
正态分布最显著的特征之一是它的形状和完美的对称性。如果你把一个正态分布的图片正好放在中间,你会得到两个相等的两半,每个都是另一个的镜像。这也意味着数据中一半的观测值落在分布中间的两边。
正态分布的中点是具有最大频率的点,这意味着该变量具有最多观测值的数量或响应类别。正态分布的中点也是三个指标的落点:均值、中位数和模式。在完全正态分布中,这三个度量值都是相同的数。
在所有正态分布或近似正态分布中,当以标准偏差单位测量时,位于平均值和距平均值的任何给定距离之间的曲线下面积的比例是恒定的。例如,在所有正态曲线中,99.73%的病例在平均值的三个标准偏差范围内,95.45%的病例在平均值的两个标准偏差范围内,68.27%的病例在平均值的一个标准偏差范围内。
正态分布通常用标准分数或Z分数表示,这些数字告诉我们实际分数与标准偏差平均值之间的距离。标准正态分布的平均值为0.0,标准偏差为1.0。
尽管正态分布是理论上的,但研究人员研究的几个变量与正态曲线非常相似。例如,SAT、ACT和GRE等标准化考试分数通常类似于正态分布。特定人群的身高、运动能力以及众多的社会和政治态度也通常类似于钟形曲线。
当数据不是正态分布时,正态分布的理想值也可用作比较点。例如,大多数人认为美国家庭收入的分布是正态分布,并且在绘制图表时类似于钟形曲线。这意味着大多数美国公民的收入处于中等水平,或者说,有一个健康的中产阶级。与此同时,经济下层阶级的人数将很小,上层阶级的人数也将很小。然而,美国家庭收入的实际分布根本不像钟形曲线。大多数家庭都属于中低收入阶层,这意味着,与过着舒适中产阶级生活的人相比,有更多的穷人挣扎着生存。在这种情况下,理想的正态分布有助于说明收入不平等。
...高。这将使生产效率降到最低。 什么是分布式数据库(a distributed database)? A distributed database contains two or more database files located at different locati*** in the network. In other words, the database is split into multiple files. The users can access the nearest data...
...存在安全和隐私问题以及隔离失败。 什么是分布式计算(distributed computing)? 分布式计算是将单个任务划分为多个任务并将它们分布在多台计算机上的技术。这些计算机可以通过网络交换信息来进行通信和协调活动。分布式系统...
...些系统需要经常更新和维护。 什么是分布式操作系统(a distributed operating system)? 分布式操作系统包含多台计算机。这些设备通过共享网络相互通信。每个设备都是独立的,由自己的内存和CPU组成。数据处理任务分布在各个设备...
...。 捕食者很容易捕捉到个体。 什么是人口分布(population distribution)? 在一定程度上,分布人口比密集人口有几个优点。例如,中国的自然条件导致人口分布不均。 Figure 2: World Population Distribution 平均分布的人口有其自身的好处...
...指令,则该处理器可能会导致延迟。 什么是分布式计算(distributed computing)? 分布式计算在多台计算机之间划分单个任务。每台计算机都可以通过网络与其他计算机通信。所有的计算机一起工作来实现一个共同的目标。因此,它...
...库、分布式数据库、并行数据库 什么是分布式数据库(a distributed database)? 分布式数据库是在网络上分布多个节点的数据库。换言之,数据库文件可以跨网络位于不同的计算机中。因此,系统管理员可以在多个位置分配数据。通...
统计抽样在统计学中经常使用。在这个过程中,我们的目标是确定某个群体的某些方面。由于总体规模通常较大,我们通过选择具有预定规模的总体子集来形成统计样本。通过研究样本,我们可以使用推断统计来确定有关人口...
...用程序和用途。这些分布范围从熟悉的钟形曲线(也称为正态分布)到鲜为人知的分布,如伽马分布。大多数分布涉及复杂的密度曲线,但也有一些不涉及。最简单的密度曲线之一是均匀概率分布。 均匀分布的特征 均匀分...
数据的正态分布是指大多数数据点相对相似,这意味着它们出现在一个较小的值范围内,在数据范围的高端和低端具有较少的异常值。 当数据呈正态分布时,将其绘制在图形上会产生钟形对称图像,通常称为钟形曲线。在这...
在整个统计过程中使用了许多概率分布。例如,标准正态分布或钟形曲线可能是最广泛认可的。正态分布只是一种类型的分布。研究总体方差的一个非常有用的概率分布称为F分布。我们将研究这类分布的几个性质。 基本性...