两种人口比例差异的假设检验

在本文中，我们将通过必要的步骤对两个总体比例的差异进行假设检验或显著性检验。这使我们能够比较两个未知的比例，并推断它们是否彼此不相等，或者一个比另一个大。...

在本文中，我们将通过必要的步骤对两个总体比例的差异进行假设检验或显著性检验。这使我们能够比较两个未知的比例，并推断它们是否彼此不相等，或者一个比另一个大。

Test statistic for comparing two population proportions

假设检验概述和背景

在我们讨论假设检验的细节之前，我们先来看一下假设检验的框架。在显著性检验中，我们试图证明关于总体参数值（有时是总体本身的性质）的陈述可能是正确的。

我们通过统计样本为这一说法收集证据。我们从这个样本中计算出一个统计量。这个统计数据的值就是我们用来确定原始陈述的真实性的值。这个过程包含不确定性，但是我们能够量化这种不确定性

假设检验的总体过程如下表所示：

确保满足测试所需的条件。
明确说明无效假设和替代假设。替代假设可能涉及单侧或双侧检验。我们还应该确定重要性的级别，这将由希腊字母alpha表示。
计算检验统计量。我们使用的统计类型取决于我们正在进行的特定测试。计算依赖于我们的统计样本。
计算p值。测试统计数据可以转换为p值。p值是在假设无效假设为真的情况下，概率单独产生检验统计值的概率。总的规律是p值越小，反对无效假设的证据就越多。
得出结论最后，我们使用已经选择的alpha值作为阈值。决策规则是，如果p值小于或等于alpha，则我们拒绝无效假设。否则，我们无法拒绝无效假设。

现在我们已经看到了假设检验的框架，我们将看到两个人口比例差异的假设检验的细节。

条件

两个总体比例差异的假设检验要求满足以下条件：

我们有两个来自大群体的简单随机样本。这里的“大”意味着群体至少是样本大小的20倍。样本量用n1和n2表示。
我们样本中的个体是独立选择的，群体本身也必须是独立的。
在我们的两个样本中，至少有10个成功案例和10个失败案例。

只要满足这些条件，我们就可以继续进行假设检验。

无效假设和替代假设

现在我们需要考虑假设来检验我们的重要性。无效假设是我们对无效的陈述。在这种特殊类型的假设检验中，我们的无效假设是两种人口比例之间没有差异。我们可以把它写成H0:p1=p2。

备选假设是三种可能性之一，取决于我们测试的具体情况：

Ha:p1大于p2。这是一个单尾或单侧测试。
Ha:p1小于p2。这也是片面的检验。
Ha:p1不等于p2。这是一个双尾或双侧测试。

一如既往，为了谨慎起见，如果我们在获得样本之前没有明确的方向，我们应该使用双边替代假设。这样做的原因是用双边检验很难拒绝无效假设。

这三个假设可以通过说明p1-p2与零值的关系来重写。更具体地说，无效假设将变成H0:p1-p2=0。潜在的替代假设将写成：

Ha:p1-p2>0相当于语句“p1大于p2”
Ha:p1-p2<0相当于语句“p1小于p2”
Ha:p1-p2≠ 0相当于语句“p1不等于p2”

这个等价的公式实际上向我们展示了更多的幕后发生的事情。我们在这个假设检验中所做的是将两个参数p1和p2转化为单个参数p1-p2。然后，我们根据值0测试这个新参数。

检验统计量

上图给出了测试统计的公式。对每个术语的解释如下：

来自第一个群体的样本大小为n1。该样本的成功数量（在上面的公式中没有直接看到）为k1。
第二个群体的样本大小为n2。该样本的成功数量为k2。
样本比例为p1 hat=k1/n1和p2 hat=k2/n2。
然后，我们结合或汇集这两个样本的成功结果，得到：p-hat=（k1+k2）/（n1+n2）。

与往常一样，在计算时要注意操作顺序。在求平方根之前，必须先计算根式下面的所有内容。

p值

下一步是计算与我们的测试统计数据对应的p值。我们使用标准正态分布进行统计，并查阅数值表或使用统计软件。

我们p值计算的细节取决于我们使用的替代假设：

对于Ha:p1-p2>0，我们计算大于Z的正态分布的比例。
对于Ha:p1-p2<0，我们计算小于Z的正态分布的比例。
房委会：p1-p2≠ 0，我们计算大于| Z |的正态分布的比例，即Z的绝对值。在此之后，为了说明我们有一个双尾检验，我们将比例加倍。

决策规则

现在我们决定是拒绝零假设（从而接受替代方案），还是拒绝零假设。我们通过将p值与显著性水平α进行比较来做出此决定。

如果p值小于或等于alpha，则我们拒绝零假设。这意味着我们有一个统计上显著的结果，我们将接受另一种假设。
如果p值大于alpha，则我们无法拒绝无效假设。这并不能证明零假设是正确的。相反，这意味着我们没有获得足够令人信服的证据来否定无效假设。

特别说明

两个总体比例差异的置信区间并不汇集成功案例，而假设检验确实如此。原因是我们的无效假设假设p1-p2=0。置信区间并不假设这一点。一些统计学家没有将这一假设检验的成功结果汇总起来，而是使用了上述检验统计量的稍加修改的版本。

发表于 2021-10-07 02:38
阅读 ( 280 )
分类：数学

你可能感兴趣的文章

t检验

...能是无意义的随机差异。 t分布表 T分布表有单尾和双尾两种格式。前者用于评估具有明确方向（正或负）的固定值或范围的案例。例如，当掷一对骰子时，输出值保持在-3以下或超过7的概率是多少？后者用于范围界限分析，例...

发布于 2021-06-04 13:19
阅读 ( 250 )

参数化(parametric)和非参数(nonparametric)的区别

...门称为参数统计的科学分支进行分析。参数统计假设关于人口的一些信息是已知的，即概率分布。作为一个例子，身高在整个世界上的分布是用正态分布模型来描述的。与此类似，任何已知的分布模型都可以应用于一组数据。然...

发布于 2021-06-25 05:34
阅读 ( 435 )

t检验(t-test)和z-检验(z-test)的区别

...正态分布的单变量检验。t检验与z检验的主要区别虽然这两种统计方法通常用于数据分析，但它们在应用、公式结构和假设等方面存在很大差异。以下是假设的t检验和z检验之间的主要区别。分配类型t检验和z检验都使用分布来比...

发布于 2021-07-07 03:27
阅读 ( 1630 )

t检验(t-test)和线性回归(linear regression)的区别

...个数据集的平均值与已知平均值进行比较）。线性回归有两种类型，即简单线性回归（包括一个依赖变量和一个独立变量）和多个线性回归（由一个受依赖变量和两个或两个以上独立变量组成）。实际应用T检验可用于测试两种...

发布于 2021-07-09 15:30
阅读 ( 2254 )

t检验(t-test)和p值(p-value)的区别

...设和结论占上风。在所有的检验和结果中，t检验和p值是两种最令人困惑的假设方法。而这两者是在同一个统计子集中发现的，并提供了进一步的假设度量，同时又是相互关联的。这两个测试不一样！测试(ttest) vs. P值(pvalue)T检验...

发布于 2021-07-09 15:46
阅读 ( 2169 )

配对t检验(paired t-test)和非配对t检验(unpaired t-test)的区别

...t意义配对T检验，也称为重复样本T检验，确定同一受试者两种均值之间的区别。非配对T检验，也称为独立T检验或学生T检验，用于确定不同/不相关受试者的两组平均数。方差齐性配对T检验两组均值的方差不相等。在非配对T检验...

发布于 2021-07-09 20:14
阅读 ( 3173 )

什么是t检验定义、计算、公式和示例(t-test? | definition, calculation, formula and examples)

...据测试导体检查特定方向差异的意图，T测试可分为以下两种类型。单尾T检验：用来检验一个总体平均数是否小于或大于另一个总体平均数。双尾T检验：用于判断两组数据之间是否存在差异。推荐口头交流(oral communication)和公开...

发布于 2021-07-10 09:20
阅读 ( 632 )

参数化(parametric)和非参数(nonparametric)的区别

...独立变量。同样地，统计学家使用各种类型的检验，其中两种是参数检验和非参数检验。这些是在统计应用的广阔世界中使用的不同统计程序的极其广泛的分类。参数化(parametric) vs. 非参数(nonparametric)这两个检验的不同之处在于...

发布于 2021-07-11 01:50
阅读 ( 511 )

t检验(t-test)和方差分析(anova)的区别

...计信息总是一个漫长而累人的过程。t检验和方差分析是两种最常用的测量方法。t检验用于检验两个中心或两种方式是否接近或不同。当看到至少三个中间产物或平均值时，方差分析是有利的。另一个工具被使用，这就是为什么...

发布于 2021-07-11 13:12
阅读 ( 808 )

科学方法词汇

...的值称为“级别” 推断统计学：应用统计学（数学）从人口中的代表性样本推断人口特征。内部效度：当一个实验能够准确地确定自变量是否产生影响时。平均值：将所有分数相加，然后除以分数数计算得出的平均值。无效...

发布于 2021-09-06 21:52
阅读 ( 131 )