参数化与非参数化
统计学是研究的一个分支,它使我们能够通过从某个感兴趣的群体中提取样本来了解种群动态。这些样品必须是随机的。许多公式是与数学结合起来建立起来的,用来推断人口参数。自然,任何总体都可能有一个“正态分布”,其中数据/样本的分散在频率图中呈钟形。在正态分布中,大多数样本集中在平均值附近,68%、95%、99%的数据分别在1、2和3个标准差内。参数统计和非参数统计取决于是否考虑正态分布。
什么是参数统计?
参数统计是指数据/样本被视为从正态分布中提取的统计。参数统计的定义是“假设数据来自某种概率分布,并对分布参数进行推断的统计”。大多数已知的基本统计方法都属于这一类。实际上,它们可能不是正态分布的。因此,这种统计类型基于更多的假设。如果数据/样本是正态分布或近似正态分布,则公式可以产生准确的结果和推论。然而,如果正态分布的假设是错误的,参数统计可能会产生很大的误导。
什么是非参数统计?
非参数统计也称为无分布统计。这种统计类型的优点是,它不必像以前那样对参数进行假设。非参数统计计算比平均值更关注中间值。因此,如果有一个或两个偏离平均值,则忽略它们的影响。一般来说,参数统计比这更可取,因为它比非参数方法更能拒绝错误假设。最著名的非参数检验之一是卡方检验。一些参数检验有非参数相似性,如配对样本T检验的Wilcoxon T检验、独立样本T检验的Mann-Whitney U检验、Pearson相关的Spearman相关等。对于单样本T检验,没有可比的非参数检验。
参数化和非参数化的区别是什么?
•参数统计依赖于正态分布,但非参数统计不依赖于正态分布。
•参数统计比非参数统计有更多的假设。
•与非参数统计相比,参数统计使用更简单的公式。
•当一个总体被认为是正态分布或接近正态分布时,最好使用参数统计。如果没有,最好使用非参数方法。