如何用统计数字欺骗自己和他人

滥用统计数据是最有效的撒谎方法之一。通常情况下,我们会教你如何避免误解统计数据,但知道数字是如何被操纵的可以帮助你发现什么时候发生的。为此,我们将向你展示如何让数据说出你到底想说什么来支持你的任何错误想法。...

滥用统计数据是最有效的撒谎方法之一。通常情况下,我们会教你如何避免误解统计数据,但知道数字是如何**纵的可以帮助你发现什么时候发生的。为此,我们将向你展示如何让数据说出你到底想说什么来支持你的任何错误想法。

这篇文章是我们在tl80的邪恶周系列的一部分,在这里我们看到了完成事情的阴暗面。有时邪恶是正当的,有时,知道邪恶意味着知道如何打败它。想要更多吗?查看我们的邪恶周标签页。

收集对你的发现有偏见的样本数据

构建统计数据的第一步是确定要分析的内容。统计学家称之为“人口”。然后定义数据的一个子集来收集数据,在分析时,这些数据应该代表整个人口。样本越大、越准确,你的结论就越准确。

当然,也有一些大的方法来破坏这种统计抽样,要么是偶然的,要么是故意的。如果你收集的样本数据不好,不管怎样,你最终都会得出错误的结论。有很多方法可以让你的数据一团糟,但这里有几个重要的方法:

  • 自我选择偏差:当你所研究的人或数据自愿地将自己放入一个不代表你全部人口的群体时,就会出现这种偏差。例如,当我们问读者“你最喜欢的短信应用是什么?”这样的问题时,我们只会得到那些选择阅读tl80的人的回答。像这样一个非正式的民意调查结果很可能不能代表整个人群,因为我们所有的读者都比普通人更聪明、更有趣、更具吸引力。
  • 便利抽样:当一项研究分析任何可用的数据,而不是试图寻找有代表性的数据时,就会出现这种偏差。例如,有线电视新闻网可能会对其观众进行政治候选人的民意调查。如果不对看其他电视网(或根本不看电视)的人进行投票,就不可能说投票结果代表了现实。
  • 无反应偏差:当所选人群中的一些人对统计调查没有反应,导致答案发生变化时,就会发生这种情况。例如,如果一项关于***的调查问到“你曾经欺骗过你的配偶吗?”有些人可能不想承认不忠,让人觉得出轨比现在更罕见。
  • 开放访问投票:这种投票允许任何人提交答案,在许多情况下,甚至不验证人们只提交一次答案。虽然很常见,但它们基本上是有偏见的,因为它们不试图以任何有意义的方式控制输入。例如,在线民意测验只要求你点击你的首选选项就属于这种偏见。虽然它们很有趣,也很有用,但它们不善于客观地证明一个观点。

这些只是一个样本可能会有偏见的许多方法中的一部分。如果你想**一个误导性的印象,那就选你的毒药吧。例如,网站上的开放式民调可以用来“证明”你最喜欢的候选人在辩论中获胜,或者说“谎言”是有史以来最好的游戏。抽样偏见的美妙之处在于,有人在某地进行一项不科学的民意测验,你想说什么就说什么。所以只要在谷歌上搜索,直到你找到一个你喜欢的不科学的民意测验,或者创建你自己的。

选择支持您想法的分析

Anscombe’s quartet shows four different charts that have nearly the exact same statistical summaries.

因为统计数据使用数字,所以很容易假设它们是他们声称支持的观点的有力证据。在现实中,统计背后的数学是复杂的,如果分析不当,可能会得出不同甚至完全矛盾的结论。如果你想扭曲一个统计数据来满足你的需要,那就捏造数学。

为了证明分析数据的缺陷,统计学家弗朗西斯·安斯科姆创作了安斯科姆的四重奏(上图)。它由四个图表组成,当在图表上查看时,它们显示出截然不同的趋势。X1图表显示了一个基本散点图,呈上升趋势。X2显示出一个曲线趋势,该趋势正在上升,但现在正在下降。X3向上的趋势较小,但Y轴上有一个异常值。X4显示的数据在X轴上非常平坦,除了一个在两个轴上都非常高的异常值。

这就是它变得疯狂的地方。对于所有四个图表,以下陈述都是正确的:

  • 每个数据集的平均x值为9
  • 每个数据集的平均y值为7.50
  • x的方差是11,y的方差是4.12
  • 对于每个数据集,x和y之间的相关性为0.816

如果您只看到文本形式的数据,您可能会认为这四种情况都是相同的。例如,假设你有一个像X1这样的图表,显示了你公司多年来**的工资,像X2这样的图表显示了同一公司同一时间**的工资。如果你只显示文本,你会看到他们的平均工资是一样的!然而,如果你展示这些图表,人们会发现**的工资由于某种原因呈下降趋势。

Anscombe建议,为了避免误导人们,你应该在得出结论之前将数据形象化,并意识到异常值是如何影响分析的。在正确绘制的图表上很难漏掉一个异常值,但它们会对文本产生巨大而无形的影响。当然,如果你的目标是误导别人,你可以跳过这一步。

**只强调你预先设想的结论的图表

大多数人没有时间做他们自己的统计分析,所以他们依赖于你给他们看总结你的结论的图表。如果你正确地创建图表,他们应该提出符合现实的想法。如果你想把它们搞砸,你可以强调你最喜欢的数据。

在最近的记忆中,一个最著名的,可笑的不准确的图表来自一位国会议员在一次关于计划生育的会议上。在这次会议上,犹他州众议员贾森·查菲茨(Jason Chaffetz)试图辩称,人民党的堕胎服务自2006年以来有所上升,而同期的癌症服务则有所下降。这是他用来证明这一点的图表:

This is one of the worst chart I’ve ever seen. And it was presented to the House Oversight Committee.

乍一看,堕胎率飙升,而癌症服务却大幅下降。我们可以感谢这张图表中的几个缺陷得出了这一结论:

  • Y轴上没有标签。虽然较低的X轴被标记多年,但Y轴根本没有标签。有多少程序?花在手术上的钱有多少?谁知道呢!你不必这么做。
  • Y轴刻度都错了。除了标签不正确外,Y轴的刻度也都是错误的。红线的最终数据点是327000,这在图表上比红线935573的最终数据点要高出很多。从技术上讲,每一条线都是朝着正确的方向发展的,但是缩放比例是各种各样的错误。
  • 它缺乏背景。这些数据点(例如它们)只表明发生了什么,而不是为什么会发生。例如,2009年,美国预防服务特别工作组更新了每两年进行一次**X光检查的建议,而不是以前每年进行一次。这可能是癌症筛查减少的原因。

大多数图表并不是那么明显的错误,但它是一个很好的例子,说明了如何通过简单地忽略图表中的几个关键元素来误导。新闻网站Quartz展示了这张图表如果表现得当的话会是什么样子(注:2008年的数据没有提供,因此从图表中缺失):

This is much more accurate. If you’re into that sort of thing.

在这个规模上,堕胎手术的上升相对平稳,而癌症筛查却有所下降。然而,由于显示了个别数据点,我们可以看到,正如我们预测的那样,下降始于2009年左右。这就是如何在适当的上下文中准确地呈现信息!所以,如果你想误导别人,你所需要做的只是一点图表的捏造。去掉你的标签,稍微操纵一下轴,你也可以欺骗别人,让他们认为你比你有更好的观点。

不惜一切代价掩盖你的消息来源

越容易看到你的消息来源,其他人就越容易证实或反驳你的结论。如果你的结论能被证实,那么就尽一切办法让人们看到你的数据以及你是如何做到这一点的。然而,如果你的目标是误导别人,千万不要让任何人知道你是如何得出你的结论的。

对于正确的来源,每一个提到一段数据的人都会包括对来源的引用。新闻网站应该链接到他们引用的研究(而不是关于研究的文章)。研究人员可能不会展示他们的整个数据集,但研究的来源应该回答一些基本问题:

  • 数据是如何收集的?你给别人打电话了吗?在商场外面拦住他们?是推特民意测验吗?你用来收集数据的方法可能指向(或反驳)抽样偏差。
  • 什么时候收集的数据?你是什么时候收集数据的?收集数据花了多长时间?报告很快就会过时,趋势也会随着时间的推移而改变。包括数据来源的时间框架可以说明很多关于你得出的结论。
  • 谁收集的数据?收集数据的个人或团体可能会提供有关数据可信度的提示。烟草公司一项声称香烟是安全的研究可能不正确,除非有人能证实。
  • 有人问谁?特别是在调查和民意测验领域,知道谁被询问是很重要的。如果一个政客只调查那些已经对他们友好的人,他们就不会得到代表整个人口的数据。

采购不仅仅是用来避免偏见,而是给别人机会来验证你的说法。它会让你的数据、方法和结论受到批评。它让其他人试图在你的想法上戳洞。如果你的结论经不起批评,那么它们就会分崩离析。最准确的统计数据是其他人能看到并用自己的研究证实的数据。然而,如果你的目标是误导你自己或其他人,不要费心分享来源。事实上,你最好的辩护就是说“查查!”然后走开。没有人能反驳这一点。

Angelica Alzona的插图。Wikimedia Comm***、美国人联合生活和Quartz提供的照片。

  • 发表于 2021-05-16 17:29
  • 阅读 ( 110 )
  • 分类:互联网

你可能感兴趣的文章

比尔·盖茨如何用两个屏幕管理电子邮件

想想互联网在过去十年里发生了多大的变化。快速响应的网页设计。Wi-Fi无处不在。生产力从桌面应用向网络应用转变。整个网络在我们的口袋里不假思索地传播着。 ...

  • 发布于 2021-03-14 14:44
  • 阅读 ( 274 )

如何用宏自动化google工作表中的重复任务

录制任务,保存该任务,然后随时运行该任务。 ...

  • 发布于 2021-03-24 23:19
  • 阅读 ( 292 )

如何用pin锁定netflix个人资料

Netflix最终允许您使用PIN保护配置文件。如果你有孩子使用你的帐户,这特别有用。您可以用PIN锁定您的**档案,确保儿童只能使用自己的个人资料。 要找到这些选项,请访问Netflix网站,将鼠标移到屏幕右上角的个人资料图标上...

  • 发布于 2021-04-02 09:35
  • 阅读 ( 148 )

如何用智能手机数字化旧照片

我们都有对自己很重要的老照片。假期,不再和我们在一起的家庭成员,我们生活中的美好时光,你知道,重要的事情。问题是,照片会褪色。保护这些珍贵记忆的最好方法是将它们数字化,而曾经漫长的过程现在可以直接从...

  • 发布于 2021-04-08 10:13
  • 阅读 ( 149 )

如何用pin码锁定你的巢穴恒温器

...调节家里的温度,但如果你不想让别人乱来,下面介绍如何用密码锁定Nest恒温器。 相关:如何安装和设置巢温控器 就像你的智能**一样,你很可能需要启用密码,这样其他人就无法访问你的应用程序和其他信息。诚然,不是其...

  • 发布于 2021-04-09 18:16
  • 阅读 ( 123 )

如何用这些有用的应用程序和网站管理你的个人财务

控制你每月的财务状况(没有双关语的意思)并不像听起来那么容易。每个月的账单都不一样,最糟糕的时候会突然出现意外开支,而且随着季节的推移,杂货店的账单似乎越来越大,向你的**或桌面寻求一些帮助并不是那么荒...

  • 发布于 2021-04-10 09:29
  • 阅读 ( 166 )

黑客如何用假文件扩展名伪装恶意程序

文件扩展名可能是伪造的——扩展名为.mp3的文件实际上可能是一个可执行程序。黑客可以通过滥用一个特殊的Unicode字符来伪造文件扩展名,迫使文本以相反的顺序显示。 Windows默认情况下还隐藏文件扩展名,这是新手用户受骗...

  • 发布于 2021-04-12 05:03
  • 阅读 ( 165 )

如何用一个大谎言毁掉一段潜在的美好关系

你有问题,我有建议。这个建议其实不是糖衣,它是无糖的,甚至可能有点苦。欢迎来到艰苦的爱。本周我们有一个女人,她在网上约会时撒的谎很快就从她身边消失了。请记住,我不是一个治疗师或任何其他类型的健康专业人...

  • 发布于 2021-05-15 18:38
  • 阅读 ( 133 )

本周最受欢迎的帖子:10月21日至28日

...喜你!你已经有很多新客户准备好听你的演讲了。如何用统计数字欺骗自己和他人滥用统计数据是最有效的撒谎方法之一。通常情况下,我们会教你如何避免误解统计数据,但知道数字是如何**纵的可以帮助你发现什么时候发生...

  • 发布于 2021-05-16 17:09
  • 阅读 ( 131 )

如何用智能手机拍摄精彩视频

我们都用智能**拍摄视频,但我们大多数人并不想拍下一部奥斯卡最佳影片。我们只是想捕捉对我们来说很重要的时刻,或者我们认为能引起他人共鸣的镜头。 你可以做很多小事情来确保你用智能**拍摄的视频是值得一...

  • 发布于 2021-05-29 05:29
  • 阅读 ( 161 )
ourb3118374
ourb3118374

0 篇文章

相关推荐