什么是马尔可夫链?5个漂亮的真实世界使用

马尔可夫链是一种简单的算法,在现实世界中有很多用途——你可能一直在从中受益,却没有意识到这一点!...

你可能听过“马尔可夫链”这个词,但除非你上过几门概率论或计算机科学算法的课,否则你可能不知道它们是什么,它们是如何工作的,以及它们为什么如此重要。

markov-chains

马尔可夫链的概念是一个“隐藏”的概念,这意味着你不需要知道它们是什么才能从中受益。不过,了解它们的工作原理肯定会让您受益匪浅。它们很简单,但在很多方面都很有用。

所以这里有一个速成课程——你需要知道的关于马尔可夫链的一切都浓缩成一篇简单易懂的文章。如果你想更深入的研究,可以尝试可汗学院的免费信息理论课程(也可以考虑其他在线课程网站)。

马尔可夫链101

假设你想预测明天的天气。一个真正的预测——专家气象学家所做的那种预测——将涉及数百个,甚至数千个不断变化的不同变量。天气系统极其复杂,无法建模,至少对你我这样的外行来说是如此。但是我们可以用概率估计来简化这个问题。

想象一下你有30年的气象数据。你从头开始,注意到第一天是晴天。你继续,注意到第2天也是晴天,但第3天是多云的,然后第4天是下雨的,第5天是雷雨,第6天是晴天和晴朗的天空。

理想情况下,你会更精细,选择一小时一小时的分析,而不是一天一天的分析,但这只是一个例子来说明这个概念,所以请容忍我!

你在整个30年的数据集上做这个(这将仅仅是11000天)并且根据今天的天气来计算明天天气的概率。例如,如果今天是晴天,那么:

  • 有百分之五十的可能明天又是晴天。
  • 明天多云的可能性是30%。
  • 明天下雨的可能性有20%。

现在对所有可能的天气条件重复这个步骤。如果今天多云,明天晴、雨、雾、雷、雹、龙卷风等的可能性有多大?很快,你就有了一个完整的概率系统,不仅可以用来预测明天的天气,还可以预测第二天的天气和第二天的天气。

过渡国家

这就是马尔可夫链的本质。您有单独的状态(在本例中为天气条件),其中每个状态可以转换为其他状态(例如,晴天可以转换为阴天),并且这些转换基于概率。如果你想预测一周内的天气情况,你可以研究未来七天的各种可能性,看看哪些可能性最大。因此,一个马尔可夫“链”。

马尔科夫是谁?他是一位俄罗斯数学家,他提出了一个国家根据一定的概率直接通向另一个国家的整个想法,在这个概率中,没有其他因素影响过渡的机会。基本上,他发明了马尔可夫链,因此得名。

马尔可夫链在现实世界中的应用

有了这些解释,让我们来探索一些现实世界中的应用程序。你可能会惊讶地发现,你一直在利用马尔可夫链,而不知道它!

名称生成

你曾经参与过桌面游戏,MMORPG游戏,甚至小说创作吗?你可能会为你的角色命名而苦恼(至少在某一点上如此)——当你似乎想不出一个你喜欢的名字时,你可能会求助于一个在线名字生成器。

你有没有想过那些名字生成器是怎么工作的?事实证明,他们中的许多人使用马尔可夫链,使其成为最常用的解决方案之一。(当然,还有其他算法也同样有效!)

你所需要的只是一个信件的集合,其中每个信件都有一个潜在的后续信件的列表。例如,字母“M”有60%的几率指向字母“a”,40%的几率指向字母“I”。对一大堆其他字母这样做,然后运行算法。砰,你的名字很有道理!(不管怎样,大多数时候。)

谷歌pagerank

马尔可夫链理论的一个有趣的含义是,随着链的长度增加(即状态转换的数量增加),你到达某个状态的概率收敛于一个固定的数字,这个概率与你在系统中的起始位置无关。

当你把整个万维网看作一个马尔可夫系统,其中每个网页都是一个状态,网页之间的链接是带有概率的转换时,这是非常有趣的。这个定理基本上是说,不管你从哪个网页开始,你登陆某个网页的概率X是固定的,假设一个“长时间”的浏览。

markov-chain-example-google-pagerank

这是谷歌对网页排名的基础。实际上,PageRank算法是Markov链算法的一种改进形式。

到达某个网页的“固定概率”越高,其页面排名就越高。这是因为一个更高的固定概率意味着这个网页有很多来自其他网页的链接——谷歌假设如果一个网页有很多链接,那么它一定是有价值的。传入的链接越多,就越有价值。

当然,这比那更复杂,但这是有道理的。为什么一个网站像关于.com在搜索结果页面上获得更高的优先级?因为事实证明,用户在网上冲浪时往往会到达那里。很有趣,不是吗?

打字词预测

移动电话已经有了几十年的预测输入法,但是你能猜出这些预测是怎么产生的吗?无论您使用的是Android(可选键盘选项)还是iOS(可选键盘选项),您选择的应用程序都很有可能使用马尔可夫链。

这就是为什么键盘应用程序会询问是否可以收集你打字习惯的数据。例如,在Google键盘中,有一个名为Share snippets的设置,它要求“共享您在Google应用程序中键入的内容和方式的片段,以改进Google键盘”。从本质上说,你的话是分析和纳入应用程序的马尔可夫链概率。

这也是为什么键盘应用程序通常会提供三个或更多的选项,通常按最可能到最不可能的顺序排列。它不能确定你下一步要键入什么,但它通常是正确的。

子reddit模拟

如果您从未使用过Reddit,我们建议您至少检查一下这个名为/r/subredditimulator的迷人实验。

简单地说,subredditsimulator接收Reddit众多社区的大量评论和标题,然后逐字分析每个句子的构成。使用这些数据,它生成单词到单词的概率——然后使用这些概率从头开始生成标题和评论。

markov-chain-example-subreddit-simulator

这个实验的一个有趣的层次是,评论和标题是按数据来源的社区分类的,因此/r/food的数据集生成的评论和标题的种类与/r/soccer的数据集生成的评论和标题有很大的不同。

其中最有趣的——或者说最令人不安的——是,生成的评论和标题常常与实际用户的评论和标题无法区分。它绝对迷人。

你知道马尔可夫链还有什么很酷的用途吗?还有什么问题需要回答吗?请在下面的评论中告诉我们!

  • 发表于 2021-03-17 07:59
  • 阅读 ( 191 )
  • 分类:IT

你可能感兴趣的文章

马尔科夫尼科夫(markovnikov)和反马尔可夫规则(anti-markovnikov rule)的区别

...则之间的关键区别解释如下。 目录 1. 概述和主要区别 2. 什么是马尔科夫规则 3. 什么是反马尔科夫规则 4. 并列比较——表格式中的马尔科夫规则与反马尔可夫规则 5. 摘要 什么是马尔科夫尼科夫法则(markovnikov rule)? Markovnikov规...

  • 发布于 2020-10-19 18:59
  • 阅读 ( 534 )

埃博拉病毒(ebola)和马尔堡(marburg)的区别

...毒和马尔堡病毒的主要区别。 目录 1. 概述和主要区别 2. 什么是埃博拉 3. 什么是马尔堡 4. 埃博拉和马尔堡的相似之处 5. 并列比较-埃博拉与马尔堡的表格形式 6. 摘要 什么是埃博拉病毒(ebola)? 埃博拉病毒是一种逆转录病毒,具...

  • 发布于 2020-10-20 12:41
  • 阅读 ( 231 )

10集黑镜会让你的脑袋乱七八糟

...的一个原因,因为正如阿甘所说,你永远不知道你会得到什么。 ...

  • 发布于 2021-03-11 17:58
  • 阅读 ( 225 )

看看这个像你一样发推特的推特机器人

... 据推测,这个机器人的模拟是使用马尔可夫链来完成的,马尔可夫链是用来驱动Reddit上同样搞笑的Subreddit模拟器实验的相同算法。 ...

  • 发布于 2021-03-16 21:49
  • 阅读 ( 184 )

以下是2018年5月netflix的来龙去脉

嘿,你这个月在Netflix上看了什么?他们丢了什么新头衔?你看到冷山了吗?也许是致命的快棒?现在有一个维恩图,只有两个圆。以下是5月份Netflix将推出的新电视剧、电影和独立特辑。亮点5月1日,发明奇思妙想的电影《阿梅...

  • 发布于 2021-05-15 02:57
  • 阅读 ( 201 )

马尔可夫(markovnikov)和反马尔可夫规则(anti markovnikov rule)的区别

...况可以使用Markovnikov规则来解释。Markovnikov法则解释了为什么某个原子或一个基团附着在某个碳原子上,而不是同一分子中的任何其他碳原子。反马尔科夫尼科夫规则解释了马尔科夫尼科夫规则的相反情况。Markovnikov规则与反Markov...

  • 发布于 2021-06-29 13:43
  • 阅读 ( 320 )

区域化学(regiochemistry)和立体化学(stereochemistry)的区别

...描述的是分子的原子排列及其操纵。 覆盖的关键领域 1.什么是区域化学-定义,马尔可夫规则和反马尔可夫规则2.什么是立体化学-定义,立体异构体,几何异构体,光学异构体,手性3.区域化学和立体化学之间的区别是什么-关键...

  • 发布于 2021-06-30 09:41
  • 阅读 ( 475 )

dna聚合酶1(dna polymerase 1)和dna聚合酶3(dna polymerase 3)的区别

... 3'-5'和5'-3'核酸外切酶活性 只有3'-5'核酸外切酶活性。 什么是dna聚合酶1(dna polymerase 1)? 它是在人类DNA中发现的一种酶,有助于DNA复制过程。最初,它被称为DNA聚合酶,因为它是第一种,但后来在同一类别的其他类型的发现后...

  • 发布于 2021-07-08 13:23
  • 阅读 ( 87 )

世界上最漂亮的溺水者马尔克斯

哥伦比亚作家加布里埃尔·加西亚·马尔克斯(1927-2014)是20世纪最重要的文学人物之一。1982年诺贝尔文学奖获得者,他最著名的作品是他的小说,尤其是《百年孤独》(1967)。 他的短篇小说《世界上最漂亮的溺水者》将平...

  • 发布于 2021-09-02 19:01
  • 阅读 ( 258 )

第二次世界大战:乔治·朱可夫元帅

乔治·朱可夫元帅(1896年12月1日至1974年6月18日)是二战中最重要、最成功的俄国将军。他负责莫斯科、斯大林格勒和列宁格勒成功防御德国军队,并最终将他们推回德国。他领导了对柏林的最后一次进攻,战后他非常受欢迎,...

  • 发布于 2021-09-05 10:55
  • 阅读 ( 195 )
nvubsythr
nvubsythr

0 篇文章

相关推荐