根據《今日科學》上發表的一項研究,兩人極限德州撲克終於解決了。科學家設計了一個名為Cepheus的電腦程式,其遊戲策略近乎完美,統計分析顯示,即使人類撲克玩家與電腦競爭了一輩子,也無法打敗它。這意味著,無論遊戲如何開始,電腦將贏得或收支平衡,從長遠來看-使它基本上是無敵的。
從長遠來看,這基本上是無敵的
阿爾伯塔大學電腦科學家、該研究的合著者邁克爾·保林說:“我們不是說,這是保證一手就能贏錢的。”我們所說的是,從長遠來看,如果你看所有可能發生的手,你平均所有這些,那麼計算機就不能以失敗的速度輸掉——它必須是收支平衡,要麼是贏。”
解決像撲克這樣的遊戲是一個巨大的計算成就(解決一個遊戲本質上意味著設計一個不能長時間丟失的程式。)簡單的遊戲,比如tic-tac-toe,很容易解決。大多數人最終掌握瞭如何贏得或畫一個遊戲的井字遊戲簡單地玩了幾次。但其他的遊戲要難得多。象棋和跳棋是複雜的,提供了成千上萬種可能的情況下,計算機必須作出反應。然而,即使是那些遊戲也沒有撲克那麼難解決,因為在撲克中,你沒有所有的資訊——你不知道你的對手拿著什麼牌。”完美的資訊遊戲,如國際象棋或跳棋,是所有你需要做決定的資訊都儲存在棋盤上的遊戲。但撲克不是這樣的;這是一場“不完美的資訊遊戲”,這使得制定戰略變得更加困難。
培訓階段涉及200臺計算機
這個程式的工作方式其實很簡單:在遊戲過程中,它所要做的就是搜尋預先計算好的遊戲場景的資料庫,在任何給定的時刻找到最佳的移動方式。然而,建立這個資料庫絕非易事。”艾伯塔大學的電腦科學家、這項研究的合著者邁克爾·約翰森解釋說:“我們在這個訓練階段,這個程式一開始就對自己進行統一隨機的比賽,這意味著“除了遵守遊戲規則之外,它根本不知道自己在做什麼。”。但隨著電腦的自我發揮,它變得更好,並更新了自己的策略。
馬庫斯·斯皮斯克
Bowling解釋說:“它是透過考慮所有可能的決策點,以及(可能從這些點發生的)每一個可能的行動來實現的。”。例如,程式可能會想:“如果我在這裡籌集資金,而不是隨機玩,我會贏多少錢或少多少錢?”如果它決定隨機玩,並且輸錢,那麼它會返回並計算如果它募集資金,它會贏多少錢。他說,這一數額隨後被儲存為後悔值因此,它計算出每一個動作的後悔數,每一個做出決定的地方的後悔數。“所以,每當它玩一手牌時,程式就會改變它的策略,這樣它就開始更頻繁地做它在過去的遊戲中後悔沒有做的事。而且,隨著它的更新,仙王座最終接近保齡球所謂的“完美髮揮”
“我們在這一點上停了下來,因為我們分不清完美與否。”
約翰森說,訓練階段花了70天,由200臺計算機組成,每臺計算機配備32GB記憶體和24個中央處理器。在那70天結束時,仙王座的比賽近乎完美。”我們可以繼續訓練它,它會繼續變得更好但我們在這一點上停了下來,因為我們分不清它和完美。“即使這個專案花了一輩子的時間在培訓上,他說,讓它更接近完美真的沒有多大的價值-“除了學術上的新奇。”簡言之,進一步訓練仙王座並不會改變這個專案的成功程度。
仙王爺也能證明,在任何一張牌發出去之前,發牌的人,因此排在第二位的人,比其他人有微小的優勢。”“事實上,我們現在可以證明,莊家有一個優勢,我們稱之為'88 millablinds'每場比賽,”約翰森說這是每場比賽0.088個大瞎子。”
“據我所知,這是迄今為止基本上解決的最大的不完美資訊遊戲,”卡內基梅隆大學的電腦科學家Tuomas Sandholm在《今日科學》上發表的一篇關於這項研究的新聞報道中說,他沒有參與這項研究。這也是“第一個由人類參與競爭的遊戲,現在已經基本解決了。”
保齡球是一個研究小組的一部分,該小組於2003年首次開始研究撲克專案的想法。當時,他說,創造一個能解決兩人遊戲的程式是他們最不想做的事情我不認為任何人夢想我們能解決這個遊戲。“相反,他們致力於開發一個程式,可以擊敗頂級玩家在平頭極限撲克,”最簡單的撲克遊戲人類玩,”保林說。2008年,他們取得了成功。一年前,這個名為“北極星”的專案輸給了職業選手菲爾·拉克和阿裡·伊斯拉米,但研究人員改進後,它在六場比賽中贏了三場,還打了一場平手。
“實際上,我們在它身上植入了一些適應素質,這樣它就可以利用人類的弱點,”保林說——這是仙王座沒有做到的,因為它試圖發揮完美,從而避免了不得不適應對手。
“最大的不完美資訊遊戲基本上解決了至今。”
在北極星擊敗頂尖選手後,保齡球和他的團隊不得不決定下一步該做什麼。他們是不是要解決兩人的限制,一個更複雜的遊戲?”有人做了一個信封背面的計算,結果表明,我們需要4 PB的磁碟空間[1000000 GB],只是寫下解決方案後,我們解決了遊戲,”保林說當時,我說,‘好吧,我想我們那時解決不了,那我們繼續吧。’但他的團隊中的其他研究人員堅持說;畢竟,購買PB級磁碟是可能的。
最終,解決遊戲不需要4 PB的磁碟空間。”“我們在這一過程中學到了一些東西,”鮑林說,“比如你可以把所有的紅心和黑桃都換成套裝,”他說,這使得它們的容量降到了520兆位元組。他們還研究瞭如何壓縮資料,以便程式能夠快速訪問策略。”“有很多這樣的技術平衡行為,”保林說如果比賽規模再大一點,速度再慢一點,我們可能就沒法成功。”
現在,研究人員已經解決了兩人極限德州撲克,他們想在其他形式的撲克工作,如頭部無限制撲克。遊戲的挑戰意味著他們可能無法解決它,但他們可能能夠**出一個可以擊敗世界上最好的人類玩家的程式。三人遊戲的情況也是如此。“三人遊戲中沒有任何策略可以保證它不會輸,因為遊戲中的其他兩個玩家可能會聯手。”在競爭***中,合謀是非法的,但很難量化這到底意味著什麼,保齡球說。有些人甚至沒有意識到就這樣做了。不過,他說,當他們用另外兩臺電腦測試仙王座時,似乎產生了很好的策略。”我們只是不能說它是否能產生最佳的策略,”保林說。
它可以幫助**或公司最佳化其安全戰略
仙王座最終可能做的遠不止打撲克。Bowling說,研究人員已經在考慮如何幫助**或公司最佳化他們的安全策略,使之成為“不可開發的”。例如,仙王座可以安排巡邏或檢查站,以挫敗試圖利用防禦策略的對手。這個專案也可以用來幫助醫生調整糖尿病患者的治療方法。如果他們的飲食或活動水平發生變化,程式可以計算出最佳反應,同時考慮到任何數量的不確定性。
“我對這一切很感興趣,”鮑林說也許是因為我們達到了這個裡程碑,我真的很想看到他們有撲克以外的應用程式空間。“當然,保齡球的願望,從遊戲中轉移可能與他的撲剋意見有關。”“我沒有耐心打撲克,”他說我其實覺得有點無聊。“這位電腦科學家去年只玩過一次撲克。”在過去的12個月裡,我唯一一次玩撲克是在測試我們當前程式的介面時我玩了大約一百手。”
要檢視仙王座的戰略或與之對抗,請單擊此處。
Skype是一個很有趣的應用程式。它第一次把VOIP電話帶給了大眾,在WhatsApp之前的時代,它是網際網路聊天之王。 ...
...啟動,並且資料會跨多個驅動器進行條帶化。因此,甚至一個檔案可以存在於多個驅動器上。 ...
... 現在你知道如何截圖了,啟動一個遊戲,然後按F-12來截圖。退出遊戲時,將顯示一個包含您所拍攝的所有螢幕截圖的彈出視窗。您可以選擇將所有或部分螢幕截圖上傳到Steam雲。 ...
...你的電腦上有你想在客廳電視上玩的遊戲,你現在只需要一個樹莓皮就可以了。哦,你甚至可以用它線上玩本地多人遊戲!這是你需要知道的。 ...
... 此外,Linux還提供了一個極好的學習空間,可以深入研究基本程式設計,或者學習計算機軟體和硬體元件如何互動。 ...
...0年代一直是網際網路的支柱,在20年的時間裡,它創造了一個前所未有的遊戲遺產,覆蓋了數萬個遊戲。 ...
...我不想一直戴著它——也不想上床睡覺,這會阻礙它成為一個有用的睡眠追蹤者的機會。 第一個系列的手錶是緩慢的,往往是痛苦的。蘋果至少解決了系列2的這個問題,不過除了內部的問題,以及手錶的游泳功能,蘋果並沒有...
...載入HBO Max。到目前為止,亞馬遜允許HBO的客戶訪問HBO的一個版本,但沒有辦法得到Max,WarneMedia的新流媒體服務。WarnerMedia的公告指出,目前的HBO使用者透過亞馬遜的Prime影片頻道選擇(頻道允許Amazon Prime使用者購買特定流媒體的...
...合作伙伴的朋友鼓勵的結果,但對我們來說,這聽起來是一個不錯的商業模式。口碑可以是一個無與倫比的廣告形式,它的工作為OMGPOP— 雖然該公司自釋出周以來一直沒有在營銷上花費任何資金,但由廣告支援的freemium遊戲顯然...
...歌即將推出的獨立應用程式,這標志著這一合作關係的另一個終結點,這一分歧始於蘋果在iOS 6中放棄谷歌地圖(Google Maps)——這正是埃裡克·施密特(Eric Schmidt)在2007年上臺宣佈的功能。 不過,儘管雙方正在分道揚鑣,但每...