close

圍棋人機大戰一周年:被AlphaGo改變的世界

文章來源:量子位·QbitAI 公眾號 舒石、若樸 發自 凹非寺

去年今日,三連敗的李世乭扳回一局。

然而這一針興奮劑很快失效,隨後李世乭再折一陣,最終以1:4輸給AlphaGo。在圍棋的人機大戰中,頂級人類選手完敗給人工智能。

人工智能一戰成名,李世乭留下落寞側影。為AlphaGo落子的黃士傑一年後回憶說:“當時我代表AlphaGo下棋,必須保持冷靜”。

從那時起到現在,人類始終生活在一個被AlphaGo改變的世界。

一年回望

站在圍棋人機大戰一周年的節點上,該如何回顧過去、展望未來呢?量子位先把幾個問題拋給創新工場AI工程院副院長王詠剛。

量子位:一年後再看AlphaGo有何改變?有什麼記滴雞精哪家好憶猶新的片段?

王詠剛:AlphaGo出世一年,其實進入大傢視野的是三個版本:5:0擊敗樊麾的內測版本,4:1擊敗李世石的版本,以Master網名60:0快棋挑落中日韓高手的版本。三個版本演進脈絡明顯,每次迭代都有重大升級。

最震撼的是計算機在人類傳統認為極其玄妙的、電腦無法掌握的“大局觀”上突飛猛進,遠遠將人類選手甩在身後。電腦計算“大局觀”的方式,和人類培養“大局觀”的思路,有根本的差別。人類沒可能在這方面趕上電腦。

和樊麾對局的棋譜基本上還看不出AlphaGo的大局觀有多強,和李世石對局就下出瞭聶衛平贊不絕口的五路肩沖,到瞭Master的60局,大局觀體現在兩個地方:

1)從始至終對局勢的把握,比如第60局古力用AlphaGo的思路對付AlphaGo,把中央撐得很滿,但AlphaGo不緊不慢,總是恰到好處地保持勝勢。

2)已經深刻影響人類對佈局的思考,大飛守角之類的變化迅速被人類棋手模仿,這和當年深藍問世後,國際象棋的佈局革命是一樣的。

量子位:過去一年,有什麼具體產品或研究,是基於AlphaGo的麼?

王詠剛:AlphaGo用的是AI領域應用非常普遍的算法:深度學孕婦滴雞精習、蒙特卡洛算法、增強學習等。

從概念上可以說,機器視覺相關的深度學習技術,包含環境-決策-反饋的智能系統,裡面都有AlphaGo的影子。當然,直接的代碼實現層面,肯定沒有復制、粘貼這樣直接借用的關系,因為AlphaGo的深度學習模型畢竟是圍繞圍棋的特征建立的。

DeepMind去年發佈的讀唇術LipNet,與英國國傢醫療服務體系NHS合作推出的醫療輔助應用Streams,與眼科醫院合作幫助眼部疾病診斷等等,可以說都是與AlphaGo同源的技術。

量子位:AlphaGo是否已經攻克圍棋?未來可提升的空間還有哪些?

王詠剛:“攻克圍棋”,如果說戰勝人類選手的話,AlphaGo已經實現瞭,而且現在“絕藝”,DeepZen之類的程序對人類勝率也很高瞭。

未來最多推薦滴雞精三年必將發生的是,手機上的本地APP就可以戰勝人類職業高手,現在熱鬧的網上圍棋對弈平臺都會死掉(因為對手可以輕易用手機作弊),人類圍棋將回歸現場競賽,圍棋培訓講師將更重視普及教育,因為中高級的提高訓練完全可以用機器代練。

不過,如果說“攻克圍棋”是像計算機可以窮舉西洋跳棋的所有變化那樣,讓電腦成為圍棋“上帝”,這個應該還不大可能。現在AI大部分的招數,還在人類高手可以理解的范疇內。AI也有一些可疑的“弱點”,比如官子水平到底如何等等。

以後AI和AI之間的競賽,應該會不斷促進AI提高(但這種沒有太多商業利益的事情,有沒有持續投入是個問題)。人類應該望塵莫及,但可以不斷從AI中學習新的思想。

不止下棋

“AlphaGo給大傢最大啟發,不是贏棋,而是如何構建一個智商超過300的機器”,HTC負責研發及醫療的總裁、原Goo燕窩功效gle中國工程院副院長張智威說。

構建的方法有兩個:一是訓練、二是數據。張智威最近在清華的一次分享(傳送門)中說,“如果能做好這件事,各位都是億萬富翁。最近兩年,我們每天都在想,哪些領域可以拿到無限的數據”。

而在AAAI Fellow、IEEE Fellow、香港科技大學楊強教授看來,DeepMind在創造AlphaGo的過程中,引入一個新的概念:利用深度學習+強化學習,來判斷現狀和預測未來。這與未來的商業模式有著明確的關聯:

通過對大數據的分析,對現實的判斷和對商業未來走向進行預估。

楊強還試圖基於AlphaGo歸納出一套人工智能的應用流程:算法的目標是什麼?有沒有數據?數據在哪裡?問題的邊界是否清晰?什麼叫合理的走法、什麼叫犯規的走法?你的特征在哪裡?又如何得到這些特征?是否可以得到一個持續的反饋?

但也有人沿著另一條路前進。

圍棋也好、國際象棋也好、國際跳棋也好,所有這些都是完美信息博弈。現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生瞭大量的不確定性,而德州撲克代表的就是這種類型的博弈。

今年初,在德州撲克的人機大戰中,人工智能Libratus擊敗瞭四位頂級人類玩傢。創造瞭這個AI的卡內基梅隆大學Sandholm教授說,能夠處理不完美信息的AI,未來可以用於商業談判、網絡安全、醫療方案制定等領域。

人工智能發展的終極目標,是通用人工智能(AGI)。通用人工智能可以解決任何一個問題。想要實現AG滴雞精門市I就得讓人工智能學會解決不確定性問題,這也是德州撲克人機大戰的重大意義之一。

對於已屆不惑的Demis Hassabis來說,創立DeepMind的目標絕不僅限於創造AlphaGo。過去的一年裡,DeepMind還搞出瞭很多有意思的創新。

比方說可以模擬任意一種人類聲音的WaveNet;以及與英國國傢醫療服務體系合作,使用人工智能來改善醫療行業等。

繼續戰鬥

過去的一年裡,僅僅在圍棋界,出彩的人工智能就不止AlphaGo一傢。比方說量子位此前報道過的首個圍棋十段:騰訊絕藝(傳送門),就是一個AI。

而對於AlphaGo來說,挑戰也還沒結束。

現在的圍棋江湖裡,中日韓三強中,無疑中國軍團占據瞭絕對的優勢。剛剛結束的第18屆農心杯三國圍棋擂臺賽上,中國隊僅上場兩位選手,就將日韓兩隊悉數全滅。連笑、柁嘉熹、柯潔等重量級棋手尚未登場,就已經拿下冠軍。

不在正式場合對陣世界排名第一的柯潔,對於AlphaGo來說始終不夠完美。去年AlphaGo挑戰李世乭前,各方還就誰贏誰輸打賭。

當時《連線》記者在報道中描述道:

一位名叫周峰的中國記者在觀戰室攔下瞭我,開心地和我這種將AlphaGo視為科技奇跡而非圍棋殺手的人進行對話。

但是當我詢問看見李世石輸瞭比賽他作何感想時,他指著心口說:“我很難過。”

四月,新的人機大戰又要啟幕瞭。

量子位很想問問,如果柯潔這次也輸給AlphaGo,周峰還會特別難過麼?

這一次,在人工智能和人類頂級高手之間,你覺得誰會贏呢?

“我們不關心輸贏。輸贏其實不用看的,AI想贏它就肯定能贏”,雲從CEO周曦說,“關鍵問題是AlphaGo會不會有些新的想法”。

好戲又要上演,而未來的人機大戰,勢必不止於圍棋。

台灣電動床工廠 電動床

台灣電動床工廠 電動床

AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋

AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots

arrow
arrow

    fsj134s6k3 發表在 痞客邦 留言(0) 人氣()