久久影音先锋_国产成人在线看_国产成人涩涩涩视频在线观看_四虎5151久久欧美毛片_日韩超碰_www97影院

首頁 > 娛樂 > 體育 > 柯潔對戰(zhàn)阿爾法狗第二局中盤認輸!Alphago為什么如此厲害?

柯潔對戰(zhàn)阿爾法狗第二局中盤認輸!Alphago為什么如此厲害?

2017-05-25 14:30:00 來源:36氪

今天上午,柯潔對戰(zhàn)阿爾法狗的第二局比賽展開角逐。在這場三番棋比賽第二局進行到下午1點37分時,柯潔主動投子認輸,臺下觀眾一臉懵逼(截止發(fā)稿前仍處于震驚中),AlphaGo提前一個多小時在中盤戰(zhàn)勝柯潔!

比賽結(jié)果

柯潔對戰(zhàn)阿爾法狗第二局中盤認輸!Alphago為什么如此厲害?

在這次比賽中,圍棋國手古力、張璇(曾獲得過中國冠軍)擔當開局時段的解說員。古力認為,在特別難判斷的盤面上,AlphaGo比我們要思考地更加準確,也就是說從一步看未來幾十步的“本事”。

從開局來看,柯潔想把時間多用在對布局的策略方面,而且在前十手時打的一直非常不錯,盤面很穩(wěn),甚至預料到AlphaGo多步棋的下子位置。與此同時,AlphaGo的表現(xiàn)跟人類無異,每一步下的都很平常,甚至很多步都被古力預測到。

但是我們需要清楚,在前天進行的第一場比賽時,前10手柯潔的勝率其實是非常高的,但越往后,AlphaGo的勝率就逐漸慢慢提高了。

一開始比賽的賽時沒有被拉開,對弈雙方的時間差也一直維持在十幾分鐘左右。但隨著戰(zhàn)局的推進,柯潔扯頭發(fā)的次數(shù)越來越多(頭發(fā)越來越亂),面部的表情也越來越焦慮。

最終,讓所有人都沒有想到的是,開局2個多小時后,局面出現(xiàn)反轉(zhuǎn),柯潔漸漸處于劣勢,而且力不從心。最終突然在下午1點37分主動投子認輸,AlohaGo在中盤執(zhí)黑子贏得勝利!隨后進行了復盤。

在整個比賽過程中,古力曾著重分析了AlphaGo的厲害之處:

在預測大局的方面非常厲害,也就是在所謂的“虛著”方面更勝一籌。

通俗來講,就是在棋子比較密布的某一區(qū)塊上面,我們誰能猜到AlphaGo的落子結(jié)果;但在盤面比較虛的地方,例如棋子稀疏的下方,我們根本無法猜到。而AlphaGo就是在這種情況下,不知不覺地積累優(yōu)勢。

其實,早在AlphaGo與柯潔未開賽前,我們曾經(jīng)提出一個腦洞大開的問題:AlphaGo會不會故意輸給柯潔?

這個命題可以設定為存在兩種情況:

第一個猜測被DeepMind創(chuàng)始人Demis以一個玩笑否認了:

這個建議太好了,看來我們以后也應該為AlphaGo安裝一些傳感器與攝像頭。你要知道,AlphaGo一定是會有弱點的。而柯潔據(jù)說也通過分析AlphaGo掌握了一些它的套路,兩位選手是勢均力敵的。

而第二個猜測,的確是DeepMind持續(xù)提升AlphaGo能力的一個方向,但目前來說,AlphaGo還做不到。

在在昨天的人工智能閉門大會上,DeepMind首席科學家Davis Silver已經(jīng)非常清晰地解釋了這個新一代AlphaGo的過人之處:

第2代“深度強化學習系統(tǒng)”AlphaGo Fan(共4代)共有12層卷積神經(jīng)網(wǎng)絡,而第4代AlphaGo(也就是與柯潔比賽的這一代)通過進行“自我學習”(監(jiān)督學習與強化學習)已經(jīng)訓練出了40層神經(jīng)網(wǎng)絡(由策略網(wǎng)絡與神經(jīng)網(wǎng)絡組成)。

在整個學習過程中,系統(tǒng)要對棋局進行圖像掃描,分成無數(shù)個小塊依次進行處理,最終構(gòu)成整個全局觀。具體來說,它可以近乎準確地判斷棋盤上現(xiàn)有的棋子能給周圍區(qū)域帶來多大的影響力。

這個“全局觀”,就是AlphaGo與人類最不一樣的地方,也是古力在解說時特意強調(diào)的AlphaGo具備的一個能力:

策略網(wǎng)絡,就是讓AlphaGo先自己跟自己比,下個幾萬場,目的就是要“走對子”,選擇最好的一步走,判斷哪個策略最有效。

而在這個步驟結(jié)束后,繼而形成價值網(wǎng)絡,用來負責估算勝率。“策略網(wǎng)絡”能夠?qū)λ新渥游恢眠M行概率分布,然后再將這些估算出的信息投入到蒙特卡羅搜索樹中,推算出勝率最高的一些算法。

換句話說,就是每走出一步,價值網(wǎng)絡就是通過這樣的函數(shù)來預測未來的輸贏,而不是靜態(tài)地去考慮這步棋。

兩者一前一后,就形成了AlphaGo的殺手锏——“在最后結(jié)果為‘贏’的前提下,去選擇每一步最可行的路徑”。

這也能解釋為何AlphaGo在去年與李世石三番棋的第二局比賽中,狗的第37子被稱為“牽一發(fā)而動全身”的一步棋。在賽后復盤后,人類棋手才發(fā)現(xiàn)這步棋完全決定了后面50步棋的下法。

照這樣來看,層數(shù)越來越多的神經(jīng)網(wǎng)絡決定了AlphaGo學習的深度正在越來越大,這就相當于AlphaGo不管是在思考每一步策略,還是在判斷勝率的精準度上都有了很大的提高。

如果要故意輸給柯潔,不僅需要AlphaGo的自我學習能力,還需要獲得柯潔這位棋手足夠多的數(shù)據(jù),因為獲得固定的勝率需要他去“揣摩”柯潔的直覺。

從理論上來說,如果AlphaGo能通過自我學習來掌握柯潔足夠多的數(shù)據(jù),是有可能控制勝率的(幾率會更高)。

但是這個決定三番棋勝局的關(guān)鍵第二場比賽,柯潔的主動投子認輸,讓我們再次見識到了AlphaGo的厲害之處。

柯潔對戰(zhàn)阿爾法狗第二局中盤認輸!Alphago為什么如此厲害?

單品搭配 技巧搭配

關(guān)于我們 | 版權(quán)聲明 | 聯(lián)系方式 | 撤稿聲明

主站蜘蛛池模板: 亚洲国产视频一区二区 | 国产成人亚洲精品自产在线 | 日韩毛片 | 中文字幕亚洲欧美日韩在线不卡 | 亚洲一区二区电影网 | 亚洲国产欧美国产综合一区 | 久久精品欧美一区二区三区不卡 | 日本国产精品视频 | 黄网站免费在线 | 激情黄色在线观看 | 亚洲欧美日韩在线 | 久久一二 | 免费视频一区 | 精品国产亚洲一区二区三区大结局 | 日日草夜夜草 | 日本精品一区二区三区视频 | 亚洲一区网站 | 亚洲精品一区二区 | 国外成人在线视频网站 | 91视频免费视频 | 亚洲国产成人精品久久久国产成人一区 | 欧美国产精品 | 久久久免费电影 | 日韩精品久久一区二区三区 | av免费网站在线观看 | 欧美精品一区在线发布 | 日本午夜网 | 欧美久久久久久久 | 午夜精品一区二区三区在线视频 | 国产精品久久二区 | 日日夜精品视频 | 三级成人在线观看 | 精品国产一区二区 | 亚洲国产成人精品女人久久久 | 这里只有精品999 | 成人av网站在线观看 | 亚洲一二三区av | 国产成人免费视频网站高清观看视频 | 91麻豆精品国产91久久久久久 | 色综合视频 | 国产精品一区在线观看 |