一呦二呦三呦国产精品,91免费版在线看,一区二区三区视频

今天上午，柯潔對(duì)戰(zhàn)阿爾法狗的第二局比賽展開(kāi)角逐。在這場(chǎng)三番棋比賽第二局進(jìn)行到下午1點(diǎn)37分時(shí)，柯潔主動(dòng)投子認(rèn)輸，臺(tái)下觀眾一臉懵逼(截止發(fā)稿前仍處于震驚中)，AlphaGo提前一個(gè)多小時(shí)在中盤(pán)戰(zhàn)勝柯潔!

比賽結(jié)果

柯潔對(duì)戰(zhàn)阿爾法狗第二局中盤(pán)認(rèn)輸!Alphago為什么如此厲害?

在這次比賽中，圍棋國(guó)手古力、張璇(曾獲得過(guò)中國(guó)冠軍)擔(dān)當(dāng)開(kāi)局時(shí)段的解說(shuō)員。古力認(rèn)為，在特別難判斷的盤(pán)面上，AlphaGo比我們要思考地更加準(zhǔn)確，也就是說(shuō)從一步看未來(lái)幾十步的“本事”。

從開(kāi)局來(lái)看，柯潔想把時(shí)間多用在對(duì)布局的策略方面，而且在前十手時(shí)打的一直非常不錯(cuò)，盤(pán)面很穩(wěn)，甚至預(yù)料到AlphaGo多步棋的下子位置。與此同時(shí)，AlphaGo的表現(xiàn)跟人類無(wú)異，每一步下的都很平常，甚至很多步都被古力預(yù)測(cè)到。

但是我們需要清楚，在前天進(jìn)行的第一場(chǎng)比賽時(shí)，前10手柯潔的勝率其實(shí)是非常高的，但越往后，AlphaGo的勝率就逐漸慢慢提高了。

一開(kāi)始比賽的賽時(shí)沒(méi)有被拉開(kāi)，對(duì)弈雙方的時(shí)間差也一直維持在十幾分鐘左右。但隨著戰(zhàn)局的推進(jìn)，柯潔扯頭發(fā)的次數(shù)越來(lái)越多(頭發(fā)越來(lái)越亂)，面部的表情也越來(lái)越焦慮。

最終，讓所有人都沒(méi)有想到的是，開(kāi)局2個(gè)多小時(shí)后，局面出現(xiàn)反轉(zhuǎn)，柯潔漸漸處于劣勢(shì)，而且力不從心。最終突然在下午1點(diǎn)37分主動(dòng)投子認(rèn)輸，AlohaGo在中盤(pán)執(zhí)黑子贏得勝利!隨后進(jìn)行了復(fù)盤(pán)。

在整個(gè)比賽過(guò)程中，古力曾著重分析了AlphaGo的厲害之處：

在預(yù)測(cè)大局的方面非常厲害，也就是在所謂的“虛著”方面更勝一籌。

通俗來(lái)講，就是在棋子比較密布的某一區(qū)塊上面，我們誰(shuí)能猜到AlphaGo的落子結(jié)果;但在盤(pán)面比較虛的地方，例如棋子稀疏的下方，我們根本無(wú)法猜到。而AlphaGo就是在這種情況下，不知不覺(jué)地積累優(yōu)勢(shì)。

其實(shí)，早在AlphaGo與柯潔未開(kāi)賽前，我們?cè)?jīng)提出一個(gè)腦洞大開(kāi)的問(wèn)題：AlphaGo會(huì)不會(huì)故意輸給柯潔?

這個(gè)命題可以設(shè)定為存在兩種情況：

第一個(gè)猜測(cè)被DeepMind創(chuàng)始人Demis以一個(gè)玩笑否認(rèn)了：

這個(gè)建議太好了，看來(lái)我們以后也應(yīng)該為AlphaGo安裝一些傳感器與攝像頭。你要知道，AlphaGo一定是會(huì)有弱點(diǎn)的。而柯潔據(jù)說(shuō)也通過(guò)分析AlphaGo掌握了一些它的套路，兩位選手是勢(shì)均力敵的。

而第二個(gè)猜測(cè)，的確是DeepMind持續(xù)提升AlphaGo能力的一個(gè)方向，但目前來(lái)說(shuō)，AlphaGo還做不到。

在在昨天的人工智能閉門(mén)大會(huì)上，DeepMind首席科學(xué)家Davis Silver已經(jīng)非常清晰地解釋了這個(gè)新一代AlphaGo的過(guò)人之處：

第2代“深度強(qiáng)化學(xué)習(xí)系統(tǒng)”AlphaGo Fan(共4代)共有12層卷積神經(jīng)網(wǎng)絡(luò)，而第4代AlphaGo(也就是與柯潔比賽的這一代)通過(guò)進(jìn)行“自我學(xué)習(xí)”(監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí))已經(jīng)訓(xùn)練出了40層神經(jīng)網(wǎng)絡(luò)(由策略網(wǎng)絡(luò)與神經(jīng)網(wǎng)絡(luò)組成)。

在整個(gè)學(xué)習(xí)過(guò)程中，系統(tǒng)要對(duì)棋局進(jìn)行圖像掃描，分成無(wú)數(shù)個(gè)小塊依次進(jìn)行處理，最終構(gòu)成整個(gè)全局觀。具體來(lái)說(shuō)，它可以近乎準(zhǔn)確地判斷棋盤(pán)上現(xiàn)有的棋子能給周圍區(qū)域帶來(lái)多大的影響力。

這個(gè)“全局觀”，就是AlphaGo與人類最不一樣的地方，也是古力在解說(shuō)時(shí)特意強(qiáng)調(diào)的AlphaGo具備的一個(gè)能力：

策略網(wǎng)絡(luò)，就是讓AlphaGo先自己跟自己比，下個(gè)幾萬(wàn)場(chǎng)，目的就是要“走對(duì)子”，選擇最好的一步走，判斷哪個(gè)策略最有效。

而在這個(gè)步驟結(jié)束后，繼而形成價(jià)值網(wǎng)絡(luò)，用來(lái)負(fù)責(zé)估算勝率。“策略網(wǎng)絡(luò)”能夠?qū)λ新渥游恢眠M(jìn)行概率分布，然后再將這些估算出的信息投入到蒙特卡羅搜索樹(shù)中，推算出勝率最高的一些算法。

換句話說(shuō)，就是每走出一步，價(jià)值網(wǎng)絡(luò)就是通過(guò)這樣的函數(shù)來(lái)預(yù)測(cè)未來(lái)的輸贏，而不是靜態(tài)地去考慮這步棋。

兩者一前一后，就形成了AlphaGo的殺手锏——“在最后結(jié)果為‘贏’的前提下，去選擇每一步最可行的路徑”。

這也能解釋為何AlphaGo在去年與李世石三番棋的第二局比賽中，狗的第37子被稱為“牽一發(fā)而動(dòng)全身”的一步棋。在賽后復(fù)盤(pán)后，人類棋手才發(fā)現(xiàn)這步棋完全決定了后面50步棋的下法。

照這樣來(lái)看，層數(shù)越來(lái)越多的神經(jīng)網(wǎng)絡(luò)決定了AlphaGo學(xué)習(xí)的深度正在越來(lái)越大，這就相當(dāng)于AlphaGo不管是在思考每一步策略，還是在判斷勝率的精準(zhǔn)度上都有了很大的提高。

如果要故意輸給柯潔，不僅需要AlphaGo的自我學(xué)習(xí)能力，還需要獲得柯潔這位棋手足夠多的數(shù)據(jù)，因?yàn)楂@得固定的勝率需要他去“揣摩”柯潔的直覺(jué)。

從理論上來(lái)說(shuō)，如果AlphaGo能通過(guò)自我學(xué)習(xí)來(lái)掌握柯潔足夠多的數(shù)據(jù)，是有可能控制勝率的(幾率會(huì)更高)。

但是這個(gè)決定三番棋勝局的關(guān)鍵第二場(chǎng)比賽，柯潔的主動(dòng)投子認(rèn)輸，讓我們?cè)俅我?jiàn)識(shí)到了AlphaGo的厲害之處。

柯潔對(duì)戰(zhàn)阿爾法狗第二局中盤(pán)認(rèn)輸!Alphago為什么如此厲害?

久久影音先锋_国产成人在线看_国产成人涩涩涩视频在线观看_四虎5151久久欧美毛片_日韩超碰_www97影院

柯潔對(duì)戰(zhàn)阿爾法狗第二局中盤(pán)認(rèn)輸！Alphago為什么如此厲害？

本文相關(guān)推薦

本周熱門(mén)

最新推薦

熱門(mén)品牌