久久影音先锋_国产成人在线看_国产成人涩涩涩视频在线观看_四虎5151久久欧美毛片_日韩超碰_www97影院

首頁(yè) > 娛樂(lè) > 體育 > 柯潔對(duì)戰(zhàn)阿爾法狗第二局中盤(pán)認(rèn)輸!Alphago為什么如此厲害?

柯潔對(duì)戰(zhàn)阿爾法狗第二局中盤(pán)認(rèn)輸!Alphago為什么如此厲害?

2017-05-25 14:30:00 來(lái)源:36氪

今天上午,柯潔對(duì)戰(zhàn)阿爾法狗的第二局比賽展開(kāi)角逐。在這場(chǎng)三番棋比賽第二局進(jìn)行到下午1點(diǎn)37分時(shí),柯潔主動(dòng)投子認(rèn)輸,臺(tái)下觀眾一臉懵逼(截止發(fā)稿前仍處于震驚中),AlphaGo提前一個(gè)多小時(shí)在中盤(pán)戰(zhàn)勝柯潔!

比賽結(jié)果

柯潔對(duì)戰(zhàn)阿爾法狗第二局中盤(pán)認(rèn)輸!Alphago為什么如此厲害?

在這次比賽中,圍棋國(guó)手古力、張璇(曾獲得過(guò)中國(guó)冠軍)擔(dān)當(dāng)開(kāi)局時(shí)段的解說(shuō)員。古力認(rèn)為,在特別難判斷的盤(pán)面上,AlphaGo比我們要思考地更加準(zhǔn)確,也就是說(shuō)從一步看未來(lái)幾十步的“本事”。

從開(kāi)局來(lái)看,柯潔想把時(shí)間多用在對(duì)布局的策略方面,而且在前十手時(shí)打的一直非常不錯(cuò),盤(pán)面很穩(wěn),甚至預(yù)料到AlphaGo多步棋的下子位置。與此同時(shí),AlphaGo的表現(xiàn)跟人類無(wú)異,每一步下的都很平常,甚至很多步都被古力預(yù)測(cè)到。

但是我們需要清楚,在前天進(jìn)行的第一場(chǎng)比賽時(shí),前10手柯潔的勝率其實(shí)是非常高的,但越往后,AlphaGo的勝率就逐漸慢慢提高了。

一開(kāi)始比賽的賽時(shí)沒(méi)有被拉開(kāi),對(duì)弈雙方的時(shí)間差也一直維持在十幾分鐘左右。但隨著戰(zhàn)局的推進(jìn),柯潔扯頭發(fā)的次數(shù)越來(lái)越多(頭發(fā)越來(lái)越亂),面部的表情也越來(lái)越焦慮。

最終,讓所有人都沒(méi)有想到的是,開(kāi)局2個(gè)多小時(shí)后,局面出現(xiàn)反轉(zhuǎn),柯潔漸漸處于劣勢(shì),而且力不從心。最終突然在下午1點(diǎn)37分主動(dòng)投子認(rèn)輸,AlohaGo在中盤(pán)執(zhí)黑子贏得勝利!隨后進(jìn)行了復(fù)盤(pán)。

在整個(gè)比賽過(guò)程中,古力曾著重分析了AlphaGo的厲害之處:

在預(yù)測(cè)大局的方面非常厲害,也就是在所謂的“虛著”方面更勝一籌。

通俗來(lái)講,就是在棋子比較密布的某一區(qū)塊上面,我們誰(shuí)能猜到AlphaGo的落子結(jié)果;但在盤(pán)面比較虛的地方,例如棋子稀疏的下方,我們根本無(wú)法猜到。而AlphaGo就是在這種情況下,不知不覺(jué)地積累優(yōu)勢(shì)。

其實(shí),早在AlphaGo與柯潔未開(kāi)賽前,我們?cè)?jīng)提出一個(gè)腦洞大開(kāi)的問(wèn)題:AlphaGo會(huì)不會(huì)故意輸給柯潔?

這個(gè)命題可以設(shè)定為存在兩種情況:

第一個(gè)猜測(cè)被DeepMind創(chuàng)始人Demis以一個(gè)玩笑否認(rèn)了:

這個(gè)建議太好了,看來(lái)我們以后也應(yīng)該為AlphaGo安裝一些傳感器與攝像頭。你要知道,AlphaGo一定是會(huì)有弱點(diǎn)的。而柯潔據(jù)說(shuō)也通過(guò)分析AlphaGo掌握了一些它的套路,兩位選手是勢(shì)均力敵的。

而第二個(gè)猜測(cè),的確是DeepMind持續(xù)提升AlphaGo能力的一個(gè)方向,但目前來(lái)說(shuō),AlphaGo還做不到。

在在昨天的人工智能閉門(mén)大會(huì)上,DeepMind首席科學(xué)家Davis Silver已經(jīng)非常清晰地解釋了這個(gè)新一代AlphaGo的過(guò)人之處:

第2代“深度強(qiáng)化學(xué)習(xí)系統(tǒng)”AlphaGo Fan(共4代)共有12層卷積神經(jīng)網(wǎng)絡(luò),而第4代AlphaGo(也就是與柯潔比賽的這一代)通過(guò)進(jìn)行“自我學(xué)習(xí)”(監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí))已經(jīng)訓(xùn)練出了40層神經(jīng)網(wǎng)絡(luò)(由策略網(wǎng)絡(luò)與神經(jīng)網(wǎng)絡(luò)組成)。

在整個(gè)學(xué)習(xí)過(guò)程中,系統(tǒng)要對(duì)棋局進(jìn)行圖像掃描,分成無(wú)數(shù)個(gè)小塊依次進(jìn)行處理,最終構(gòu)成整個(gè)全局觀。具體來(lái)說(shuō),它可以近乎準(zhǔn)確地判斷棋盤(pán)上現(xiàn)有的棋子能給周圍區(qū)域帶來(lái)多大的影響力。

這個(gè)“全局觀”,就是AlphaGo與人類最不一樣的地方,也是古力在解說(shuō)時(shí)特意強(qiáng)調(diào)的AlphaGo具備的一個(gè)能力:

策略網(wǎng)絡(luò),就是讓AlphaGo先自己跟自己比,下個(gè)幾萬(wàn)場(chǎng),目的就是要“走對(duì)子”,選擇最好的一步走,判斷哪個(gè)策略最有效。

而在這個(gè)步驟結(jié)束后,繼而形成價(jià)值網(wǎng)絡(luò),用來(lái)負(fù)責(zé)估算勝率。“策略網(wǎng)絡(luò)”能夠?qū)λ新渥游恢眠M(jìn)行概率分布,然后再將這些估算出的信息投入到蒙特卡羅搜索樹(shù)中,推算出勝率最高的一些算法。

換句話說(shuō),就是每走出一步,價(jià)值網(wǎng)絡(luò)就是通過(guò)這樣的函數(shù)來(lái)預(yù)測(cè)未來(lái)的輸贏,而不是靜態(tài)地去考慮這步棋。

兩者一前一后,就形成了AlphaGo的殺手锏——“在最后結(jié)果為‘贏’的前提下,去選擇每一步最可行的路徑”。

這也能解釋為何AlphaGo在去年與李世石三番棋的第二局比賽中,狗的第37子被稱為“牽一發(fā)而動(dòng)全身”的一步棋。在賽后復(fù)盤(pán)后,人類棋手才發(fā)現(xiàn)這步棋完全決定了后面50步棋的下法。

照這樣來(lái)看,層數(shù)越來(lái)越多的神經(jīng)網(wǎng)絡(luò)決定了AlphaGo學(xué)習(xí)的深度正在越來(lái)越大,這就相當(dāng)于AlphaGo不管是在思考每一步策略,還是在判斷勝率的精準(zhǔn)度上都有了很大的提高。

如果要故意輸給柯潔,不僅需要AlphaGo的自我學(xué)習(xí)能力,還需要獲得柯潔這位棋手足夠多的數(shù)據(jù),因?yàn)楂@得固定的勝率需要他去“揣摩”柯潔的直覺(jué)。

從理論上來(lái)說(shuō),如果AlphaGo能通過(guò)自我學(xué)習(xí)來(lái)掌握柯潔足夠多的數(shù)據(jù),是有可能控制勝率的(幾率會(huì)更高)。

但是這個(gè)決定三番棋勝局的關(guān)鍵第二場(chǎng)比賽,柯潔的主動(dòng)投子認(rèn)輸,讓我們?cè)俅我?jiàn)識(shí)到了AlphaGo的厲害之處。

柯潔對(duì)戰(zhàn)阿爾法狗第二局中盤(pán)認(rèn)輸!Alphago為什么如此厲害?

單品搭配 技巧搭配

關(guān)于我們 | 版權(quán)聲明 | 聯(lián)系方式 | 撤稿聲明

主站蜘蛛池模板: 欧美日韩亚洲一区 | 国产麻豆乱码精品一区二区三区 | 在线国产视频 | 女人牲交视频一级毛片 | 中文在线一区二区 | 毛片.com| 国产精品久久久久久久久久久久久 | 亚洲视频区 | 97国产爽爽爽久久久 | 国产午夜精品视频 | 久久99精品久久久97夜夜嗨 | 国产免费一区二区三区 | 99精品久久久久久中文字幕 | 久久久久久美女 | 国产超碰人人爽人人做人人爱 | 国产一级毛片精品完整视频版 | 久久九九99| 华人黄网站大全 | 97av视频在线观看 | 人人做人人澡人人爽欧美 | 91久久夜色 | 久久免费香蕉视频 | 日韩一区二区三区在线视频 | 日韩在线精品视频 | 涩涩视频在线播放 | 国产精品日本一区二区在线播放 | 可以免费看的毛片 | 欧美日韩福利 | 成人黄色在线观看 | 亚洲综合视频 | 欧美日韩一区在线观看 | 国产精品一区在线 | 日韩欧美一级精品久久 | 成人性视频免费网站 | 亚洲精品日韩综合观看成人91 | 一级毛片观看 | 亚洲免费在线观看视频 | 精品福利av导航 | 国产伦一区二区三区视频 | 欧美影院| 91麻豆精品国产91久久久更新资源速度超快 |