被閱讀2377次,日期:2017-03-16 10:24:47
2016年3月15日,圍棋“人機(jī)大戰(zhàn)”在韓國首爾進(jìn)行最后一盤的對弈,韓國棋手李世石九段執(zhí)黑中盤280手告負(fù),至此他的總比分1比4不敵“阿爾法圍棋”,在本次“人機(jī)大戰(zhàn)”中宣告失敗。
阿爾法圍棋的主要工作原理是“深度學(xué)習(xí)”,其核心是“策略網(wǎng)絡(luò)”和“價(jià)值網(wǎng)絡(luò)”兩種不同的深度神經(jīng)網(wǎng)絡(luò)。其中,“價(jià)值網(wǎng)絡(luò)”主要任務(wù)是一邊推算一邊判斷局面,一旦局面處于明顯劣勢時(shí),就直接拋棄一些路線;而“策略網(wǎng)絡(luò)”則是負(fù)責(zé)減少搜索的寬度,判斷某些棋步該不該走,防止隨便送子給別人吃。
這兩個(gè)工具通過相互合作做出一些類似于人們思考的行為,“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計(jì)算量控制在計(jì)算機(jī)可以完成的范圍里,以期取得最終的勝利。
事實(shí)上阿爾法圍棋的強(qiáng)大,除了其本身采用了最先進(jìn)的深度學(xué)習(xí)技術(shù),利用深度神經(jīng)網(wǎng)絡(luò)對棋盤的局勢進(jìn)行了預(yù)測之外,還在于研發(fā)團(tuán)隊(duì)在前期搜集了大量圍棋名人對弈的歷史數(shù)據(jù),使得這一人工智能機(jī)器可以迅速汲取眾多圍棋高手的棋局,充分利用人類棋手的即有經(jīng)驗(yàn)。
這次“阿爾法圍棋”的勝利,代表著人工智能在自主學(xué)習(xí)、自我完善等方面有了更進(jìn)一步的發(fā)展。隨著人工智能的應(yīng)用,必將會(huì)在推動(dòng)計(jì)算機(jī)技術(shù)的不斷進(jìn)步,人類生活方式的持續(xù)改善等方面產(chǎn)生更加深遠(yuǎn)的影響,為人類社會(huì)做出巨大的貢獻(xiàn)。(本文來源:中國科普網(wǎng))