首页 > 热点

比2016年强10倍 AlphaGo之父揭密致胜关键

作者:水晶 来源:网络 2017-05-25 15:46:39

AlphaGo连胜柯洁两场,让世人见识到人工智慧的厉害。Google旗下DeepMind团队CEO,有“AlphaGo之父”之称的DemisHassabis透露,和2016年相比,本次参赛的新版AlphaGo,采用CloudTPU技术,运算速度是之前的10倍。▲...

AlphaGo连胜柯洁两场,让世人见识到人工智慧的厉害。Google旗下DeepMind团队CEO,有“AlphaGo 之父”之称的Demis Hassabis透露,和2016年相比,本次参赛的新版AlphaGo,采用Cloud TPU技术,运算速度是之前的10倍。

▲“AlphaGo 之父”Demis Hassabis透露,和2016年相比,本次参赛的新版AlphaGo,采用Cloud TPU技术,运算速度是之前的10倍。(视频/取自YouTube,若遭移除请见谅)

前一个版本AlphaGo Lee以“只考虑人类可能走的位置”和“预先判定50回合”的准则,来限制搜索规模,去年的AlphaGo 混合了蒙特卡洛树搜索、监督学习、增强学习等三种演算法。如今AlphaGo Master已提升到可以优先考虑哪里是最有价值的位置,并预测更少回合数目,达到更高的准确率。

AlphaGo运用蒙特卡洛树(Monte Carlo tree search)启发式搜寻演算方法,在比赛回合进行时,考虑的走子位置更少、预判回合数更少,预判依靠更强大的网络,仅用了4个TPU,只需要旧版AlphaGo Lee 10分之1的计算能力,速度更快,棋力更加强大。

▲蒙特卡洛树(Monte Carlo tree search)启发式搜寻演算方法。(视频/取自YouTube,若遭移除请见谅)

DeepMind 资深研究员 David Silver 表示,AlphaGo 对战柯洁比赛当中,主要是采用“单一机器”运作,与2016年对战韩国棋王李世乭的“分布式”的电脑们共同运作,透过 Cloud TPU 技术,运算法比去年更强大。此外,它的自我对弈能力更强,研究团队会利用此次跟柯洁比赛,观察AlphaGo弱点为何。

David Silver 指出,AlphaGo最初设计主要目的就是为了透过跟人类对弈的方式来学习,因此必须要跟世上顶尖的棋手对弈,才能不断改善进步,在目前最新版本当中,AlphaGo Master 现在已是自己的导师,能够不断自我学习、探索,因此对人类数据的依赖*日益减弱,能够继续不断超越。原文详见:http://www.limitlessiq.com/

【本文经智慧机器人网同意授权刊出】

上一篇 下一篇

I 热点 / Hot