阿尔法狗之父揭秘阿尔法狗再进化

作者：佚名来源：法律法规网 2017-10-19 15:24:12

阿尔法狗之父揭秘，阿尔法狗再进化！最强的阿尔法狗是怎么练成的呢？阿尔法围棋是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序伦敦当地时间10月18日18：00（北京时间19日01：00），...

法律法规网综合消息 阿尔法狗之父揭秘，阿尔法狗再进化！最强的阿尔法狗是怎么练成的呢？阿尔法围棋是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序

伦敦当地时间10月18日18：00（北京时间19日01：00），谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ，代号AlphaGo Zero。

新版本的AlphaGo究竟有多厉害？打败李世石的AlphaGo用了3000万盘比赛作为训练数据，AlphaGo Zero用了490万盘比赛数据。经过3天的训练，AlphaGo Zero就以100：0的比分完胜对阵李世石的那版AlphaGo。

DeepMind联合创始人兼CEO 、AlphaGo之父戴密斯·哈萨比斯（Demis Hassabis）和AlphaGo团队负责人大卫·席尔瓦（Dave Sliver）等人同时在官方博客上发表文章，详解最强版本阿尔法狗是如何炼成的，与前代有何不同。

与学习大量人类棋谱起步的前代AlphaGo不同，AlphaGo Zero是从“婴儿般的白纸”开始，通过3天数百万盘自我对弈，走完了人类千年的围棋历史，并探索出了不少横空出世的招法。

哈萨比斯等人专文：《AlphaGo Zero：从零开始》

从语音识别、图像分类到基因和药物研究，人工智能发展迅速。这些专家系统，很多是借用海量人类经验和数据开发出来的。

然而，在有些特定问题上，人类的知识要么过于昂贵，要么不靠谱，要么无法获得。因此，人工智能研究的一个长期目标就是跳过这一步，创造能在最有挑战*的领域，不用人类输入就达到超人水平的算法。我们发表在《自然》期刊上的最新论文，展示了实现该目标的关键一步。

论文介绍了首个战胜人类围棋冠军的电脑程序AlphaGo的最新进化版本：AlphaGo Zero。AlphaGo Zero更为强大，可以一争史上最强围棋手。

AlphaGo的前几代版本，一开始用上千盘人类业余和专业棋手的棋谱进行训练，学习如何下围棋。AlphaGo Zero则跳过了这个步骤，自我对弈学习下棋，完全从乱下开始。用这种方法，它很快超过了人类水平，对阵此前战胜人类冠军李世石的前代AlphaGo取得了100连胜。

AlphaGo Zero之所以能当自己的老师，是用了一种叫强化学习的新模式。系统从一个对围棋一无所知的神经网络开始，将该神经网络和一个强力搜索算法结合，自我对弈。在对弈过程中，神经网络不断调整、升级，预测每一步落子和最终的胜利者。

升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero，如此往复循环。每过一轮，系统的表现就提高了一点点，自我对弈的质量也提高了一点点。神经网络越来越准确，AlphaGo Zero的版本也越来越强。

这种技术比此前所有版本的AlphaGo都更为强大。这是因为，它不再受到人类知识的限制，而能够从婴儿般的白纸状态，直接向世界上最强大的棋手——AlphaGo本身学起。

AlphaGo Zero相较前代还有几点明显的差别：

首先，AlphaGo Zero仅用棋盘上的黑白子作为输入，而前代则包括了小部分人工设计的特征输入。

其次，AlphaGo Zero仅用了单一的神经网络。在此前的版本中，AlphaGo用到了“策略网络”来选择下一步棋的走法，以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中，这两个神经网络合二为一，从而让它能得到更高效的训练和评估。

第三，AlphaGo Zero并不使用快速、随机的走子方法。在此前的版本中，AlphaGo用的是快速走子方法，来预测哪个玩家会从当前的局面中赢得比赛。相反，新版本依靠的是其高质量的神经网络来评估下棋的局势。

所有这些差异，都提高了系统的表现，使其更为普适。不过，是算法上的变化使得系统更为强大和高效。

仅仅自我对弈3天后，AlphaGo Zero就以100：0完胜了此前击败世界冠军李世石的AlphaGo版本。自我对弈40天后，AlphaGo Zero变得更为强大，超过了此前击败当今第一人柯洁的“大师”版AlphaGo。

通过数百万次自我对弈，AlphaGo从零开始掌握了围棋，在短短几天内就积累起了人类几千年才有的知识。AlphaGo Zero也发现了新的知识，发展出打破常规的策略和新招，与它在对战李世石和柯洁时创造的那些交相辉映，却又更胜一筹。

这些创造*的时刻给了我们信心：人工智能会成为人类智慧的增强器，帮助我们解决人类正在面临的一些严峻挑战。

尽管才刚刚发展起来，AlphaGo Zero已经走出了通向上述目标的关键一步。如果类似的技术可以应用在其他结构*问题，比如蛋白质折叠、减少能耗和寻找新材料上，就能创造出有益于社会的突破。

阿尔法围棋：

阿尔法围棋（AlphaGo）是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序，由谷歌（Google）旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。

2016年3月，阿尔法围棋与围棋世界冠军、职业九段棋手李世石进行围棋人机大战，以4比1的总比分获胜；2016年末2017年初，该程序在中国棋类网站上以“大师”（Master）为注册帐号与中日韩数十位围棋高手进行快棋对决，连续60局无一败绩；2017年5月，在中国乌镇围棋峰会上，它与排名世界第一的世界围棋冠军柯洁对战，以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平，在GoRatings网站公布的世界职业围棋排名中，其等级分曾超过排名人类第一的棋手柯洁。

2017年5月27日，在柯洁与阿尔法围棋的人机大战之后，阿尔法围棋团队宣布阿尔法围棋将不再参加围棋比赛。

2017年7月18日，教育部、国家语委在北京发布《中国语言生活状况报告(2017)》，阿尔法围棋入选2016年度中国媒体十大新词。

董洁更新了微博跟陈坤什么关系

法律法规网综合消息近日董洁突然更新了微博，距离她上次更新已经五年之久，我们来看看她发了什么？近日，《妈妈是超人》预告片曝光，视频中董洁与儿子顶顶一起去公园健身、打跆拳道、在家教育儿子等日常生活的画面，平凡却温馨 ...

港股下午突然转弱下跌逾三百点

港股今早市况先升后回，跌不足一百点，但下午市况突然转弱，跌逾三百点，恒生指数报28356点，跌355点，跌幅逾百分之一。 ...

张晓明称中央强调对港澳有全面管治权与高度自治无矛盾

港澳办主任张晓明说，十九大报告有关港澳部分的论述，令他感到中央对香港发展的支持，对香港工作的重视，而中央强调对香港及澳门有全面管治权，以及港澳享有高度自治权，两者之间没有矛盾，因为香港回归时政权移交的，不仅是空洞的主 ...

日本首相或将诞生谁将成为日本新首相安倍胜算多大？

法律法规网综合消息日本首相即将在11月1日公布，谁将成为日本新首相，安倍晋三能否连任？安倍胜算多大？ 10月19日电日本第48届众议院选举公告已于10月10日发布，本届日本众议院选举将于本月22日进行投票，并于当天开票。多名 ...

阿尔法狗之父揭秘 阿尔法狗再进化

I 热点 / Hot

阿尔法狗之父揭秘阿尔法狗再进化