首页 > 热点

李世石输给机器了,AlphaGo是个什么鬼?

作者:佚名 来源:法律法规网 2016-03-10 06:50:02

昨天,围棋界上演了一出人机大战的大戏,韩国著名棋称,被称为韩国围棋棋王的李世石和谷歌制造的一台名为AlphaGo的机器人进行了一场对抗,虽然开赛前李世石多次自称有信心,但结果还是败给了AlphaGo机...

 1.jpg

昨天,围棋界上演了一出人机大战的大戏,韩国著名棋称,被称为韩国围棋棋王的李世石和谷歌制造的一台名为AlphaGo的机器人进行了一场对抗,虽然开赛前李世石多次自称“有信心”,但结果还是败给了AlphaGo机器人,全球围棋界一片哗然。

AlphaGo是什么?棋王李世石为什么会输给AlphaGo呢?下面,我们来分析一下这两个问题。

AlphaGo说是机器人,其实,它不过是一款电脑程序。AlphaGo由谷歌旗下,位于英国伦敦的DeepMind公司研发,是一款专业的围棋人工智能程序,去年10年,AlphaGo就曾向欧洲围棋冠军、职业二段选手樊麾下战书,并以5:0的悬殊比分大胜。此次挑战韩国选手李世石,在科技迷们看来,AlphaGo的胜算也已不言自明。

昨天的比赛中,AlphaGo开场并不算太完美,因为在布局和大局判断上不如人类顶级棋手,本来,很多人认为,此局李世石赢定了,没想到,在后盘的较量中,AlphaGo越战越勇,最终反转。有人认为,李世石昨天输在了中后盘的松懈上,如果后面李世石能够乘胜追击的话,胜负很有悬念。

网络上,昨天有人发了一篇评论,对李世石输给AlphaGo是这样分析的:

熟悉围棋的朋友应该都知道李世石有个外号叫“僵尸”,这源于他“僵尸流”的棋风,即总在局面不利的情况下绝地反击;相应的,他也时常在一些局面占优的情况下丢掉比赛。

而这种明显的战术风格也很容易在算法上进行针对*设置,而且别忘了,过去三个月,AlphaGo 每天都在进行着成千上万局的模拟对弈。

昨天的比赛进程也证明了这点。李世石在比赛开始时选择了他并不太擅长的进攻*打法,在 AlphaGo 出现一次重大失误后,李世石没有捉住机会一举拿下比赛,而是在之后多次的正面交锋中节节败退最终选择了认输。

让敌人用不擅长的方式应战,这是李世石陌生的套路,也是 AlphaGo 胜利的正确方法。

当然,虽然存在着商业上的考量,但这些并非对人工智能的恶意揣度。别忘了,在这次人机对战的规则中,哪怕是在未满五局的情况下胜负已分也要坚持打满五局。

虽然看上去有些胜之不武,但是,如果你认为 AlphaGo 也是那些只会赚噱头的“人工智障”公司的产品那你就错了。

毕竟,打人机,人类派出的可是韩服第一上单。

“早期象棋机器会有盲点和可加利用的弱点,而且吸引棋手的是将(利用)这些(弱点)作为目标,而不是正儿八经对弈。对战深蓝时,我就没有抵挡住这一诱惑。心智(Mind)运动,比如象棋和围棋,需要高度集中的精神,当你的注意力被试图对计算机耍花招打乱时,最终就是诱惑自己下出客观上并不可靠的棋招。随着机器变得强大,这些做法会受到惩罚。”

20 年前曾输给 IBM “深蓝”机器人的国际象棋大师 Garry Kasparov 输给了曾经的“穷举法”,而 AlphaGo 进步的地方在于,他在更为复杂的运算体系里只使用了“穷举法”几千分之一的计算量。

简单地说,AlphaGo 学会了自己思考。

AlphaGo 的核心是两种不同的深度神经网络——“策略网络”(policy network)和 “价值网络”(value network)。它们通过相互配合来计算出相对有优势的步法并摒弃差棋,从而将计算量控制在计算机可以完成的范围里。

在“价值网络”中,AI 会一边推算一边判断局面,当局面处于明显劣势的时候,机器便会就直接抛弃某些路线;而“策略网络”则负责减少搜索的宽度,将那些棋步是明显不该走的放弃并避免无端送子给对手吃。通过将这些信息放入一个概率函数,AI 便可以重点分析优势的步法而不用给每一步以同样的重视程度。

这种“思考”的方式本质上和人类棋手所做的一样。与之不同的是,人类在长时间的比赛后难免会因为疲劳而犯错,但机器不会。而且机器能通过每天近 100 万局的训练来不断提高,而精力的限制却似乎只能让人类随着时间的积累而束手就擒。   

与此同时,Google Deep Mind 团队还采用了“监督学习”(supervised learning) 的方式让 AI 和自己进行对弈,这种“强化学习”(reinforcement learning)的方法也能让 AI 长期处于高水平的对抗中。这也是 AlphaGo 最可怕的一点。

虽然如此,我们时至今日也没有让机器自动化这个概念实现真正意义上的突破,大多数机器还是只能进行一些重复的运算和工作,不能从复杂的环境里面学习到一个事物跟另一个事物之间的关系,它需要人不断地去引导。

“无论哪个搜索引擎,做图像搜索的时候,因为它没有概念,我们需要用手圈一下,告诉它识别这个部分的图像。而不像人一样,人站在这个讲台上时候,非常容易能够把人和背景抽离开。我看到别人是怎么找出租车的,我一招手就能够学会。”

搜狗 CEO 王小川认为,人有概念之后能够一次*建立推理能力,但昨天的机器还不具备这个能力。这就好比,人靠一张图片便可识别什么是“猫”,而 Google 通过 200 万张图片的测试才将图片识别的准确率提升到 75%,而对概念的缺乏也让 Google 将非洲妇女识别为猩猩,这当然引来不小的争议。 

智能搜索、推荐和各类电子助手正让你的生活变得越来越便捷,但关于无人驾驶和 AI 未来的安全*担忧也从未消减。

抛开那些概念*的探讨和对人工智能“挂羊头卖狗肉”似的跟风,我们更应该关注的是如何有效提高技术的效率和实用*,这要大于比赛本身的意义。

上一篇 下一篇

I 热点 / Hot