人工智能大战李世石 AlphaGo到底是啥

PChome | 编辑: 张超晔 2016-03-14 05:00:00原创

这几天 阿法狗大战李世石的新闻开始刷屏,全世界的目光都聚集在了这场最强人脑和最强大脑之间的PK,在阿法狗连续两次战胜李世石之后,舆论开始完全倾向人工智能一边,原本预测人脑能够横扫的人们不得不承认一个残酷的事实,人类最后一项运动也将被电脑攻陷。

这几天 阿法狗大战李世石的新闻开始刷屏,全世界的目光都聚集在了这场最强人脑和最强大脑之间的PK,在阿法狗连续两三次战胜李世石之后,舆论开始完全倾向人工智能一边,原本预测人脑能取得完胜的我们不得不承认一个残酷的事实,人类最后一项运动也将被电脑攻陷。

人类和电脑的战斗其实从未停止过, 1997年5月11日,一台名为“深蓝”的超级电脑将棋盘上的一个兵走到C4位置时,人类有史以来最伟大的国际象棋名家卡斯帕罗夫不得不沮丧地承认自己输了。世纪末的一场人机大战终于以计算机的微弱优势取胜。整个比赛引起了全世界传媒的巨大关注。比赛吸引人们注视目光的原因之一是世界象棋冠军卡斯帕罗夫赛前充满信心,发誓要为捍卫人类之优于机器的尊严而战。然而,最后的结果却是他所捍卫的人类尊严在一台冷漠的“蓝色巨人”面前被无情地击溃了。

围棋是相当感性的项目,它不像象棋每个子都有价值计算,目标明确就是将死对方的王,不被对方将死。围棋的形好坏是相当感性的东西。对优劣的判断也不是纯计算的结果。

而且,围棋的棋盘太大,手数太多,五子棋的复杂度是10的28次幂,国际象棋是10的46次幂,而围棋因为棋盘大,复杂度是10的172次幂。复杂度越高,对计算能力的要求就越高,所以围棋计算机程序的水平一直无法与人类高手相比。这也是为什么人类坚信在围棋上电脑永远不可能战胜人类的重要原因。但是AlphaGo的出现彻底颠覆了我们的认知,那么AlphaGo到底是个什么的怪物呢?

AlphaGo的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到黑;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

更为可拍的是,AlphaGo具备了深度学习能力,这个深度学习是可以不断进化的,学习过的越多,选点的水平就越高,而在选择了有限的点之后,就可以用MCTS (Monte Carlo tree search)来算下去了,求出最优解。AlphaGo可以通过自己与自己下棋从而产生出无数盘棋局。这就好比拥有了一个可以不断自己我学习,从不知疲倦的大脑。

AlphaGo研发有何意义?AlphaGo里面的深度学习、神经网络、MCTS,和AlphaGo的扩张能力计算能力都是通用的技术。AlphaGo今天要进入一个新的应用领域,用AlphaGo的底层技术和AlphaGo的团队,应该可以更快更有效地开发出解决方案。简单来说,计算机具备了深度学习能力以后,人类的所有劳动都可以被替代。工厂是无人的,车辆是无人的,飞机是无人的,饭店服务员是机器人,名厨是一台自动烹调的机器,人类只复杂在机器故障或者失灵时候,做人为的干预与检修。而机器给人创造的财富几乎没有上限,只取决于自然资源的多少。或许,电影中虚构的天网系统将在不久的将来成为现实。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑