详细信息

AlphaGo击败柯洁,未来真的属于AI吗?

发布时间:2017-05-25 09:23

5月23日,中国·乌镇围棋峰会的首场人机围棋对抗比赛,暨“柯洁PK AlphaGo”三盘棋的第一盘刚刚结束。AlphaGo 经过一番苦战,成功击败世界第一柯洁,取得1:0的领先。


本次柯洁与AlphaGo的终极对决共有三盘,除23日外,25、27日还分别有一盘棋的比赛。


开幕仪式上,柯洁与DeepMind CEO 哈萨比斯以及Alphabet 董事长 Eric Emerson Schmidt合影


峰会开幕式也在23日上午举行,DeepMind CEO 哈萨比斯在开幕式的演讲中说到:我们最终的目的是探索新的领域,而最终的胜利属于人类。中国是围棋的诞生地,这是举行最伟大对弈的理想地方。非常感谢中国各方面的帮助。柯洁是一个真正的天才,相信他和  AlphaGo的对弈,将开启一个新的天地。围棋是艺术,非常深奥,我们的峰会宗旨在于探索新的思路,如探索宇宙一样,相信再过一万年,也无法穷尽。



本次峰会的开幕仪式上,我们看到以三维围棋也就是魔方作为整场峰会的主题之一,AI 围棋是对人类智能的升格。从AlphaGo去年与李世乭的对战以后,现在众多棋手已经开始从AlphaGo身上学习新的下法,新的策略,比如著名的“点三三”。长远看来,这不仅是AlphaGo(阿老师)对围棋世界的影响,更是人类文明的智能革命的一个开端。


胜负已无悬念?第一盘比赛回顾


比赛开始之前,柯洁普遍不被看好,不少人工智能领域的专家都直接给出了“胜负已无悬念”的论断。虽然目前三盘比赛只下了第一盘,但是对柯洁能否最终取胜,大家普遍比较悲观。


比赛开始不久,哈萨比斯就在Twitter上发文,称柯洁使用了1月份时候出现在线上对战平台的Master的下法。哈萨比斯还说,柯洁明知AlphaGo喜欢三三,开局就用三三式


开局半小时后。黑白双方用时相差10分钟。这次比赛相比于李世石和阿尔法狗,人和机器的时间都增加了 1 小时。开局半小时,柯洁下出了很多针对阿尔法的下法,效果还有待考察。


据观察,AlphaGo 每步棋都用时 40秒 左右,这样 3 个小时Alphago是远远用不完的。



简单回顾一下比赛:


今天的第一盘比赛,柯洁执黑,AlphaGo 执白。


柯洁使用了 Master 此前经常采用的 大飞 下法开局,这不是柯洁惯用的开局方法,这一下法很有针对性。明显是针对 AI 专门训练的。


柯洁说阿尔法狗风格“不拘一格,狂捞实地”,柯洁先捞实地。看能否引发阿尔法狗 Bug。黑棋点三三,白棋二路扳,都是在捞取实地。

 

如果换作以前,人类棋手可能会觉得局面不利,只捞了一个角,角上的实地也不是很大。但现在,因为 AI 的洗礼,人类的认识已经有了很大变化。


中午没有分盘,AlphaGo 在体力上的优势不言自明。黑棋捞实地,白棋则有一定的外势。人下得越来越像机器,机器倒有几分像人了。



双方行至中盘,盘面相当。柯洁用时几乎是AlphaGo的一倍。可以看出,柯洁一直努力在找 AlphaGo 的漏洞。而在双方的近身缠斗中,执白的 AlphaGo 一度还似乎略处下风。但这“下风”仍然是人类的认识。记得去年 AlphaGo 大战 李世石时,李世石在几盘棋中也似乎占有着一点点优势。


进入到官子阶段,局面愈发焦灼。有围棋专业人士评论,对 AlphaGo 来说,连胜 60局时都未曾出现今日的艰难局面。


AlphaGo收官异常简明,甚至使出苦肉计弃一子吃黑两子将白棋彻底做活。


AlphaGo的用时,令人发指的短........到最后还剩了接近两个小时,柯洁只剩10多分钟.......


AlphaGo 2.0 与其 1.0 相比有哪些提升?深度解析


另一方面,AlphaGo也不在是一年前的AlphaGo了。


1月11日,哈萨比斯在出席德国慕尼黑举行的DLD(数字、生活、设计)创新大会,宣布将推出真正2.0版本的AlphaGo,特点是摈弃人类棋谱,只靠深度学习的方式成长。哈萨比斯有一次在剑桥大学的演讲中提到,以前从零训练一个AlphaGo要三个月,现在只需要一个星期。由此看来,硬件上AlphaGo已经有了较大的升级。


搜狗公司CEO王小川在知乎上写道,根据公开资料推测,此次AlphaGo2.0的技术原理与之前有着巨大不同:


1. 放弃了监督学习,没有再用人的3000万局棋谱进行训练。这本是AlphaGo最亮眼的算法,也是今天主流机器学习不可避免的核心条件:依赖于优质的数据,在这个特定问题下就这么被再次突破了。


2. 放弃了蒙特卡洛树搜索,不再进行暴力计算。理论上,算法越笨,就越需要暴力计算做补充。算法越聪明,就可以大大减少暴力计算。从AlphaGo 2.0的“马甲”Master的历史行为看,走棋非常迅速,约在每10秒钟就走棋一步,如此速度很可能是放弃了暴力的计算。


3. 极大地强化了增强学习的作用,之前敲边鼓的算法,正式成为扛把子主力。想想看有多励志:两台白痴机器,遵守走棋和获胜规则,从随机走棋开始日夜切磋,总结经验,不断批评和自我批评,一周后终成大器。


Alphago 强大之处并不在于单独的一手或一连几手,而是它为每一局对弈带来的独一无二的新视角。虽然围棋的风格很难以一言以蔽之,但 AlphaGo 的策略象征了一种灵活和开放的精神:没有先入为主的观念,因此可以找到最有效的对弈策略。


勇士柯洁:探索人机共存的正确态度


5月22日,在围棋大战开始前夜,柯洁在微博上发文:


决战前夕,感慨万千...

在这个特殊的时间,我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

无论输赢,这都将是我与人工智能最后的三盘对局

很多人可能会问为什么?

其实私底下我已经与朋友家人说了很多次这样的想法,现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距,但已经表现出超强的实力了...我相信未来是属于人工智能的。

可它始终都是冷冰冰的机器,与人类相比,我感觉不到它对围棋的热情和热爱。对它而言...它的热情——也只不过是运转速度过快导致CPU发热罢了。

我会我用所有的热情去与它做最后的对决,不管面对再强大的对手——我也绝不会后退!至少这...最后一次...

拼尽全力后,无论结果...管他口中是是非非,来一首《沧海一声笑》..岂不美哉、快意?我淡然笑到...

不眠夜,且看且珍惜,请大家欣赏我最后的三盘人机大战。


正如柯洁所说,“未来是属于人工智能的”,这一点是大势所趋。柯洁,包括众多即将走上与AlphaGo对决赛场的职业棋手们在这场大赛中我们展示了面向未来世界的勇气和热情。


正在大家都认为人类毫无胜算,人工智能越来越强大的时候,勇士柯洁依然勇敢地站了出来,迎接来自人工智能的挑战。


未来,AI 会是无处不在的。AlphaGo在2016年横空出世,开启了人与机器共存的新时代,也带给我们更多关于人类未来、关于智能、关于人类的“存在”的深度思考。在这一点上,勇士柯洁树立了一个很好的榜样。我们要做好准备,勇敢迎接一个人机共存,人与机器共同进步和进化的时代。


素材来源:新智元