AlphaGo（阿法狗）对科研的启示-江西理工大学期刊社

AlphaGo（阿法狗）对科研的启示

作者：bjb 时间：2016-05-25 点击数：

　　2016年3月上中旬应该属于AlphaGo的，计算机围棋程序首次番棋赛中击败了顶级职业棋手，并且取得了碾压式的胜利。这个结果，引起了整个社会对人工智能极大的讨论。在那段时间里，新闻、微博充满了AlphaGo和AI，有讨论技术的，也有展望未来的，也不时有公司宣称要深度进入AI领域。虽然现在影响随着时间逐渐消逝，但是AlphaGo的这5盘棋带来的影响还会持续很久。已经有很多文章从技术层面上讨论了人工智能的潜在应用和对社会带来的影响，这里也不再重复了。作为科研人员，AlphaGo也可以对我们的工作带来不少的启发。

　　从技术上来说，AlphaGo使用的深度学习技术是比较通用的，可以用在非常多的领域。如果自己的研究方向涉及到大数据的分析，或者是多自由度的优化等等，卷积神经网络会有比较大的用处，当然难度也是有的，有效地网络需要大量有效数据的训练，收集数据也是个功夫活。

　　讨论非技术因素更有意思一点。首先，关于怎么寻找课题，Deepmind给出了一个很好的例子。围棋够难，但是似乎也没有那么难。因为规则极为简单，入门极为容易。计算机围棋程序经过了十几年的发展，基于蒙特卡洛方法的程序到目前为止已经有业余4段的水平了。即使没有AlphaGo的强势介入，按照正常的发展，5-10年内也非常可能跨入职业水平。可以说现在属于黎明阶段。再看看影响力，围棋是一个小众游戏。但是据说，看这次人机对战直播的人超过1亿。懂棋的不懂棋的，都在关注。因为这个比赛本身已经超越了围棋，而成为人工智能的代表者。虽然它离真正的人工智能还有很长的路要走。课题的前景跟社会影响力都有了，那为什么这么有面子的事情没人抢着做呢？信心！！！不少人都在观望，能看到的只是阶段性的进步，而看不到跨越式的提升。但是deepmind做到了，而且仅仅花了2年时间。所以呢，我们申请和批准项目的时候，是不是眼光可以放远一点呢？如果眼睛就盯着一个点，就只能看到难度，总觉得在自己能力之外，那是很难有创造性地突破的。

　　AlphaGo的胜利是谁的胜利？我觉得，是资本的胜利。从学术上看，虽然AlphaGo创造性地使用了多个网络协助方式来预测下一手的着子，但其核心的卷积神经网络并非其首创，在60年代的时候就已经被提出。只是近年来由于其在图像处理上的巨大优势而成为热点。卷积神经网络用来处理二维的数据，要想作为成功的预测手段，需要构造复杂的网络和巨大的训练样本，还需要调节大量的参数，工作量很大。要想训练出达到职业棋手水平的网络，一般的个人和团队没法短时间内完成，google则动用了海量的资源。Nature上的文章说，google训练了3000万盘棋，这是什么样的一个概念？按照平均一盘棋为150手来算，按照1秒钟一个CPU训练一手棋，3000万盘需要125万个小时。按照学校的超算中心的单个CPU价格为4毛钱一小时，那么训练一次这些棋谱就要花费50万元。要想早出结果，并行是必然的，考虑到效率的降低跟中间犯错误的可能，光是计算的成本就要10倍不止。放眼世界，有魄力、有资源、有兴趣花这么多钱玩围棋的公司就寥寥无几了。当其他开发者还在绞尽脑汁想办法提高算法效率的时候，拥有同等技术的资本家早就完成了跨越式的超越。

　　AlphaGo胜利的时候，也会是一部分人梦碎的同时，超大资源的优势会无情地碾压掉对一部分科研人员对自己智商的信心。现在的科研，跟过去的个人英雄时代已经不一样了。将来的科研更属于集体，而资本的作用也会越来越明显。科研个体户提出点概念没问题，但是要多做点时间，就要面对更多写本子找钱的问题。

　　这次的人机对战，google的营销手段称的上是顶级公司的手笔。100万美金的噱头，和非主流职业二段的诱饵，让任何人都无法不心动。而且google的保密的确做得很好，直到第一盘棋电脑胜势之前，大家都还是相信李世乭拿下是没有问题的。看最后的结果呢，李世乭成为AlphaGo登基的垫脚石，拿到的也只是十几万美元的出场费。而google的股价增值了大约5%，那可是200亿美元呢。这种性价比真的没法说。科研也是需要营销的。我们习惯了灌水。但是从另外一个角度想，是不是可以少发点文章，憋个大招呢？

　　本文引用地址：http://blog.sciencenet.cn/blog-681387-978362.html