辛顿惊讶的道:“你们攻克了《打砖块》?”
哈萨比斯眉开眼笑的道:“没错!”
“快演示给我看看!”辛顿颇为激动。
从上个世纪50年代人工智能刚形成概念的时候起,游戏始终都是人工智能的重要测试手段。
早在1990年的时候,人工智能就在跳棋项目上击败了人类世界冠军。
1997年,ib的超级计算机“深蓝”击败了国际象棋世界冠军卡斯帕罗夫。
2011年,另一台ib计算机“沃森”在游戏《危险边缘》中击败了所有人类玩家。
deepd也试图从游戏项目入手挖掘人工智能的潜力,他们开发出了一个会玩游戏的人工智能,主要目标瞄准了雅达利游戏。
雅达利是一种上世纪80年代流行一时的主机,曾经是游戏市场的霸主,却由于推出了一款史上最垃圾的游戏《et》而一蹶不振,最后被任天堂的fc取而代之。
但在很多欧镁人的心中,雅达利游戏依然是经典,其中最出名的几款游戏《太空入侵者》、《乒乓》和《打砖块》都被deepd列入人工智能的攻克名单。
来到演示电脑前,屏幕上正在进行着一场《打砖块》游戏,没有人操控,挡板自动的在屏幕下方游走,一次又一次的把小球弹向上方砖墙。
哈萨比斯道:“弗拉德,你来给大家讲解一下吧。”
弗拉德·姆尼是deepd的资深工程师,这台正在打砖块的人工智能系统正是他率领团队做出来的,闻言点了点头道:“诸位,我们使用一种全新的深度神经网络构造方法,制作出了这个系统。通过反复试错来学习《打砖块》的游戏方法和每一种击球角度的细微差别,目前已经玩了14283局游戏,系统已经能够分析出哪一种动作是有效击打,哪一种是无效击打,我们称这种学习方式为强化学习。”
“在最初的系统中,它需要300个小时以上,才能精通这款游戏,并且通关。经过我们不断调整算法和结构之后,它现在已经能够在30分钟之内学会游戏的基本规则,1个小时达到普通玩家的熟练度,每次都能准确的接到小球命中砖块,2个小时候它就学会了进阶技巧,能够找准角度把球打入砖块后的狭窄空间,利用小球在砖块之前的反弹碰撞快速得分。”
“目前,这个系统在游戏中的得分已经超越了deepd的所有人。”姆尼最后的一句话发人深省。
辛顿一直靠在墙边安静的听着,直到此时问道:“所以你们的系统真的是每一次都从头学习打砖块的游戏技能?”
姆尼道:“没错。我们只是设定了一个目标,比如得到最高的分数,它就可以自动试错和学习,制订一些独特的游戏策略。这些策略的最终目标就是得到最高分。然后,它每次都能成功,只是每一次耗费的时间越来越短。”
“真是令人震惊……”辛顿喃喃道。
李睿尽管早就知道人工智能会在十年后掀起狂风巨浪,也依然和辛顿一样,受到了深深的震撼。