观察 分析 正文

汪军:人工智能将广泛应用于金融和广告行业

未来几年,人工智能和机器学习我们会看到有更广泛和深入的应用,特别是在控制和决策层面,深入影响到金融、互联网广告等领域。

人工智能将广泛应用
人工智能将广泛应用

电脑很难学会围棋的定论终于改写。3月12日,谷歌alphago世界围棋顶尖高手,曾经获得18个世界围棋冠军头衔的李世石。

在alphago的第一场胜利之后,职业围棋界不再取笑取胜“欧洲冠军”的电脑棋手,而在0比3输掉了这轮人机大战的系列赛后,职业围棋选手们不得不低头。中国围棋终身棋圣聂卫平就表示,alphago最终说服了我们,它真的会下围棋。

而人们普遍意识到的是,alphago的这场胜利,将会在世界范围内掀起一场人工智能、机器学习所引导的革命,广泛地影响到金融、互联网等行业。

世界顶级人工智能、数据挖掘专家,伦敦大学学院大学(UCL)教授、互联网科学与大数据分析专业主任汪军认为,之前“深度学习”的应用停留在预测上,比如图像识别,语音识别,和机器翻译。但是,Alphago证明“深度学习”也可以用在控制和决策上,特别是在处理动态数据和实时接收并处理反馈信息上有很大空间。

汪军的主要研究领域包括信息检索,数据挖掘以及在线广告学,他发表了80篇学术论文。2007年,他在美国获得了由微软“超越搜索——语义计算和互联网经济学奖”。此外,他还是2014年Yahoo!FREP的获奖者之一,是ACMSIGIR2005(国际计算机学会)的领域主席。

他也是北京优路公司的创始人,一家基于人工智能和数据挖掘领域技术的创业公司,主要服务于媒体、金融、电商、互联网娱乐等领域,通过挖掘用户数据信息,帮助企业降低获客成本。

汪军认为,未来几年,人工智能和机器学习我们会看到有更广泛和深入的应用,特别是在控制和决策层面,比如在金融方面可以对投资决策进行优化,在在线广告行业可以对广告投放进行更佳精确的定位和实时竞价,对网上的欺诈行为可以进行有效地监测和剔除。

Alphago的创造者deepmind的创始人DemisHassabis即毕业于UCL大学,另外有2位核心人员ThoreGraepel和DavidSilver仍兼任UCL大学的教职。在大赛开始前一周,deepmind团队曾回到UCL大学,针对全球关注的alphago做分享,展望与李世石的比赛,信心满满。

3月24日,在alphago和李世石的世纪大战系列赛之后,DavidSilver还将回到UCL再做一次总结报告。汪军也将开设专门的针对深度学习的课程,并专题分析alphago的技术进展。

Alphago项目的成功彰显了UCL大学在科研和成果转化方面的超强实力。UCL计算机系在人工智能和机器学习的研究领域在全球处于领先地位。2014年,在英国四年一度的大学研究评比中伦敦大学学院计算机系排名全英国排名第一。

此次,alphago与李世石的比赛吸引了来自全球科研、职业围棋界、企业乃至大众的广泛关注。全球范围内如此关注一场“人机大战”,最早是1997年IBM研制的“深蓝”面对国际象棋大师卡斯帕罗夫的,深蓝战而胜之。2011年,沃森自然处理系统在电视综艺节目中战胜人类的智利冠军。

汪军分析认为,alphago的胜利同深蓝和沃森的例子不同,alphago采用的是通用人工智能技术AGI(artificialgeneralintelligence)。强调是endtoend从原始数据开始直接提供解决方案,尽量减少人工干预。换一个场景重新训练,只要问题相似可以解决另外一个问题。

“alphago的一个主要技术突破是把深度学习和强化学习有效地结合起来解决一些实际的问题。让机器人学习围棋这件事归结于一个搜索的问题,也就是说在有限的时间里怎么样找出最优的落子。”汪军说,“深度学习”目前也是世界范围内最受瞩目的研究领域,该技术主要是用多层嵌套的神经网络技术已达到endtoend的解决方案。

Alphago的难度在于,围棋有10的171次方种落子选择,直接遍历搜索的话是不可能的。计算机的任务就是要发现一个比较好的方案能够在有限的时间里面找到落子方案。

10年前技术突破是计算机采用树状的结构把棋手的步数,有效表达出来。再用蒙特卡洛仿真的技术遍历搜索树以达到有效地寻找到优化解决方案的目的。这个方法的好处就是因为不需要任何先验的知识(比如说以前自然人的棋局)和人工干预就可以和人类进行比拼。

但是,这种算法效率对于围棋来说还是非常不够。在小棋盘中可以,但是到真正的19×19的棋盘中就显得捉襟见肘。Alphago正是采用深度学习的方法有效地将先验知识结合到蒙特卡罗仿真树搜索中。

汪军解释,alphago有两个“大脑”。一个是通过深度学习的方法通过对以前大量自然人然人下围棋的数据进行“监督学习”,预测如果是自然人他应该走哪一步的概率。而另外一个大脑采用同样的深度学习方法对第一个大脑进行提高,通过不断地仿真对每一个下棋位置提供一个价值的预测。当有了这两个大脑以后,蒙特卡罗仿真就有的放矢,大大的提高了优化的准确率和其效率。

“深度学习和强化学习的结合是一个技术上的发展,延续的深度学习在自然语言处理和计算机视觉中的应用突破。值得关注的是之前的深度学习的应用停留在预测上比如说对图像的识别、机器翻译。Alphago证明深度学习也可以用在控制和决策上。”

正如此前,深蓝和沃森自然处理系统引发全球工业界和学术界对相关技术领域产生了一次热潮,推动的技术的进步和发展。此次,alphago所引发的关注更超过了深蓝和沃森系统,对人工智能、机器学习领域研究和产品开发持续升温。我们应该会陆续看到更多的技术开发和工业应用会接踵而来。