余凯:大数据驱动人工智能

前百度深度学习项目负责人余凯

跟大家分享一个叫Google白板的小故事:

Google白板

讲的是几年前,在谷歌搜索的Peter Norvig开了竞争对手微软的一个玩笑,说谷歌里大家用贝叶斯统计的方法,(笔记侠注:英国学者托马斯•贝叶斯在《论有关机遇问题的求解》中提出一种归纳推理的理论,后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法。)就像微软的程序员用的EF(笔记侠注:Entity Framework实体框架,微软已开放代码。)逻辑一样,谷歌是一个大数据公司,是人工智能的公司,用大量的数据训练模型,做了很多事情,包括无人驾驶。

当然,这玩笑的背后讲的是时代的趋势。我在读大学、读本科的时候,那个时候一年级的学生都在如痴如醉地学C++编程。而今天,一个北大清华的本科生找我聊的是他在用大数据训练一个深度神经网络模型,识别信息。

这是整个计算机科学的发展,最近在发生一个深刻的变化。过去通过程序员写程序,去执行这些逻辑的指令,今天是数据驱动的人工智能模型,这是时代的变化。

这个时代的趋势:人工智能的革命

给大家分享另外一个故事:

人工智能

2011年,我在斯坦福大学教一门课,叫人工智能。这个课程项目到最后要交差,是整个课程占分最重要的指标。有一个叫Lee Redden的学生在当时做了一个项目,他拿两个自行车,上面放一台机器,因为他家来自加州农村,这个农村在加州要雇佣很多墨西哥的非法移民,去除杂草。这是一个很费时费力的事情,雇很多的非法人员,也会导致很多社会问题。

他说:他用计算机视觉的方法,是不是能够区分哪个是胡萝卜苗,哪个是杂草?他针对性用高温水枪去除杂草,高温水枪带来的好处是有机食品,无毒无公害。他的这个项目当时还是不错的,得了一个高分。

几个月前,我在拉斯维加斯开会,碰到了他,他做了一个做机器人的公司,叫“生菜机器人”。这个机器人上有36个摄像头,装置了GPU,图像加速处理器,可以运行神经网络,识别杂草。今天美国市场上10%的生菜地都是用他的这个机器人除杂草。

当年课程的一个project变成了现在真正改变世界、造福人类的项目,我觉得是很有意义的事情。这样一个项目,实际上是一个时代的趋势。这样一个时代的趋势,我认为是人工智能的革命。

我们经常讲,人类历史上有四次的产业革命:

蒸汽机时代——电气时代——信息时代,现在到了第四次这样一个门口。第四次跟前面最大的不同,就是这次真正诞生一个新物种了。

人工智能

为什么叫新物种?因为在过去,历次的产业革命实际上都是以人为中心,去延展人的体力跟脑力。它是以人为中心,让人能够跑得更快、飞得更高、看得更远。这次的产业革命,它不再听命于你,不再是这样一个汽车,你让它开快一点、慢一点、左边、右边都听你的。它有可能自动驾驶;它有可能坐在你对面,跟你下围棋,独立做决策,甚至下得比你更好。

这样一个物种,它的典型特征是自主的决策行为。历史上之前所有的机器都不是自主的行为,这次它是自主的决策行为,这是一个典型特征。未来更多的机器人是在不确定性的非标准产线上完成它的工作,它需要独立自主做决策,这就是人工智能所带来的改变。

Android,长得像人的Robot

讲到这个新物种通常会出现一个词:Robot。

机器人是未来人工智能的核心

我们把Robot翻译成机器人,必须指出这个中文的翻译给大家带来好多误解。剑桥辞典对Robot的翻译和解释:「说的是可以在计算机的控制下,能够自主完成任务的机器」。实际上它的意思是说:智能的机器。

我们讲Robot这个产业的时候,它的形态是不是有两条腿,是不是有两个眼睛,是不是有鼻子,鼻孔还朝下,其实并不重要。那有没有长得像人的这样一个Robot这样一个词呢?实际上有的,大家非常熟悉,这个词叫Android。(2003年10月,Andy Rubin等人创建Android公司,并组建Android团队,做机器人,命名为Android。被谷歌收购后,Andy Rubin成为Google公司工程部副总裁,继续负责Android项目,后来Android成了安卓系统。)

在未来,新物种无处不在,大部分都是Robot,但是长得像人的Robot,也就是Android实际上只是小部分。

什么是智能?未来在我们生活的周遭,天上飞的、地上跑的、家里玩的、手里用的,很多的产品很平凡,完全在你的操作下,但是未来它一定是装上大脑、传感器,有着种种智能的算法,有自主的决策和行为。未来十年有上千个品类的产品会变得跟今天不一样,能够感知环境,能够跟人机做自然的交互,能够实时决策和行为,这样的新物种会在我们生活里无处不在。

学习模仿无处不在

给大家看这两张图(一只黑猩猩,一个人类在宇宙太空图),如果把两张图放在一块,大家如果对比,会是怎么样的感想?实际上这两个近亲,从基因的层面来讲非常相像,人类现在已经在探索宇宙外空,探索知识的边界,另外一个还在丛林里吃香蕉。

为什么有如此大的不同?因为我们有非凡的大脑,让我们可以认识这个世界,形成知识体系,让我们做决策和行为。大脑的本质,从物质层面讲就是一团浆糊,但是大脑生物化学的反应导致的是算法的运算,可以让我们做很多事情。同样,从计算机算法来讲,它可以模拟大脑的运算,使得计算机也能够做这些事情。这就是人工智能需要做的事情。

神经网络

在过去十年里,人工智能最大的突破性进展就是深度学习。用计算机的程序模拟类似于大脑的神经网络结构和行为。比如这样一个卷积神经网络,可以对图像识别,能够突飞猛进的发展,包括语音识别,从过去30年的完全不可用,到今天语音的产品已经进入我们的生活,因为深度学习的发展。

深度学习

过去的十年,深度神经网络的发展主要是在感知这个领域,最近我们看到一个新的趋势,从感知到决策。任何一个决策问题都是一个连续决策的问题,不是优化一个短期的收益目标,是优化一个长期的目标。比如我们做投资,连续决策,每天都要面临买卖,买什么、卖什么、买多少、卖多少的问题,但是优化的不是今天的收益也不是明天的收益,至少是年底的收益或者是五到十年的长期收益。

增强学习

这样的模型用简单优美的数学框架叫增强学习。实际上是把这个事情变成一个决策者和整个环境的博弈,对投资来讲,就是每个投资人跟整个市场的博弈。

这个框架也被谷歌应用得淋漓尽致,使得我们的围棋第一次能够超越人类想象的边界。当时在比赛之前所有人都预测,人肯定是赢的,机器是赢不了人类的。比赛前一天网易的记者问我怎么看,我的预测是这次机器一定赢,如果你知道整个行业的发展、技术的发展,你就能做出这样正确的判断。

过去十年,深度学习推进社会有很大的进展,未来的十年,除了深度学习持续发展,另外还有基于因果性的这种推理。这种基于因果性的推理,可以让我们的计算机系统能够做决策,能够做最优化的决策。

从深度神经网络的感知到基于因果的推理,整个人工智能系统从知到行,知行合一这样一个新的境界。深度神经网络是由人工智能一个著名的学者Geoffrey Hinton长达30年时间不断推动的结果,同时基于因果性的推理是由2013年图灵奖的获得者Judea Pearl不断的推动人工智能领域,这个领域会逐渐受到大家的关注。

所有这些东西都是算法,背后都是处理器。处理器大家知道比如英特尔、摩尔定律、复杂适应系统、CPU,构建了整个从80年代开始的信息产业的基础,没有这些东西,今天所有的这些都不复存在。英特尔做的是通用处理器,我们今天讲人工智能,需要考虑感知、认知、决策,控制,那需要为这些问题做专用的处理器吗?回答这个问题,我们还是回到一个本原。

人类的大脑

我们知道现在宇宙中最聪明的是人类的大脑,人类大脑是一个通用处理器还是一个专用处理器?人类的大脑看起来无所不能,所以你很容易得出一个结论,人类大脑是通用处理器。如果你这么看,我问你一个问题:345*6789=?你能够立刻回答吗?

我想绝大部分人不能立刻回答,因为大脑是一个专业处理器。

大脑所擅长的是人类作为一个物种在繁衍、生存,很长的时间段里不需要回答复杂的乘法问题,你只需要数清楚手里的果子;你只需要知道河对岸有一头狮子还是两头狮子;怎么样和你的伙伴形成策略,至少保留种群里可以有人活下来就可以了。这样一个问题涉及不到复杂的问题,但是它需要让你能够在复杂的环境下能够奔跑、爬树,这些功能是大脑擅长的。

再看一个例子:

汉字的顺序不影响阅读

如图,大家可能自己会觉得很吃惊,怎么会这样?这反映大脑处理信息的结构,实际上是并行处理空间序列,不是按照顺序,我们其实对顺序不敏感。有一个时序的网络结构把这个顺序做自我修正,大脑在处理信息的时候有特别特殊的结构,这些结构使得我们并行处理信息,所以对顺序不敏感,效率更高,大脑的功耗是特别低的。

比如我们现在大脑每秒钟的运算次数跟天河二号(目前世界运行最快的计算机)是相当的,但是我们只用20瓦的功耗,天河二号用1000万瓦。

有个人讲过一句话:预测未来最好的方法是创造未来。这个人叫Alan Kay,也是图灵奖的获得者,他发明了面向对象编程,发明了图形用户界面,他发明的GUI构建了Windows和Macintosh两大操作系统的基础。Alan Kay还提出一个思想,就是极致的软件实现必须设计硬件。这个思想只有一家公司follow, 这家公司就是苹果。

计算机处理器架构的本原

站在时代的起点,重新思考计算机产业,你需要思考计算,你要回到本原,你的计算机处理器的架构是不是这样的?大家听起来会觉得很奇怪,但实际上这个事情已经发生了。

CPU的发展

2011年,谷歌当时做大规模的深度神经网络训练系统,当时他们相信用CPU可以做所有的事情,但是这个项目失败了。2012年,当时我在百度工作,负责人工智能项目,在2014年我们意识到GPU只适合做训练,不适合预测。在2015年7月份,我们出来创业,当时所有人觉得很奇怪,你为什么要做人工智能的芯片?

到今年的时候,投资人不再问这个问题了,谷歌也在做,英特尔也在做,看起来好像大家都在做,这是一个大趋势。

人工智能是大趋势

地平线还是站在一个世界的起点,我们是最早做深度神经网络芯片,我们要做的事情是构建这样的软硬件平台,可以支持所有的应用,可以有一千倍的效率的提升,这是我们想做的事情。

我们面临怎么样的未来?未来这样的新物种还有好多种类,这样一个时代,比如我们今天看深圳机场或者北京机场,最多的广告是手机广告,手机催生这么大的产业,因为每个人一台,催生了所有的应用。未来这种具有人工智能的新物种,它的数量是今天手机的数量10倍以上,它催生整个产业革命的规模,它是今天移动计算的10倍以上。

这是我们地平线和同行面临的一个未来。

谢谢大家!

更多文章请点击http://go2live.cn

未经允许不得转载:人工智能 » 余凯:大数据驱动人工智能

赞 (0)
分享到:更多 ()

评论 0

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址