姚欣:人工智能的创业“风口”(上)
人工智能
A轮学院
贺老屋
2016-08-28 17:30
[ 亿欧导读 ] 姚欣,pptv网络电视创始人,在过去的半年时间,他置身于美国硅谷,感受了一番科技创新的氛围。本文是他回国后对硅谷见闻的内容分享,同时包含他对近20年科技发展的理解,以及对深度学习和人工智能的看法。
姚欣

大家好,我是姚欣,今天很高兴能够做这次跨群的直播,这也是我在网上做上千人的这样一个分享,虽然看不见大家,但还是有点小紧张。今天我的分享也是从过去半年时间,我在硅谷居住游学的一些心得和体会,我先简单介绍下自己,我是pptv网络电视的创始人,2004年在华中科技大学休学,然后创办公司,14年后,我离开公司。过去的一年时间,很多时间都在看新的方向,那今天的分享实际上也是我在硅谷游学的一些心得和体会。

姚欣分享人工智能心得

一、回顾科技发展

在过去十多年的创业过程中,我很大的一个感受,创业者其实非常的难,因为一方面创业者需要有从0到1,他的这种产品加直觉。但其实创业者更重要的一点,还需要跟你喜欢的事业结合起来。当我在结束pptv的创业之后,实际上过去一年多的时间,我一直在思考,下一次新的机会和机遇在哪里,或者下一波,巨大的风口在哪里?实际上也是带着这个问题,我在硅谷停留了半年多的时间,然后看了很多相关领域,但在这么多领域里面,可能我觉得最为感受强烈的是技术创新的氛围。

姚欣分享人工智能心得

我先把我的观点抛出来,我觉得从硅谷的经验来看,接下来整个创新周期会进行一次更迭,实际上我们知道过去的十多年,特别是98、99年互联网开始起来,这十几年的起起伏伏里,互联网的商业模式或者模式创新是整个互联网的核心,因为他的技术创新早就已经突破了,包括pptv这个业务,商业模式本身,其实我们都是将很多传统行业搬到网络上来,但我同时有能感觉到,新的一轮创新周期,可能它的核心题材会以技术为主,为什么这样?我在硅谷,也看了许多硅谷的历史,给大家做一个小小的分享。

姚欣分享人工智能心得

如果大家有机会去硅谷的话,我非常推荐一定要去那个Mountain View山景城,距离谷歌总部不远的计算机历史博物馆,在博物馆详细介绍了整个硅谷是怎么诞生的,包括整个计算机产业怎么从无到有发展起来的。在看整个博物馆的时候,能感觉到,在每一个不同的时代,最核心的主题或者每一次时代的变迁,其背后的科技力量实际上是由这三种能力构成的,分别是计算、交互和连接。

这三种能力每一次出现质的飞跃,都会推动一次产业的大革新,比如pc时代,主要是因为CPU摩尔定律,然后得到了一种指数级的计算能力不断的叠加,就是平均18~24个月左右,计算能力提升一倍,但成本下降很快。所以今天我们的计算机其实在当年来讲的话,已经算是超级计算机了。另外一个很重要的事情,就是发生在PC时代,大家都读过《乔布斯传》,大家可能注意其中,提到了乔布斯从施乐公司的研究中心偷学到了GUI图形界面,其实开发这种图形界面以及操作方式,也包括开始大量使用鼠标这种新的交互手段。其实在这里有一个很有趣的一点,大家发现没有。

就是PC,我们在80年代以前统一叫做计算机,但是在80年代以后,大家开始称之为电脑,实际上从计算机到电脑这个翻译的变迁,你也能感觉到在PC诞生之前,其实那个时候的电脑更多的是一个专有的计算工具,但在这之后缺成了一个电子辅助大脑,那这一点也是拜整个GUA图形界面的诞生,很多专业的操作不再由专业用户才能使用,而是普通的消费者。普通的办公白领都可以方便的操作电脑,而不是只有程序员才能操作电脑,那这个其实也是Ω对PC时代普及很大的推进。

那第三块来讲的话是局域网技术,我还记得当年最开始在80年代末90年代初,当时使用的电脑还叫微机,用那个时候的话来讲的话,实际上就开始有小范围的和区域性的联网,主要是因为单机的计算能力太薄弱了,或者存储空间太有限了。这个时候的话,就把一个房间里面的多台电脑连接起来,承担不同的角色,这就是那个时候的局域网,但局域网这个名字也决定了,它只是在一个小小的固定区域范围内,但它给未来的互联网打下了很好的一个基础。

实际上到了1995年互联网时代普及。普及的几个典型特征就是:在计算方面,客户服务机器开始发展起来了,就是因为虽然有CPU摩尔定律,这样不断的每1~2年性能翻倍提升,但还是太慢了。那这个时候大家想说,能不能让我们的每个人使用的电脑连到一台非常强劲的电脑上面去,那我们就可以调用这台强劲电脑的服务器端的计算存储能力,那这个就是客服机服务器的发起的缘由。也开始由访问本机资源到访问对方服务器资源的时代,但这种访问最先开始也是基于命令行、基于指令的,也只有专业人士才能操作。我记得最早在互联网上,上网都是需要敲指令的。

所以针对这种不方便,在94、95年的时候,又有一家著名的公司诞生了。这家公司叫Net网景,诞生之初,连续在华尔街涨停,其实这家公司最重要的一件事情是发明了浏览器,而且是图形界面的浏览器,实际上再次将整个上网的门槛大幅降低,不在是针对专业人士才可以使用,而普通消费者,我只要会使用鼠标键盘,我也可以去上网。所以才有了后来互联网时代的到来,但我们也要知道,在互联网时代,我们早先上网的方式主要是我们的PC机,然后连接一个modem,拨号上网。我记得当年在国内互联网94、95年的时候,网费非常的贵,每小时都是几十块钱,那个时候都是需要的时候练上去去,不需要的时候就断开,按照使用时间来计费。

而随着技术的不断进步,在十多年以后,就是到了2010年前后,特别是iPhone 3GS的发明发布为标志,我们迎来了全新的移动互联网时代,移动互联网时代同样的也是三种能力的一个质的飞跃。一个就是云计算,实际上就比服务器计算,我们可以更进一步去强化服务器端的资源与计算能力,不仅仅是把一个区的服务器连接起来,甚至把全球的服务器连接起来。比如说谷歌,据说现在服务器数量已经是近千万台,它在全球可能有数千个这种计算节点,然后把这些能力连接起来,形成一个庞大的围绕全球的这样的一个云计算网络,那这个就是云计算能力的提升。另外一个来讲,手机也成为一个非常重要的交互终端。

手机跟键盘最大的差别是,触控的发明。所以说当年还在用键盘的,比如黑莓、诺基亚那种,还不是真正的移动互联网时代。这里还的再次感谢乔布斯的发明,让我们用这种触摸的方式去操控。举个例子,比如我的父母,在PC互联网时代只能上网,没法聊天,因为他们打字不会用拼音,但现在他们用微信可以很方便的输入,很方便的交流。同时的话,手机还集成了各种位置传感器、摄像头等设备,其实可以更方面的让我们去感知这个世界,所以手机也不断成为我们新的移动互联网时代的交互中心,触控也成为我们主要的操作手段。

当然在移动互联网时代,最大的差别还不仅仅是前两项,它的连接方式发生,发生了一个质的飞跃,就是从最开始的有线拨号上网到后来的3G普及,大家开始无线上网,4G之后速度更快。实际上一方面,我们可以看到上网更方便啦,更快了,不需要网线了。但其实无线比有线更重要的一个区别是什么?无线的情况下,你可以全天候24小时都在线,PC机时代你必须停留在PC机前面,PC机连上网的时候才是上网。举个例子,大家都知道早些年我们使用QQ的时候,有个隐身的功能,但是现在你用微信不会让你隐身,因为默认就是你都已经连在网上了,随时随地都可以访问和连接互联网。

我特别想指出,这种方式不仅仅只是一种技术的提升。其实在它的背后还隐藏着商业模式的变迁。举个例子,就想我们看到的新的商业模式,比如嘀嘀打车、uber,那你能看到,如果在当年还是有线拨号上网的情况下,这种服务是不可能诞生的。司机不可能在PC机前面接这个单,然后再去接客。而今天司机随时在车里就可以接单,我们也可以方便在车里进行支付,这个时候是全在线的。可以说,真正的相当于把所有的人通过智能手机连接到一张网里面去。所以说,我想移动互联网时代,也是我称人联网时代的终极。

姚欣分享人工智能心得

二、深度学习的兴起

当然,这是我们的过去所经历的三个重要的时代。在短的30年间发生的变化,那我今天能看到的是,这种变化并没有停止反而越来越快,而且越来越具有想象力。计算交互连接也在进入,在未来3到5年会出现新的一次质的飞跃。那第一个我们先来看计算,这是一张大家可能很熟悉的照片,是1997年应该讲当时的是IBM的深蓝电脑超级计算机,在跟卡斯帕罗夫国际象棋棋王在下棋,第一次95年是输了,然后97年的话最后3:,2,艰难战胜了这个卡斯帕罗夫,实际上这个是我们大家知道的,第一次用这种计算机下赢了人类的冠军。

姚欣分享人工智能心得

当然,我想说的是,其实这个事情还没有完。是IBM在深蓝获胜之后,这个项目在继续往前研发。我这里摘取了一段2005年的一本著名的畅销书,《奇点临近》的其中的一段,实际上他讲到了就是在05年的时候,IBM就推出了一个新的一套程序叫申·弗里茨再次下赢了人类冠军。但是,这个申·弗里茨很重要的一点,跟深蓝的不同是,它的计算能力是使用的普通的服务器来搭建的,但是知道深蓝当年能下赢卡斯帕罗夫,主要在于IBM为深蓝重新定制了一套精简指令集,就是专门为下棋做了一台电脑,那最后其实是靠它的计算能力,庞大的计算量下赢了这个人类冠军。

姚欣分享人工智能心得

这个新的算法我们就称之为叫深度学习。实际上深度学习可能最近大家听了很多,其实这是人工智能最近能取得质的飞跃,非常重要的一环上。为了方便大家理解,其实深度学习最常用的我们采用是某种深度神经网络。我给这里大家贴了一个截图,右下角有它的网址,大家感兴趣的话都可以去访问。这个是谷歌的一个开源项目tensorflow,就是它的一个深度学习框架,采用一种非常图形化的方式,让大家来感受。实际上我们看到,中间的部分其实就是一个深度学习的网络,这个图里面我们大概摆了6个隐层,就6个中间层,然后最左边的话是输入的数据,最右边图形的话是输出的结果,这个问题是做一个分类,就是让计算机自动的学习。

让计算机自动的能够将左边的这个图形里面不同颜色的点能够通过画一条曲线,然后把它隔离出来,或者分类出来,然后的话形成右边这样一个分类函数。然后我们可以看到最后的一个结果,右上角的话,大家能看到图的这边有一个曲线,这个曲线的话实际上是一个,就是收敛函数,或者说就是它实际上是通过大量的自动学习,最后的把这个函数倒推出来的。其实如果说让我们简单的讲什么叫深度学习的话,其实就是,在一组给定的输入输出的数据中,去传出一个最优解,就像我们解方程等式的两边都已经知道了。然后,我们现在需要确定的是xyz等于多少,那这个如果只有一个方程式的话不好解,但如果方程是数量很多的话,就有机会了。

姚欣分享人工智能心得

其实alphago之所以能获得这么大的进步,实际上来自于3个方面。第一个来讲的话就深度神经网络这一套算法在过去的这六七年时间得到了一个质的飞跃;但另外一方面,也是来自于计算能力的一个大规模的提升,特别是我们以前的计算都用的是CPU资源,就是我们的服务器。而这次在人工智能的深度学习计算来讲,大量的在使用GPU就是我们的显卡进行并行的计算,因为大家可能不知道,我们一个显卡里面,可能他有上百上千个微核就等于是几百个核的一个卡,那我们一般CPU的话,可能只有4个和8个核。但是一个GPU目前新的这种商用版本有1000,多个核在一个卡里面,那将很多个显卡并联的话,就能有几千几万个微型的计算机,让我们来进行快速计算。

那另外一方面来讲的话就是数据,刚才其实我在用一个所谓的解读方程式的这样一个方式来给大家做一个粗略的描述,不精准的描述。其实,当我们的已知的数据越来越多,我们的这种,方程是越来越多,那这样的话,其实我们是有机会去猜出来,xyz分别等于多少?实际上,深度学习有一个训练的过程,就是将大量的已经有标签的数据输入进去,让计算机不断的去缩小猜测的这个范围。最后逐渐,你合成了一个图,一个函数,你合的一个最优解。实际上就是当右上角曲线开始。这个接近于零的时候就证明计算机已经推你出来了一条可能的解法的方程,那这个方程就是训练出来的一个模型,实际上,今天这幅图你能看到,在过去3年时间获得了50倍以上的提升。

对,这是一个来自于NVIDIA就是显卡公司的一个报告,上能看到在3年多时间,我们的这个人工智能的计算能力,大概提升了50倍。那这50倍的提升,一方面来自于它的芯片的提升,比如大家能看到从CPU到2013年在使用k40,就特斯拉k40的芯片,到2015年使用m40的芯片,这是一个质的飞跃,但另外一方面也是算法。从这个QDN的一代到三代到四代也实现了不断的飞跃。由此的话,这几种能力的结合就是计算和算法能力同时的提升,最终带来了指数级的进步。

姚欣分享人工智能心得

甚至我们能看到在很多领域计算级的这种在某个垂直领域的这种感知能力,在不断的快速提升,甚至在超越人。上面这幅照片的话上,来自于一个计算机图形识别的一个挑战赛,就叫image recognize。实际上他就是让计算机去在几千万幅照片里面来去分辨,还去认出各个物品,我们都知道人也是可以去在图片里面来去认,但是人的这个认识是有一定的正确率的,可以看到最右边黄色Human,人在这种大量数据和照片看的时候,也会有脸盲的情况,大概有5%的出错概率,那计算机以前的出错率很高,在2010年的时候达到27%,但这几年因为引入了深度学习的算法在迅速下降。在2015年的时候,微软的模型的话已经超越了人的辨识能力。

三、人工智能的分类

这里我截取的一幅图上也讲到了,就是人工智能目前在多个领域都在发生着这种作用。但这里我想特别想强调一点,就是人工智能并不是真正的万能的。我们知道人工智能上有两个分类,一个就是我们叫做强人工智能,或者叫通用的人工智能,就大家今天在电影里面所看到的似乎无所不能,像钢铁侠的助手一样的,但这件事情强人工智能目前哪怕在学术角度还几乎没有突破。我们今天所能看到的人工智能都是在人工智能的另外一个领域,称之为叫弱人工智能,实际上这个弱人工智能什么?他第一步首先是让计算机去感知这个世界,那目前比较成熟的两个领域一个,就是用计算机去识别图形图像,就叫计算机视觉;另外一个领域,让计算机去理解人的,说话就是语音识别和自然语言理解。

姚欣分享人工智能心得

所以说,因为这两个方面比较成熟了,技术上得到了一个质的飞跃,已经甚至说已经达到了人类的这种识别能力当然也是只在特定领域的,所以说的话也由此诞生了很多的创业项目。大家可以看到这幅图片里面其实大多数都跟这两种认知能力是相关的,所以说现在还是一个计算机人工智能远远没有达到跟人能相匹配的程度,即使alphago战胜了人,其实人工智能还有更高的挑战。就最基础层面是计算机的某种认知能力,在往上来讲话,开始到了计算机的某种理解能力。然后最往上来讲的话,是计算机的某种推理和预测的能力,这个才真正达到像人的这种计算能力,目前我们能看到的都是在,在最基本的感知认知这个层面,而在理解这个层面上还没有得到一个飞跃,更不要提推理预测了。

我们能看到这个又是一个非常著名的曲线,也是刚才我提到的刚才的报告,实际上是今年刚刚发表的2016年,新兴科技的成熟度报告。实际上大家可以看到,在第三个第四个曲线的时候,这个分别是这个科技逐渐的成熟,甚至说它经过了炒作破灭,然后的话开始逐渐对接,需求慢慢开始崛起,让我们能看到在稳步爬升的光明期,很重要的技术的突破是来自于虚拟现实。而在泡沫化的低谷,就是说即将结束它的泡沫化进入到现实应用。那另外一个,是这个增强现实,这两个其实都是指的我们交互技术的发展和提升。

姚欣分享人工智能心得

不过纵然如此,计算机逐渐的在一些垂直细分的领域,特别是一些知识框架已经也已经确定的这样一些领域里面会发展起来成为了现实。实际上,我们能看到这是美国技术成熟的一个调研公司,它的2015年的一个报告,实际上报告显示就是在2018年的时候,全球其实有三百多万的这个工作者,其实他都是要有一个机器人来给他下发指令。实际上这种情况我觉得已经发生了,比如说我们去看很多的工厂,工厂很多的这种生产,他甚至会让工人去佩戴一些可穿戴的设备,来去检测这个工人,它的每一道工序的这个时间频次移动的空间来提升效率,那最后这些所有的监测数据都是有一个人工智能或者某一个计算机来处理。

全部评论

  • 艺林小宇
  • 2016-08-28 22:47
  • 下个风口

(0)

赞同

  |

回复

相关文章

关闭
发送验证码
发送验证码
如果你遇到下面的问题

我在注册/找回密码的过程中无法收到手机短信消

我先前用E-mail注册过亿欧网但是现在没有办法通过它登录,我想找回账号

其他问题导致我无法成功的登录/注册

请发送邮箱到service@iyiou.com,说明自己在登录过程中遇到的问题,工作人员将会第一时间为您提供帮助

意见反馈
意见反馈
返回顶部