2017GAITC专访 | 大会程序委员会主席周明

人工智能
亿欧
亿欧
2017-05-09 16:40
[ 亿欧导读 ] 自然语言处理的目的就是让机器能够理解人语言中所表达的含义,能够完成识别,翻译,理解以及搜索等。而近些年炙手可热的AI,也变成了自然语言处理中的一项关键技术。
GAITC,人工智能,语音识别,自然语言处理,深度学习,人工智能产业结构

2017年5月21日至22日,由中国人工智能学会、中国中文信息学会主办,亿欧公司、CSDN和小象学院联合承办的“2017全球人工智能技术大会”将在北京国家会议中心拉开序幕。

本次大会为中国人工智能权威大会,以“交叉、融合、相生、共赢”为主题,汇聚了全球人工智能学术界和产业界著名学者、顶级专家和业界精英,大会期间涵盖10+分论坛,此外还创新性地召开论坛围绕人工智能伦理和人工智能女科技工作者两个命题做探讨。大会主席由中国人工智能学会理事长李德毅院士、创新工场董事长李开复先生与IBM首席技术官沈晓卫先生共同担任。此外,大会还汇聚了2000多位全球人工智能学术界和产业界著名学者、顶级专家和业界精英。

为了探寻这次国际顶尖AI大会的风采,亿欧代表大会组委会走访了本次大会“程序委员会”主席,微软亚洲研究院常务副院长,首席研究员,ACL候任总裁周明,他对于自然语言理解,人工智能产业结构以及自然语言处理的未来的话题给出了独特的见解。以下是他分享的主要观点:

周明老师接受亿欧专访.jpg

自然语言理解角度的人工智能的定义

人工智能肯定是每个人都有一个自己的定义。我是站在自然语言理解的角度来给它一个定义的。我认为人工智能就是一组关键的技术,使得电脑或者设备具有听、说、读、写、问、译等方面的能力,听就是语言识别,说就是语言合成,读就是阅读理解,写就是自然写作,问就是提出问题或者回答问题,译就是翻译。

如果电脑或者设备具有这样的能力,它就可以支撑其做智能的人机接口,或者提供无障碍翻译系统。支持现在流行的无人驾驶汽车或者智能家居、智能设备等方面的应用,或者出国旅游和同声翻译。

自然语言处理本身它的作用和价值

自然语言处理它是这样的一个技术,就是给定人类的语言,有时候是一句话或者一篇文章,或者一个网页,分析出这个语言中包含的主要内容,出现了哪些词,每一个词是什么意思,句子结构是什么;再进一步,谁做了什么事,在什么时候,什么结果,再进一步还有它的观点是什么?表达的情感是正面的、负面的,还是悲哀的、喜怒、愤怒的等等。然后基于这些理解的结果来支持一些应用,虽然不同的应用所涉及的语言理解的程度可以不同。常见的应用包括机器翻译:把一种语言理解的结果翻译成另外一种语言;搜索:给定用户的查询表达,理解用户的查询表达到语料库或者网页中,找到最合适的答案或者所在的网页;阅读理解:就是让机器扫描了这篇文章或者网页之后,机器可自动生成关于一些问题,或者针对问题,机器可以基于文本理解的结果给出精准的回答;

我觉得如果自然语言能够把这一系列技术都做出来,将来就有很多的重要的用途。像语言翻译、语言助手,以及更下一代的搜索引擎都可得到长足的支持。

人工智能两种模式思维

一种是说模拟人脑的结构,如果我们对人脑的机理研究的比较清晰的话,就可以把有些机制加入到我们学习模块里,从而改进学习机能。但是目前这方面的进展似乎并不那么明显;

第二种,利用大数据做深度学习来做一个黑箱式的学习,利用大数据反映出来的从输入到输出的映射,自动学习数据内部的规律。但是所采取的神经网络架构不一定完全跟人脑机理完全一致,只不过这从结果上来看跟人类的能力可以类比。目前集中在如何获得大数据、如何提高学习能力,如何提高学习效率.这是目前的一个研究主流。

当然我们不排除未来随着人们对人脑机理更深的了解,会把一些新的发现融入到神经网络或者机器学习里面去,然后更有效的利用数据来提高学习的效果。但是这件事目前来讲还在探索之中。

人工智能产业的结构性层面

人工智能的产业的结构,我的认为是这样的:第一层是数据层。首先要做好包括大的数据获取、存储、以及基于大数据的大数据信息的抽取和知识的获取,这是数据层;

第二层学习层,利用强大的计算能力,支持利用大规模数据来建立模型包括机器学习和深度学习的模型,来发现数据中的规律,使得系统可对预期的输入获得预期的输出。

第三层就是应用层。基于这些机器学习或者深度学习所训练的模型,来支撑一些可以落地的应用,比如我刚才说到的听、说、读、写、问、译这些问题,或者在智能家居、智能汽车等方面人机接口。

这样逐层开展起来,使它每一层互相衔接。而且在任何一个阶段都可以提供一些方便的技术接口的支持,便于维护、更新、管理和升级。

深度学习现在对自然语言贡献

第一个,表达字符串或者句子、篇章的语义(embedding),在此基础上计算词汇、句子之间的语义距离,一种典型的做法是用卷积神经网络来做;

第二个,对一个输入串进行某种序列标注或者序列变换。比如说机器翻译就是某一种意义上的序列变换。一种典型的做法是通过循环神经网络的编码解码机制来做。

自然语言处理的未来

我想举两个例子,也是我所从事的领域来说明自然语言的未来。

第一个是语音翻译。它提供语音对语音的直接翻译,你可以设想我们出国的时候,即使你不懂某一国家的语言,你也可以跟本地人进行自如的沟通。你可以询问,跟他聊天,看当地的一些介绍,买火车票、住旅馆、在餐馆吃饭,一点障碍都没有,我觉得这是一件非常了不起的事;

第二件事,语音助手。我们早上起来跟语言助手说话,了解当天新闻、股票,了解今天的日程,它都会很方便地告诉你。然后你可安排它帮你做一些事情,比如买个火车票、订一个会议室,安排一些跟重要贵宾的会见。你告诉语音助手,它就帮你把这些事安排出来了,你就可以腾出时间做一些你认为更加重要的事情。

我个人认为两件事不是一个梦想,都是目前正在发生的一些事情,只不过还没有那么好,我们需要耐心地一点一点把它做得更好。

附“20172017全球人工智能技术大会”活动详情:

活动详情页面:http://2017gaitc.caai.cn/

活动时间:2017年5月21日09:00至5月22日18:00

活动地点:国家会议中心会议区四层大会堂B

活动方简介:

中国人工智能学会(Chinese Association for ArtificialIntelligence,CAAI)成立于1981年,是经国家民政部正式注册的我国智能科学技术领域唯一的国家级学会,是全国性4A社会组织,是中国科学技术协会的正式团体会员,具有推荐“两院院士”的资格。学会的基本任务是团结全国智能科学技术工作者和积极分子通过一系列学术活动促进我国智能科学技术的发展。

中国中文信息学会(Chinese Information Processing Society of China,CIPS)成立于1981年,是依法成立并经中国科学技术协会接纳的科学技术工作者的学术性群众团体,是具有独立社团法人资格的国家一级学会。学会以开展国内外学术交流为中心工作,并开展技术咨询服务、办好学会刊物,编辑出版学术书刊等。学会的学术研究内容是在人工智能、语言文字学等基础之上研究中文信息处理。

亿欧作为中国最具影响力的科技产业服务平台,是致力于推动新科技、新理念与各产业结合的产业创新服务平台,服务产业,探索革新,激发行业活力。希望基于大数据、人工智能成为传统产业的新动力,集合学会、企业、政府之力,将人工智能和产业融合,提升企业效率和带动产业升级。

版权声明

凡来源为亿欧网的内容,其版权均属北京亿欧网盟科技有限公司所有。文章内容系作者个人观点,不代表亿欧对观点赞同或支持。

打赏支持

5
5
10
20
50
80
100
其它金额
任意赏:

参与评论

相关文章

关闭

亿欧

 

1828篇文章  |  9,595,740次浏览

  • 精彩推荐
  • Talking Data

快来扫描二维码,参与话题讨论吧!

发送验证码
发送验证码
发送验证码
找回密码失败,请选择人工找回
如果你遇到下面的问题

我在注册/找回密码的过程中无法收到手机短信消

我先前用E-mail注册过亿欧网但是现在没有办法通过它登录,我想找回账号

其他问题导致我无法成功的登录/注册

请发送邮箱到service@iyiou.com,说明自己在登录过程中遇到的问题,工作人员将会第一时间为您提供帮助

账号密码登录

乐乐呵呵@微信昵称

该亿欧账号尚未关联亿欧网账户

关联已有账户

曾经使用手机注册过亿欧网账户的用户

创建并关联新账户

曾用微信登录亿欧网但没有用手机注册过亿欧的用户

没有注册过亿欧网的新用户

先前使用邮箱注册亿欧网的老用户,请点击这里进入特别通道
意见反馈
意见反馈
亿欧公众号 亿欧公众号
小程序-亿欧plus 小程序-亿欧plus
返回顶部