报告速读:知识图谱,从感知到认知的核心资产

亿欧智库 > 智库观点 > 报告速读:知识图谱,从感知到认知的核心资产

语音识别综合科技
中国中文信息学会
中国中文信息学会
2018-09-06 16:56
[ 亿欧导读 ] 今天人工智能以模式识别为主的“感知”层为主导,下一阶段将是“认知”层的技术突破,知识图谱则是实现机器“认知”非常重要的技术手段。本文将精选《2018知识图谱发展研究报告》的部分内容进行呈现,内附下载链接。
亿欧智库精选分享,亿欧智库,人工智能,知识图谱

从技术角度来看,“人工智能”是机器学习、数据挖掘、机器人技术、专家系统等多种技术的统称,笼统地谈论“人工智能”则缺乏实际意义。

今天的人工智能技术公司,主要通过图像识别、语音识别等模式识别技术,完成“感知”层面的工作。而真正到达“认知”的层面,目前知识图谱技术被广泛看好,它有希望成为“大脑”。最典型的则是IBM Watson在认知计算方向的探索,路虽坎坷,但方向值得肯定。

上个月,中国中文信息学会语言与知识计算专委会发布《2018知识图谱发展报告》,是了解知识图谱技术内涵和应用方向的优质读物,本文将对其中的部分内容进行呈现。文末有完整报告下载链接。

报告封面

图一:报告封面,图片来自报告

一、知识图谱与技术内涵

知识图谱(Knowledge Graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。

知识图谱技术是知识图谱建立和应用的技术,是语义Web、自然语言处理和机器学习等的交叉学科。我们将知识图谱技术分为三部分:知识图谱构建技术、知识图谱查询技术和推理技术,以及知识图谱应用。

二、知识图谱与知识工程

知识图谱于2012年由谷歌提出并成功应用于搜索引擎,知识图谱属于人工智能重要研究领域——知识工程的研究范畴,是利用知识工程建立大规模知识资源的一个杀手锏应用。回顾知识工程四十年来发展历程,总结知识工程的演进过程和技术进展,体会知识工程为人工智能所作出的贡献和未来面临的挑战,可以将知识工程分为五个标志性阶段:前知识工程时期、专家系统时期、万维网1.0时期,群体智能时期以及知识图谱时期。

知识工程发展历程

图二、知识工程发展历程,图片来自报告

1950-1970 时期:图灵测试

 人工智能旨在让机器能够像人一样解决复杂问题,图灵测试是评测智能的是手段。这一阶段具有代表性的工作是通用问题求解程序(GPS):将问题进行形式化表达,通过搜索,从问题初始状态,结合规则或表示得到目标状态。其中最成功应用是博弈论和机器定理证明等。

图灵

图三:图灵,图片来自网络

1970-1990 时期:专家系统

70 年开始,人工智能开始转向建立基于知识的系统,通过知识库+推理机实现智能,这一时期涌现出很多成功的限定领域专家系统,如MYCIN 医疗诊断专家系统、识别分子结构的DENRAL 专家系统以及计算机故障诊断XCON 专家系统等。94 年图灵奖获得者Feigenbaum 教授在70 年代提出知识工程的定义,确立了知识工程在人工智能中的核心地位。

费根鲍姆

图四:Feigenbaum教授,图片来自网络

1990-2000时期:万维网 Web 1.0

在1990年代到2000年,出现了很多人工构建大规模知识库,包括广泛应用的英文WordNet,采用一阶谓词逻辑知识表示的Cyc常识知识库,以及中文的Hownet。Web1.0万维网的产生为人们提供了一个开放平台,使用HTML定义文本的内容,通过超链接把文本连接起来,使得大众可以共享信息。

2000-2006时期:群体智能Web 2.0

Web1.0万维网的出现使得知识从封闭知识走向开放知识,从集中知识成为分布知识。这个过程中出现了群体智能,最典型的代表就是维基百科,实际上是用户去建立知识,体现了互联网大众用户对知识的贡献,成为今天大规模结构化知识图谱的重要基础。

2006年至今:知识图谱

“知识就是力量”,将万维网内容转化为智能应用提供动力的机器可理解和计算的知识是这一时期的目标。从2006年开始,大规模维基百科类富结构知识资源的出现和网络规模信息提取方法的进步,使得大规模知识获取方法取得了巨大进展。与Cyc、WordNet和HowNet等手工研制的知识库和本体的开创性项目不同,这一时期知识获取是自动化的,并且在网络规模下运行。当前自动构建的知识库已成为语义搜索、大数据分析、智能推荐和数据集成的强大资产,在大型行业和领域中正在得到广泛使用。

三、知识图谱应用

(一)通用和领域知识图谱

知识图谱分为通用知识图谱与领域知识图谱两类,两类图谱本质相同,其区别主要体现在覆盖范围与使用方式上。通用知识图谱可以形象地看成一个面向通用领域的结构化的百科知识库,其中包含了大量的现实世界中的常识性知识,覆盖面广。领域知识图谱又叫行业知识图谱或垂直知识图谱。

知识图谱举例

图五:知识图谱举例,图片来自CSDN

(二)语义集成

语义集成的目标就是将不同知识图谱融合为一个统一、一致、简洁的形式,为使用不同知识图谱的应用程序间的交互提供语音互操作性。语义集成研究对于提升知识图谱的信息服务水平和智能化程度,推动语义网以及人工智能、数据库、自然语言处理等相关领域的研究发展,具有重要的理论价值和广泛的应用前景,可以创造巨大的社会和经济效益。

(三)语义搜索

当前基于关键词的搜索技术在知识图谱的知识支持下可以上升到基于实体和关系的检索,即语义搜索。语义搜索利用知识图谱可以准确地捕捉用户搜索意图,借助于知识图谱,直接给出满足用户搜索意图的答案,而不是包含关键词的相关网页的链接。

百度搜索

图五:百度语义搜索举例,截图自网络

(四)基于知识的问答

问答系统(Question Answering, QA)是指让计算机自动回答用户所提出的问题。不同于现有的搜索引擎,问答系统返回用户的不再是基于关键词匹配的相关文档排序,二位精准的自然语言形式的答案。问答系统被看做是未来信息服务的颠覆性技术之一,被认为是机器具备语言理解能力的主要验证手段之一。

阅读完整报告,欢迎点击【下载完整报告】。

打赏支持

5
5
10
20
50
80
100
其它金额
任意赏:

参与评论

关闭
快捷登录 密码登录
获取验证码

新用户登录后自动创建账号

登录表示你已阅读并同意《亿欧用户协议》

快捷登录 密码登录

账号为用户名/邮箱的用户 选择人工找回

关联已有账户

新用户或忘记密码请选择,快捷绑定

账号为用户名/邮箱的用户 选择人工找回

快速注册

获取验证码

创建关联新账户

发送验证码

找回密码

获取验证码
账号为用户名 / 邮箱的用户 选择人工找回

未完成注册的用户需设置密码

如果你遇到下面的问题

我在注册/找回密码的过程中无法收到手机短信消

我先前用E-mail注册过亿欧网但是现在没有办法通过它登录,我想找回账号

其他问题导致我无法成功的登录/注册

请发送邮箱到service@iyiou.com,说明自己在登录过程中遇到的问题,工作人员将会第一时间为您提供帮助

账号密码登录

乐乐呵呵@微信昵称

该亿欧账号尚未关联亿欧网账户

关联已有账户

曾经使用手机注册过亿欧网账户的用户

创建并关联新账户

曾用微信登录亿欧网但没有用手机注册过亿欧的用户

没有注册过亿欧网的新用户

先前使用邮箱注册亿欧网的老用户,请点击这里进入特别通道