6个方面分析知识图谱的价值和应用.pdf
《6个方面分析知识图谱的价值和应用.pdf》由会员分享,可在线阅读,更多相关《6个方面分析知识图谱的价值和应用.pdf(12页珍藏版)》请在三一文库上搜索。
1、6 个方面分析知识图谱的价值和应用 6 个方面分析知识图谱的价值和应用 知识对于人工智能的价值就在于,让机器具备认知能力 和理解能力。构建知识图谱这个过程的本质,就是让机器形 成认知能力,理解这个世界。一、知识图谱无处不在说到人 工智能技术,人们首先会联想到深度学习、机器学习技术; 谈到人工智能应用,人们很可能会马上想起语音助理、自动 驾驶等等,各行各业都在研发底层技术和寻求AI 场景,却 忽视了当下最时髦也很重要的AI 技术:知识图谱。当我们 进行搜索时,搜索结果右侧的联想,来自于知识图谱技术的 应用。我们几乎每天都会接收到各种各样的推荐信息,从新 闻、购物到吃饭、娱乐。个性化推荐作为一种信
2、息过滤的重 要手段,可以依据我们的习惯和爱好推荐合适的服务,也来 自于知识图谱技术的应用。搜索、地图、个性化推荐、互联 网、风控、银行越来越多的应用场景,都越来越依赖知 识图谱。二、知识图谱与人工智能的关系知识图谱用节点和 关系所组成的图谱,为真实世界的各个场景直观地建模。通 过不同知识的关联性形成一个网状的知识结构,对机器来说 就是图谱。形成知识图谱的过程本质是在建立认知、理解世 界、理解应用的行业或者说领域。每个人都有自己的知识面, 或者说知识结构,本质就是不同的知识图谱。正是因为有获 取和形成知识的能力,人类才可以不断进步。知识图谱对于 人工智能的重要价值在于,知识是人工智能的基石。机器
3、可 以模仿人类的视觉、听觉等感知能力,但这种感知能力不是 人类的专属,动物也具备感知能力,甚至某些感知能力比人 类更强,比如:狗的嗅觉。而“认知语言是人区别于其他动 物的能力,同时,知识也使人不断地进步,不断地凝练、传 承知识,是推动人不断进步的重要基础。” 知识对于人工智 能的价值就在于,让机器具备认知能力。而构建知识图谱这 个过程的本质, 就是让机器形成认知能力,去理解这个世界。 三、图数据库知识图谱的图存储在图数据库(Graph Database)中,图数据库以图论为理论基础,图论中图的基 本元素是节点和边,在图数据库中对应的就是节点和关系。 用节点和关系所组成的图,为真实世界直观地建模
4、,支持百 亿量级甚至千亿量级规模的巨型图的高效关系运算和复杂 关系分析。目前市面上较为流行的图数据库有:Neo4j、 Orient DB、Titan 、Flock DB、Allegro Graph 等。不同于关系型数 据库,一修改便容易“牵一发而动全身”图数据库可实现数 据间的“互联互通” ,与传统的关系型数据库相比,图数据 库更擅长建立复杂的关系网络。图数据库将原本没有联系的 数据连通,将离散的数据整合在一起,从而提供更有价值的 决策支持。四、知识图谱的价值知识图谱用节点和关系所组 成的图谱,为真实世界的各个场景直观地建模,运用“图” 这种基础性、通用性的“语言”, “高保真”地表达这个多姿
5、 多彩世界的各种关系,并且非常直观、自然、直接和高效, 不需要中间过程的转换和处理这种中间过程的转换和 处理,往往把问题复杂化,或者遗漏掉很多有价值的信息。 在风控领域中, 知识图谱产品为精准揭露“欺诈环”、“窝案”、 “中介造假”、 “洗钱”和其他复杂的欺诈手法,提供了新的 方法和工具。尽管没有完美的反欺诈措施,但通过超越单个 数据点并让多个节点进行联系,仍能发现一些隐藏信息,找 到欺诈者的漏洞,通常这些看似正常不过的联系(关系), 常常被我们忽视,但又是最有价值的反欺诈线索和风险突破 口。尽管各个风险场景的业务风险不同,其欺诈方式也不同, 但都有一个非常重要的共同点欺诈依赖于信息不对称 和
6、间接层,且它们可以通过知识图谱的关联分析被揭示出 来,高级欺诈也难以“隐身”。凡是有关系的地方都可以用 到知识图谱,事实上,知识图谱已经成功俘获了大量客户, 且客户数量和应用领域还在不断增长中,包括沃尔玛、 领英、 阿迪达斯、惠普、FT 金融时报等知名企业和机构。目前知 识图谱产品的客户行业,分类主要集中在:社交网络、人力 资源与招聘、金融、保险、零售、广告、物流、通信、IT 、 制造业、传媒、医疗、电子商务和物流等领域。在风控领域 中,知识图谱类产品主要应用于反欺诈、反洗钱、互联网授 信、保险欺诈、银行欺诈、电商欺诈、项目审计作假、企业 关系分析、罪犯追踪等场景中。那相比传统数据存储和计算
7、方式,知识图谱的优势显现在哪里呢?(1)关系的表达能 力强传统数据库通常通过表格、字段等方式进行读取,而关 系的层级及表达方式多种多样,且基于图论和概率图模型, 可以处理复杂多样的关联分析,满足企业各种角色关系的分 析和管理需要。 (2)像人类思考一样去做分析基于知识图谱 的交互探索式分析,可以模拟人的思考过程去发现、求证、 推理,业务人员自己就可以完成全部过程,不需要专业人员 的协助。(3)知识学习利用交互式机器学习技术,支持根据 推理、纠错、标注等交互动作的学习功能,不断沉淀知识逻 辑和模型,提高系统智能性,将知识沉淀在企业内部,降低 对经验的依赖。 (4)高速反馈图式的数据存储方式,相比
8、传 统存储方式,数据调取速度更快,图库可计算超过百万潜在 的实体的属性分布,可实现秒级返回结果,真正实现人机互 动的实时响应,让用户可以做到即时决策。五、知识图谱的 主要技术 5.1 知识建模知识建模,即为知识和数据进行抽象 建模,主要包括以下5 个步骤:以节点为主体目标,实现 对不同来源的数据进行映射与合并。(确定节点)利用属性 来表示不同数据源中针对节点的描述,形成对节点的全方位 描述。(确定节点属性、标签)利用关系来描述各类抽象建 模成节点的数据之间的关联关系,从而支持关联分析。(图 设计)通过节点链接技术,实现围绕节点的多种类型数据的 关联存储。(节点链接)使用事件机制描述客观世界中动
9、态 发展,体现事件与节点间的关联,并利用时序描述事件的发 展状况。 (动态事件描述)5.2 知识获取从不同来源、不同结 构的数据中进行知识提取,形成知识存入到知识图谱,这一 过程我们称为知识获取。针对不同种类的数据,我们会利用 不同的技术进行提取。从结构化数据库中获取知识:D2R。 难点:复杂表数据的处理。从链接数据中获取知识:图映射。 难点:数据对齐。从半结构化(网站)数据中获取知识:使 用包装器。 难点:方便的包装器定义方法,包装器自动生成、 更新与维护。从文本中获取知识:信息抽取。难点:结果的 准确率与覆盖率。5.3 知识融合如果知识图谱的数据源来自 不同数据结构的数据源,在系统已经从不
10、同的数据源把不同 结构的数据提取知识之后,接下来要做的是把它们融合成一 个统一的知识图谱,这时候需要用到知识融合的技术(如果 知识图谱的数据结构均为结构化数据,或某种单一模式的数 据结构,则无需用到知识融合技术)。知识融合主要分为数 据模式层融合和数据层融合,分别用的技术如下:数据模 式层融合:概念合并、概念上下位关系合并、概念的属性定 义合并。数据层融合:节点合并、节点属性融合、冲突检测 与解决(如某一节点的数据来源有:豆瓣短文、数据库、网 页爬虫等, 需要将不同数据来源的同一节点进行数据层的融 合) 。由于行业知识图谱的数据模式通常采用自顶向下(由 专家创建)和自底向上(从现有的行业标准转
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方面 分析 知识 图谱 价值 应用
链接地址:https://www.31doc.com/p-4971713.html