第一节:知识图谱相关文献

5.探秘未来偶像:知识图谱如何给AI“生命感”

其中有几句话写的非常好:

知识图谱的作用,就是将不同的知识相互关联,并形成一个网状的知识结构,帮助人工智能增强认知、理解行业并且建立“世界观”。这一点在人机交互中体现的更为明显,比如在用户向语音助手询问“《天龙八部》里的阿紫”时,普通的语音助手只能调用搜索引擎原样搜索用户所说的话,一一展示出指向连接。但建立在知识图谱之上,语音助手可以分别提供出小说、电视剧、电影等等多个版本《天龙八部》中阿紫这一角色的相关信息。

引自邵浩博博士

知识图谱的发展之所以相比深度学习、神经网络较慢,是因为知识图谱的建立过程非常复杂:将非结构化数据转变成结构化数据已经是一项繁重的工作,还需要建立数据之间的对应关系。如何保证知识的权威性,更需要技术专家和学术专家一同跨领域合作。

6.智能搜索时代:知识图谱有何价值?

搜索引擎的技术基石是什么?

自然语言处理技术,不论是爬取、处理和索引网页,还是理解用户的搜索诉求,关键技术就是自然语言处理技术。五年前这个答案是正确的,今天再来看这个问题,答案已经变成了知识图谱。

当构建了知识图谱,就可以利用它来让搜索变得更加智能。

一方面,有知识图谱等于对世界有了认知,再加上自然语言处理技术,可以理解用户的自然语言、听懂用户的语音命令,理解各种内容进而更好地匹配答案。另一方面,基于知识图谱和自然语言处理技术孵化出了许多创新的智能搜索产品,如智能问答、对话式搜索、信息流等等,比如被视作“被动搜索引擎”的信息流,每个用户看到的结果都不一样,看了一篇文章的行为会决定接下来会被推荐什么,一切都是动态的,而其基础除了用户理解和内容理解技术以外,同样包括知识图谱:内容被建立了图谱,用户被贴上了标签(画像),进而智能推荐。

谁主宰了知识图谱?

谷歌是知识图谱的始作俑者,而在知识图谱的探索上,百度在中国走在了前面,2014年上半年就已开始提供线上服务,四年的时间线上服务量整体上增长了300多倍,正是因为构建了知识图谱,所以百度能够提供跟五年前截然不同的智能搜索体验。

王海峰是自然语言处理领域的顶尖专家,是百度AI技术的奠基人,也是百度知识图谱的推动者。

王海峰认为,“互联网很大程度是真实世界的一个镜像,而搜索引擎又是互联网的一个镜像,所以,搜索引擎很大程度上成了真实世界的镜像。”知识图谱是搜索引擎描述和映射真实世界的关键

知识图谱不只是改变搜索

智能搜索是知识图谱最典型的应用,不过,既然知识图谱的本质是数字世界对真实世界的认知的构建,它的应用场景就不只是智能搜索。

王海峰提到

知识是人工智能的基础,知识对于人工智能的价值就在于让机器具备认知能力。

知识图谱在AI地位

伴随着互联网+的浪潮,人工智能渗透到各行各业成为一个大趋势,它要在不同行业发挥作用的关键,就是构建知识图谱。

最后总结一句话

前最热门的新技术,IoT(物联网)、区块链,其本质都是为了更好地映射真实世界——IoT更好地感知世界,区块链解决现实世界的信任问题。通过映射真实世界得到数据后,再由AI进行智能化的处理,进而给出反馈,只要涉及到映射真实世界,知识图谱都是不可或缺的技术,可见其应用将远远不止智能搜索,百度在知识图谱上的积累将会进一步释放出价值。百度使命是让复杂的世界更简单,理解这个复杂的世界,将其映射为机器可以理解的知识图谱,也是必经之路。

7.语义网(知识图谱)是什么?有什么好处?

机器和机器的摩擦,就是机器怎么有效地把一个信息传送给另一个机器?

各种网络协议都在不同层次上解决这个问题。和语义网特别相关的有两个。一个是XML,帮助机器建立一个交换数据的语言。一个是RSS,让博客的传播变得自动化。各个不同的领域都有自己的这种语言,比如金融领域的XBRL,医疗领域有HL7,图书馆领域都DC,等等。这些语言有些人叫模式(schema),有些人叫元数据(metadata),有些人叫本体(ontology),本质上都是促进机器之间通信的手段。

那减少人机界面的摩擦呢?

这个就是强调,如何利用元数据让用户来探索,来发现。比如寄包裹那个例子,如果信封上只印二维码可以吗?不可以,大多数人不会写二维码的(对应到语义网,大多数人不会去写元数据的),也看不懂。你必须提供工具让寄信的人、邮递员、收信的人都一眼就明白,哦,这个包裹从哪里来到哪里去。比如Faceted Browser,就是让用户在交互的过程中逐渐找到最需要的信息。还有各种可视化Visualization,特别是交互式的可视化,把数据变成特别容易理解的形式。再有社交媒体上现在越来越多的元数据,如Facebook Open Graph, Twitter Card,这些都是帮助用户集成信息,更直接地看到信息,发现信息的手段。

8.百度王海峰:知识图谱是AI的基石

普通搜索跟百度搜索+知识图谱区别

传统的搜索是搜索一个内容,主流搜索引擎一页给10个结果。有了知识图谱的支撑,我们可以给用户更直接的答案,并以一种更友好的方式呈现。比如第一个例子是搜索“胡歌”,大家看到图文并茂的结果,需要的常用信息放在这儿。第二个问“太阳的重量”,虽然网页也能找到,但不如直接把重量给出来。最右边的例子是用户搜索“孙俪”,除了给一些孙俪的信息出来,还会有相关的人、作品等等。我们把相关的影视作品推荐出来,用户可能感兴趣,比如《那年花开月正圆》,在界面一点就可以进入《那年花开月正圆》的页面。