知识图谱之第一性原理
知识图谱是个知识网络?是个语义图?是个关系图?好像这些都没有直达本质,那本质是什么?
我们知道,数学的一个重要思维是公理思维,定义几个简单的公理,然后就可以用逻辑推出很多的引理,定理,从而完成一个完备公理体系,或严密的逻辑体系。
比如欧式几何,它首先定义五大公理:
1. 过不同两点,能作且只能作一直线(直线公理);
2. 线段(有限直线)可以任意地延长;
3. 以任一点为圆心、任意长为半径,可作一圆(圆公理);
4. 凡是直角都相等(角公理);
5. 两直线被第三条直线所截,如果同侧两内角和小于两个直角,则两直线则会在该侧相交。
欧几里德把人们公认的一些事实列成定义和公理,以形式逻辑的方法,用这些定义和公理来研究各种几何图形的性质,从而建立了一套从公理、定义出发,论证命题得到定理的几何学论证方法,形成了一个严密的逻辑体系。
知识图谱,和欧几里德的数学思维一样,也是一种公理体系。不同的知识图谱,就如不同的数学体系,分别是不同的公理体系,形成一个自洽的逻辑体系。
比如,家庭关系的知识图谱,只需要定义三大关系(公理),其它的关系都可以由这三大基础关系定义出来(定理)。
1. 性别关系,一个人是男性还是女性;
2. 出生关系,谁生了谁;
3. 婚姻关系,谁和谁结婚。
有了这三大关系,就可以定义儿子,女儿,父亲,母亲,哥哥,姐姐,叔叔,阿姨,爷爷,奶奶,外公,外婆,等等。
儿子就是性别关系是男性,和某个人有被出生关系。女儿就是性别关系是女性,和某个人有被出生关系。母亲就是性别关系是女性,和某个人有出生关系。父亲就是性别关系是男性,和某个性别关系是女性的人有婚姻关系,而且这个女性和另外一个人有出生关系。以此类推,可以定义其他的家庭成员。想想,如何教一个小孩复杂的家庭称谓,是不是根据这种公理思维来学习的。
由此可见,知识图谱的精华在于,任何的概念(本体)都是可以用精确的逻辑给定义出来的。而不是大家看到的字面的表达,比如”儿子“这个概念,不管你是用中文”儿子“,还是英文”son”来表示,还是外星人文字“%#&@”,它的内涵都是用公理之间的逻辑关系来精确定义的,丝毫没有歧义,不同的人,人和机器之间,都是能理解。也就是说,除了先前定义的几条公理,不需要任何其它的背景知识来完成人和人,人和机器,机器和机器的沟通,这就是知识图谱的意义所在。
很多讲知识图谱的东西,还基本停留在表面和浅层,而没有涉及到知识图谱的深层和内涵,什么东西,都应该看到它的第一性原理。我们这里,从数学的公理思维出发,让大家真正看到知识图谱实际上是一个公理系统,一个严密的逻辑系统。
有了严密的逻辑,知识图谱就能以形式逻辑,集合论,和其它数学为工具,来验证一个知识图谱建构的有效性(有没有冲突,有没有矛盾),来证明一个论断,来推理出隐含的新的知识。
微信扫码关注该文公众号作者