构建个人知识库
Abstract: 记录搭建个人知识库的过程
前言
知识的类别和形式纷繁多样,不常接触的知识可以可能因时间而在记忆中消退,构建个人知识库的目的在于记录已经学过的知识,甚至于量化分析自己的知识深度及广度。
图书分类方法
总括地将学科知识、生活常识、实践经验等进行分类,可以将知识分类为陈述性知识(Declarative Knowledge)、程序性知识(Procedural Knowledge)和条件性知识(Conditional Knowledge)三类。
- 陈述性知识是关于事实和信息的知识
- 程序性知识是关于如何做某事的知识,包括执行任务的步骤和方法
- 条件性知识是关于何时和为何应用某一知识的知识
这一分类方式很有道理,但是分类标准过于宽泛,例如最容易分类的学科知识应该归类于述性知识,这样的分类会导致层次变得复杂,且三个类别的条目数量极度不平衡,并且很多知识和经验难以建立条目来记录,比如骑自行车的方法。
因为人类的知识记录和传播十分依赖于书本,这一知识的记录形式已经具有长远的发展,其层次结构一定是较为合理的,知识库的条目分类方法可以借鉴图书馆的图书的分类方法。
杜威十字分类法(Dewey Decimal Classification, DDC)
详细的分类参见Dewey Decimal Classification。
DDC把所有的学科归纳成九大类,不能归入任何一类的总为一大类,共10大类。每一个大类下再分为9类加1个“总论”类,依次类分下去,形成一个完整的层层展开的等级体系。
以三位数字代表分类码,共分为10个大分类、100个中分类及1000个小分类。
美国国会图书馆分类法 (Library of Congress Classification, LCC)
LCC将图书按大类、纲目(大类之下的细分)、纲目下的细分、书次号(每个类别每本书唯一)、出版年份五部分组成的代码标记和分类。
中国图书馆分类法(中图法)
详细的分类参见中国图书馆分类法。
中图法用字母加数字的组合分类图书。图书分为22个大类(分别用22个字母表示),大类的细分用数字编码,大类细分的下级用小数点和数字的形式编码,例如C976.7 劳动计量学,大类细分的数字编码类似于(舍去高位零的)DDC,位数越多分类层级越低。
通用十进制图书分类法(UDC)
详细的分类参见UDC Summary
UDC是在DDC的发展上得来的,编码上采用数字和若干符号的组合,在保留了DDC的三位数字分类的基础上,发展出了用以表示简单集合关系的通用辅助符号及表示地域、语言、民族等信息的通用复分号。
以上提及的分类方法各有特点且会融合民族、地域、语言带来的特色,另外,虽然这些分类方法可以十分详尽地将图书分类,但是个人的知识远不如图书馆的藏书丰富,图书馆的部分条目(如报纸、期刊等)也不能应用在个人知识库的分类中。
因此,从简易、清晰又尽可能合理详细的目标考量,杜威十字分类法对于个人知识的分类已经是足够的,但是由于个人知识十分有限,在分类时过于细化分支会背离简易的目标,实际使用的分类方法应该是定制化的。
知识库采用的分类方法
采用六个数字字符编码各类别,从左到右数,一类编码占一位,二类编码占一位,三类编码占两位,四类编码占两位,如“123456”。一二类的编码不可为“0”。六位全“0”编码(“000000”)作为保留编码,不予使用。四级类别编码的“00”编码用于记录诸如发展历史等补充性说明的条目。为保证简洁,当给新类别新增条目时,如果该类别的条目数量很少,可以不进行细分,且不划分类别的条目归入“9”编码类别,例如,和自然科学相关的未分类条目归入“119999”类别,和数学相关的未分类条目归入“111099”类别。
另外,分类方法应该是可以更新的,而非一成不变。
一级类别
首先,将自己已有的知识分为两个大类:
- 学科知识类
- 实践经验类
以上两个大类用代号“1”和“2”编码。
学科知识类记录定义、理论相关的条目;实践经验类记录方法、应用相关的条目。
二级类别
学科知识类
学科的分类参见高等学校科技统计。
分为五个大类:
- 自然科学。编码为“1”
- 农业科学。编码为“2”
- 医药科学。编码为“3”
- 工程与技术科学。编码为“4”
- 人文与社会科学。编码为“5”
实践经验类
此类别的条目是综合性的,难以详尽地区分,暂且按以下分类:
- 创造类 。编码为“1”
- 职业类 。编码为“2”
- 生活类 。编码为“3”
三级类别
二级类别的实践经验类暂且不细分三级分类。
自然科学
- 数学。编码为“10”
- 力学。编码为“20”
- 物理学。编码为“30”
- 化学。编码为“40”
- 天文学。编码为“50”
- 生物学。编码为“60”
- 心理学。编码为“70”
农业科学
医药科学
工程与技术科学
- 电子与通信技术。编码为“10”
- 计算机科学技术。编码为“20”
- 核科学技术。编码为“30”
人文与社会科学
- 马克思主义。编码为“10”
四级类别
为避免篇幅过长,四级类别的编码不在此列出,之后会贴上完整的分类说明图。
记录工具
网络上可以找到各种各样可以构建个人知识库的软件和程序,不乏有很多功能丰富、完善稳定的版本,但是考虑到个人的知识是个人的宝贵财产且使用他人的工具可能带来的风险,决定使用自己的方法记录自己的知识,功能需要漫长的时间丰富,但是胜在可控性高。
初步的想法是使用数据库记录,利用网页展示。
(待更新……)