四库全书》,《古今图书集成》当中,将宋代部分的文、集、章、奏、墓志、笔记等,都纳入其中,仅《四库全书》的‘别集类’著录就有三百八十八部,五千多万字,例如徐铉的《骑省集》三十卷,田锡的《咸平集》三十卷,《欧阳文忠公集》的一百五十三卷正文和两卷附录等等,都在其中。”
“资料齐备以后,我们便可以开始构建应用,技术工具的实现非常复杂,这里我就不讲了,现在我通过应用来给大家演示一下吧。”
“比如我们想要建立一个苏轼的检索目录,我可以在引擎工具里输入‘苏轼’二字,”周至在主索引的栏位开始录入两个字并且回车,很快,在电脑屏幕的下方出现了一大堆的文字介绍。
“在古人的文献典籍当中,苏轼二字其实主要存在于奏章、传记名称、词作者等地方,在更多的文献当中,多用‘轼’,‘子瞻’,‘东坡’等称谓。”
“除此以外,在他人的章奏笔记里,他还往往以‘三苏’,‘轼辙’等并称。”
“另外,史籍中的‘元祐党’,‘蜀党’等,可以是他的标签。”
“如何根据‘苏轼’这个主标签找寻出刚刚我说的二类标签,我们研发出了一些算法,这里边会涉及到许多的问题。”