高校档案是高等学校从事招生、教学、科研、管理等活动直接形成的对学生、学校和社会有保存价值的各种文字、图表、声像等不同形式、载体的历史记录。高校档案工作应当以利用服务工作为中心,充分挖掘蕴藏在档案中的知识资源,为学校党政管理、教学、科研等提供服务,使档案在学校的建设和发展中发挥作用、体现价值。但从目前来看,由于各种因素的影响,高校档案利用率还不是很高,利用方式也以借阅复制为主,因而,挖掘蕴含在档案中的知识资源还有很大的空间。
一、高校档案利用情况统计
总体来看,高校档案的构成和利用情况具有一定的共性。笔者对我校近四年来档案利用情况作了一个统计。
总体来看,馆藏档案卷数及利用档案卷数每年都呈递增态势,但利用案卷的增长速度赶不上馆藏案卷的增长速度,而绝对利用人数增长缓慢,甚至出现波动。
对比可以看出,在目前档案的利用中,工作查考占据主要地位,比例在70%以上,这主要体现了档案的凭证、依据作用,也反映了档案的真实性。如在2009年省审计厅来我校进行经济责任审计期间,查阅了档案1000余卷,借阅档案500余卷;在学校进行住房清理和整顿期间,查阅了自建校以来所有住房分配及改革相关文件100多卷,这些都很好地体现了档案的凭证、依据作用。其次是编史修志方面的利用,自2007年开始,占到总利用的10%以上,主要因素是我校校史馆筹建工作的需要。学术研究与宣传教育方面利用率很低,这与高校档案馆服务于教学与科研、服务于校园文化建设的职能及爱国主义教育基地的功能是不相称的,高校档案所具备的文化价值远远没有体现出来,所蕴含的知识资源还有待大力开发,这应当是今后利用工作的重点之一。而如何挖掘其中所蕴含的知识,也是高校档案工作者所面临的重要任务。
二、利用数据挖掘技术,加大档案资源知识资源的开发力度高校档案作为高校重要的信息资源,它蕴藏着丰富的知识,包括显性的知识和隐性的知识。对于其知识资源的挖掘,要立足于现有资源,实现显性知识资源的整理与隐性知识的开发并行,促进隐性知识向显性化转化。从目前的利用状况来看,多是查考性利用,即是显性知识在发挥着印证比对功效,而隐性知识的利用则少之又少。由此,档案知识资源的挖掘主要是针对了隐性知识,而高校档案在学术研究与宣传教育方面的利用,也主要是发挥隐性知识的作用。
档案知识资源挖掘的途径较多,对档案实体的整理、保管过程,也是一种对档案隐含知识资源的挖掘过程。在对文件进行分类、排序、著录、标引时,便是对文件之间的联系、案卷之间的联系进行揭示和说明,也是使描述档案一般特征的知识,如主题词、摘要、形成时间、地点、文种、作者等显性化的过程和途径,这种隐性知识的挖掘与揭示,也使对档案所记载的显性知识的检索、利用更加快捷、方便。
随着计算机在档案部门的普及和网络技术的应用,电子文件从质和量上都在不断提升,在对档案知识资源的开发过程中,可以有效地引入数据挖掘技术,从而加大隐性知识的利用率,更大程度地发挥高校档案资源库的作用。
(一)关于数据挖掘
数据挖掘是从大量的、不完全的、模糊的、随机的数据中发现趋势或模式,提取有价值信息的一种过程。从本质上说,它是一种新的信息处理技术。数据挖掘的过程一般可描述如下:
数据挖掘的目的是发现知识,用于数据挖掘的方法很多,主要有概念描述、关联分析、聚类分析、分类等。
概念描述:概念描述就是对某类对象的内涵特征进行概括,形成一个整体性、全面性的认识。概念描述分为特征性描述和区别性描述,前者描述对象的共同特征,后者描述不同对象之间的区别。
关联分析:就是对大量数据进行分析,从中发现满足一定支持度和可信度的对象之间的联系。
聚类分析:聚类分析是把一组个体按照相似性归成若干类别,使得属于同一类别的个体之间的差别尽可能小,不同类别的个体间的差别尽可能的大。
分类:分类是按照一定的标准把数据对象划归成不同类别的过程,主要用于描述重要数据类的模型或预测未来的数据趋势。
(二)数据挖掘与档案利用服务
为研究档案用户的信息需求和心理行为提供支持。通过对档案用户各种背景信息的掌握,利用分类分析和聚类分析的方法,实现对用户的科学分类,全面掌握和准确理解各类用户的信息需要和心理行为,从而对未来的档案利用趋势进行预测,并实现对不同类型的用户提供个性化的服务。例如,在一般的高校档案利用者中,有的用户需要纸质实体档案的复印件,用以补全个人档案,或补办毕业证等证件;有的用户只需核对、核查相关信息,并不需要实体复印件;有的用户需要高校档案馆根据相关档案提供证明,如学历、学位证明等;有的不仅需要档案复印件,还需要附加服务,如提供外文翻译;有亲自上门的用户,也有电话查询的用户。针对不同类型和不同需求的用户,我们应当提供相应的个性化服务。
在优化馆藏和加大档案信息资源建设中发挥作用。优化馆藏和信息资源建设是高校档案馆的重要任务,是高校档案部门提供优质利用服务的基础和保障。利用数据挖掘技术对归档、整理及利用的相关信息进行分析,可以发现馆藏资源的漏洞,了解馆藏资源的利用率,从而有针对性地加强利用率较高的档案信息资源的建设,控制对利用率较低的档案资源建设,剔除无利用价值的馆藏,以达到优化馆藏的目的。同时,可以利用文本挖掘技术,运用关联、分类、聚类等方法,突破原有的档案整理体系,按专题对档案信息资源进行分类、整理、加工、重组,构建专题档案信息库和特色档案信息库,以更好地为用户提供利用服务。
在改进检索方式,提高档案信息查准率和查全率方面发挥作用。基于数据挖掘的档案信息检索系统除支持概念检索、模糊检索、联想检索以外,还可以利用聚类算法、分类法等对档案信息资源中的隐性主题及隐藏的语义结构信息进行充分的挖掘,在一定程度上减少了因档案信息主题不规范而引起的漏检现象,从而提高检索的查全率和查准率。
在拓展服务方式,提高服务质量方面发挥作用。数据挖掘技术的应用为档案信息个性化、精品化服务提供了支持工具。通过对利用类型和利用频率进行统计和分析,确定档案信息或服务受欢迎的程度,从而提供档案信息定制服务。通过分析档案用户的类型和爱好,针对特定的需求,系统收集各类资源并加以分析、判断、综合、归纳,从而为用户提供档案信息分析服务,并根据档案用户需求和兴趣的变化,适时推荐相关专题信息,提供档案信息推送服务。这些措施不仅能提高利用服务的针对性和服务质量,还可以进一步发掘潜在的用户。
对高校档案所蕴含的知识资源进行挖掘,一方面能为用户提供更优质的服务,充分发挥档案的信息资源库作用,实现档案信息的增值,另一方面也会对档案的收集等工作起到一定的促进作用。在高校数字化、信息化建设快速发展的趋势下,如何更好地挖掘出高校档案知识资源,使之在学术研究、校园文化建设等方面发挥作用,进而更好地推动和谐校园建设,还需要更进一步的探讨。
参考文献
1.毛国君,段立娟,王实,石云,编著。数据挖掘原理与算法[M]。北京:清华大学出版社,2005年7月2.(美)Mehmed Kantardzic 著,闪四清,陈茵,程雁等译。数据挖掘:概念、模型、方法和算法[M]。北京:清华大学出版社,2003年(8)3.冯湘君。谈档案知识资源的挖掘[J]。浙江档案,2006年(8)4.吴加琪,李广都。数据仓库及数据挖掘技术在档案馆中的应用[J]。湖北档案,2004(1—2)5.张凤丽,邢伟,胡铂,王立栋。提高高校档案利用的新途径[J]。中国环境管理干部学院学报,2009年9月第19卷第3期6.杜昆。数据挖掘在数字档案馆中的应用[J]。机电兵船档案,2005年(4)7.陈晖。高校档案利用情况分析[J]。甘肃行政学院学报,2002(3)
聚合中文网 阅读好时光 www.juhezwn.com
小提示:漏章、缺章、错字过多试试导航栏右上角的源