王文娟
摘 要 本文分析了档案信息资源建设的主要内容及档案信息的几种主要获取方式,从四个不同方向论述了当前档案信息资源建设应注意的问题
关键词 数字 信息资源 建设 注意问题
《全国档案事业发展“十五”计划》明确提出,在全国档案事业第十个五年发展计划期间,要坚持依靠科教振兴档案事业的方针,加快档案信息化进程。而档案信息资源建设是档案信息化建设的基础和核心,它的开发和利用是档案信息化建设取得成败的关键,也是衡量档案信息化水平的一个重要标志。目前,为适应网络、通讯和多媒体技术迅猛发展的新世纪信息化建设需要,各地档案馆都在积极引用计算机技术和网络技术开发档案信息资源,进行档案数字化和信息化建设,档案信息化和网络化已成为档案工作必然的发展方向。
1、档案数字信息资源建设的主要内容及信息获取方式:
档案数字信息资源建设主要指馆藏档案的数字化和电子文件的采集和接收,它的主要形式有馆藏档案目录中心数据库建设、各种数字化档案全文及专户数据库建设。其信息资源的获取渠道与方式主要有:
1、现有馆藏各种传统介质档案的数字化。主要是通过多媒体技术、数据库技术、数据压缩技术、网络技术等手段,将馆藏纸质、声像、缩微胶片等各种传统介质档案通过计算机著录、扫描仪扫描或数码相机拍摄等方式进行数字化处理,并将数字信息整合到相应的档案信息数据库中,实现数字化档案资源在网上的发布和传递。
2、收集和接收应归档的各种形式的电子文件及其元数据。主要有两种移交接收形式,一种是网络在线移交接收,即将需移交的电子文件通过网络直接传输到档案馆,或加工后传输到档案部门规定的地址中,并存储在档案馆;另一种是介质移交接收,即将电子文件存储在一定的介质上,再移交给档案馆。
3、采集有档案性质的行业、专题信息资源库。具有档案性质的政府和行业信息及专题资源库也是档案馆数字资源建设的重要采集内容,它可以通过网络在线采集网上现有的各种信息资源库,也可以根据社会需求,采购一些全文光盘数据库补充档案馆数字资源建设的不足。
4、下载互联网上其他具有档案价值的信息。互联网上其他零散、无序的具有档案价值的信息也是档案馆数字信息资源建设采集的对象。例如,各网站的历史照片、新闻报道、网页、统计数据、历史事件的声像资料等,经过整理、组织、加工可成为本地的现实资源。
2、档案数字信息资源建设应注意的几个问题
2.1 档案数字信息资源建设应切合实际,科学规划
档案数字信息资源建设是一项需要运用各种先进技术、投资多、开发周期长的系统工程。近年来随着国民经济的发展进步,档案部门也正逐步改变过去那种封闭、落后的状态,然而,地区差别、行业差别乃至上级领导重视程度的差异,使得不同档案馆在资源、条件与基础等方面仍然存在着较大差异。因此,在规划档案数字信息资源的建设时应首先进行全面的调研,如:档案馆和文件生成部门的现代化管理水平、计算机及网络普及程度、办公自动化状况、资金与设备条件,归档人员及档案工作者的业务素质与技术水准,新进档案及馆藏档案概况、特点等等。在广泛调查、系统分析、深入研究的基础上,结合自身实际、本单位需要和社会需求,按“统筹规划、分步实施、突出重点、资源共享”的原则进行档案信息资源建设的规划和部署,并注意将分步实施和远期规划有机地结合起来。有条件的,可将重点放在中、长远规划上,以尽量减少重复投资所造成的浪费;而条件差点的档案馆,可按轻重缓急采取分步进行、逐步完善的办法,并按规划有计划有步骤的实施和检查各阶段的建设目标,争取以最小投入获得最大收益。
2.2 馆藏档案数字化要注重实效,要在鉴定的基础上优化选择
馆藏档案数字化是档案数字信息资源建设的一个重要组成部分,也是影响档案资源信息化和档案信息开发、利用的重要因素。仅就信息资源建设来讲,将馆藏档案全部进行数字化,对馆藏信息资源的丰富性和完整性无疑是有益的,但对目前大多数在资金、人力、技术、设备等资源都还相对薄弱、匮乏的档案部门来说,这将会大大增加档案馆的经济负担。因此,馆藏档案数字化要注重实效,要在鉴定的基础上优化选择。
一是分析馆藏,根据本馆实际馆藏情况确定数字化目标,鉴定出需要优先数字化的档案。如:以提高利用效率为目的,应以利用者需求为中心,总结、分析和研究信息时代个人、本单位及社会各界不同利用者利用档案的心理和需求,预测利用重点,从而选择出利用频率较高、用户需求量较大的档案优先数字化。这样不仅能提高利用效率,同时也可减少或避免对档案原件利用频繁所造成的磨损和破坏。如果以保护档案原件为主要目的,应首先保证那些存储载体易损或不稳定的档案原件以及稀有、珍贵的历史档案原件优先进行数字化,使其成为数字化的多媒体文件,以实现在计算机上检索、浏览和利用档案。这样就可以避免或大大减少对档案原件的使用,从而达到减少磨损、保护档案原件以及抢救档案信息内容、避免信息进一步丢失的目的。
二是分析数字化技术的难易程度,遵循先易后难的原则。由于馆藏数字化技术对不同物理形式的档案原件,其信息转换技术的要求和支持程度有所不同。因此,有些档案可能会因目前技术条件的制约难以进行数字化,或虽可进行数字化但无法达到满意的数字化效果。因此,数字化时应分析其数字化技术的难易程度,对那些目前技术上较难处理或处理效果达不到要求,或虽能达到要求,但相应付出的成本太高的档案,可暂缓进行数字化,因为数字技术的发展很快,待技术的发展能较容易的解决问题时,那时再做数字化可能较之现在会收到事半功倍的效果。
第三、由于档案绝大多数都是“孤本”,因此应分析馆藏资源,挖掘本馆精华,选择本馆独有的、具有资源优势的专题和项目,打造品牌特色,开发、建设特色数字化档案信息资源系统,实现网上各档案馆档案信息资源优势互补和馆际资源共享,从而避免重复建设,保证馆藏数字化建设的效益。
第四,档案作为原始的历史记录,是过去和现在的国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的各种原始记录,记载着许多重要的秘密。档案信息数字化后,一般都会在网上传播利用,因此,涉密档案信息的安全与保密问题也是档案信息数字化时应重视和关注的问题。
2.3 电子文件的收集刻不容缓
办公自动化的开展,产生了大量的电子文件,电子文件是档案数字资源的重要来源和组成部分,然而目前电子文件的收集归档仍是制约档案数字信息资源建设的瓶颈,各单位的电子文件大部分还处于无序状态,而电子文件信息与载体的可分离性、信息易更改、安全性差的特点,决定了电子文件如果不及时做好收集、积累和归档工作,随着时间的推移,将会有越来越多的电子文件散落、丢失,同时文件的原始性、真实性和完整性也难以保证。因此,电子文件的收集与归档刻不容缓。
首先充分研究电子文件的形成规律,加快制订电子文件的管理标准。由于电子文件在记录方式、载体形式等方面与纸质文件不同,使得电子档案在管理内容、管理方式和方法上也与传统档案有所区别。因此,必须根据电子文件的特点和特性,加快制定相应的收集、鉴定、登记、归档、安全等管理标准,为电子文件的标准化、规范化管理提供依据和保障。
其次、努力争取领导支持,主动介入本系统、本单位办公自动化建设,争取把电子文件归档与管理功能设置作为单位审批办公自动化项目的内容之一,通过技术支持与制度建设,建立起完善的电子文件归档机制。做好与本单位办公自动化及各类数据库系统的有效衔接。依托数据交换平台,多层面、多门类采集需要长期或永久保存的、符合归档要求的各种电子信息。
第三、做好各类现行电子文件的收集积累工作。对于必须长期或永久保存的、符合归档要求的各种现行电子文件,无论是文本、图形、表格文件,还是影像、声音、多媒体等文件;也无论是草稿性或辅助性文件,还是在网上呈批后成为定稿的或正式的电子文件,只要有保存价值,就应及时归档。避免一方面是已生成的电子文件无法归档而流失,另一方面日后档案馆再花费大量的人力物力去重新扫描、著录等重复劳动,更重要的是防止有些信息(如有重要修改过程的草稿性文件等)一旦被覆盖就难以再恢复,从而造成不可挽回的损失。同时还应注意电子文件的相关背景信息及动态电子文件信息的收集积累,以保证电子文件的真实性、完整性和有效性。
2.4、做好网络信息的采集积累
因特网是一个包含众多信息内容的信息源。与有着信息质量控制机制的传统信息发布和传播模式相比,自由、开放的因特网为用户提供了更为方便、更加快捷和更为广泛的信息获取渠道。因此,下载网络上有价值的信息也是获取数字信息资源的重要渠道。但是网站成千上万,网络信息浩如烟海,不可能也做不到全部都进行搜索和采集。而且,网络的自由与自发特性,使得网络信息的发布缺乏质量控制机制,虽有一些单位、机构落实专人进行控制,但大多数信息发布随意,从而导致网上信息来源复杂,信息资源良莠不齐,信息的真实性、可靠性得不到完全保证。
因此,网络信息的搜索和采集必须注意要有所选择,一是要把关注的重点放在那些能长期提供信息、而信息内容范围又较为稳定并能经常进行更新、维护的固定性网站,如政府机构、企事业单位、学术团体、网络公司等机构网站。相对于那些提供信息内容范围经常会发生变化或产生信息的随意性很大或随时都可能会消失的网站,如一些个人网站或正在试运行的网站等非固定性网站。这些出自机构的固定信息源,其信息的真实性与可靠性相对较高,信息的内容范围也比较稳定,因此更符合信息资源建设的标准和要求。
为了保证网络系统检索的速度与稳定性,网络系统中的信息需要定期删除,一般来说,因特网上网页的平均寿命只有几十天,一旦网页更新,以前的资料将逐次消失,失去的信息将难以恢复。网上信息这种易逝性的特点,大大增加了网络信息资源收集、积累的难度。因此,为了确保有保存价值的信息资源的安全,应有目的、有计划地进行搜集和保存相关的信息资料,如新闻报道、行业信息、统计数据等,及时将其中有档案价值的信息下载到本地,经过整理、组织,收入馆藏,从而确保信息资源的安全。
另外,网络信息资源的使用权与所有权问题也是网络信息资源采集时应特别注意的。关于如何利用网上数字信息资源方面,当前法律方面还无明确规定,所以对本单位以外的网站信息进行下载、归档时,有可能涉及到版权问题时,应尽量与网站所有单位协商,从而避免可能产生的侵权和纠纷。
总之,档案数字信息资源建设是一项需要运用各种先进技术、投资多、开发周期长的系统工程,需要解决的问题还很多很多,但如果能切实解决好上述所提及的应注意的问题,相信将一定能加快档案信息化建设的步伐和提高建设的质量。
参考文献:
[1]、《档案信息化建设讲座》深圳档案局网站
[2]、刘 轩 《 档案数字化的策略分析及系统构建》《 北京档案》2004年第 12期
[3]、徐义全 电子文件系列讲座《电子文件的收集积累》《北京档案》2001年第1.期
[4]、夏晓慧/窦红梅《关于数字信息资源的另一面》
[5]、顾学中《谈馆藏档案数字化范围的科学界定》《档案时空》2004年第12期