北京市档案馆的馆藏涉及政治、经济、文化、教育等各个方面,内容丰富,价值珍贵;同时在档案管理的现代化建设中一直走在国内档案行业的前列。随着档案资料数量的不断增加,如何在档案资料有效管理的基础上,根据需要 从原始档案信息中实现对某一专题数据的深层发掘,以为各级
北京市档案馆的馆藏涉及政治、经济、文化、教育等各个方面,内容丰富,价值珍贵;同时在档案管理的现代化建设中一直走在国内档案行业的前列。随着档案资料数量的不断增加,如何在档案资料有效管理的基础上,根据需要 从原始档案信息中实现对某一专题数据的深层发掘,以为各级领导和公众对档案的利用提供更详尽、快捷和高效的信息服务,成为北京市档案馆重点考虑的问题。
在考察和试用国内、国外多家软件厂商后,北京市档案馆最终选定了北京国信贝斯软件有限公司的iBASE数据库和内容管理产品用以构建北京市档案馆的信息检索与管理系统。该系统主要由数据库管理、档案检索、分类用户管理和网站内容的动态发布等主要功能模块构成。通过本系统,北京市档案馆分别建立了明清、民国档案数据库、建国后档案数据库、劳模档案数据库、诉讼档案数据库、工商档案数据库、税务档案数据库等6个数据库,共84.73万条数据,覆盖了807475万卷册档案;并通过网络进行发布供用户浏览和检索。
数据库管理
数据库是管理档案的最佳方式。因此,档案数据库管理子系统是北京市档案馆的信息检索与管理系统的基础。北京市档案馆利用iBASE非结构化数据库强大的数据管理能力和开放的数据接口等功能,满足了档案馆实际业务及数字化建设的要求,具体表现在:
在数据库结构定义上,iBASE数据库采用重复字段、子字段,实现数据变长存储,彻底解决了档案馆业务中常见的变长字段和重复字段的定义问题,实现了对于变长字段、重复字段和子字段的定义、存储和管理,允许数据项具有多值性和可包含子字段,能充分满足了北京市档案馆进行数据处理特殊管理要求。
在数据著录格式方面,iBASE数据库不仅支持国际标准(ISO-2709,MARC,CCF)和国内标准(CCFC)格式,而且支持最新的XML格式,具有可扩展性,可以与其它元数据单元(项目)连接使用,不仅适合中文全文检索系统平台的应用,同时也符合国际数字档案馆标准化的发展趋势,便于与国际交流与接轨,这对于档案馆数据库标准化以及数据的交换与共享,起着极其重要的作用。
在数据处理对象上,iBASE数据库采用面向对象技术,以XML技术为其核心,不仅可以处理TXT文本、DOC、EXCEL、PPT、PDF等流行的文件类型数据,而且可对图象、音频、视频、计算机程序以及网址资源进行编目和数字化处理,能支持各类非结构化数据(文本、图像、视频、音频OLE对象等)的存储,真正的实现海量数字信息的存储与管理,为档案馆管理各种数字化信息资源提供了强大的数据管理平台。
整个档案数据库管理系统采用标准的B/S结构,数据库均放在服务器端,档案馆人员可以通过浏览器,在经过系统用户密码、权限认证后,就可以根据具体情况在本地或者远程对档案数据库中的档案数据进行浏览、增加、修改、删除等数据维护工作。由于数据维护采用标准的浏览器界面,因此界面友好、操作简单,非常便于使用。
档案检索
iBASE数据库将全文检索功能内置在强悍的数据库引擎核心内,避免了采用关系数据库时还需额外买外挂的全文检索组件的问题,具备强大的信息检索功能。它基于中文自然语言处理技术,采用的倒排挡索引技术和世界领先的B*索引算法,使数据库的检索速度实现了海量数据秒级响应;同时引入分布式处理技术、智能检索技术和数据挖掘技术,实现了智能、高效、快速而灵活的信息检索和基于内容的查询,大大提高对信息检索的速度和深度,满足数字档案馆海量数据检索的需要。
北京市档案馆的检索系统模块涵盖了目前的6个数据库中共84.73万条数据。按照从1533年至1966年,400余年的时间跨越,及180个机构、团体,内容包括政治、经济、军事、文化教育、医药卫生、工业、农业、建筑、交通、运输、商业、金融、社会救济、刑事案件等分类信息进行全文检索。使浏览者可分别进入明清、民国档案数据库;建国后档案数据库;劳模档案数据库;诉讼档案数据库;工商档案数据库;税务档案数据库等,使用“普通检索”和“高级检索”两种方法,搜索到北京市档案馆的全部开放档案信息。还可进入现行文件浏览北京市委、市政府及委办局网上公开的政策、法规文件。其中“分类检索”主要利用北京市档案馆馆员对档案库的充分了解及其专业知识,为用户查找档案提供的导航工具。
由于使用了iBASE数据库强大的智能全文检索引擎,实现了档案信息及档案全文的简单、渐进与任意项的组配检索。系统设置了任意多项单项快速检索与自由组合检索,支持国内外各种成熟检索方法,如基于自然语言的全文检索、字段限定检索、布尔检索、前方一致检索、相邻检索、基于内容的全文检索以及后控词表检索等,检索方式灵活,检索途径多且十分灵活方便。对数以百万份档案的检索速度仅在1秒钟范围内,大大提高用户查找档案效率。
网站内容的动态发布与查询访问
将各种资源动态发布上网实现资源的共享是档案馆数字化建设的最终目的。利用iBASE内容管理平台提供的强大的发布功能,北京市档案馆网站实现了“预约单处理”、“读者建议处理”、“精品档案维护”、“网上展览”、“档案史料目录”、“专题史料出版物目录”、“业务论文”等信息的发布上网功能。由于系统采用了先进的模板技术,系统从数据库中提取数据按照模板格式自动动态生成或更新网页,因此大大减轻了管理人员的负担。对于发布上网的数据库资源,系统提供了完善的检索功能。它不仅支持一般的全文检索,而且支持组配检索、前方一致检索、ANY检索、布尔逻辑检索、二次检索和基于网络的后控制词表管理与检索等多种复杂检索方式,从而极大地方便了读者对文献信息资源的深层挖掘和利用,为读者提供完善的服务。
完善的系统管理功能
根据数字档案馆面临的版权和信息安全问题,iBASE内容管理系统还提供了基于角色的用户权限管理、基于策略的计费管理和完善安全认证管理以及图形界面维护管理机制。北京市档案馆可以根据读者角色,提供多级用户管理机制,以确保只有授权的用户才能访问相关资源;同时可提供完全基于管理策略的计费管理机制;整个系统完全基于图形界面,界面友好,操作简单,可大大降低档案馆管理人员的劳动强度。 (提供厂商:国信贝斯)
更多精彩的精彩IT新闻电视,请点击进入 宽频新闻频道
大家如果对本栏目有任何建议、意见或问题的话,或者有任何IT业界资讯、厂商宽频内容合作,欢迎发邮件到huangweibing@pchome.net, 惟冰会尽快给予回复,并且感谢大家对PChome宽频资讯频道一贯的关注和支持!
更多优惠,更多惊喜,请拨DELL免费电话800-858-2336

网友评论