古籍数字化实践与分析.docx
《古籍数字化实践与分析.docx》由会员分享,可在线阅读,更多相关《古籍数字化实践与分析.docx(8页珍藏版)》请在三一文库上搜索。
1、古籍数字化实践与分析古籍数字化实践与分析 2018/08/28 摘要:古籍数字化是古籍保存、整理和利用的必然趋势。文章结合国家珍贵古籍名录数字化工作,从古籍数字化设备甄选、元数据著录、图像采集、图像处理以及数据库建设等方面对古籍数字化实践进行探讨,指出实践中存在的问题与不足,并提出古籍数字化工作的合理化建议。关键词:古籍数字化;古籍保护;古籍数据库发布平台;国家珍贵古籍2017年2月28日,国家图书馆(国家古籍保护中心)与上海图书馆、天津图书馆、浙江图书馆、云南省图书馆等4家单位在国家图书馆首次联合在线发布古籍数字资源,本次发布的古籍资源均为各馆所藏特色资源,加上此前已发布资源,总量达到2.4
2、万部,读者实名注册后便可免费查阅使用。本文在前人研究讨论的基础上,结合国家珍贵古籍名录数字化实践中的体会,对数字化过程中出现的问题作出分析、总结。1云南省古籍入选国家珍贵古籍名录概况从2008年3月1日第一批国家珍贵古籍名录开始公布,到2016年3月27日公布的第五批,我国已公布国家珍贵古籍名录12,274部。国家珍贵古籍包括甲骨文、简帛古籍、敦煌遗书、宋至清汉文古籍、少数民族文字古籍、碑帖拓本、舆图和外国文字古籍等,是最珍贵、最具代表性的中华民族典籍文化遗产。云南省内共14家古籍存藏单位及个人共235部珍贵古籍入选国家珍贵古籍名录,包括汉文珍贵古籍174部,少数民族珍贵古籍61部。在汉文珍贵
3、古籍里,有现存云南最早的写本大理保安八年(1052)大理国写经护国司南抄;有存世不多的、装祯形式为旋风装的大理保天八年(1136)写本诸佛菩萨金刚等启请;有云南大理國刻本佛說長壽命經,元延佑五年(1318)中庆路清凉山报国禅寺刻大华严方广普贤灭罪称赞佛名宝忏;约在元代至顺三年到至元二年(1332-1336)前后,徽政院主持,在大都弘法寺刻官刻大藏经和明万历十七年至清康熙十五年刻的一万二千六百余卷嘉兴藏等大藏经典;有北宋哲宗二年绍圣二年(1095)刻本春秋经传集解;有宋刻递修本南齐书北齐书周书;有元至正二十三年(1363)朱元佑刻鄂国金佗粹编;有代表性的稿本东塾着稿;有顾炎武纂辑的钞本肇域志。2
4、012年8月国家古籍保护中心开始国家珍贵古籍数字化试点工作,启动“中华珍贵典籍资源库”项目的同时,编制了古籍数字化工作手册(试用本)作为本次试点工作的标准规范。古籍数字化工作手册(试用本)规定了珍贵古籍数字化的范围、规范性引用文件、术语定义、工作流程、加工准备、元数据著录、图像数字化、数据命名、数据提交、数据验收、数据发布利用等,作为古籍数字化依据。由于入选古籍的珍贵性,在数字化加工中,从设备的选择、元数据的著录、图像的扫描采集、图像处理到资源发布,每一个环节都必须做好充分的调查研究。2国家珍贵古籍名录数字化的实践与讨论2.1古籍数字化加工准备古籍数字化工作大致分为七个步骤实施,依序为古籍数字
5、化加工准备,元数据著录,图像数字化,数据命名,数据提交,数据验收,数据发布利用。2.1.1古籍数字化的工作流程古籍数字化的总原则是:严格管理,明确责任,落实安全保密管理机制、质量管理机制,确保古籍文献原件和数字化信息的安全,确保各环节工作符合质量要求,建立完整、规范的工作记录。具体包括以下几个方面。(1)书目的确定。为最大限度地避免数字化的重复建设,在书目的选定上,一定要坚持珍贵性、地方性、系统性的选择标准。如国家古籍保护中心开展的珍贵古籍数字化试点工作,从已入选国家珍贵古籍名录的古籍中进行遴选,选定了云南省图书馆珍贵古籍44种,这其中包括国内罕有的大理国时期的写本11部、存世不多的元官藏23
6、部、稿本5部、刻本5部。(2)场地的选定。为确保古籍的安全,数字化过程中古籍不得被擅自带离保管单位,因此加工场所应选定在古籍存藏机构的内部,便于古籍的监管。云南省图书馆古籍由历史文献部负责管理,部门有两个阅览室,面积都较大,因此将加工场地设在不接待读者的善本阅览室。(3)古籍的交接。核查书目中古籍的保存状况,制作古籍文献交接清单,由加工人员从古籍库房管理人员处领取待加工古籍,需要根据加工工作进度安排按规定领取,领取时需要对古籍数量进行清点,并填写交接登记表,当日出库的古籍当日入库。在扫描前,加工人员按照索书号、册次及卷次进行整理登记,并统计每册书的页数及制作卷端目录。对于虫蛀、破损、残缺、褶皱
7、等书品比较差的书籍进行相应的记录并及时通知古籍管理人员协调处理。2.1.2古籍数字化扫描设备古籍数字化扫描设备的配置是进行古籍数字化的关键环节,是古籍数字化的主要硬件。珍贵古籍数字化,首先考虑的是古籍在无损害或最大限度减少损害的情况下进行。现在市场上有很多古籍数字化扫描的设备,经过考察比较,云南省图书馆选择使用法国i2s公司生产的专业古籍数字化扫描设备,该公司提供了CopibookA2、SuprascanQuartzA1及SuprascanQuartzA0三种类型古籍数字化扫描仪,扫描的古籍书影均能达到或者超过古籍数字化工作手册(试用本)的要求。这三种类型扫描设备,首先解决了不同尺寸、不同装帧
8、形式对设备的要求。在幅面上由A2到A0,且可以根据古籍尺寸大小做出调整,可以满足不同幅面古籍的数字化扫描需求,避免了较大幅面古籍分段扫描后拼接效果不理想和费时费力的问题。其次解决了翻页中不同厚度对设备的要求。扫描设备的操作平台具备作业独立升降功能,解决了古籍扫描过程中因古籍左右厚度不一而需要垫板的问题,也利于对古籍实体的保护。再次,解决了古籍扫描过程中对光源的特殊要求。扫描时的照明系统均使用冷光光源,无紫外线和红外线。照明光线由上方漫射至整个操作台,并通过软件调整整个操作台的亮度,保证了数字化过程中古籍受光的均匀,最大限度地降低对古籍的影响,保证了采集图像的精度和色彩还原度,实现所见即所得的效
9、果。选择古籍数字化的软件,首先,要能对各种古籍扫描参数设置进行保存,可根据不同大小、类型的古籍选择最佳的扫描参数。其次,要根据古籍页边距的尺寸,设置精确尺寸,在扫描成像过程中自动裁切。再次,软件要支持多幅面图像的同时采集、多种格式输出保存。云南省图书馆使用的古籍数字化软件有i2sCopibook系列设备自带软件和i2sSuprascanQuartz系列的yooscan软件,能够满足以上的要求。2.2古籍元数据的著录古籍元数据的著录是古籍数据库建设的基础,必须是统一的标准才能使数字化成果达到合作共建、资源共享的目标。2012年国家古籍保护中心编制古籍数字化工作手册,2014年做了修订。建议古籍数
10、字化过程中的元数据著录,以此做为标准。古籍数字化工作手册元数据的著录包括文献整理登记、描述元数据、管理元数据三部分,需要制作6张库表,包括文献整理登记表(全书)、文献整理登记表(各卷)、书目数据表、卷目数据表、外字表、管理信息表。1各表对数字化珍贵古籍整体、卷次、题名、卷名、责任者、版本、存卷、册数、页码、批跋、板式、透字、夹字、皱折、馆藏号、馆藏单位、制作单位等信息进行客观准确的著录。对古籍题名、卷次、责任者、版本、页码、批校题跋等详细记录是建立数据库的基础,也是读者快速查阅所需文献的重要依据。对古籍的夹字、透字、虫蛀、褶皱、破损、霉变、残页等进行著录,反映珍贵古籍损坏状况,便于及时发现破损
11、情况,为下一步的修复提供依据。2.3古籍数字化图像的扫描采集古籍书页图像扫描采集时参数的选择与设置对采集图像、后期图像的处理速度、制作电子图书的质量以及后续制作仿真本有直接的影响,2且在古籍书页扫描操作过程中可能出现页面修整、古籍放置、透字衬纸、拆卷装订等方面的问题,若处理不当,会对古籍造成二次损坏。(1)扫描参数设置。古籍数字化工作手册中规定,数字扫描参数应设置为彩色扫描色深24、光学分辨率600dpi、半页型页面、输出无压缩的TIFF格式、冷光光源扫描,亮度、曝光度、白平衡等需根据环境的变化时时做出调整。(2)古籍放置。在古籍书页扫描时,书籍放置在承书操作平台上书页应与扫描仪确实成为垂直角
12、度,并固定好使之不可移动。由于古籍年代久远,存在纸质脆化、老化、破损等状况,扫描放置古籍时工作人员须轻拿轻放,同时须避免古籍因过分挤压拖动、反复放置,造成人为的古籍实体损坏。(3)古籍页面修整。馆藏古籍存在纸张卷曲,页面褶皱、折角的现象,在图像扫描采集前如不对古籍页面进行修整,玻璃压板挤压便会造成古籍损坏加重,也可能因书面文字受到遮挡进而影响古籍文字内容的识别阅读,甚至还会影响古籍图像的美观,因而,云南省图书馆在古籍图像扫描采集时对书页卷曲、褶皱、折角进行轻微的抚平,确保页面的平整。(4)古籍透字处理。古籍数字化中出现透字情况,是每一个负责扫描的工作人员最不愿意遇见的,不是怕麻烦,而是方法使用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 古籍 数字化 实践 分析
