档案数字化加工方案.doc
《档案数字化加工方案.doc》由会员分享,可在线阅读,更多相关《档案数字化加工方案.doc(24页珍藏版)》请在三一文库上搜索。
1、档案室、档案馆馆藏档案扫描、数字化加工整体解决方案第一节质数字化加工作业前期准备一、数字化工作人员准备1二、数字化工作软件、硬件准备 4三、确定数字化内容、数量及用户需求 5第二节数字化加工流程及主要技术方案6一、入库提卷、拆卷 6二、标引著录7三、档案扫描8四、图像处理11五、全文OCR、生成双层pdf、板式还原及格式12六、总质检 14七、批量挂接15八、还卷及数据备份提交 15第三节 质量控制方案和保证措施 17一、 加工质量保障措施 17二、多环节,多层次的质量检查体系 17三、阶段性验收与终验相结合的严格验收程序是质量控制的终级保障19第四节 安全保密控制 21保密协议 2224第五
2、节 售后服务项目背景随着全国文化信息资源共享工程与中国数字图书馆工程的起动,信息化已 成为国际潮流,信息资源建设成为当务之急。信息资源建设的重点是电子文献、 各类数据库、网络资源、电子档案、电子图书等新型数字化信息资源的建设。 在数字化信息资源建设中,很大的一个需求是将现有的纸介质印刷品数字化, 使之成为能够用计算机阅读、理解、查询、检索的电子文件,最终将其应用于 数据库存储,或通过 CD-RO、M Internet 网进行出版,或上传数字档案馆供用户 使用。以传统纸张为载体的保存方式,占据了大量的空间,需要特殊的环境,而 且不方便查询,随着时间的推移,还面临着腐蚀、老化等问题。而将纸介质文
3、件信息进行电子化处理,保存到光盘上,具有存储、管理、共享等功能,还可 以减少文件库房占地,节省保管设备和人员方面开支,又方便统计和进行远程 查询。因此,将档案、期刊、文件等资料通过扫描仪,扫描成图像文件,再通过处理转换成电子文档,建立目录和索引,制作成电子文件,已是当务之急第一节 数字化加工作业前期准备一数字化工作人员准备1 . 甲方人员职务:现场交接管理人员人数要求:一名 专业要求:为学校档案馆负责档案管理工作的技术或管理人员。职责范围: . 负责与乙方的档案提卷和还卷等交接工作,协同甲方人员作好交接清单记录 并签字。 . 负责监督乙方规范化加工。 随时把握乙方加工进度并进行协调。 . 及时
4、关注并抽查乙方加工质量 .代表甲方与乙方进行及时的沟通及问题协调,确保项目顺利完工。2 乙方人员2.1 管理人员主要为:熟悉现场加工管理,熟悉数字化整体作业流程,具有较强组织能力和现 场管理及沟通能力的乙方负责人。2.2 工程技术人员 主要为:熟悉计算机软、硬件技术,了解档案数据库标准和系统开发。了解档案管理等相关专业知识的乙方技术部技术支持工程师。2.3 数据采集作业员 主要为:了解档案数据库数据标准和计算机软件应用等相关知识的乙方数字化制作部工作人员人员安排见表3-1职务职责人 员备注管 理 人 员项目负责 人1 负责人员,资源的调配工作。2负责施工组织设计、管理。3负责施工条件的保障及与
5、甲乙双方 关于项目进展状态的汇报和协调工 作。1人项目负责人 不一定要常驻 现场,但要通过 一切通讯手段 和定期到现场 的督导,切实做 到对该项目加 工进度和加工 质量的掌控现场主管1. 负责与乙方的档案提卷和还卷等交 接工作2. 负责现场的人员管理和加工管理3负责数据的终验和挂接4.配合项目负责人做好与乙方的沟通 协调工作。1人数据采集人员著录人员负责将档案卷内目录及其匕索引信息 进行手工录入为电子数据信息并校对1人扫描人员负责按制定的技术规范将档案资料扫 描1人图像处理 人员1去污:将扫描获取的图像进行图像去 污;去黑边及去杂点等;2纠偏:将偏斜的图像进行纠正处理;3文字处理:将不清楚的文
6、字进行加深 或变浅;4拼接:将页面较大的图像进行拼接处 理;1人在进行图像处 理的时候,肯定 是逐页处理,所 以要留意每一 页扫描的质量,发现扫描质量 问题立即发还 上一工序重扫 并作好记录。图像矢量 化人员1负责将处理好的图像进行全文识别、 2.校对、板式还原和格式转换3.对已经产生的成品数据进行初验后 移交给现场主管终验并挂接。1-3人矢量化人员最 终定员需结合 矢量化的图形 数量和采集难 度。数字化工作软、硬件准备1 .配备硬件数量及档次要视数据采集工作情况及数据量大小。2. 甲方提供PC机4-6台给乙方作为采集作业使用,其他硬件设备由乙方自行解 决。3. 场地:甲方提供。4. 办公用具
7、甲方提供打印机(以实际用量为标准)、办公桌椅、档案资料的 装订及打印机所用的全部耗材。5. 其他条件:提供电力和饮水。软硬件准备详见表3-2表3-2软、硬件配备列表软、硬件名称数量详细配置响应时间提供方综合档案管理系统一套1 需支持全文 检索使用功 能。2.支持TIFF和 PDF格式数 据的批量挂 接功能。项目开始需 到位甲方数字化流程管理和加工软件、OCR软件全套能满足本加 工项目所有的 技术要求项目开始需 到位乙方服务器一.台项目开始需 到位甲方扫描仪(A3幅面)一.台富士通A3幅面FI-4750C(ADF)项目开始需 到位乙方扫描仪(A4幅面)一.台A4幅面 虹光-FB6030 (平板
8、项目开始需 到位乙方计算机4-6套PC机项目开始需 到位甲方三.确定数字化内容、数量及用户需求在数据采集之前,首先要客观真实统计数字化内容和数量,确定用户使用需求,然后制定对应方案和技术控制以便准确地进行施工安排。表3-3三峡大学档案馆档案数字化用户需求调研表档案类型档案数量数字化准备情况招生名册一档案装订 厂档案著录 n档案整理排序学籍档案学生成绩厂档案装订 档案著录=档案整理排序11档案装订厂档案著录档案整理排序党群档案厂档案装订厂档案著录档案整理排序基建档案档案装订 厂档案著录 厂档案整理排序纸张及保存情况很好p般 i较差I很差 了很好口一般 厂较差厂很差 口很好p般 较差口很差很好I
9、一般 厂较差U很差很好丨$般 lif较差I很差用户需求厂影像化矢量化ri|影像化厂矢量化口影像化厂矢量化T影像化丄矢量化ni影像化口矢量化科研档案L档案装订 厂档案著录档案整理排序很好口一般较差|_1很差其它:档案装订档案著录 档案整理排序厂很好一般厂较差很差填表人 职务第二节数字化加工流程及主要技术方案档案数字化加工主要流程包括:提卷 -拆卷-档案著录-扫描-图像处理-OCR-档案数字化加工流程图档秦目录档效犯議入光盘制件扫楷文件程 单文件电子 文件流单皑子 文件文件档案 目录十程I文件曉检涼程单、J数弼校F(文 ftldlH流程单/口-泉光盘移交清单校对-版式还原-转双层PDF终验-挂接图
10、一一、入库提卷、拆卷1. 从档案室移交档案,严格执行原始档案的交接手续,使用双方项目负责人 确认的档案交接清单(完成清点登记)。2档案整理:编写页码、核对纸质档案页码、对可拆钉的文件做拆钉处理以适应扫描的要求、对需要修复的档案进行归并整理(如果发现破损严重,无法 直接进行扫描的档案,应先进行技术修复、折皱不平影响扫描质量的原件应先 进行相应处理后再进行扫描,发现破损严重的档案须立即报知项目相关负责人) 制作卷内目录,扫描文件抽取3按照扫描处理量明确交接周期和档案交接量(双方项目负责人签字,以保在施工过程中档案不损失、不丢失。)4装订案卷应保证装订牢固,案卷整齐,卷内材料不松动,脱落,保持与原
11、案卷一致。图二栉案交按二、标引著录按要求将文件所需信息录入到软件数据库里,标引著录按照国家档案局有 关标准结合用户档案著录的具体要求进行。1. 录入方式采用手工录入的方式2. 校对方式校对以软件校对和打印输出、对比校对相结合,错误率在万分之二以下。案卷目录和卷内目录按照档案的原始数据录入。卷案目录和卷内目录的样 式经用户同意可做相应调整。对档案目录数据修改和补充的数据,须填写更改 资料、更改资料放入原案卷内,卷内目录及其他不全的需补充完整。三、档案扫描1.扫描方式:根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进 行扫描。大幅面档案可采用加长式扫描或者图像拼接处理方式处理,同一页面 有两个
12、以上文件,需分别扫描。2扫描色彩模式:以黑白二值扫描为主,附有灰度(彩色)照片及原件分明 度很低的档案,可视情况采取灰度和 24位真彩色扫描。然后以黑白二值保存。例:蓝底招生名册,此种档案长见为 A3幅面、纸张很薄,底色与文字的分明度很低。实 物档案查看时都显吃力,此种档案如果用黑白二值扫描,则会出现大幅暗面,文字显现不清; 如果使用彩色扫描,文字部分明度很低。只有使用灰度扫描,效果相对好一些,如图三。扫 描后的图像再辅以黑白二值保存,则最大限度的提高了图像质量,如图四。图三灰度扫描效果图四保存为黑白值后的效果1110810501 1 1118代i谭玉具/女16F1杨飞r IHI 16U201
13、05901452010C73C刘輪丿151010CP561OIO5M4孟祥風WF女15210059(X)252100068 . 1李春 i立153分辨率:无全文检索需求的文档分辨率调整为 200DPI最为合适。需要全 文检索而做ocr识别的文档,黑白二值扫描分辨率最佳为400dpi,此分辨率下识 别成功率最高。24位真彩色扫描分辨率标准为200dpi。4. 图像文件的大小:黑白二值扫描 A3页面:20K40K;灰度或彩色扫描 A3 页面:100 150K。5. 如遇字间距和行间距过密、原件本身是复印件等字迹不清楚的情况,可 适当增加扫描的分辨率,但要保证图像清晰的同时,又不影响远程查询和浏览
14、的速度。6. 清晰度:扫描图像字迹清晰、颜色恰当,不宜过浅或过深,并且不得出 现字迹笔画残缺或字迹笔画叠合而影响阅读的情况,即使原档案存在锈斑变质、 颜色过浅或深浅不一致,也保证扫描图像可读,扫描留下的墨迹宽度不得超过0.5 厘米,并且指印和黑线不能覆盖或影响正文内容7根据档案实体情况,在档案电子文件中相对应目录设置“复制件” 、“原 件不清”标志。目录以原有档案目录为准,在实际处理过程中著有未归类的新 目录。可根据情况修改目录,增加或调整标准目录,对档案原目录数据修改或 补充的数据,需填写更改资料,更改资料放入原案卷内,能实现一条目录对应 多个图像和一个图像对应多条目录的编目。8图像内容:8
15、1实时在屏幕上监控扫描全过程, 遇有漏扫、 重张,图像黑边、偏斜、 折角、不清晰等情况,则进行重扫或补扫。8.2 检查扫描件是否合乎要求,扫描图像必须与原图页面一一对应,不 得出现颠倒、缺页、重页或错页情况,不能有遗漏、重复,扫错的现象8.3 扫描的页面内容居中显示,不可出现明显偏左或偏右的现象,正文 内容、页眉、页脚、反面印章、附件、手写注释等信息完整;图像内容与书本 面完全对应,不得出现书页内容残缺或将旁边页面信息扫入本页的现象。 (对图 像黑边、偏斜、折角、不清晰等情况进行处理,以达到用户需求)8.4 纸张较差档案扫描方案:由于进行数字化的档案会有部分为历史档 案,纸张质量比较差,对于
16、这部分纸张质量较差的历史档案扫描,我们本着以 下原则:8.4.1 保证档案安全。纸张较差的档案多为破损档案,对于破 损档案更应该在生产流程中加以特殊对待, 不能造成二次破坏。 保证档 案的安全是第一要务。 因此,在处理纸张较差的档案时, 不允许使用蘸 水防滑等有破坏档案可能性的操作方法。8.4.2 保证扫描质量。历史档案之所以进行档案数字化,其中 最主要的目的之一就是抢救这部分历史档案,今后在应用这部分档案 时,尽量避免人为翻阅历史档案而给档案造成二次伤害, 而应使用电子 系统,使用扫描件。这样档案扫描的质量要尽可能的清晰、干净,尽可 能的恢复历史原貌,这对扫描质量的要求很高。8.4.3 高效
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 档案 数字化 加工 方案
