你好,欢迎访问崇左市档案信息网!
今天是:
档案馆工作
您当前所在的位置:首页 > 业务指导 > 档案馆工作 >

广西壮族自治区纸质档案数字化技术要求(试行)

发表时间:2014-04-22 16:38:01    来源:

本规定对纸质档案数字化的工作流程提出具体的技术要求,适用于档案馆(室)纸质档案的数字化加工、验收及数据管理。

本规定依据国家行业标准 DA/T 312005《纸质档案数字化技术规范》而制定。

1 纸质档案数字化基本要求

1.1 加工范围

档案数字化加工的范围为永久或长期保存的、社会利用价值高的档案。

1.2 基本环节

纸质档案数字化的基本环节为:档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、数据管理等。

1.3 过程管理

1.31 建立档案数字化加工安全保密管理制度,确保档案原件和数字化档案信息的安全。

1.32 建立档案数字化的台帐制度,在档案数字化各环节均进行详细登记,以备查考。

2 档案整理

在档案进行数字化扫描前,应对档案进行整理,确保档案数字化质量。

2.1 目录审核

目录审核是根据档案的实际情况,按照《档案著录规则》(DA/T 18)等要求,规范档案目录著录内容,核实目录的准确性。如有不规范或错误的文件题名、责任者、档号、起止页号和页数等,应对目录进行修改,为建立目录数据库做准备;已建立目录数据库的,则依据档案实体对目录数据进行检查核实和修改。

2.2 鉴定扫描件和非扫描件

制定扫描件和非扫描件的范围,按要求把同一案卷中的扫描件和非扫描件区分开。原则上重份文件、有正文的底稿或档案经过鉴定后不列入扫描范围的属于非扫描件。

2.3 拆件和装订

以不损伤档案原件为前提,尽量拆除档案装订物,以免影响扫描质量。如拆除装订物可能会对档案原件造成损伤的,应保持原装订。

扫描工作完成后,应进行档案清点,做到准确、无遗漏;拆除过装订物的档案应按原档案卷内文件的排列顺序进行排列,恢复装订,或根据工作需要改变原装订方法。

2.4 页面修整

对已确定扫描的档案进行页面情况检查,页面破损严重,无法直接进行扫描的,应先进行页面修复;页面折皱不平,影响扫描质量的,应先压平或熨平后再进行扫描。

2.5 档案整理登记

制作档案整理工作登记表,对档案整理的过程一一进行登记,包括目录审核修改情况,扫描件和非扫描件鉴定情况,页面修整情况等,作为数字化其他工作环节的依据(登记表格参见附表A)。

3 档案扫描

3.1 扫描方式

3.1.1 根据档案幅面的大小选择相应规格的扫描仪或专业扫描仪进行扫描。大幅面档案可采用大幅面平板直接扫描,或采用缩微拍摄后胶片转数字化。没相应设备的一般采用小幅面扫描后进行图像拼接的方式处理。

3.1.2 纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式。

3.1.3 扫描方式的选择以不损伤档案原件为原则。

3.2 扫描色彩模式

3.2.1 扫描色彩模式有黑白二值、灰度、彩色等。

3.2.2 用黑白二值模式扫描,形成的图像文件所占用的空间较小,适用于页面为黑白两色,字迹清晰,不带插图的档案。

3.2.3 灰度模式适用于页面为黑白两色,但字迹清晰度差,或带有插图的档案,以及页面为多色文字的档案。

3.2.4 彩色模式扫描形成的图像文件所占用的空间较大,但能直接反映档案的原貌,用途广泛,并且可根据需要把彩色图像转换成黑白二值或灰度。页面有红头、印章或有照片、彩色插图的档案应采用彩色模式。

3.3 扫描分辨率

3.3.1 扫描分辨率参数大小的选择,应以扫描后的图像清晰、完整,不影响图像的利用效果为准。

3.3.2 不论采用何种色彩模式,一般情况下,扫描分辨率大于或等于100dpi即可。如果档案文字偏小、密集、清晰度差等,可适当提高分辨率。

3.3.3 需要进行OCR汉字识别的档案,扫描分辨率应大于或等于200dpi

3.4 扫描登记

登记扫描档案的页数、色彩模式、分辨率等,如需要进行OCR识别的档案应注明。在登记的同时应注意核对每份文件的实际扫描页数与档案整理登记单填写扫描件的页数是否一致,发现漏扫或错扫时应及时补扫,并在登记表上注明原因和处理方法(登记表格参见附表A)。

4. 图像处理

4.1 图像质量检查

4.1.1 图像质量应达到以下要求:图像完整、清晰,无影响图片美观的黑边和污点,图像不偏斜或倒置,符合正常阅读习惯。

4.1.2 检查图像的偏斜度、清晰度以及完整性,发现不符合图像质量要求的应进行图像处理;因操作不当造成图像不完整或无法清晰识别时,应重新进行扫描。

4.1.3 扫描图像的排列顺序与档案原件一致,发现不一致时应进行调整;发现文件漏扫时,应及时补扫并正确插入图像。

4.2 纠偏

对出现偏斜的图像应进行纠偏处理,以达到视觉上不感觉偏斜为准。对方向不正确的图像进行旋转还原,以符合阅读习惯。

4.3 去污

对图像页面中出现的影响图像质量的杂质,如黑点、黑线、黑框、黑边等应进行去污处理,在不影响文字可懂度的前提下展现档案原貌。

4.4 图像拼接

对大幅面档案采用分区小幅面扫描后,形成的多幅图像,应进行拼接处理,合成为一个完整的图像,拼接后应与档案原件核实,确保拼接无误,保证数字化图像的整体性。

4.5 裁边

为缩小图像文件容量,节省存储空间,扫描的图像应去除图像无内容、多余的边。

5 图像存储

5.1 图像存储格式

5.1.1 图像存储格式一般应选择TIFFG4)或JPEG格式。这两种图像格式存储文件小,通用性强,不使用专门图像编辑和浏览软件也能在WINDOWS系统平台上进行浏览和管理。

5.1.2 采用黑白二值模式扫描的图像文件,应采用TIFFG4)格式存储;采用灰度或彩色模式扫描的图像文件,应采用JPFG格式存储。

5.1.3 提供网络查询的图像,可把原TIFFJPEG图像文件转换为CEBPDF、海蓝或其他格式。

5.2 图像文件的命名

5.2.1 每一份文件应以该文件相对应的唯一档号来为扫描后的图像文件命名。为了便于管理和数据挂接,图像文件命名的档号格式应与其目录数据库中的档号格式相一致。

5.2.1.1 传统以卷为保管单位的文书档案,档号格式为:全宗号—目录号—案卷号—文件所在页号(或文件顺序号)或全宗号—年度—保管期限代码—类别(机构)代码—归档号—文件所在页号(或文件顺序号)。

5.2.1.1.1 保管期限代码为永久为1、长期为2、短期为330年为410年为5

5.2.1.1.2 类别(机构)代码由各单位根据实际情况进行编制,固定使用,没进行分类的则以“0替之。

5.2.1.2 立卷改革后以件为保管单位的档案,根据档案类型的不同其档号格式有所区别。

5.2.1.2.1 文书档案档号格式为:全宗号—年度—保管期限代码—机构(问题)代码—件号。

5.2.1.2.2 会计档案图像档号格式为:全宗号—年度—类别—件号。

5.2.1.2.3 基建档案档号格式为:全宗号—年度—项目代号(代码)—保管期限代码—类别号代码—件号。

5.2.1.2.3.1 类别号代码:基建文字为1、基建图纸为2

5.2.1.2.3.2 项目代号(代码)由各单位自行编制,固定使用。

5.2.1.3 企事业档案的图像文件以档号及件号来命名,具体格式为:全宗号—类号—案卷号—件号(或文件所在页号)。企事业档案类号的编制应遵循国家档案局制定的《工业企业档案分类试行规则》,年度与类目号以及不同级类目号之间用“.”分隔;

5.2.1.4 如有行业规定的档号命名格式,则应按行业标准来命名其图像文件。

5.2.2 档号中的各号(代码)固定位数,不足前补“0。具体如下:

全宗号3位、目录号3位、案卷号4位、文件所在页号4位、文件顺序号(件号)4位、年度4位、类别(机构)代码2位、归档号4位、一级类目代号1位、二级以上类目代号2位。

档号中空缺或没有进行编制的号(代码),如全宗号、类别(机构)代码等,则以“0”替之。

5.2.3 多页文件应建立相应的文件夹,并按档号加上页码顺序对图像文件命名。

5.2.3.1 以卷为保管单位的档案,每卷建立一个文件夹并以其档号来命名。

5.2.3.2 以件为保管单位的档案,每件建立一个文件夹并以其档号来命名。

6 目录建库

6.1 数据格式

选择通用的数据格式(DBFTXTMDB),能直接或间接地通过XML文档进行数据交换。

6.2 档案著录

按照《档案著录规则》(DA/T 18)、《广西文件级档案目录数据采集方案》等要求进行著录,建立规范档案目录数据库。

6.3 目录数据质量检查

质量检查可采用人工抽查或软件自动校对等方式,核对著录项目是否完整、著录内容是否规范、准确。为了保证目录数据与图像文件能够正确挂接,检查时要重点检查档号是否准确、录入的数据条目数与档案的实际数量是否一致,发现数据错录、漏录应及时进行修改、补录。

7 数据挂接

7.1 汇总挂接

档案数字化后形成的图像数据库,经过质量检查确认合格后,通过相应的软件与档案文件目录数据库进行批量挂接。

7.2 检查挂接

数据挂接后,以档案文件级目录数据库为依据,对挂接的图像文件进行检查,核对图像文件的命名格式是否符合要求,发现错误及时作出修正。

7.3 挂接登记

对汇总挂接及检查挂接的情况进行登记,对挂接错误的注明错误原因、处理办法及修正结果(登记表格参见附表B)。

8 数据验收

8.1 数据抽查

8.1.1 以抽查的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。

8.1.2 同一批验收的档案,抽查的比率不得低于15%

8.2 验收指标

8.2.1 目录数据库与图像文件挂接错误,图像文件不完整、不清晰、有错误等,为“不合格”。

8.2.2 同一批验收的档案,质量抽查合格率达到95%以上(含95%)时,可以验收“通过”。

合格率=抽查合格的文件数/抽查文件总数×100%

8.3 验收审核

验收“通过”的结论,必须经过分管领导审核、签字后才有效。

8.4 验收登记

对验收过程进行详细登记,以备查考(登记表格参见附表B)。

9 数据备份

9.1 备份要求

9.1.1 在档案数字化的过程中,要求把每天形成的图像文件数据备份到计算机的硬盘上。

每星期形成的图像文件数据,除备份在计算机硬盘外,并采用一次性写入光盘刻录一套数据保存。

9.1.2 数据挂接并验收合格后,应及时进行备份。采用多套备份方式,备份介质为一次性写入光盘,至少备份3套,并注意异地保存。

9.2 数据检验

备份的数据应进行检验,检查备份数据是否能被计算机正确读取、数据信息是否完整、文件数量是否准确等。

9.3 备份标签

数据备份后应在相应的备份介质上做好标签,并简略说明备份内容和备份时间,以便查找和管理。

9.4 备份登记

对每次备份的内容、数据大小、备份时间、备份套数及数据存放位置等进行记录(登记表格参见附表C)。

10 数据管理

10.1 管理要求

加强对纸质档案数字化成果的管理,制定相应的管理制度,对备份数据定期检查,确保数据的安全、完整和长期可用。

10.2 保管环境

10.2.1 数据光盘不得擦洗、划痕、触摸其裸露处以及弯曲、挤压、摔打盘片。

10.2.2 数据光盘保管环境温度为1424,相对湿度为45%60%

10.2.2 防止数据光盘沾染灰尘和污垢,避免阳光直接照射,远离热源、酸碱等有害气体和强磁场。

10.3 检测与维护

10.3.1 备份数据光盘每年进行一次有效性、安全性检查,并每45年重新刻录、备份数据。

10.3.2 如原数据运行的软、硬件平台发生改变,应及时对数据进行转换,并做好备份。

10.3.3 做好数据检测与维护过程的登记,数据转换时应说明数据转换的原因及采取的转换措施、转换数据数量等