為按期完成國(guó)家重點(diǎn)檔案搶救任務(wù),加快推進(jìn)數(shù)字檔案館建設(shè)步伐,江西省檔案館于2007年啟動(dòng)省檔案館館藏紙質(zhì)檔案數(shù)字化工作,圍繞如何解決數(shù)字化服務(wù)外包過(guò)程中的檔案實(shí)體與檔案信息安全、質(zhì)量控制,以及如何提升紙質(zhì)檔案數(shù)字副本憑證性問(wèn)題,不斷學(xué)習(xí)、研究、總結(jié),形成了一整套可行的紙質(zhì)檔案數(shù)字化全程管理工作方法與措施。
一、實(shí)施紙質(zhì)檔案數(shù)字化全程管理的必要性
1.實(shí)施全程管理是維護(hù)檔案實(shí)體與檔案信息安全的重要屏障
在紙質(zhì)檔案數(shù)字化外包過(guò)程中如何保障檔案實(shí)體和檔案信息的安全,已成為開(kāi)展紙質(zhì)檔案數(shù)字化外包工作中急需解決的問(wèn)題。在維護(hù)檔案實(shí)體和檔案信息安全實(shí)踐中,檔案實(shí)體和檔案信息在數(shù)字化各環(huán)節(jié)中流轉(zhuǎn),都離不開(kāi)人這個(gè)關(guān)鍵因素,而把具有主觀能動(dòng)性的人與具有客觀性的流程設(shè)計(jì)管理制度、監(jiān)控設(shè)備有機(jī)結(jié)合起來(lái)的有效手段,就是全程管理。只有進(jìn)行全程管理,實(shí)現(xiàn)兩方面優(yōu)勢(shì)互補(bǔ),才能最大限度地保障檔案實(shí)體和檔案信息安全。
2.實(shí)施全程管理是質(zhì)量控制的必然要求
質(zhì)量控制如同醫(yī)生看病,治標(biāo)不能忘治本,現(xiàn)實(shí)中經(jīng)常存在“頭疼醫(yī)頭、腳疼醫(yī)腳”的“重結(jié)果輕過(guò)程”的質(zhì)量管理誤區(qū)。對(duì)紙質(zhì)檔案數(shù)字化實(shí)施全程管理,就是為了徹底走出“事后控制”的誤區(qū),由單一的事后質(zhì)量檢驗(yàn)把關(guān)控制轉(zhuǎn)變?yōu)椤邦A(yù)防式”的事前控制、事中控制和事后數(shù)據(jù)質(zhì)檢相結(jié)合的綜合管控策略,實(shí)現(xiàn)質(zhì)量問(wèn)題的處理“由堵向疏”的轉(zhuǎn)變,進(jìn)一步提高數(shù)據(jù)質(zhì)量,提高各環(huán)節(jié)工作效率。
3.實(shí)施全程管理將為今后認(rèn)定紙質(zhì)檔案數(shù)字副本憑證性奠定基礎(chǔ)
通過(guò)數(shù)字化轉(zhuǎn)換制作紙質(zhì)檔案數(shù)字副本,是當(dāng)前和今后一個(gè)時(shí)期實(shí)施重要檔案異質(zhì)異地備份,加快數(shù)字檔案資源建設(shè)與網(wǎng)絡(luò)化共享的主要途徑。以數(shù)字副本作為紙質(zhì)檔案的異質(zhì)備份件,在網(wǎng)絡(luò)化查檔利用工作中代替檔案原件出證,這都要求紙質(zhì)檔案數(shù)字副本應(yīng)具備憑證功能,這也是今后必須解決的問(wèn)題。鑒于當(dāng)前我國(guó)認(rèn)定數(shù)字副本法律地位的法規(guī)和標(biāo)準(zhǔn)尚未出臺(tái),而紙質(zhì)檔案數(shù)字化以及數(shù)字副本的長(zhǎng)期保存是一個(gè)浩大的系統(tǒng)工程,在經(jīng)費(fèi)、人力、物力等方面的投入可謂巨大,屬于稀缺資源的檔案原件在數(shù)字化過(guò)程要經(jīng)過(guò)一場(chǎng)浩蕩的拆裝過(guò)程,若以這樣的代價(jià)制作形成并長(zhǎng)期保存的數(shù)字副本僅具有查考價(jià)值,那么紙質(zhì)檔案數(shù)字化的工作績(jī)效將被大打折扣。基于這樣的認(rèn)識(shí),參照《縮微攝影技術(shù)縮微品法律認(rèn)可性》等標(biāo)準(zhǔn),省檔案局館認(rèn)為只有通過(guò)全程管理,從保障紙質(zhì)檔案數(shù)字副本真實(shí)性、完整性、可靠性和可用性入手,規(guī)范數(shù)字副本的制作過(guò)程,盡力保存數(shù)字副本的背景和結(jié)構(gòu)信息才能為將來(lái)認(rèn)定它的憑證性奠定基礎(chǔ)、創(chuàng)造條件。
二、紙質(zhì)檔案數(shù)字化全程管理實(shí)踐的主要做法
省檔案館將紙質(zhì)檔案數(shù)字化全程分為10個(gè)基本環(huán)節(jié),包括審批數(shù)字化對(duì)象、制定數(shù)字化工作方案、檔案出庫(kù)、整理分件、建元數(shù)據(jù)庫(kù)、檔案掃描、圖像處理、數(shù)據(jù)質(zhì)檢、檔案還原入庫(kù)、數(shù)字化成果驗(yàn)收移交等,同時(shí),針對(duì)數(shù)字化基本環(huán)節(jié)建立數(shù)字化工作文檔管理制度。下面重點(diǎn)介紹下省檔案館在幾個(gè)關(guān)鍵環(huán)節(jié)的主要做法。
1.?dāng)?shù)字化對(duì)象的審批。為證明民國(guó)檔案數(shù)字副本來(lái)源的可靠性,參照檔案原件縮微品規(guī)范制作要求,對(duì)數(shù)字化對(duì)象實(shí)行審批制,由法人簽署《紙質(zhì)檔案原件數(shù)字化審批書(shū)》,并將其納入全宗卷和數(shù)字化工作文檔管理范疇。審批書(shū)主要內(nèi)容包括數(shù)字化對(duì)象、數(shù)字化目的、授權(quán)信息、審批時(shí)間等。
2.制定數(shù)字化工作方案。省檔案館把數(shù)字化工作方案視為有效管理數(shù)字化全程、控制數(shù)字化成果質(zhì)量的重要武器,因此,它既是數(shù)字化服務(wù)外包招標(biāo)文件的主要內(nèi)容,也是項(xiàng)目實(shí)施全過(guò)程的操作和管理標(biāo)準(zhǔn),應(yīng)盡量具體、量化并具可操作性。省檔案局館編制的紙質(zhì)檔案數(shù)字化工作方案主要包括數(shù)字化現(xiàn)場(chǎng)安全保密措施、項(xiàng)目管理要求、檔案整理與修復(fù)要求、技術(shù)標(biāo)準(zhǔn)、數(shù)字化工作文檔管理要求、數(shù)據(jù)質(zhì)檢與驗(yàn)收要求、數(shù)字化成果移交要求等主要內(nèi)容。每個(gè)方面都有詳細(xì)的要求,比如,技術(shù)標(biāo)準(zhǔn)部分又進(jìn)一步明確了數(shù)字圖像技術(shù)參數(shù)、圖像處理、格式與存儲(chǔ)、命名標(biāo)準(zhǔn)、著錄與目錄數(shù)據(jù)庫(kù)建庫(kù)、數(shù)字化元數(shù)據(jù)賦值等要求。
3.整理分件。整理分件是整個(gè)數(shù)字化過(guò)程的重要環(huán)節(jié),直接關(guān)系到檔案實(shí)體安全和數(shù)字副本的命名、存儲(chǔ)與質(zhì)量控制,抓好該環(huán)節(jié),整個(gè)數(shù)字化工作將事半功倍。省檔案局館的主要做法:一是加強(qiáng)對(duì)數(shù)字化服務(wù)外包商員工的集中培訓(xùn),他們對(duì)民國(guó)時(shí)期公文、組織職能等方面的認(rèn)知水平將決定整理分件的準(zhǔn)確性,培訓(xùn)內(nèi)容包括民國(guó)公文種類(lèi)、公文處理辦法、民國(guó)時(shí)期文化背景知識(shí)、政府機(jī)構(gòu)的衍變、電報(bào)在公文中的應(yīng)用等;二是每個(gè)案卷填寫(xiě)一張數(shù)字化流程單,并跟隨案卷在數(shù)字化各個(gè)環(huán)節(jié)流轉(zhuǎn),需要填寫(xiě)案卷的總頁(yè)數(shù)、頁(yè)號(hào)編制、修裱、分件情況,登記珍貴和特殊檔案頁(yè)面;三是實(shí)行流水線上整理分件環(huán)節(jié)的在線指導(dǎo),發(fā)現(xiàn)問(wèn)題及時(shí)指正,提高整理分件的準(zhǔn)確率,從而提高整個(gè)項(xiàng)目的工作效率。
4.建文件級(jí)元數(shù)據(jù)庫(kù)。省檔案局館將檔案目錄數(shù)據(jù)與數(shù)字化元數(shù)據(jù)的集合稱為元數(shù)據(jù)庫(kù)。自2009年起,省檔案局館要求數(shù)字化服務(wù)外包公司在數(shù)字化過(guò)程中由數(shù)字化系統(tǒng)自動(dòng)捕獲或手動(dòng)批量著錄數(shù)字化授權(quán)、時(shí)間、分辨率、格式、捕獲設(shè)備等20個(gè)有關(guān)數(shù)字副本背景和結(jié)構(gòu)的元數(shù)據(jù)。這一做法在后來(lái)發(fā)布的《信息與文獻(xiàn)——文件檔案數(shù)字化實(shí)施指南》中得到印證。同時(shí),在準(zhǔn)確分件的基礎(chǔ)上按照《檔案著錄規(guī)則》《民國(guó)檔案目錄中心數(shù)據(jù)采集標(biāo)準(zhǔn)民國(guó)檔案著錄細(xì)則》《江西省文書(shū)類(lèi)電子檔案著錄與數(shù)據(jù)格式規(guī)范》等標(biāo)準(zhǔn)規(guī)范進(jìn)行著錄與目錄數(shù)據(jù)錄入,建立案卷級(jí)、文件級(jí)目錄數(shù)據(jù)庫(kù)。鑒于經(jīng)費(fèi)、人力和時(shí)間等方面的限制,著眼為今后各項(xiàng)業(yè)務(wù)工作建立基礎(chǔ)數(shù)據(jù)庫(kù),省檔案局館采取了民國(guó)檔案文件級(jí)著錄分步實(shí)施、逐漸完善的策略,即在數(shù)字化過(guò)程中做到卷內(nèi)檔案分件基本準(zhǔn)確,建立文件級(jí)目錄數(shù)據(jù)庫(kù)時(shí)照錄檔案原有事由,無(wú)事由時(shí)才重?cái)M題名,為今后著錄職能部門(mén)依托數(shù)字檔案集成管理系統(tǒng)進(jìn)一步開(kāi)展著錄工作奠定基礎(chǔ)。實(shí)踐證明這是一項(xiàng)有效的舉措。
5.圖像處理。按照精確復(fù)制的原則并參照《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》的要求實(shí)施圖像處理,使數(shù)字圖像清晰、端正,準(zhǔn)確反映檔案原件的原始面貌,不去除檔案頁(yè)面原有的紙張褪變斑點(diǎn)、水漬、污點(diǎn)、裝訂孔等;在距頁(yè)邊最外沿約2毫米處裁剪數(shù)字圖像,保留紙質(zhì)檔案原有頁(yè)邊,包括破損、歪斜頁(yè)邊。
6.?dāng)?shù)據(jù)質(zhì)檢。包括數(shù)字圖像質(zhì)檢與目錄數(shù)據(jù)質(zhì)檢兩個(gè)部分。按批次數(shù)據(jù)隨機(jī)抽檢方式進(jìn)行質(zhì)檢,質(zhì)檢次數(shù)一般為兩次。一次質(zhì)檢抽檢率不少于20%,二次質(zhì)檢抽檢查率不少于10%,批次抽檢合格率應(yīng)為100%,否則整批數(shù)據(jù)打回重新制作或不予驗(yàn)收,同時(shí)據(jù)實(shí)填寫(xiě)質(zhì)檢任務(wù)安排單、質(zhì)檢情況登記表、質(zhì)檢驗(yàn)收登記表等數(shù)字化工作文檔,作為數(shù)字化成果驗(yàn)收移交的依據(jù)。
7.數(shù)字化成果驗(yàn)收移交。移交的內(nèi)容包括符合標(biāo)準(zhǔn)化要求的紙質(zhì)檔案數(shù)字副本及其元數(shù)據(jù)庫(kù)、數(shù)字化工作文檔以及按照規(guī)范要求制作的存儲(chǔ)移交介質(zhì)。其中,紙質(zhì)檔案原件數(shù)字化審批書(shū)、數(shù)字化工作方案、數(shù)字化項(xiàng)目招投標(biāo)文件、中標(biāo)通知書(shū)、數(shù)字化項(xiàng)目合同書(shū)等憑證性文件的數(shù)字副本一同存儲(chǔ)于移交介質(zhì)的授權(quán)文件夾中。
三、幾點(diǎn)思考
紙質(zhì)檔案數(shù)字化是高速發(fā)展的信息時(shí)代給檔案工作帶來(lái)的一項(xiàng)新內(nèi)容,在推進(jìn)過(guò)程中不可避免會(huì)遇到一些新情況、新問(wèn)題。
1.如何更加科學(xué)確定數(shù)字化范圍,除了考慮檔案重要程度、破損情況、利用需求等,是否還要結(jié)合數(shù)字化工作進(jìn)度、工作量以及數(shù)字化績(jī)效等實(shí)際情況綜合考慮。
2.?dāng)?shù)據(jù)質(zhì)檢與準(zhǔn)確率問(wèn)題。面對(duì)數(shù)以百萬(wàn)級(jí)甚至千萬(wàn)級(jí)的目錄和圖像數(shù)據(jù),即使實(shí)施全程管理、盡最大努力提高抽檢比例,也難免會(huì)掛一漏萬(wàn)。在合理安排年度工作量的前提下,如何提高數(shù)據(jù)準(zhǔn)確率,需要進(jìn)一步摸索、研究和總結(jié)推廣。
3.?dāng)?shù)字副本的法律地位問(wèn)題。目前,我國(guó)尚未啟動(dòng)有關(guān)數(shù)字副本法律認(rèn)可性的法規(guī)標(biāo)準(zhǔn)的制定工作,現(xiàn)有標(biāo)準(zhǔn)均沒(méi)有明確的相關(guān)條款,通過(guò)實(shí)踐證明《信息與文獻(xiàn)——文件檔案數(shù)字化實(shí)施指南》以及澳大利亞等國(guó)的先進(jìn)標(biāo)準(zhǔn)具有科學(xué)性、合理性和可操作性,因此,應(yīng)該參照這些標(biāo)準(zhǔn)并結(jié)合我國(guó)的具體實(shí)踐著手制定有關(guān)標(biāo)準(zhǔn),用于規(guī)范數(shù)字副本制作的全程管理與技術(shù)要求??偨Y(jié)省檔案局館在這方面的做法主要包括以下幾個(gè)方面:
(1)實(shí)施數(shù)字化對(duì)象審批制,用以記錄數(shù)字化項(xiàng)目授權(quán)信息,證明數(shù)字副本來(lái)源的合規(guī)性;
(2)建立并歸檔保存規(guī)范的數(shù)字化工作文檔,記錄、審核數(shù)字化項(xiàng)目全過(guò)程管理信息;
(3)完整掃描關(guān)于同一項(xiàng)業(yè)務(wù)活動(dòng)的往來(lái)文件,以及一份文件的正本、定稿、公文處理單、重要修改稿等,確保數(shù)字化對(duì)象及其來(lái)源信息的完整性;
(4)精確復(fù)制、準(zhǔn)確標(biāo)識(shí),以文件級(jí)檔號(hào)及件內(nèi)頁(yè)面流水號(hào)命名數(shù)字副本,以彩色JPEG格式存儲(chǔ)源版數(shù)字副本,完整記錄檔案原件頁(yè)面原有內(nèi)容,包括斑點(diǎn)、破損頁(yè)邊等頁(yè)面信息;
(5)通過(guò)數(shù)字化元數(shù)據(jù)記錄紙質(zhì)檔案數(shù)字副本的技術(shù)參數(shù)與生成背景;
(6)通過(guò)先期制定數(shù)字化工作方案,結(jié)合現(xiàn)場(chǎng)監(jiān)管、按比例抽檢、分階段驗(yàn)收等方式,實(shí)施數(shù)字化成果的質(zhì)量控制。
原載于《中國(guó)檔案報(bào)》2013年11月14日 總第2533期