檔案數(shù)字化加工計(jì)劃
檔案數(shù)字化加工計(jì)劃
檔案數(shù)字化建設(shè)是檔案工作隨著現(xiàn)代化管理發(fā)展到一定階段而出現(xiàn)的一種新的趨勢(shì)。國(guó)家檔案局中央檔案館在《全國(guó)檔案事業(yè)發(fā)展“十二五”規(guī)劃》明確提出:加強(qiáng)檔案安全體系建設(shè),提高檔案的容災(zāi)及災(zāi)備能力,確保檔案安全,是高校檔案數(shù)字化建設(shè)的主要目標(biāo)。
出于對(duì)現(xiàn)有全區(qū)各盟市旗縣檢察院紙質(zhì)檔案的保護(hù)和提高現(xiàn)有檔案的準(zhǔn)確、高效的利用,在全區(qū)范圍內(nèi)實(shí)施檔案數(shù)字化加工,最終實(shí)現(xiàn)檔案的網(wǎng)上調(diào)檔、網(wǎng)上查詢、網(wǎng)上展示編研。
并為保證數(shù)字化加工處理工作安全、有序進(jìn)行,本院與外聘技術(shù)操作人員簽訂安全保密協(xié)議,加工處理場(chǎng)所安裝監(jiān)控設(shè)施,對(duì)出入庫(kù)檔案建立登記,嚴(yán)格清點(diǎn)核查,做到檔案數(shù)字化處理工作的安全、有序、穩(wěn)步、高效進(jìn)行。
同時(shí),以數(shù)字化加工處理工作為契機(jī),安排本院檔案室管理人員與外聘技術(shù)人員共同工作,實(shí)地學(xué)習(xí)操作,掌握室藏檔案數(shù)字化處理程序和方法,并定期舉辦檔案數(shù)字化管理培訓(xùn),對(duì)縣區(qū)檢察院檔案管理人員和各部門內(nèi)勤進(jìn)行系統(tǒng)培訓(xùn),幫助檔案管理及相關(guān)人員掌握檔案數(shù)字化加工處理技術(shù),為今后自主進(jìn)行檔案數(shù)字化加工處理工作提供保障。
一、紙質(zhì)檔案數(shù)字化處理后具有幾點(diǎn)益處:
進(jìn)入21世紀(jì)以來,我國(guó)的各級(jí)政府、企業(yè)、事業(yè)單位的檔案信息化意識(shí)極大加強(qiáng),其中就包括對(duì)浩如煙海的實(shí)體檔案進(jìn)行數(shù)字化,以提供準(zhǔn)確、快速、實(shí)時(shí)的網(wǎng)絡(luò)化信息服務(wù)。實(shí)施實(shí)體檔案數(shù)字化需要有具備相當(dāng)規(guī)模的專業(yè)化團(tuán)隊(duì)、大量的掃描等數(shù)字化專業(yè)設(shè)備、高效的數(shù)字化加工業(yè)務(wù)管理軟件系統(tǒng)以及嚴(yán)密的項(xiàng)目管理制度體系等條件。顯然,采用數(shù)字化外包方式完成檔案的數(shù)字化是最佳的
選擇。
1、檔案的調(diào)閱方便快捷。從前查閱卷宗都要辦理相關(guān)手續(xù)后,到檔案保管處手工查找翻閱。檔案數(shù)字化處理后,可以直接通過電腦在幾秒內(nèi)時(shí)間里準(zhǔn)確找到所需的檔案。這大大提高了工作效率。
2、實(shí)現(xiàn)多種檢索方式。凡是能登陸到局域網(wǎng)的計(jì)算機(jī)都能進(jìn)入電子檔案系統(tǒng)?梢园凑债(dāng)事人姓名、案號(hào)、歸檔號(hào)、按類型等多種方式進(jìn)行檢索查詢。
3、檔案可實(shí)現(xiàn)部分或全部復(fù)制、打印。檔案員不需要進(jìn)入庫(kù)房調(diào)卷,就可以復(fù)印、打印部分或全卷檔案。還可以將其存到各種移動(dòng)存儲(chǔ)介質(zhì)(移動(dòng)硬盤、u盤等)。
4、電子檔案實(shí)現(xiàn)分組管理。電子檔案系統(tǒng)管理員有權(quán)對(duì)用戶進(jìn)行注冊(cè)、注銷、刪除、權(quán)限修改等。可以通過權(quán)限設(shè)置對(duì)用戶瀏覽的內(nèi)容加以限制,比如,高權(quán)限用戶可訪問瀏覽法院訴訟檔案的副卷;只能瀏覽,不能打印等。
5、電子檔案實(shí)現(xiàn)日志管理。電子檔案系統(tǒng)對(duì)每天電子檔案查看情況自動(dòng)記錄?蓪(shí)現(xiàn)對(duì)什么人、什么時(shí)間,在哪臺(tái)計(jì)算機(jī)查看哪本卷宗清晰記錄。通過日志的科學(xué)管理,檔案員可以快速排查解決問題。
6、電子檔案大幅提升安全性。電子檔案安裝于內(nèi)部局域網(wǎng),只允許本院受權(quán)人員調(diào)閱。其他非本院人員無法登陸系統(tǒng)查看。如有特殊情況,上級(jí)檢察院需要調(diào)卷,可另行處理。檔案數(shù)字化處理后,紙質(zhì)檔案都封存入庫(kù),避免了檔案的破損和丟失。
7、電子檔案成本低。電子檔案的維護(hù)成本遠(yuǎn)遠(yuǎn)低于紙質(zhì)檔案。
二、基礎(chǔ)設(shè)備建設(shè)預(yù)算:
類型服務(wù)器存儲(chǔ)備份存儲(chǔ)備份軟件單價(jià)15萬元25萬元25萬元15萬元數(shù)量金額合計(jì)元元元元注:1、服務(wù)器用于掛接檔案數(shù)據(jù),以便準(zhǔn)確、高校的利用。2、存儲(chǔ)用于保存已產(chǎn)生的檔案數(shù)據(jù)。3、備份存儲(chǔ)用于及時(shí)備份已產(chǎn)生的檔案數(shù)據(jù),以保證數(shù)據(jù)的安全和完整性。4、備份軟件用于及時(shí)備份新產(chǎn)生的檔案數(shù)據(jù),在沒有人看管的情況下也可以實(shí)現(xiàn)準(zhǔn)確、高效的數(shù)據(jù)備份。三、數(shù)字化服務(wù)預(yù)算如下:類型掃描加工費(fèi)用檔案整理費(fèi)用檔案處理掛接后期維護(hù)費(fèi)用金額頁(yè)數(shù)x0.4頁(yè)數(shù)x0.05頁(yè)數(shù)x0.055萬/年費(fèi)用合計(jì)元元元元四、具體實(shí)行步驟:1、完善基礎(chǔ)設(shè)備建設(shè)。2、201*年完成本院現(xiàn)有紙質(zhì)檔案的數(shù)字化處理。3、201*年逐步完成推動(dòng)各盟市旗縣等下級(jí)單位的現(xiàn)有紙質(zhì)檔案的數(shù)字化處理。
4、最后,完成現(xiàn)有紙質(zhì)檔案數(shù)字化處理的基礎(chǔ)上,完成每年生成檔案的數(shù)字化處理。
擴(kuò)展閱讀:檔案數(shù)字化加工方案
檔案室、檔案館館藏檔案掃描、數(shù)字化加工
整體解決方案
目錄
-0-_______________________________________________________________________________________
第一節(jié)質(zhì)數(shù)字化加工作業(yè)前期準(zhǔn)備1
一、數(shù)字化工作人員準(zhǔn)備1二、數(shù)字化工作軟件、硬件準(zhǔn)備4三、確定數(shù)字化內(nèi)容、數(shù)量及用戶需求5
第二節(jié)數(shù)字化加工流程及主要技術(shù)方案6
一、入庫(kù)提卷、拆卷6二、標(biāo)引著錄7三、檔案掃描8四、圖像處理11五、全文OCR、生成雙層pdf、板式還原及格式12六、總質(zhì)檢14七、批量掛接15八、還卷及數(shù)據(jù)備份提交15
第三節(jié)質(zhì)量控制方案和保證措施17
一、加工質(zhì)量保障措施17二、多環(huán)節(jié),多層次的質(zhì)量檢查體系17
三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終
級(jí)保障19
第四節(jié)安全保密控制21
保密協(xié)議22
第五節(jié)售后服務(wù)24
-1-_______________________________________________________________________________________
項(xiàng)目背景
隨著全國(guó)文化信息資源共享工程與中國(guó)數(shù)字圖書館工程的起動(dòng),信息化已成為國(guó)際潮流,信息資源建設(shè)成為當(dāng)務(wù)之急。信息資源建設(shè)的重點(diǎn)是電子文獻(xiàn)、各類數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)資源、電子檔案、電子圖書等新型數(shù)字化信息資源的建設(shè)。在數(shù)字化信息資源建設(shè)中,很大的一個(gè)需求是將現(xiàn)有的紙介質(zhì)印刷品數(shù)字化,使之成為能夠用計(jì)算機(jī)閱讀、理解、查詢、檢索的電子文件,最終將其應(yīng)用于數(shù)據(jù)庫(kù)存儲(chǔ),或通過CD-ROM、Internet網(wǎng)進(jìn)行出版,或上傳數(shù)字檔案館供用戶使用。
以傳統(tǒng)紙張為載體的保存方式,占據(jù)了大量的空間,需要特殊的環(huán)境,而且不方便查詢,隨著時(shí)間的推移,還面臨著腐蝕、老化等問題。而將紙介質(zhì)文件信息進(jìn)行電子化處理,保存到光盤上,具有存儲(chǔ)、管理、共享等功能,還可以減少文件庫(kù)房占地,節(jié)省保管設(shè)備和人員方面開支,又方便統(tǒng)計(jì)和進(jìn)行遠(yuǎn)程查詢。
因此,將檔案、期刊、文件等資料通過掃描儀,掃描成圖像文件,再通過處理轉(zhuǎn)換成電子文檔,建立目錄和索引,制作成電子文件,已是當(dāng)務(wù)之急。
-2-_______________________________________________________________________________________
第一節(jié)數(shù)字化加工作業(yè)前期準(zhǔn)備
一.?dāng)?shù)字化工作人員準(zhǔn)備1.甲方人員
職務(wù):現(xiàn)場(chǎng)交接管理人員人數(shù)要求:一名
專業(yè)要求:為學(xué)校檔案館負(fù)責(zé)檔案管理工作的技術(shù)或管理人員。職責(zé)范圍:
①.負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作,協(xié)同甲方人員作好交接清單記錄并簽字。
②.負(fù)責(zé)監(jiān)督乙方規(guī)范化加工。
③.隨時(shí)把握乙方加工進(jìn)度并進(jìn)行協(xié)調(diào)。④.及時(shí)關(guān)注并抽查乙方加工質(zhì)量
⑤.代表甲方與乙方進(jìn)行及時(shí)的溝通及問題協(xié)調(diào),確保項(xiàng)目順利完工。2乙方人員2.1.管理人員
主要為:熟悉現(xiàn)場(chǎng)加工管理,熟悉數(shù)字化整體作業(yè)流程,具有較強(qiáng)組織能力和現(xiàn)場(chǎng)管理及溝通能力的乙方負(fù)責(zé)人。2.2.工程技術(shù)人員
主要為:熟悉計(jì)算機(jī)軟、硬件技術(shù),了解檔案數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)和系統(tǒng)開發(fā)。了解檔案管理等相關(guān)專業(yè)知識(shí)的乙方技術(shù)部技術(shù)支持工程師。2.3數(shù)據(jù)采集作業(yè)員
主要為:了解檔案數(shù)據(jù)庫(kù)數(shù)據(jù)標(biāo)準(zhǔn)和計(jì)算機(jī)軟件應(yīng)用等相關(guān)知識(shí)的乙方數(shù)字化制作部工作人員。
-3-_______________________________________________________________________________________
人員安排見表3-1職務(wù)職責(zé)人備注員項(xiàng)目負(fù)責(zé)人不一定要常駐1.負(fù)責(zé)人員,資源的調(diào)配工作。2.負(fù)責(zé)施工組織設(shè)計(jì)、管理,F(xiàn)場(chǎng),但要通過一切通訊手段項(xiàng)目負(fù)責(zé)3.負(fù)責(zé)施工條件的保障及與甲乙雙方人關(guān)于項(xiàng)目進(jìn)展?fàn)顟B(tài)的匯報(bào)和協(xié)調(diào)工1人和定期到現(xiàn)場(chǎng)的督導(dǎo),切實(shí)做管作。到對(duì)該項(xiàng)目加理工進(jìn)度和加工人質(zhì)量的掌控員1.負(fù)責(zé)與乙方的檔案提卷和還卷等交接工作現(xiàn)場(chǎng)主管2.負(fù)責(zé)現(xiàn)場(chǎng)的人員管理和加工管理3.負(fù)責(zé)數(shù)據(jù)的終驗(yàn)和掛接1人4.配合項(xiàng)目負(fù)責(zé)人做好與乙方的溝通協(xié)調(diào)工作。著錄人員負(fù)責(zé)將檔案卷內(nèi)目錄及其它索引信息進(jìn)行手工錄入為電子數(shù)據(jù)信息并校對(duì)1人數(shù)據(jù)掃描人員負(fù)責(zé)按制定的技術(shù)規(guī)范將檔案資料掃1采描人集在進(jìn)行圖像處人1.去污:將掃描獲取的圖像進(jìn)行圖像去理的時(shí)候,肯定員污;去黑邊及去雜點(diǎn)等;是逐頁(yè)處理,所圖像處理2.糾偏:將偏斜的圖像進(jìn)行糾正處理;以要留意每一人員3.文字處理:將不清楚的文字進(jìn)行加深1人頁(yè)掃描的質(zhì)量,
或變淺;發(fā)現(xiàn)掃描質(zhì)量4.拼接:將頁(yè)面較大的圖像進(jìn)行拼接處問題立即發(fā)還理;上一工序重掃并作好記錄。1.負(fù)責(zé)將處理好的圖像進(jìn)行全文識(shí)別、矢量化人員最圖像矢量2.校對(duì)、板式還原和格式轉(zhuǎn)換1-3終定員需結(jié)合化人員3.對(duì)已經(jīng)產(chǎn)生的成品數(shù)據(jù)進(jìn)行初驗(yàn)后人矢量化的圖形移交給現(xiàn)場(chǎng)主管終驗(yàn)并掛接。數(shù)量和采集難度。數(shù)字化工作軟、硬件準(zhǔn)備
1.配備硬件數(shù)量及檔次要視數(shù)據(jù)采集工作情況及數(shù)據(jù)量大小。
-4-_______________________________________________________________________________________
二.
2.甲方提供PC機(jī)4-6臺(tái)給乙方作為采集作業(yè)使用,其他硬件設(shè)備由乙方自行解決。
3.場(chǎng)地:甲方提供。
4.辦公用具:甲方提供打印機(jī)(以實(shí)際用量為標(biāo)準(zhǔn))辦公桌椅檔案資料的裝訂及打印機(jī)所用的全部耗材。5.其他條件:提供電力和飲水。軟硬件準(zhǔn)備詳見表3-2
表3-2軟、硬件配備列表
軟、硬件名稱數(shù)量詳細(xì)配置1.需支持全文檢索使用功能。2.支持TIFF和PDF格式數(shù)據(jù)的批量掛接功能。能滿足本加工項(xiàng)目所有的技術(shù)要求響應(yīng)時(shí)間提供方綜合檔案管理系統(tǒng)一套項(xiàng)目開始需到位甲方數(shù)字化流程管理和加工軟件、OCR軟件服務(wù)器掃描儀(A3幅面)全套項(xiàng)目開始需到位項(xiàng)目開始需到位乙方一臺(tái)一臺(tái)甲方乙方富士通A3幅面項(xiàng)目開始需FI-4750C(ADF)到位A4幅面虹光-FB6030(平板)PC機(jī)項(xiàng)目開始需到位項(xiàng)目開始需到位掃描儀(A4幅面)一臺(tái)乙方計(jì)算機(jī)4-6套甲方三.確定數(shù)字化內(nèi)容、數(shù)量及用戶需求
在數(shù)據(jù)采集之前,首先要客觀真實(shí)統(tǒng)計(jì)數(shù)字化內(nèi)容和數(shù)量,確定用戶使用需求,
-5-_______________________________________________________________________________________
然后制定對(duì)應(yīng)方案和技術(shù)控制以便準(zhǔn)確地進(jìn)行施工安排。
表3-3三峽大學(xué)檔案館檔案數(shù)字化用戶需求調(diào)研表檔案類型檔案數(shù)量數(shù)字化準(zhǔn)備情況檔案裝訂檔案著錄紙張及保存情況用戶需求備注招生名冊(cè)約件約面很好較差很好較差很好較差很好較差很好較差一般很差一般很差一般很差一般很差一般很差一般很差一般很差影像化矢量化影像化矢量化影像化矢量化影像化矢量化影像化矢量化影像化矢量化影像化矢量化檔案整理排序檔案裝訂學(xué)籍檔案約件約面檔案著錄檔案整理排序約件約面檔案裝訂檔案著錄檔案整理排序檔案裝訂黨群檔案約件約面學(xué)生成績(jī)檔案著錄檔案整理排序檔案裝訂基建檔案約件約面檔案著錄檔案整理排序檔案裝訂很好較差科研檔案約件約面約件約面檔案著錄檔案整理排序檔案裝訂檔案著錄其它:很好較差檔案整理排序
填表人職務(wù)
第二節(jié)數(shù)字化加工流程及主要技術(shù)方案
-6-_______________________________________________________________________________________
檔案數(shù)字化加工主要流程包括:提卷-拆卷-檔案著錄-掃描-圖像處理-OCR-校對(duì)-版式還原-轉(zhuǎn)雙層PDF-終驗(yàn)-掛接。
圖一檔案數(shù)字化加工流程圖
一、入庫(kù)提卷、拆卷
1.從檔案室移交檔案,嚴(yán)格執(zhí)行原始檔案的交接手續(xù),使用雙方項(xiàng)目負(fù)責(zé)人確認(rèn)的檔案交接清單(完成清點(diǎn)登記)。
2.檔案整理:編寫頁(yè)碼、核對(duì)紙質(zhì)檔案頁(yè)碼、對(duì)可拆釘?shù)奈募霾疳斕幚硪赃m應(yīng)掃描的要求、對(duì)需要修復(fù)的檔案進(jìn)行歸并整理(如果發(fā)現(xiàn)破損嚴(yán)重,無法直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、折皺不平影響掃描質(zhì)量的原件應(yīng)先進(jìn)行相應(yīng)處理后再進(jìn)行掃描,發(fā)現(xiàn)破損嚴(yán)重的檔案須立即報(bào)知項(xiàng)目相關(guān)負(fù)責(zé)人)
-7-_______________________________________________________________________________________
制作卷內(nèi)目錄,掃描文件抽取
3按照掃描處理量明確交接周期和檔案交接量(雙方項(xiàng)目負(fù)責(zé)人簽字,以保在施工過程中檔案不損失、不丟失。)
4裝訂案卷應(yīng)保證裝訂牢固,案卷整齊,卷內(nèi)材料不松動(dòng),脫落,保持與原案卷一致。
圖二
二、標(biāo)引著錄
按要求將文件所需信息錄入到軟件數(shù)據(jù)庫(kù)里,標(biāo)引著錄按照國(guó)家檔案局有關(guān)標(biāo)準(zhǔn)結(jié)合用戶檔案著錄的具體要求進(jìn)行。
1.錄入方式采用手工錄入的方式2.校對(duì)方式
校對(duì)以軟件校對(duì)和打印輸出、對(duì)比校對(duì)相結(jié)合,錯(cuò)誤率在萬分之二以下。案卷目錄和卷內(nèi)目錄按照檔案的原始數(shù)據(jù)錄入。卷案目錄和卷內(nèi)目錄的樣式經(jīng)用戶同意可做相應(yīng)調(diào)整。對(duì)檔案目錄數(shù)據(jù)修改和補(bǔ)充的數(shù)據(jù),須填寫更改
-8-_______________________________________________________________________________________
資料、更改資料放入原案卷內(nèi),卷內(nèi)目錄及其他不全的需補(bǔ)充完整。三、檔案掃描
1.掃描方式:根據(jù)檔案幅面的大小選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn)行掃描。大幅面檔案可采用加長(zhǎng)式掃描或者圖像拼接處理方式處理,同一頁(yè)面有兩個(gè)以上文件,需分別掃描。
2.掃描色彩模式:以黑白二值掃描為主,附有灰度(彩色)照片及原件分明度很低的檔案,可視情況采取灰度和24位真彩色掃描。然后以黑白二值保存。
例:藍(lán)底招生名冊(cè),此種檔案長(zhǎng)見為A3幅面、紙張很薄,底色與文字的分明度很低。實(shí)物檔案查看時(shí)都顯吃力,此種檔案如果用黑白二值掃描,則會(huì)出現(xiàn)大幅暗面,文字顯現(xiàn)不清;如果使用彩色掃描,文字部分明度很低。只有使用灰度掃描,效果相對(duì)好一些,如圖三。掃描后的圖像再輔以黑白二值保存,則最大限度的提高了圖像質(zhì)量,如圖四。
圖三灰度掃描效果圖四保存為黑白值后的效果
3.分辨率:無全文檢索需求的文檔分辨率調(diào)整為200DPI最為合適。需要全文檢索而做ocr識(shí)別的文檔,黑白二值掃描分辨率最佳為400dpi,此分辨率下識(shí)別成功率最高。24位真彩色掃描分辨率標(biāo)準(zhǔn)為200dpi。
4.圖像文件的大。汉诎锥祾呙鐰3頁(yè)面:20K40K;灰度或彩色掃描A3頁(yè)面:100150K。
5.如遇字間距和行間距過密、原件本身是復(fù)印件等字跡不清楚的情況,可適當(dāng)增加掃描的分辨率,但要保證圖像清晰的同時(shí),又不影響遠(yuǎn)程查詢和瀏覽的速度。
-9-_______________________________________________________________________________________
6.清晰度:掃描圖像字跡清晰、顏色恰當(dāng),不宜過淺或過深,并且不得出現(xiàn)字跡筆畫殘缺或字跡筆畫疊合而影響閱讀的情況,即使原檔案存在銹斑變質(zhì)、顏色過淺或深淺不一致,也保證掃描圖像可讀,掃描留下的墨跡寬度不得超過0.5厘米,并且指印和黑線不能覆蓋或影響正文內(nèi)容。
7.根據(jù)檔案實(shí)體情況,在檔案電子文件中相對(duì)應(yīng)目錄設(shè)置“復(fù)制件”、“原件不清”標(biāo)志。目錄以原有檔案目錄為準(zhǔn),在實(shí)際處理過程中著有未歸類的新目錄?筛鶕(jù)情況修改目錄,增加或調(diào)整標(biāo)準(zhǔn)目錄,對(duì)檔案原目錄數(shù)據(jù)修改或補(bǔ)充的數(shù)據(jù),需填寫更改資料,更改資料放入原案卷內(nèi),能實(shí)現(xiàn)一條目錄對(duì)應(yīng)多個(gè)圖像和一個(gè)圖像對(duì)應(yīng)多條目錄的編目。8.圖像內(nèi)容:
8.1實(shí)時(shí)在屏幕上監(jiān)控掃描全過程,遇有漏掃、重張,圖像黑邊、偏斜、
折角、不清晰等情況,則進(jìn)行重掃或補(bǔ)掃。
8.2檢查掃描件是否合乎要求,掃描圖像必須與原圖頁(yè)面一一對(duì)應(yīng),不
得出現(xiàn)顛倒、缺頁(yè)、重頁(yè)或錯(cuò)頁(yè)情況,不能有遺漏、重復(fù),掃錯(cuò)的現(xiàn)象
8.3掃描的頁(yè)面內(nèi)容居中顯示,不可出現(xiàn)明顯偏左或偏右的現(xiàn)象,正文
內(nèi)容、頁(yè)眉、頁(yè)腳、反面印章、附件、手寫注釋等信息完整;圖像內(nèi)容與書本面完全對(duì)應(yīng),不得出現(xiàn)書頁(yè)內(nèi)容殘缺或?qū)⑴赃呿?yè)面信息掃入本頁(yè)的現(xiàn)象。(對(duì)圖像黑邊、偏斜、折角、不清晰等情況進(jìn)行處理,以達(dá)到用戶需求)
8.4紙張較差檔案掃描方案:由于進(jìn)行數(shù)字化的檔案會(huì)有部分為歷史檔
案,紙張質(zhì)量比較差,對(duì)于這部分紙張質(zhì)量較差的歷史檔案掃描,我們本著以下原則:
8.4.1保證檔案安全。紙張較差的檔案多為破損檔案,對(duì)于破
損檔案更應(yīng)該在生產(chǎn)流程中加以特殊對(duì)待,不能造成二次破壞。保證檔
-10-_______________________________________________________________________________________
案的安全是第一要?jiǎng)?wù)。因此,在處理紙張較差的檔案時(shí),不允許使用蘸水防滑等有破壞檔案可能性的操作方法。
8.4.2保證掃描質(zhì)量。歷史檔案之所以進(jìn)行檔案數(shù)字化,其中
最主要的目的之一就是搶救這部分歷史檔案,今后在應(yīng)用這部分檔案時(shí),盡量避免人為翻閱歷史檔案而給檔案造成二次傷害,而應(yīng)使用電子系統(tǒng),使用掃描件。這樣檔案掃描的質(zhì)量要盡可能的清晰、干凈,盡可能的恢復(fù)歷史原貌,這對(duì)掃描質(zhì)量的要求很高。8.4.3高效高質(zhì)的完成任務(wù)。
9.掃描登記:認(rèn)真填寫紙質(zhì)檔案數(shù)字化轉(zhuǎn)換過程交接登記表單,登記掃描的頁(yè)數(shù),核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫的文件頁(yè)數(shù)是否一致,不一致時(shí)應(yīng)注明具體原因和處理方法。
四、圖像處理
1.逐張檢查圖像質(zhì)量(包括黑邊、折角、圖像偏斜度、清晰度、失真度等進(jìn)行檢查,發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像處理),檔案順序(頁(yè)號(hào))是否正確,有無漏掃、重張等情況(發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確插入圖像。發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。)
2.糾偏:圖像整體傾斜不得超過1度,不得出現(xiàn)圖像的一部分傾斜或扭曲而影響閱讀的現(xiàn)象。如果檔案頁(yè)面存在部分傾斜的,以頁(yè)面中標(biāo)題糾正為準(zhǔn)。
3去污:所有掃描留下的黑線、指印、陰影或污點(diǎn)都必須清除干凈(在放大50%的情況下)由于印刷質(zhì)量或紙張質(zhì)量等造成的頁(yè)面上有零星的污點(diǎn)和反面倒映文字污點(diǎn)比較多,如果在頁(yè)面視圖下看不清楚,或該污點(diǎn)嵌在文本行中無法清除,可以不清除,但應(yīng)盡量保證圖像可讀。
-11-_______________________________________________________________________________________
4全文頁(yè)面及局部文字的加深和變淺的處理:原始檔案的清晰度較低時(shí),可提高圖像的清晰度,修正原資料中存在的字間距和行間距過密,文字較深或較淺,字跡不清楚的缺陷,確保文字及圖像信息清晰可辨。
5圖像拼接:對(duì)大幅面檔案進(jìn)行分區(qū)掃描形式的多幅圖像,應(yīng)進(jìn)行拼接處理,合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性和數(shù)字化檔案的準(zhǔn)確可讀。
6照片頁(yè)處理:必要時(shí)采用專業(yè)的圖像處理軟件進(jìn)行處理,確保照片的清晰度。
7圖像存儲(chǔ):存儲(chǔ)格式以G-4壓縮TIFF格式保存。A4幅面檔案保存文件不得大于100K;其他幅面檔案掃描形成文件在保證影像質(zhì)量的前提下,盡量縮小文件占用空間。掃描文件存儲(chǔ)命名必須與條目檔案號(hào)一一對(duì)應(yīng)。
五、全文識(shí)別(OCR)及生成雙層pdf、版式還原及格式轉(zhuǎn)換
將掃描處理完成后的文檔利用專業(yè)的識(shí)別軟件進(jìn)行全文OCR,如甲方對(duì)識(shí)別成功率有嚴(yán)格要求的,還需另外進(jìn)行人工校對(duì),校對(duì)結(jié)束后將版式還原及轉(zhuǎn)換成雙層PDF文件格式。
根據(jù)用戶對(duì)識(shí)別率的要求,可選擇性進(jìn)行人工校對(duì)。進(jìn)行人工校對(duì)和不進(jìn)行校對(duì)的優(yōu)缺點(diǎn)對(duì)比:
1.不進(jìn)行人工校對(duì):其原理是在單層PDF的基礎(chǔ)上利用計(jì)算機(jī)軟件進(jìn)行全文OCR識(shí)別后生成雙層PDF文件。從而激活了圖片中所反映的文字,而達(dá)到提取文字和利用原文所包含的文字進(jìn)行檢索的目的。但是不進(jìn)行人工校對(duì)和版式還原,識(shí)別的準(zhǔn)確率取決于原始資源的情況及保存現(xiàn)狀。
優(yōu)點(diǎn):效率高、成本低、能利用原文檢索瀏覽速度快。
-12-_______________________________________________________________________________________
缺點(diǎn):識(shí)別準(zhǔn)確率取決于原件的質(zhì)量,所以準(zhǔn)確率不穩(wěn)定。適應(yīng)范圍:
①、原件版面干凈及保存完好的資源。(準(zhǔn)確率可達(dá)95%以上)②、原文中只含部份核心檢索內(nèi)容的資源。(如學(xué)籍檔案,檢索的重點(diǎn)
只是圍繞學(xué)生的身份信息)
2.進(jìn)行人工校對(duì):其原理是在OCR的基礎(chǔ)上,為了確保識(shí)別的準(zhǔn)確率而增加了人工校對(duì)和版式還原的工序。可實(shí)現(xiàn)無障礙的全文檢索。
優(yōu)點(diǎn):全文檢索無差錯(cuò),準(zhǔn)確率可達(dá)99%,且文本層和圖像層一一對(duì)
應(yīng)。
缺點(diǎn):效率極低、成本極高、因?yàn)檫M(jìn)行了版式還原,所以原真率不到
98%,而且存儲(chǔ)空間很大而致瀏覽速度降低。
適應(yīng)范圍:
①、所載信息珍貴且使用頻率很高的資源。
②、數(shù)字化項(xiàng)目資金預(yù)算充裕且項(xiàng)目實(shí)施時(shí)間寬松的資源。③、有很好的硬件環(huán)境支持的數(shù)字化項(xiàng)目。
-13-_______________________________________________________________________________________
六、總質(zhì)檢
1.對(duì)掃描處理完成后的圖像頁(yè)進(jìn)行檢驗(yàn),對(duì)檔案拆分、掃描、修正、去污、插圖、照片的處理以及文本和圖像頁(yè)的匹配等質(zhì)量進(jìn)行全面檢驗(yàn),對(duì)于質(zhì)量達(dá)不到要求的進(jìn)行重掃、補(bǔ)掃等操作。
2.對(duì)文本域錄入與文本錄入域的標(biāo)引、文件的頁(yè)號(hào)和頁(yè)數(shù)進(jìn)行對(duì)比,對(duì)掃描前圖像頁(yè)的標(biāo)引與掃描后的圖像頁(yè)的編號(hào)與頁(yè)數(shù)進(jìn)行對(duì)比,發(fā)現(xiàn)不合格的登記清單重新處理。
3.對(duì)圖像質(zhì)量的檢查,確保圖像版面清晰,干凈,大小一致,方向一致。4.主要質(zhì)檢標(biāo)準(zhǔn):
4.1.加工后的電子影像在總數(shù)量、完整性、清晰度上與源文件保持一致。
4.2.案卷著錄、按文件的屬性著錄數(shù)據(jù)庫(kù)字段,檢查“文件路徑”字段與文件實(shí)際存儲(chǔ)位置一致,差錯(cuò)率控制在千分之五以內(nèi)。
4.3.電子影像檔案件信息定義數(shù)據(jù)差錯(cuò)率控制在百分之二以內(nèi)。4.4.電子影像檔案卷內(nèi)頁(yè)碼差錯(cuò)率控制在千分之一以內(nèi)。4.5.每頁(yè)電子影像左右端正度控制在三度以內(nèi)。4.6.電子影像漏掃,壓邊率控制在千分之一以內(nèi)。
4.7.電子檔案與條目數(shù)據(jù)的掛接一致,差錯(cuò)率小于千分之一以內(nèi)。
七、批量掛接
1掃描處理后的圖像成品,按年度、機(jī)構(gòu)上傳至檔案專用服務(wù)器,利用檔案管理軟件中的對(duì)應(yīng)掛接功能將掃描圖像信息與錄入到檔案管理軟件系統(tǒng)中的目錄進(jìn)行對(duì)應(yīng)掛接,確保目錄與原文的一一對(duì)應(yīng)。
-14-_______________________________________________________________________________________
2掛接到檔案管理系統(tǒng)中區(qū),進(jìn)行再次的成品驗(yàn)收。
八、還卷及數(shù)據(jù)備份提交
1.原始檔案還原工作嚴(yán)格按照國(guó)家檔案局規(guī)定的相關(guān)標(biāo)準(zhǔn)和實(shí)際情況進(jìn)行有序的還原,
將還原的檔案資料逐卷精心檢查,確實(shí)沒有落頁(yè)、掉頁(yè)、折頁(yè)等問題后再歸還檔案管理人員,經(jīng)雙方仔細(xì)核實(shí)無誤后,在還卷交接單上簽字確認(rèn)。
2.在數(shù)據(jù)化加工過程中的各項(xiàng)工作記錄,在數(shù)據(jù)轉(zhuǎn)移完成后、提交給用戶方。
3.為了有效地保護(hù)數(shù)據(jù),因此建立數(shù)據(jù)備份制度,在數(shù)字化加工項(xiàng)目工作結(jié)束,并經(jīng)用戶在終驗(yàn)報(bào)告上簽字確認(rèn)后,將通過驗(yàn)收后的數(shù)據(jù)利用用戶軟件的光盤制作功能刻錄成光盤,刻錄到DVD光盤中,刻錄完成后再制作一個(gè)光盤備份,或用移動(dòng)硬盤等存儲(chǔ)介質(zhì),將所有成品數(shù)據(jù)備份,提交給用戶。
4.刻錄光盤要求:
4.1、光盤制作兩份,制作成檔案數(shù)據(jù)格式為多頁(yè)TIFF的光盤單盤調(diào)閱。4.2、同一份文件不跨越二片DVD片號(hào)(同一份文件頁(yè)數(shù)需在同一DVD內(nèi))4.3、電子檔案存在于符合標(biāo)準(zhǔn)的單片包裝光盤
4.4、光盤標(biāo)示光盤編號(hào),單片包裝盒上注明光盤內(nèi)主要信息
4.5、在光盤刻錄完成后,與硬盤系統(tǒng)中電子檔案進(jìn)行一次比對(duì),確保檔案資
料無遺漏及正確性。
4.6、制作光盤人員對(duì)于所有光盤序號(hào)進(jìn)行標(biāo)記,并提交相應(yīng)表格。
-15-_______________________________________________________________________________________
第三節(jié)質(zhì)量控制方案和保證措施
項(xiàng)目加工總體質(zhì)量目標(biāo):保證合格、爭(zhēng)創(chuàng)優(yōu)良!
一、加工質(zhì)量保障措施
1.嚴(yán)格遵照?qǐng)?zhí)行我方簽定的《不分包、轉(zhuǎn)包三峽大學(xué)檔案數(shù)字化項(xiàng)目承諾書》,避免項(xiàng)目轉(zhuǎn)包、分包引起的管理混亂和質(zhì)量風(fēng)險(xiǎn)。
-16-_______________________________________________________________________________________
2.嚴(yán)格按照我方制定的人員和設(shè)備投入計(jì)劃進(jìn)場(chǎng)加工,確保人員設(shè)備供應(yīng),為項(xiàng)目進(jìn)度和質(zhì)量提供保障。
3.在該項(xiàng)目加工過程中,我方所有現(xiàn)場(chǎng)加工人員均受我公司《數(shù)字化作業(yè)人員質(zhì)量考核制度》的約束,并承擔(dān)相應(yīng)獎(jiǎng)罰結(jié)果。
二、多環(huán)節(jié),多層次的質(zhì)量檢查體系。
1.對(duì)檔案簽收和屬性數(shù)據(jù)錄入的質(zhì)量檢查,主要內(nèi)容:檔案簽收的準(zhǔn)確性,完整性和即時(shí)性;數(shù)據(jù)內(nèi)容齊全,屬性數(shù)據(jù)輸入準(zhǔn)確;與數(shù)據(jù)校對(duì)的檔案交接。
2.對(duì)數(shù)據(jù)校對(duì)處理的質(zhì)量檢查,主要內(nèi)容:校對(duì)后的數(shù)據(jù)內(nèi)容齊全,正確;紙質(zhì)檔案實(shí)體完整,還案及時(shí)無誤。
3.對(duì)數(shù)據(jù)遷移的質(zhì)量檢查,主要內(nèi)容:遷移后的數(shù)據(jù)的完整性準(zhǔn)確性;對(duì)數(shù)據(jù)進(jìn)行組合查詢并且結(jié)果正確;對(duì)數(shù)據(jù)進(jìn)行匯總統(tǒng)計(jì)并輸出標(biāo)準(zhǔn)表格,試運(yùn)行無死機(jī)現(xiàn)象。
4.在完成以上每個(gè)環(huán)節(jié)后,檢查人員將其數(shù)據(jù)再次進(jìn)行一遍全面的復(fù)查,尤其對(duì)檢查記錄單上更正后的錯(cuò)誤進(jìn)行仔細(xì)的檢查,確保掃描得來的數(shù)據(jù)與源文件內(nèi)容完全一致。
5.實(shí)施項(xiàng)目負(fù)責(zé)人對(duì)成品數(shù)據(jù)進(jìn)行百分之十的抽查,在抽查時(shí)將該查數(shù)據(jù)的年度、保管期限、全宗號(hào)、卷號(hào)、卷內(nèi)順序號(hào)等目錄信息是否準(zhǔn)確無誤,再對(duì)獲取圖像數(shù)據(jù)的亮度、歪斜、是否錯(cuò)頁(yè)等方面進(jìn)行抽查,如有不合格的數(shù)據(jù)及時(shí)進(jìn)行統(tǒng)計(jì)和修正,確保最終數(shù)據(jù)的準(zhǔn)確無誤。
-17-_______________________________________________________________________________________
三、階段性驗(yàn)收與終驗(yàn)相結(jié)合的嚴(yán)格驗(yàn)收程序是質(zhì)量控制的終極保障。
階段驗(yàn)收?qǐng)?bào)告
項(xiàng)目名稱項(xiàng)目編號(hào)報(bào)告人項(xiàng)目負(fù)責(zé)人時(shí)間所處階段項(xiàng)目狀態(tài)參數(shù)監(jiān)控情況項(xiàng)目狀態(tài)項(xiàng)目進(jìn)度計(jì)劃情況實(shí)際情況偏差掃描糾正措施
-18-_______________________________________________________________________________________
項(xiàng)目工作量(人時(shí))項(xiàng)目規(guī)模項(xiàng)目外工作量情況描述(非項(xiàng)目工作)其他工作中遇到問題及困難:需要用戶支持與配合:用戶意見:用戶簽字:簽字日期:終驗(yàn)報(bào)告
項(xiàng)目名稱報(bào)告人項(xiàng)目負(fù)責(zé)人項(xiàng)目編號(hào)時(shí)間第()階段本階段項(xiàng)目完成情況驗(yàn)收項(xiàng)目檔案整理(卷)完成情況備注檔案掃描(A4頁(yè),A3頁(yè),其他頁(yè))圖像處理(卷頁(yè))索引目錄錄入(條)-19-_______________________________________________________________________________________
全文OCR所有報(bào)表輸出(卷)資料裝訂(卷,件)內(nèi)部驗(yàn)收(頁(yè))目錄與圖像文件的銜接數(shù)據(jù)是否上傳到服務(wù)器數(shù)據(jù)備份本階段驗(yàn)收結(jié)論:雙方于年月日,進(jìn)行了檔案數(shù)字化工作的第階段的成品驗(yàn)收,乙方所提供的數(shù)據(jù)基本滿足甲方的要求,甲方同意通過驗(yàn)收,進(jìn)入下一個(gè)工作階段。用戶簽字:日期:項(xiàng)目經(jīng)理簽字:日期:
第四節(jié)安全保密控制
一、為了確保采集數(shù)據(jù)不外泄,在開始進(jìn)行數(shù)字化加工后,我公司將不允許加工人員攜帶任何存儲(chǔ)介質(zhì)進(jìn)出加工現(xiàn)場(chǎng)。
二、為避免采集數(shù)據(jù)在硬盤上的物理磁道上被還原外泄,我公司將使用乙方提供的電腦用于數(shù)據(jù)采集作業(yè)。
三、電腦上所有的可以讀寫存儲(chǔ)介質(zhì)的接口,自進(jìn)場(chǎng)之日起即貼上封條,直到工程完工。
四、為避免數(shù)據(jù)采集過程中數(shù)據(jù)通過網(wǎng)絡(luò)外泄,我公司在加工期間將關(guān)閉外網(wǎng),只使用局域網(wǎng)完成數(shù)字化作業(yè)。
-20-_______________________________________________________________________________________
五、為了建立并嚴(yán)格落實(shí)安全保密制度,保證檔案資料的安全保密性,做到絕對(duì)不外泄任何信息。保密協(xié)議將同加工合同同時(shí)簽定并成為合同不可分割的一部分。見附件。
附件:保密協(xié)議
保密協(xié)議
甲方:地址:
乙方:數(shù)字科技有限公司地址:
鑒于甲方委托乙方承擔(dān)其檔案資料的數(shù)字化加工服務(wù),乙方可能接觸到甲方某些非公開的,涉密的文件、檔案和資料,為了維護(hù)甲方資料的安全,保守國(guó)家秘密,乙方同意在整理檔案中涉及大量的重要的檔案材料承擔(dān)保密義務(wù),并遵守如下保密規(guī)定:
-21-_______________________________________________________________________________________
1,乙方同意上訴須保密的文件和資料承擔(dān)保密義務(wù),數(shù)字化期間保證上訴文件和資料秘密安全,不得以任何形式向第三方(包括家屬、親友)談?wù)摴ぷ髦薪佑|的文件資料內(nèi)容。
2,在乙方工作人員在工作過程中接觸到重要文件資料時(shí),除確有必要(如自擬文件標(biāo)題,圖像處理等需要查看文件內(nèi)容外)不得閱讀文件資料內(nèi)容。
3,乙方工作人員不得帶進(jìn)、帶出各種計(jì)算機(jī)磁盤、光盤等易于存儲(chǔ)文件資料的存儲(chǔ)介質(zhì);
4,因工作需要必須帶進(jìn)的計(jì)算機(jī)軟件工具類應(yīng)用軟件,須經(jīng)檔案室同意,并在帶出時(shí)辦理檢查登記手續(xù)。
5,甲方提供乙方所需數(shù)字化處理的文件和資料等有形載體,僅限于乙方基于甲方需要制作檔案數(shù)字化產(chǎn)品的應(yīng)用,乙方不得復(fù)制以上的任何文件和資料,或向第三方泄露;同時(shí)乙方在結(jié)束本期工作,所加工的數(shù)據(jù)經(jīng)甲方按照《合同》驗(yàn)收合格后,必須無條件將其工作組機(jī)器內(nèi)的數(shù)據(jù)清理干凈。
6,乙方工作人員在工作任務(wù)實(shí)事工程中,非工作需要不得將檔案資料帶出工作場(chǎng)所,不得私自記錄或議論甲方涉密文件資料的內(nèi)容。7,乙方應(yīng)承擔(dān)本協(xié)議約定的保密責(zé)任,妥善保管有觀點(diǎn)文件和資料,并對(duì)有關(guān)人員進(jìn)行有效管理,以確保本協(xié)議的履行。
8,乙方工作人員在工作過程中造成泄密或遺失文件資料的,甲方視情節(jié)輕重追究其行政甚至刑事責(zé)任。
9,未盡事宜,按《保密法》等有關(guān)規(guī)定執(zhí)行。
10,本協(xié)議一式貳份,甲乙雙方各執(zhí)一份,其有同等的法律效率,本協(xié)議
-22-_______________________________________________________________________________________
經(jīng)甲乙雙方簽字蓋章立即生效。
甲方:
代表人(簽字)
第五節(jié)售后服務(wù)
一、享有在雙方簽字驗(yàn)收合格后12個(gè)月內(nèi)的免費(fèi)技術(shù)服務(wù)
二、一般技術(shù)響應(yīng)時(shí)間為24小時(shí),若出現(xiàn)數(shù)據(jù)加工質(zhì)量問題,在48小時(shí)內(nèi)到達(dá)現(xiàn)場(chǎng)進(jìn)行服務(wù)。
三、為檔案館軟件使用人員提供免費(fèi)的檔案資料加工軟件的使用培訓(xùn),同時(shí)有義務(wù)提供有償?shù)暮罄m(xù)技術(shù)支持。
四、保證建庫(kù)的檔案資料電子影像的數(shù)據(jù)質(zhì)量,對(duì)出現(xiàn)質(zhì)量問題的檔案資料,有重新整理,免費(fèi)補(bǔ)掃的責(zé)任。
五、電話支持服務(wù):提供7×24小時(shí)電話支持,售后服務(wù)電話:六、在線QQ技術(shù)服務(wù):提供5-8小時(shí)QQ在線支持,號(hào)碼:七、電子郵件服務(wù):在收到郵件的8小時(shí)內(nèi)做出響應(yīng)。郵件地址:八、定期回訪服務(wù)。在售后服務(wù)有效期內(nèi),我公司將安排不少于三次的定期回
-23-_______________________________________________________________________________________
乙方:
代表人(簽字)
訪服務(wù),以了解用戶使用狀況,收集反饋意見等。
-24-_______________________________________________________________________________________
友情提示:本文中關(guān)于《檔案數(shù)字化加工計(jì)劃》給出的范例僅供您參考拓展思維使用,檔案數(shù)字化加工計(jì)劃:該篇文章建議您自主創(chuàng)作。
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請(qǐng)聯(lián)系我們及時(shí)刪除。