一直以來,裝訂文獻要做到不失真和均勻照明地掃描是幾乎不可能的,在德國的 ‘斯圖加特’ 市的一個著名的科技小鎮(zhèn)‘Tübingen’,一家掃描儀專家“賽數(shù)”和在 ‘馬格德堡的’ 的一家“電子、信號處理和通訊技術(shù)所”的合作下,這個問題現(xiàn)在已成過去。一個名為‘Perfect Book’的創(chuàng)新軟硬技術(shù)已能夠完美地展平書本中縫和修正變形問題,該技術(shù)現(xiàn)在已經(jīng)應(yīng)用到新的“賽數(shù)”O(jiān)S12000系列掃描儀上。
裝訂文獻的數(shù)字化存檔在圖書館和博物館變得日益重要。在過去,不拆書特別是掃描厚的書本,由于書脊做成頁面的彎曲,要影像完全不出現(xiàn)彎曲或變形幾乎是不可能的。由于表面彎曲引起的變形,做成信息在光學(xué)字符識別時產(chǎn)生較高錯誤率。
“賽數(shù)”和位于馬格德堡的“Otto von Guericke大學(xué)”內(nèi)的“電子、信號處理和通訊技術(shù)所”就這個基本問題,雙方在其硬件和軟件的共同開發(fā)提出了解決方法。
長久以來在掃描儀技術(shù)領(lǐng)域中,對書本和文檔變形修正的方法不外是推斷頁面上光的分布或?qū)嶋H表面輪廓線或把頁面邊緣變直方式進行修正。用精確的數(shù)學(xué)運算和軟件來完全解決,使用“平直”和 “平滑”方式 ,將扭曲的線和文字校正。
“賽數(shù)公司”的“Orthoscan”也就是使用這種技術(shù),這方法對于消除書脊弧面是非常有效的工具,但是在實踐中經(jīng)常有其局限性。如果書本輪廓出現(xiàn)插入便條或頁面不完整或邊沿破損,做成展平困難,甚至不能展平。
早期插入便條或頁面損壞影響展平的質(zhì)量和準(zhǔn)確性
注 : 只有當(dāng)書本的上下輪廓線條都能被充份確認,軟件和數(shù)學(xué)運算才可以對其進行精確的 修正和展平處理。
1 加 1 變成 3 = 3D
“Perfect Book” 是基于硬件和軟件相結(jié)合的方法,使用“賽數(shù)”12000系列掃描儀和“賽數(shù)”掃描軟件?!癙erfect Book”的設(shè)計是基于立體視覺系統(tǒng),在掃描過程中捕捉頁面3D輪廓。除了常用的高分辨率線陣掃描頭(圖示黃色部份)外,捕捉3D數(shù)據(jù)需要額外具有VGA分辨率(640 x 480像素)的標(biāo)準(zhǔn)USB數(shù)碼相機,其作用為表面或面陣模型式數(shù)碼相機(圖示綠色部分)。
兩個成像系統(tǒng)同時捕捉影像,不需要耗時的預(yù)掃,達到3D(3維)結(jié)構(gòu)
來自線陣掃描的影像 來自面陣模形拍攝的影像
用線陣掃描產(chǎn)生一個可再生形式的影像。一條光帶以可再生速度與線陣掃描同步移動,在掃描時照亮原稿。移動光帶照亮的影像被一個固定面陣模型數(shù)碼相機以既定的幀頻將影像順序記錄。利用特殊的數(shù)學(xué)計算,從面陣拍攝的影像頻率可以重建掃描頁面的輪廓,并在第二階段轉(zhuǎn)變?yōu)橐粋€平面。
從不同角度同時用兩個校準(zhǔn)的成像系統(tǒng),可達到高質(zhì)量的修正,“Perfect Book”成功克服對純數(shù)學(xué)方法在模糊或書邊破損時帶來的誤差和影響。線陣掃描和面陣拍攝雙組合,在掃描平臺上產(chǎn)生虛擬的書本表面3D模型,從既定的坐標(biāo)系統(tǒng)計算3D表面的等高線作為整個系統(tǒng)的校準(zhǔn)。
由於使用真的3D數(shù)據(jù),“Perfect Book” 不需再只依靠頁邊來確定位置和格式。頁的識別是基于書本右頁面、左頁面和兩頁之間的高度。當(dāng)高度數(shù)據(jù)出現(xiàn)不等同時,自動加入結(jié)構(gòu)性分析確定頁邊。因此書本能自然地打開,操作不但更容易,省時和更能保護書本。 “Perfect Book” 既能非常準(zhǔn)確地分開書的兩頁,在需要打印時就能夠確保理想打印質(zhì)量和效果。
“Perfect Book” 自動修正出現(xiàn)在朝向書中縫字符所產(chǎn)生的變形和自動識別頁面的大小。
Orthoscan 效果 Perfect Book 效果
結(jié)果是靠近書中縫變形的字符在掃描過程中被直接正確地排列成直線,頁與頁自動正確地分離。軟件更使靠近書中縫變形的字符變得平直和平整,字與字之間更平均,消除中縫陰影等。即使字符是隱藏在書中縫也能捕捉清楚無遺。
除了得到高質(zhì)量打印的好處外, ‘Perfect Book’ 功能清除了書本中縫和邊緣的陰影,達至打印時顯著節(jié)約墨粉。 對于用戶更可貴的是在將掃描的文字從影像轉(zhuǎn)換為文本格式時,OCR識別的錯誤率顯著減少,提高了工作效率。
在過去“賽數(shù)”已經(jīng)在照明(曝光)概念上有過一次成功改革,現(xiàn)在的‘LED’(發(fā)光二極管)照明技術(shù)提供更佳的光聚焦掃描,其結(jié)果是更高的處理速度和對操作員及被掃描物提供低于1 lux 小時的曝光量。
由于光聚焦和高能效,可得到更清晰、無干擾、真彩色的影像。防止陰影的發(fā)生和反射光的干涉因而盡量保證光照區(qū)朝向書中縫,正好用于有問題的文檔,更何況“Perfect Book” 的面陣模型式相機是不需要額外光源的。