1 中國古籍?dāng)?shù)字化的歷史回顧
雖然我國擁有豐富的古籍資源,但中文古籍的數(shù)字化最早是從計算機(jī)技術(shù)發(fā)達(dá)的美國開始的。20世紀(jì)70年代末,OCLC和RLIN先后推出了《朱熹大學(xué)章句索引》、《朱熹中庸章句索引》、《王陽明大學(xué)問索引》、《 王陽明傳習(xí)錄索引》、《戴震原善索引》等數(shù)據(jù)庫,到20世紀(jì)80年代以后,中國的臺灣、香港和大陸才相繼開始了中文古籍?dāng)?shù)字化項(xiàng)目。
2 臺灣地區(qū)古籍?dāng)?shù)字化項(xiàng)目
臺灣地區(qū)從20世紀(jì)80年代開始研發(fā)大型古籍資源庫。1984年,臺灣中央研究院開始的“史籍自動化計劃”,計劃開發(fā)《二十五史(全文資料庫)》全文數(shù)據(jù)庫,后在其基礎(chǔ)上逐漸增加《阮刻十三經(jīng)注疏》等項(xiàng)目擴(kuò)展成為包括多種經(jīng)典古籍在內(nèi)的“翰典全文檢索系統(tǒng)”。 1989年,臺灣中央研究院提出了 “數(shù)字典藏計劃”,古籍?dāng)?shù)字化包括善本古籍、金石拓片、古籍附圖、臺灣地方文獻(xiàn)及期刊報紙等。1993年,元智大學(xué)羅鳳珠教授最早開發(fā)出“《紅樓夢》網(wǎng)絡(luò)教學(xué)研究數(shù)據(jù)中心”、《全唐詩》、《全宋詞》古籍資源庫。其后,臺灣漢學(xué)研究中心制作的“善本叢刊影像先導(dǎo)系統(tǒng)”、中華電子佛典協(xié)會的“在線藏經(jīng)閣”都有一定的影響。
3 香港古籍?dāng)?shù)字化項(xiàng)目
1989年起,香港中文大學(xué)中國文化研究所開展有關(guān)中國傳世典籍?dāng)?shù)據(jù)庫的研究工作,中國文化研究所還正式成立“古文獻(xiàn)數(shù)據(jù)庫中心”(CHANT Center),并先后推出《先秦兩漢古籍逐字索引叢刊》及《漢達(dá)古籍?dāng)?shù)據(jù)庫檢索系統(tǒng)》。
4 大陸地區(qū)古籍?dāng)?shù)字化項(xiàng)目
從20世紀(jì)80年代起,大陸地區(qū)開始出現(xiàn)了古籍?dāng)?shù)字化的工作,但是研究和成果甚少。直至進(jìn)入90年代以后,隨著我國計算機(jī)的普及網(wǎng)絡(luò)技術(shù)的介入,才有了古籍?dāng)?shù)字化的雛形。90年代中期以后,國家圖書館制訂了一個龐大的古籍特藏文獻(xiàn)數(shù)字化計劃,如碑砧菁華、西夏碎金、敦煌遺珍、數(shù)字方志以及甲骨文、永樂大典等。北京大學(xué)《中國基本古籍光盤庫》,計劃收錄古籍1萬種 。迪志文化出版有限公司、上海人民出版社推出了文淵閣《四庫全書》全文檢索版。書同文數(shù)字化技術(shù)有限公司推出了《四部叢刊》的全文檢索版。國學(xué)公司推出了《國學(xué)寶典》等系列產(chǎn)品。截止2004年底,網(wǎng)上可見的中文古籍?dāng)?shù)據(jù)庫約70多個。北京大學(xué)主持的CALIS項(xiàng)目及南京大學(xué)圖書館CANAL項(xiàng)目古籍子項(xiàng)目已取得階段性成果。
5 研究進(jìn)展
自從20世紀(jì)80年代以來,通過二十多年的古籍?dāng)?shù)字化建設(shè),我國已經(jīng)在項(xiàng)目建設(shè)和理論研究方面取得了實(shí)質(zhì)性的進(jìn)展,主要表現(xiàn)在:(1)確認(rèn)了古籍?dāng)?shù)字化的標(biāo)準(zhǔn)程式和體系結(jié)構(gòu);(2)完成了數(shù)據(jù)庫檢索系統(tǒng)、輔助性研究支持系統(tǒng);(3)確定了書目數(shù)據(jù)庫的標(biāo)準(zhǔn)和規(guī)范;(4)完善了漢字字符編碼系統(tǒng)和規(guī)模錄入技術(shù);(5)實(shí)現(xiàn)了國際性的古籍資源合作與資源共享;(6)形成了以跨領(lǐng)域跨學(xué)科的專業(yè)研究隊伍。
古籍?dāng)?shù)字化處理流程與體系結(jié)構(gòu)
處理流程:
體系結(jié)構(gòu):
一個基本的古籍?dāng)?shù)字化系統(tǒng)至少包括兩個子系統(tǒng):數(shù)字化子系統(tǒng)和檢索瀏覽子系統(tǒng)。