浩如煙海的典籍文獻是中華文明特有的存留。“讓書寫在古籍里的文字活起來”,實現中華優秀傳統文化創造性轉化和創新性發展,是當代古籍出版業面臨的新挑戰。
日前,中華書局總編輯、古聯數字傳媒科技有限公司董事長顧青在接受本報記者專訪時表示,中華書局的數字化戰略,將根據國家規劃,著力打造中華傳統文化大數據中心和國家級古籍整理出版資源平臺,使中華書局成為國內領先的優質傳統文化數字資源的內容提供商和知識服務商,再造一個“線上中華”。
中華經典古籍庫:以最高質量匯聚優秀古籍
“處理古籍,我們要應對的是幾千年留下來的各種形體漢字。越是大數據時代,古籍數據來源的可靠性、準確性、規范性就越是重要。這些漢字呈現要準確,而且能夠被檢索。”2014年,中華書局“中華經典古籍庫”發布,4年來已從初期的2億字擴展至10億字,從單一的局域網版擴展到在線版和微信版。“我們經過多年積累,建立了11余萬字的字庫,解決了絕大部分古籍生僻字、異體字和字符集外字等用字難題,滿足了古籍文獻全文本數字化加工要求。”顧青說。
面對目前市面上良莠不齊的古籍資源庫,顧青用“自來水”和“純凈水”的差別來比喻其質量的差異。“目前網絡上各類古籍數據庫不少,數量大、版本多,但是存在兩個大問題,一是沒有版權,二是差錯率高,不能被直接引用。中國幾千年的文獻流傳,尤其一些經典文獻歷經各代抄、刻、刪改,如不進行認真整理,會出很多問題。中華書局是代表國家做這個項目,我們的數據庫必須是以古籍整理為基礎,因此‘中華經典古籍庫’的特點是:基于古籍整理成果和規范的海量合法數據,最高質量,可供征引。”
除了質量過硬,“中華經典古籍庫”還實現了多功能服務,不僅能瀏覽、閱讀、定制資源,在線編輯、下載、寫作,還可以全文檢索、深度檢索和個性化檢索。
“中華經典古籍庫”發布后,銷量持續增長,并在美、日、德、英等國實現了海外銷售。2015年銷售收入400萬元,2017年升至 1500萬元,今年預計可達2800萬-3000萬元。
顧青表示,加速發展的同時,也要解決產品面臨的“痛點”。“一是版權問題。我們是代表國家形象,必須嚴謹,所有書的版權我們都是一家家出版社去簽合同。二是制作問題。新中國成立以來很多古籍的數據是不能用的,有的全是鉛排,要重新錄入、制作。因此,數據庫只能以每年3億-4億字的速度增加,每1億字意味著500萬-1000萬的資金投入。”
“未來還要將新中國成立以來整理好的優秀古籍全部融匯進去,‘十三五’的目標是30億字,5000種整理本古籍。我經常鼓勵員工,當數據量達到一定程度時,我們質量優勢就能充分體現了。”顧青說。
產業升級,開創古籍整理出版3.0時代
今年4月,國家級古籍整理出版資源平臺“籍合網”上線,這是一個基于古籍整理與數字化的綜合性知識服務平臺,由中華書局旗下的古聯公司負責建設和運營。
“籍合網”的一個令人矚目的功能,是推出了“古籍整理工作與發布平臺”這一在線應用系統,可通過發放整理任務、自主申領選擇的“眾包”形式,實現古籍的線上協作整理。同時,平臺還提供校勘、標點、注釋等一系列在線工具,“籍合網”的數據庫也可供整理者利用,使古籍整理的質量更有保證。整理工作完成后,成果可直接在“籍合網”上發布,實現全流程數字出版。
“越是大型項目,這一平臺越有優勢,例如‘中華大藏經續編’多達兩億字規模,利用線上整理和全媒體出版,可減少重復勞動,提升質量,使古籍整理的生產能力成倍增加。”顧青說,“古籍整理出版從‘紙—紙’的1.0時代,發展到‘電子—紙’的2.0時代,現在又進入了‘電子—電子’的3.0時代。‘籍合網’是對古籍整理出版產業鏈進行重組的一次大膽嘗試,通過線上線下聯動,充分發揮網絡技術和新科技的優勢推動古籍整理工作,這將徹底改變古籍整理出版的生態。”
顧青還透露,為了實現古籍的知識服務,目前,中華書局正準備做“中華傳統文化大數據中心”,將涵蓋中國傳世古籍的主要品種,基本滿足學術界和全社會對優質傳統古籍的需要。計劃三年時間完成150億字,2萬種古籍的整理工作,其中50億字(自有版權)要完成校勘與標點,成為可供閱讀引用的標準文獻。
“‘中華傳統文化大數據中心’的基礎是已經過深度標引的知識化、結構化的數據,這是中華書局數字古籍的核心競爭力。這是中華書局的未來,更是中華優秀傳統文化和古籍整理出版的未來。”顧青表示。(李揚)
原標題:打造“線上中華”,讓古籍煥新生
轉自:文匯報
【版權及免責聲明】凡本網所屬版權作品,轉載時須獲得授權并注明來源“中國產業經濟信息網”,違者本網將保留追究其相關法律責任的權力。凡轉載文章及企業宣傳資訊,僅代表作者個人觀點,不代表本網觀點和立場。版權事宜請聯系:010-65363056。
延伸閱讀