水利水電科技文獻分類體系研究

時間:2022-04-29 04:21:39

導語:水利水電科技文獻分類體系研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

水利水電科技文獻分類體系研究

1研究背景

構建水利水電科技文獻資料數據的數字化存儲管理,是當前水利行業信息化發展的緊迫任務之一。中國水利水電科學研究院(以下簡稱“中國水科院”)資料室收藏的科技文獻資源,不僅數量多,而且涉及水利學科范圍廣、層次高、內容新,在同行業中,其完整性和權威性也是最高的。本文以中國水科院資料室收藏的科技文獻資源為研究對象,闡述了水利水電科技文獻數字化查詢體系構建過程中學科分類和元數據結構的解決方案,并在此基礎上介紹了水利水電科技文獻數字化查詢平臺的整體架構。

2水利水電科技文獻學科分類體系

水利水電科技文獻從技術角度分為技術報告、技術論文、技術譯文等;從內容上分為成果報告、生產報告、評估報告等。科技文獻數字化建設的一個重要任務,就是找到適合系統應用和用戶檢索的文獻資源分類方法。學科分類一般遵循以下基本原則[1-2]:①科學性:分類必須以科學的知識分類為基礎,選擇事物或概念(即分類對象)的最穩定的本質屬性或特征作為分類的基礎和依據。②系統性:將選定的事物、概念的屬性或特征按一定排列順序加以系統化,從而形成一個合理的科學分類體系。③可擴延性:分類的編碼結構必須能適應同類編碼對象不斷擴充的需要,以便保證增加新的事物或概念時,不至于打亂已建立的分類體系。④兼容性:與有關標準(包括國際標準、國家標準、行業標準等)協調一致。⑤唯一性:指任何專業名詞、術語的定義必須嚴格保持概念的一致,對同一專業名稱、術語必須是唯一的,且不能重復。⑥合理性:分類編碼體系結構與數據分類體系相適應,能反映分類體系的層級、機理及相關聯系的特性。⑦規范性:編碼的結構、類型及編寫的格式統一,以便于數據的檢索和共享。我國現有與水利信息相關的分類編碼標準有:《水利工程基礎信息代碼編制規則》(SL213-1998)、《水利系統政務信息編碼規則與代碼》(SL/T200-97)、《中國河流名稱代碼》(SL249-99)、《中國湖泊名稱代碼》(SL261-98)、《中國水庫名稱代碼》(SL259-2000)、《中國水閘名稱代碼》(SL262-2000)、《中國蓄滯洪區代碼》(SL263-2000)、《土壤侵蝕分類分級標準》(SL190-96)、《水情信息編碼標準》(SL330-2005)、《水文數據GIS分類編碼標準》(SL385-2007)等,這些標準的制定解決了許多基礎信息重復整編、互不統一的局面。但是,由于這些標準大多僅僅針對的是某一項專題或調查制定的,并沒有進行全局性考慮。因此,水利部為建立一個完善的水利信息分類體系,組織專家編制了《水利信息分類》標準,該標準對水利水電科技文獻分類研究也具有一定的借鑒作用。2001年,水利部頒布了《水利技術標準體系表》,2008年進行了修訂,其中將水利信息按專業劃分為綜合、水資源、水文水環境、大中型水利水電工程、防洪抗旱、農村水利、水土保持、農村水電、移民、水利信息化等,該分類方便了水利行業技術標準的管理和使用,具有非常高的理論性和非常強的實踐價值。然而,該分類僅是針對我國水利技術標準成果的管理這一特殊用途的一種分類體系,隨著水利信息化發展,其分類層次和內容體系還有待進一步完善。在國家層面上,我國于2008年頒布的國家標準《學科分類與代碼》(GB/T13745-2008),其中設有“水利工程”分類與代碼[3],并把水利工程分為水利工程基礎學科、水利工程測量、水工材料、水工結構、水力機械、水利工程施工、水處理、河流泥沙工程學、海洋工程、環境水利、水利管理、防洪工程、水利經濟學等。但是,該分類方法過粗,未能充分體現水利行業有關的學科,因此也無法完全滿足水利行業的數據管理的需要。關于水利水電科技文獻的分類,原水利部信息研究所(現水利部發展研究中心)編制有《水利水電科技文獻分類》,該分類包括四級:基本類目24個,二級類目301個,三級類目1514個,四級類目1079個,長期以來為水利系統各級科技文獻收藏個管理部門沿用。但由于該分類編制年代較早,隨著水利形勢的發展以及水利科技的進步,越來越難以適應水利科技文獻的分類需要。較為突出的如該分類法中一級類目中,缺少防洪抗旱、環境水利、城鄉水利、水利信息化等內容,而近年來相關方面取得了相當多的科研成果。本文在調研以上分類標準的基礎上,并在參考了《中國圖書館分類法》(第四版)(簡稱《中圖法》)、《中國科學院圖書分類法》(第三版)(簡稱《科圖法》)、《中國水利百科全書》(第二版)(簡稱《水百》)基礎上,經過綜合對比分析認為,《水百》編纂過程中,集中了包括中國科學院和中國工程院院士在內的眾多水利系統的專家學者,是水利學科現狀的權威體現。相對其他的分類體系,《水百》可以說基本做到了取長補短,既包括有水利水電建設所涉及的基礎領域,如力學、化學、地質學等一般自然科學,涉及面較廣,而且基本上較為全面反映了水利水電建設的最新形勢和進展,如水利管理、水利經濟、環境水利等均有單獨的類項。本項目學科分類以《水百》為基礎進行,將基本類目縮減為21類,二級類目211類,三級類目1508類[4],基本涵蓋了水利水電學科的所有領域,見表1。因此,在目前水利信息資源管理領域尚無現成可參考的學科門類條件下,以《水百》的條目分類為基礎,適當進行調整,不失為一種實用的方法。

3水利水電科技文獻元數據結構

元數據是定義和描述數據的數據,是一種用來描述數字化信息資源,確保數字化信息資源能夠被計算機及網絡系統自動識別、分析、提取和分析歸納的一整套編碼體系[5]。水利水電科技文獻元數據,用來描述水利水電科技文獻信息資源,其目的在于方便用戶發現資源、識別資源、評價資源,而且對相關的信息資源進行選擇和定位,并追蹤資源在使用過程中的變化,實現文獻資源的有效整合、管理使用和長期保存。水利水電科技文獻元數據建立在傳統技術和現代技術兩個基礎之上,不僅用來描述數字化信息的內容特征,而且更要描述數字化信息的基本屬性,使得數字化信息得以被有效傳播、交流和利用。同時水利水電科技文獻元數據為文獻數字化信息資源建立一種機器可理解的框架,幫助計算機系統以及其它網絡通信設備獲得并理解文獻數字資源的基本特征,包括系統特征、內容特征、權利特征等方面。迄今為止,世界上已開發并付諸使用的元數據主要有以下幾種:一是最早普遍使用的元數據MARC機讀目錄;二是描述博物館藏品與檔案特藏的元數據EAD編碼文檔;三是描述和管理大量網絡信息資源的元數據(包括都柏林考DC、因特網內容挑選平臺PICS、因特網館藏WC等元數據);四是其他形式的元數據(包括頻道定義格式CDF、教育管理系統IMS、全球信息定位服務GILS等元數據)。水利水電科技文獻信息與其他類信息相比,在其載體和類型上沒有太大差別,只在具體內容上差別較大。因此,水利水電科技文獻元數據體系的建立應遵循通用、易兼容、可擴展的原則。在對國內外數字圖書館元數據標準進行調研和分析的基礎上,筆者認為:DC元數據標準簡單易懂,既便于專業用戶的擴展,又適合普通用戶使用,它是由世界各國專家共同參與制定的,并經過圖書館界、檔案界、計算機界的專家以及Z39.50和通用標記語言標準(SGM)等方面的專家學者不斷地修正。我國和其他許多國家的數字圖書館工程都是以DC元數據為基礎進行信息化建設。因此,水利水電科技文獻選用DC標準作為基本元數據標準,并根據實際需要進行必要的擴展和裁剪,確定了每一個元素的描述方式、基本定義和填充規范,對每個元素都給予了相應的解釋。水利水電科技文獻元數據體系包括20個類別,60多個元素,主要元素如表2所示。通過表2描述的元數據,管理人員和用戶可以有效地管理、鑒別、了解和使用其中的信息資源。這些元數據可以實現以下功能:一是描述水利水電科技文獻資源對象的內容;二是識別資源日期、類型、格式等數據元素;三是定位資源的位置,以利于網絡環境中水利信息對象的發現和檢索;四是檢索,成為用戶查找電子資源的重要依據。為方便水利水電科技文獻元數據的共享,參考當前異構系統數據交換技術,我們采用可擴展標記語言XML[6-8](ExtensibleMarkupLanguage)來對元數據進行描述。XML是繼HTML之后的又一種Web標記語言,專用于基于Internet的數據共享和交換設計,它已成為互聯網上數據共享和數據交換的關鍵技術和標準[9]。用XML來描述元數據,具有清晰的結構、語法和內容,并能被計算機更高效地處理。XML還具有易于編輯、便于管理、適于存檔、容易查詢等諸多優點[10],這些特點,使得它成為了描述元數據的最佳選擇。

4數字化查詢平臺架構

水利水電科技文獻數字化技術研究的一個重要任務,就是在完成分類體系的基礎上,以元數據為數據資源的描述方式,構建水利水電科技文獻數字化查詢平臺。水利水電科技文獻數字化查詢平臺具有以下功能:①科技文獻的數字化保存、分類管理;②科技文獻資料的查詢、瀏覽;③科技文獻的匯交、;④科技文獻的統計結果輸出功能;⑤用戶和系統管理人員相關的權限管理、使用管理、統計水利水電科技文獻數字化查詢平臺根據水利水電科技文獻數據的特點,數據進行加工保存入數據庫中后,系統對數據進行分級分類存儲,并定義數據的詞匯表,方便用戶查詢檢索。最終,系統通過web的方式,將文獻數據資源在Internet上,并提供數據檢索、文獻下載以及數據統計等功能,其整體架構如圖1所示。

5結語

本文以水利水電科技文獻資源為基礎,選擇中國水科院資料室收藏的科技文獻資料,開展水利水電科技文獻數字化技術研究,初步制定了適合于水利水電科技文獻的學科分類方法和元數據結構,搭建了水利水電科技文獻數字化查詢平臺,為水利水電科技文獻資料的管理提供了網絡化管理平臺。該研究充分利用行業文獻資源,更好地為水利水電科研生產提供服務,為廣大水利水電科研人員提供了快速、便捷的科技文獻查詢途徑,促進了水利水電文獻信息化建設步伐,豐富了水利水電信息化的建設內容。

作者:繆綸張偉兵葉茂王冠華工作單位:中國水利水電科學研究院