地質檔案精細化管理服務信息化研究

時間:2022-04-26 04:06:40

導語:地質檔案精細化管理服務信息化研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

地質檔案精細化管理服務信息化研究

摘要:經過多年的努力,內蒙古地質檔案管理服務信息化建設取得了重要成果,在大數據時代下,內蒙古自治區結合自身實際,開展地質檔案精細化管理服務信息化建設,打破傳統管理模式,地質檔案按照文件級進行信息化管理服務,滿足新一代信息技術條件下地質檔案管理服務要求。

關鍵詞:地質資料;精細化;文件級管理;元數據自動提取

1.引言

近年來,物聯網、移動互聯網、云計算、大數據、人工智能等新一代信息技術深刻地影響著科技和產業界,也對我們日常生產生活產生了重大的轉變。物聯網和移動互聯網是新一代信息的基礎;云計算為大數據存儲、處理提供依托;大數據是人工智能的基礎,為人工智能決策提供數據支持。大數據在新一代信息技術中顯得尤為重要。美國將大數據看作是“未來的石油”,政府投資巨資啟動大數據研究和發展計劃,并將這一計劃上升到了國家高度[1];歐盟非常重視數據開放,由于數據資源全面開放,每年會給歐盟帶來400億歐元經濟增長,歐盟認為大數據是促進經濟增長的重要動力[2]。內蒙古自治區把大數據、云計算產業作為培育戰略性新興產業的主攻方向、作為經濟社會發展的新引擎,制定出臺《內蒙古國家大數據綜合試驗區建設實施方案》和《內蒙古自治區促進大數據發展應用的若干政策》,決心把內蒙古建設成為“中國北方大數據中心、絲綢之路數據港、數據政府先試區、產業融合發展引導區、世界級大數據產業基地”[3]。地質工作是內蒙古經濟社會的先行性、基礎性工作,涉及各行各業,關系到國計民生。地質檔案資料是地質工作最直接的成果,由此形成地質資料信息產品有各種文本、圖表、聲像、實物、數字代碼等形式資料和數據,這些資料和數據是內蒙古大數據重要組成部分。傳統方式采用中國科技檔案通用的案卷級方式保存地質資料,這種保存方式中的案卷級目錄無法詳細地顯示每件資料包含具體信息,使得精準信息難以獲取。為了適應大數據時代下地質檔案信息管理服務要求[4-7],提升地質檔案精細化管理服務,內蒙古自治區國土資源信息院在財政經費的支持下,進行了地質檔案管理服務精細化建設,其主要目標為:按照大數據技術規范,匯聚地質檔案數據,初步建成內蒙古自治區地質檔案數據中心,在完善“地質檔案管理與服務系統”的基礎上,按照精細化管理服務要求,開發文件級地質檔案管理與服務系統,實現地質檔案信息按照細粒度(文件級)進行存儲、管理、服務,即實現地質檔案按照文件級目錄、單個電子文件、段落進行管理服務;實現關聯地質檔案智能匯聚、提取、挖掘等應用。

2.系統設計

2.1內蒙古地質檔案管理服務信息化現狀分析。經過多年的努力,內蒙古地質檔案管理服務信息化建設取得了重要成果,為自治區社會、經濟發展提供了大量基礎性信息產品。利用電子閱覽室,實現了地質檔案到館“一站式”服務;利用地質檔案信息共享服務平臺,實現了互聯網在線服務;利用微信公眾號等新媒體工具,拓寬服務渠道;利用自身地質檔案信息庫優勢,積極開展各項專題服務。面向政府部門、基層地勘單位、礦業權人以及生產和科研機構等部門,積極提供地質檔案多元化服務,同時為國家生態文明建設和自治區重大項目提供綠色通道服務,地質檔案管理和服務能力逐年提高[8-14]。2.2系統建設總體規劃。系統建設按照先進性原則、實用性原則、標準化原則、安全可靠性原則、可擴展性原則進行系統設計。系統建設采用大數據技術平臺、網絡通信技術、數據訪問技術、微服務軟件開發技術;按照國家標準、行業標準以及地方性實施細則和規范進行,系統設計遵循統一的信息編碼、規范;系統設計時充分考慮了與已有地質檔案管理與服務系統整合,并為今后的功能擴充預留必要的軟件接口,系統框架見圖1。基礎設施層主要包括網絡設施、網絡存儲、服務器等硬件設備,同時還包括支撐這些硬件設備運行的操作系統、應用軟件等軟設施;數據源層主要為結構化數據和非結構化數據,結構化數據包括地質檔案案卷級目錄庫(成果資料目錄數據庫、原始資料目錄庫、實物資料目錄庫、涉密信息庫等)和文件級元數據;非結構化數據有地質報告和圖件等,通過數據采集、整理、清洗、轉換、裝載等過程,將多元、異構、分布的數據最終形成一個一體化大數據;計算層主要是大數據技術平臺,主要包括分布式文件系統、數據庫、數據庫倉庫、計算框架、流計算框架、數據挖掘等;業務組件和數據訪問層采用微服務技術為應用平臺提供數據安全傳輸、緩存訪問、檢索、用戶管理、日志管理、可視化等。應用平臺是此次建設重點,在原有地質檔案管理與服務系統的基礎上,實現地質檔案精細化管理服務升級,增加文件級管理服務信息化建設,完善電子閱覽室系統和共享服務系統。在已有的基礎上,按照“總體規劃,分步實施”的原則進行信息化建設,具體為:適應地質大數據技術發展要求,研究建立精細化地質檔案管理元數據模型;按照該模型規范和要求,完成全館八十多萬件地質檔案文件級元數據著錄;開發文件級管理與服務系統;升級數據庫,完善地質檔案管理與服務系統;實現地質檔案向智能化服務轉變,在地質檔案精細化管理服務基礎上,融入人工智能,實現地質檔案正文報告按章節進行搜索,并且能夠按用戶需要內容進行重新組合,實現地質檔案知識服務。2.3系統建設關鍵技術。大數據環境下,除了需要解決大數據應用中的關鍵技術外,更需要解決地質檔案精細化管理服務中的關鍵技術。由于不同時期地質檔案數據的管理軟件和保管格式也隨著采用軟件不同而格式不一致。綜合利用圖文數字化目錄文件、電子文件登記表、地質檔案歸檔匯交信息系統(ED-Maker)軟件中XML格式文件、案卷級目錄數據庫FoxPro等信息,實現地質檔案文件元數據自動提取,自動提取的數據為:檔號、題名、編著者、文件名稱、中文名稱、文件后綴、文件類型、文件路徑、文件大小、比例尺、密級、密級來源、館藏機構、資料分類、數字資源類型、語種、起始經度、起始緯度、終止經度、終止緯度等。自動提取的這些信息與文件級的文字報告和圖件進行關聯。互聯網環境下,需要解決地質檔案正文報告和圖件傳輸慢的問題。正文報告傳輸中采用“骨架法”,先傳輸地質檔案文件級元數據、章節目錄等信息,然后按需傳輸對應章節數據,這樣能夠大大提高傳輸效率,減少等待時間,通過這種技術,可以把正文報告、附圖、附表、附件等信息組織在一起,形成整冊閱讀;圖件傳輸中采用“瓦片法”,把圖件按照“金字塔”規則切成“瓦片”,在瀏覽器端按需進行調度,通過這種方法,圖形操作平滑,用戶體驗較好。大數據環境下,資料檢索采用基于地質領域本體,構建基于知識的檢索技術[15]。其組成包括中英文分詞、推理引擎、組成新的查詢條件、返回結果等部分。推理引擎結合領域本體,根據本體上位詞、下位詞、相關詞、實例詞等進行語義推理,推理后形成新的查詢條件,然后從結構化或非結構化數據中進行檢索,并返回結果。

3.系統應用

系統建設在已有基礎上,采用大數據技術、計算機網絡等技術,采用面向對象技術開發,采用的技術先進,架構合理,開發的功能先進、實用。目前已經完成了文件級管理與服務開發,系統開發完成后在內蒙古自治區國土資源廳信息院進行上線運行,通過一段時間的試運行后,正式投入使用,如圖2。圖2地質檔案文件級管理與服務Figure2FileManagementofGeologicalData系統兼容中國地質調查局地質檔案管理服務要求的各種數據格式,能夠從不同格式地質檔案數據中提取文件級信息,進行精細化管理服務;按照“應提盡提”的原則,自動化方式提取文件級信息;用戶按照導入、自動提取、人工核實流程進行地質檔案文件級元數據采集,能盡量減少人工工作量,提高工作效率。利用該系統,完成全館文字類和圖件類資料文件級元數據入庫,其中自動提取元數據731660件,人工核對681719件。完成附圖595828件,正文17409件,附件17409,附表29600件。

4.結論與建議

通過信息系統建設工作,首先查清了館藏地質檔案電子文件情況,并對館藏電子文件進行了文件級元數據采集入庫,為進行精細化管理服務提供了物質條件;開發完成的文件級地質檔案管理與服務系統具備按照條件查詢、圖形查詢功能,查詢結果能夠實現單個文件和案卷關聯,提高管理服務能力。建議進一步完善日常運行的地質檔案管理與服務系統,使得地質檔案從接收驗收、管理、借閱服務全流程信息化更加優化,提升地質檔案管理精細化水平,提高地質檔案服務精準水準,建議如下:(1)進一步把地質檔案數據庫更新維護日常化,在地質檔案格式規范、涉密信息處理、接收驗收方面安排專人專崗進行日常化處理,在信息系統的支持下,進行細粒度信息采集入庫,提升精細化管理水平和服務效率。(2)完善地質檔案管理與服務系統,把文件級管理、借閱服務加入到地質檔案管理服務系統中來,實現地質檔案文件級查詢、借閱、互聯網在線服務;進一步提高地質檔案知識服務能力。

作者:汪艷梅 單位:內蒙古國土資源信息院