空間數據倉庫概念框架思考

時間:2022-10-25 07:52:00

導語:空間數據倉庫概念框架思考一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

空間數據倉庫概念框架思考

摘要:首先表述了空間數據倉庫的三個核心思想;其次設計出了空間數據倉庫的概念框架,著重描述了空間數據倉庫的外部結構、內部結構以及各組成模塊的工作流程,設計出了空間數據倉庫認知過程的概念框圖,并對認知的基本概念進行了描述,表述了認知過程14個世界模型和13個轉換算子的基本內容,并用代數系統給出了嚴格定義;最后得出的結論是,研制空間數據倉庫十分必要,以支持我國的空間數據基礎設施建設。

關鍵詞:地理信息系統;空間數據倉庫;數據倉庫;認知過程

0引言

進入21世紀后,對空間數據倉庫的研究方興未艾,在許多次的國際學術會議上都有相關[1~3]。例如在泰國召開的ISPRS第三屆動態與多維GIS會議暨CPGIS第十屆地理信息年會、北京召開的第20屆國際制圖協會國際學術會議、南非召開的第21屆國際制圖協會國際學術會議等。還有一些ESRI公司的白皮書、全球性用戶大會、SSD國際會議、數字地球國際會議、GIS國際會議等也開始討論空間數據倉庫問題[4~8]。將空間數據倉庫技術引入到我國大概是20世紀90年代末,文獻[9~14]的發表開創了我國空間數據倉庫理論與技術研究的新局面,此后又陸續出現了一些這方面的論文。

總體說來,上述工作對空間數據倉庫的理論和方法進行了初步研究,在概念、原理、結構、操作與算法等方面進行了初步論述,已取得了卓有成效的成績。但是到目前為止,空間數據倉庫的概念框架和認知過程等方面還是缺乏系統的論述,沒有形成一套比較完整的空間數據倉庫概念框架體系和認知過程體系。

1概念框架

空間數據倉庫是GIS技術和數據倉庫技術相結合的產物,其定義很多,但中心思想包含三方面內容:①空間數據倉庫是在網絡環境下,實現對異地、異質、異構不同源數據庫中地理空間數據、專題數據及時間數據的統一、整合、集成處理,形成用戶獲取數據的共享操作模式;②空間數據倉庫可根據需求對這些數據再進行測繪專業處理,提供多種空間數據產品,滿足用戶更高層次——對數據產品的需求;③基于空間數據產品,空間數據倉庫可從多維的角度進行空間數據立方體分析和空間數據挖掘分析,提供綜合的、多維的、面向分析的空間輔助決策支持信息,滿足用戶空間決策分析的需求。

空間數據倉庫的概念框架分為外部結構、內部結構。外部結構主要描述空間數據倉庫與外部系統的關系;內部結構主要描述空間數據倉庫的內部功能模塊組成。

1.1外部結構

數據庫系統處于空間數據倉庫系統的最底層,管理著若干種不同的地理空間數據庫和專題數據庫,它們各自獨立,形成了各式各樣的異地異質異構的數據庫系統,它們主要為空間數據倉庫提供數據源。應用系統處于空間數據倉庫系統的最上層,它通過一個標準的接口從空間數據倉庫中提取地理空間數據、空間數據產品和空間輔助決策分析信息,為應用系統服務。其具體外部結構如圖1所示。

1.2內部結構

空間數據倉庫的內部組成應由八個獨立功能模塊構成,分層次實現空間數據倉庫系統。其中,第一層次的功能模塊是空間數據倉庫的基礎處理模塊,由多源空間數據抽取、多源空間數據整合、多源空間數據統一、空間數據倉庫元數據組成;第二層次的功能模塊是空間數據倉庫的服務模塊,由空間數據產品服務、空間數據立方體分析、空間數據挖掘分析組成;第三層次的功能模塊是空間數據倉庫的對外數據接口模塊,由對外數據交換格式組成。第一層次的功能模塊為第二層次的功能模塊服務,第二層次的功能模塊為第三層次的功能模塊服務。其具體內部結構圖如圖2所示。

當應用系統提出需求時:①多源空間數據抽取功能模塊從各源數據庫系統中抽取出相應地理范圍(矩形、多邊形、橢圓)的不同種類的地理空間數據、專題數據;②多源空間數據整合功能模塊對這些由圖幅范圍組織的地理空間數據進行相應地理范圍的裁剪、拼接、接邊、圖形編輯、拓撲重組等整合處理,形成裁剪拼接和接邊好的、具有完整拓撲關系的、物理上無縫的、按區域范圍組織的地理空間數據;③多源空間數據統一功能模塊對這些整合處理好的地理空間數據進行數學基礎、數據編碼、數據格式、數據精度等方面的統一處理,形成能相互疊加的地理空間數據;④將經抽取、整合、統一處理好的地理空間數據提交給空間數據產品服務功能模塊,經過集成、融合、派生和關聯等測繪專業算法處理,生成應用系統所需的各種空間數據產品;⑤基于已生成的空間數據產品,進行空間數據立方體分析和空間數據挖掘分析,得到面向空間輔助決策分析的結果;⑥將這些空間數據產品和空間輔助決策分析結果,以對外數據交換格式的形式提交給應用系統使用。

2認知過程

2.1認知過程概念圖

空間數據倉庫是描述地理現象的一個重要分支,其認知過程應與地理空間信息的認知過程基本一致,不同之處在于其描述的內容和范圍大小的區別。因此,建立空間數據倉庫的認知過程,實際上是要經過一個地理現象認識、抽象、組織、分析和應用的過程。其具體的認知過程概念框圖如圖3所示。

2.2認知過程描述

這14個世界模型和13個轉換算子的組合構成了三個層次世界,即實體世界、目標世界和產品世界。其中,現實世界、地理現實世界、地理工程現實世界和地理工程概念世界這四個世界模型,以及命名、選擇、抽象這三個轉換算子,共同構成實體世界;地理工程尺度世界、地理要素分類世界、地理要素編碼世界、地理要素幾何世界和地理要素集合世界這五個世界模型,以及度量、分層、編碼、測量和聚集這五個轉換算子,共同構成目標世界;地理空間抽取世界、地理空間整合世界、地理空間統一世界、地理空間產品世界、地理空間決策世界這五個世界模型,以及提取、處理、變換、計算、分析這五個轉換算子,共同構成產品世界。

數據庫概念設計階段、地理空間數據庫實現階段和空間數據倉庫實現階段構成了空間數據倉庫系統實現過程的三個階段,這三個階段分別對應著三個層次世界,即實體世界、目標世界和產品世界。其中,前兩個階段是為地理空間數據庫的建立服務的,由它們實現實體世界向目標世界的轉換;后一個階段是為空間數據倉庫的建立服務的,由它們實現目標世界向產品世界的轉換。

由此可見,空間數據倉庫的認知過程主要就是這14個世界模型通過這13個轉換算子的轉換實現三個層次世界的過程。這個認知過程指導了空間數據倉庫的實現。

3認知的概念定義

3.1世界模型

實際上,這些世界模型主要是依靠具體的實體模型或數據模型描述來實現的。每個世界模型均有其描述的地理空間對象,因此這些世界模型描述的內容大不相同,必須定義出這些世界模型。

3.1.1現實世界模型

現實世界中,人們能看到一系列物質和現象,對于這些物質和現象,不管是否能叫上名字,它們都是客觀存在的,并且相互之間通過它們的關系組成了自然界的千差萬別。由此可見,能將現實世界中所有物質和現象集合以及它們之間的相互關系用一定的形式進行描述就是現實世界模型。

現實世界的物質和現象集合中,隱含著許多不同的地理現象類,如地質、礦產、石油、自然地理等地理現象類。地理現象類是現實世界的一個子集。由此可見,能將現實世界中所有地理現象類集合以及它們之間的相互關系用一定的形式進行描述就是地理現實世界模型。

本文原文

3.1.3地理工程現實世界模型

地理現實世界的地理現象類集合中,特指一個或若干個地理現象就是地理工程現實世界,如自然地理等。地理工程現實世界是地理現實世界的一個子集。由此可見,能將地理現實世界中特指的地理現象以及它們之間的相互關系用一定的形式進行描述就是地理工程現實世界模型。

3.1.4地理工程概念世界模型

要用計算機來描述地理工程現實世界中的地理現象,就必須對它們進行抽象描述,形成地理現象在人們頭腦中的反映,生成概念模型。由此可見,能將地理工程現實世界中特指的地理現象以及它們的內部關系用一定的形式進行抽象的概念描述就是地理工程概念世界模型。

3.1.5地理工程尺度世界模型

將地理現象抽象成概念模型,僅有這些還遠遠不夠,因為現實世界中的所有地理現象均是有度量的,所以用計算機描述這些地理現象時,也必須是可度量的。度量主要包括描述地理現象的歐幾里德幾何坐標系和數學單位尺度。由此可見,對地理工程概念世界中的抽象地理現象進行歐幾里德幾何坐標系和數學單位尺度描述就是地理工程尺度世界模型。

3.1.6地理要素分類世界模型

按照GIS理論,概念中的地理現象最終都是通過多種地理要素來表達的,因此如何對地理要素進行合理的設計和劃分就顯得十分重要。根據ARC/INFO的分層理論,只有將這些地理要素進行分類分級,才能高效地處理它們。由此可見,對地理工程尺度世界中具有尺度度量的地理現象進行地理要素的分類分級描述就是地理要素分類世界模型。

3.1.7地理要素編碼世界模型

要使計算機能識別和處理地理要素,就必須給這些地理要素進行分類分級編碼,即用一串數字來表示它們,該分類分級編碼就成為該地理要素在計算機中的唯一標志符,以便計算機能識別和處理。由此可見,對地理要素分類世界中具有明確分類分級定義的地理要素進行分類分級編碼描述就是地理要素編碼世界模型。

3.1.8地理要素幾何世界模型

為了便于計算機的存儲和管理,必須將地理要素細分為幾何目標。地理要素幾何目標包括基本目標和復合目標。基本目標按地理要素的空間特征劃分為點狀目標、線狀目標、面狀目標、體狀目標和表面狀目標等五種;復合目標由基本目標集合嵌套構成。由此可見,對地理要素編碼世界中具有明確分類分級編碼的地理要素進行幾何目標的劃分和描述就是地理要素幾何世界模型。

3.1.9地理要素集合世界模型

因為地理要素在一定的條件下由相同或不同的點、線、面、表面和體等五類空間目標組合而成,所以在實際使用中,必須通過計算機系統把數據庫中存儲的基本目標、復合目標還原成地理要素。由此可見,對地理要素幾何世界中具有基本目標、復合目標描述的地理要素進行數據庫的幾何目標集合操作就是地理要素集合世界模型。

定義9地理要素集合世界模型。設Con中地理要素點狀目標、線狀目標、面狀目標、體狀目標、表面目標集合分別表示為Po、Lo、Ao、To、So,Atr為地理要素的某一地理特征集合,則地理要素集合世界模型為Ent={e|(Po,Lo,Ao,To,So)∈Atr}。

3.1.10地理空間抽取世界模型

地理空間抽取的主要功能就是從源數據庫中按地理區域范圍(矩形、橢圓、多邊形等)抽取出滿足一定條件的不同種類的地理空間數據。由此可見,對地理要素集合世界中的地理空間數據按一定地理區域范圍和地理特征進行抽取的操作描述就是地理空間抽取世界模型。

3.1.11地理空間整合世界模型

數據庫中存儲的地理空間數據是以圖幅為單位組織的,但應用系統使用數據是無圖幅概念的,是以地理區域范圍為組織的。由此可見,對地理空間抽取世界中抽取出的地理空間數據進行圖形裁剪、圖形拼接、圖形接邊、圖形編輯和拓撲重組等整合處理,形成以地理區域范圍為組織的無縫數據集合操作就是地理空間整合世界模型。定義11地理空間整合世界模型。設Con中圖形裁剪、圖形拼接、圖形編輯、圖形接邊、拓撲重組功能分別表示為Cut、Stitch、Meet、Edit和Topology,整合功能集合表示為Fun={Cut,Stitch,Meet,Edit,Topology},則地理空間整合世界模型Pro={e|(e∈Ext,e∈Fun)}。

3.1.12地理空間統一世界模型

實現地理空間數據整合后,必須對來自不同源數據庫中的地理空間數據進行統一,因為地理空間數據存在著差異。這些差異表現在如下方面,即數學基礎差異、數據編碼差異和數據格式差異、數據精度差異。由此可見,對地理空間整合世界中的地理空間數據進行數學基礎、數據編碼、數據格式、數據精度的統一操作和描述就是地理空間統一世界模型。

3.1.13地理空間產品世界模型

隨著應用的深入,單純的地理空間數據已越來越不能滿足用戶的需求,用戶更加希望使用的是經過測繪專業處理的、經過二次加工處理的地理空間數據產品,后者在實際中具有更大的應用價值。由此可見,對地理空間統一世界中的地理空間數據進行測繪專業處理生成空間數據產品的操作就是地理空間產品世界模型。

定義13地理空間產品世界模型。設Con中單一、集成、融合、派生和關聯的功能分別表示為Single、Integrate、Fuse、Derive和Relate,測繪專業處理算法集合為Fru={Single,Integrate,Fuse,Derive,Relate},則地理空間產品世界模型Pdu={e|(e∈Uni,e∈Fru}。

3.1.14地理空間決策世界模型

建立空間數據倉庫的最終目的是為空間決策支持服務,為用戶提供大量的具有空間決策支持的信息,這可通過空間數據倉庫中的空間數據立方體分析和空間數據挖掘分析來實現。由此可見,對地理空間產品世界中的空間數據產品進行空間數據立方體分析和空間數據挖掘分析,生成空間決策支持信息的操作和描述就是地理空間決策世界模型。

定義14地理空間決策世界模型。設Con中的空間數據立方體分析和空間數據挖掘分析分別表示為Scube、Smine,空間決策分析算法集合為Sdss={Scube,Smine},則地理空間決策世界模型Dss={e|(e∈Pdu,e∈Sdss)}。

3.2轉換算子

在空間數據倉庫的認知過程中,14個世界模型的變換離不開13個轉換算子,即命名、選擇、抽象、度量、分層、編碼、測量、聚集、提取、處理、變換、計算和分析,由它們實現每兩個世界模型的轉換。這些轉換算子主要是依靠元數據來實現的,因為每個世界模型均有描述它的元數據,要實現兩個世界模型的轉換,通曉這兩個世界的元數據是轉換的前提。雖然這些轉換算子的具體定義不同,但它們都是實現每兩個世界模型的轉換,從數學的定義上說就是由某個世界模型通過函數轉換到另一個世界模型上,因此這些轉換算子的宏觀數學定義是一致的。

4結束語

目前,空間數據倉庫理論和技術研究才剛剛起步,其目標是支持數字地球發展、空間數據集成、空間決策支持發展的需求。因此應該抓住這個千載難逢的好機會,將我國的空間數據倉庫研究與建立邁上一個新臺階,以支持我國的空間數據基礎設施建設。本文對空間數據倉庫的概念框架和認知過程體系進行了一定程度的技術探討,希望能起到拋磚引玉的作用。

參考文獻:

[1]ZOUYijiang.Theconceptualframeworkonthemulti-scaleandspatio-temporaldatawarehouse[C].Beijing:20thICCAcademicPress,2001:2823-2831.

[2]ZOUYijiang.Thedesignofspatlatldatawarehouse[C].Bangkok:GeoInformatics&DMGIS’2001AcademicPress,2001:421-426.

[3]ZOUYijiang.Theresearchofmetadataonspatialdatawarehouse[C].Durban:21thICCAcademicPress,2003:225-226.

[4]ESRI.ESRIopenstrategywhitepapersonSDE/CADclient&spatialdatawarehousing[EB/OL].(1998).www.Esri/com/base/compay/opengis.

[5]ESRI.AnESRIwhitepapers,mappingforthedatawarehouse[EB∕OL].(2002).www.Esri/com/base/compay/opengis.

[6]TOMB,GRAYJ,SLUTZD.Microsoftterraserver:aspatialdatawarehouse.microsoftresearchadvancedtechnologydivision[EB/OL].(2004)./.

[7]SHEKHARS,LUCT,TANX,etal.Avisualizationtoolforspatialdatawarehouses[EB/OL].(2003).www.cs.umn.edu/Research/Shashi-group.[8]DIMITRISP.EfficientOLAPoperationsinspatialdatawarehouses,HKUST-CS01-01[R].HongKong:[s.n.],2001:65-69.

[9]趙霈生,楊崇俊.空間數據倉庫的技術與實踐[J].遙感學報,2000,4(2):157-160.

[10]李琦,楊超偉.空間數據倉庫及其構建策略[J].中國圖像圖形學報,1999,4(11):984-990.

[11]楊群,閭國年,陳鐘明.地理信息數據倉庫的技術研究[J].中國圖像圖形學報,1999,4(8):621-626.

[12]周炎坤,李滿春.大型空間數據倉庫初探[J].測繪通報,2000,22(8):22-23.

[13]鄒逸江.空間數據倉庫研究綜述[J].測繪學院學報,2002,19(4):287-289.

[14]鄒逸江.空間數據倉庫的概略設計[J].測繪科學,2002,27(3):13-15.