SemanticWeb網(wǎng)絡(luò)導(dǎo)航論文

時(shí)間:2022-03-12 08:51:00

導(dǎo)語(yǔ):SemanticWeb網(wǎng)絡(luò)導(dǎo)航論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

SemanticWeb網(wǎng)絡(luò)導(dǎo)航論文

1網(wǎng)絡(luò)信息資源導(dǎo)航的現(xiàn)狀

遍布全世界的主機(jī)和服務(wù)器,錯(cuò)綜相聯(lián)的超媒體資源,這是互聯(lián)網(wǎng)為我們所構(gòu)建的一個(gè)巨大而豐富的電子信息空間。它無(wú)疑是現(xiàn)代社會(huì)最重要的信息獲取手段,但是它的開放性、分布性、無(wú)序性以及驚人的發(fā)展速度也為人們對(duì)信息資源的利用帶來(lái)了困難。正如在大海中行駛的船只需要導(dǎo)航系統(tǒng)確定方位一樣,要想在茫茫的信息海洋中有效獲取有用信息,也必須擁有便捷有效的信息導(dǎo)航技術(shù)。一般來(lái)說(shuō),www網(wǎng)絡(luò)中常用的信息導(dǎo)航方式有三種:一是利用門戶網(wǎng)站的分類索引;二是利用網(wǎng)絡(luò)搜索引擎;三是利用網(wǎng)站的相關(guān)鏈接。但是目前這三種信息導(dǎo)航方式的效果都不盡如人意。分類索引所覆蓋的網(wǎng)絡(luò)站點(diǎn)范圍太小,更新較慢,難以適應(yīng)網(wǎng)絡(luò)的快速增長(zhǎng),而且分類標(biāo)準(zhǔn)的不統(tǒng)一和不規(guī)范常常影響到用戶對(duì)站點(diǎn)所屬的判斷,造成導(dǎo)航失敗。搜索引擎雖然是目前主要的網(wǎng)絡(luò)信息檢索工具,但是通過(guò)簡(jiǎn)單的邏輯運(yùn)算檢索到的結(jié)果往往是數(shù)量龐大且魚目龍雜,充斥著大量的無(wú)用和重復(fù)信息。網(wǎng)站的相關(guān)鏈接是指符合當(dāng)前網(wǎng)站內(nèi)容主題的內(nèi)部和外部信息資源的超鏈接,這種導(dǎo)航方式雖然簡(jiǎn)單直接,但是信息量非常有限,而且對(duì)外部信息的鏈接常常出現(xiàn)錯(cuò)鏈和假鏈,即使是內(nèi)部信息,也常常因?yàn)榻M織和描述方式的影響,造成用戶的“資源迷向”。

用戶在信息空間中的“迷航”會(huì)使他們感到厭倦而喪失獲取信息的信心,分析其原因,主要包括以下幾個(gè)方面[1,2]:

(1)網(wǎng)絡(luò)的巨大信息量使人們必須依賴于自動(dòng)化的處理技術(shù)。但是目前因特網(wǎng)的各個(gè)網(wǎng)端的技術(shù)支持環(huán)境比較復(fù)雜,信息資源的內(nèi)容范圍、組織結(jié)構(gòu)和存儲(chǔ)方式各不相同,呈現(xiàn)出分散、無(wú)序、變幻多端的特點(diǎn),這使自動(dòng)信息處理技術(shù)的應(yīng)用困難重重。因此要提高信息導(dǎo)航的效率和質(zhì)量,必須先解決資源異構(gòu)的問(wèn)題。

(2)網(wǎng)絡(luò)信息空間中的數(shù)據(jù)大多以半結(jié)構(gòu)化和非結(jié)構(gòu)化的形式存在,對(duì)信息資源的內(nèi)容缺乏形式化的語(yǔ)義描述,而且大部分資源間的鏈接也沒有反映語(yǔ)義關(guān)系,這使得機(jī)器很難對(duì)網(wǎng)絡(luò)信息空間進(jìn)行深層次的理解和處理,對(duì)信息的自動(dòng)導(dǎo)航也無(wú)法像人工操作那樣準(zhǔn)確有效。

(3)目前的網(wǎng)絡(luò)導(dǎo)航系統(tǒng)缺乏個(gè)性化的信息服務(wù)。由于知識(shí)背景的差異和一詞多義等方面的原因,不同的網(wǎng)絡(luò)用戶之間、用戶與系統(tǒng)設(shè)計(jì)者之間對(duì)于問(wèn)題和信息內(nèi)容可能會(huì)具有不同的理解與認(rèn)識(shí),當(dāng)用戶按照自己的思路查找信息時(shí),他所選擇的導(dǎo)航路徑可能是錯(cuò)誤的或者低效的。因此信息導(dǎo)航必須考慮具體用戶的特殊性,有針對(duì)性地提供導(dǎo)航服務(wù)。

(4)網(wǎng)絡(luò)導(dǎo)航系統(tǒng)的設(shè)計(jì)缺乏規(guī)范。門戶網(wǎng)站各自依據(jù)不同的標(biāo)準(zhǔn)建立自身的分類導(dǎo)航系統(tǒng),網(wǎng)站的劃分隨意性較大,常常引起用戶的困惑。一些著名的信息搜索引擎也各自采用不同的檢索規(guī)則,有些系統(tǒng)不能利用歷史信息或者不提供二次檢索,給用戶的使用帶來(lái)不便。另外,在網(wǎng)站內(nèi)部的導(dǎo)航系統(tǒng)設(shè)計(jì)上,也存在著導(dǎo)航結(jié)構(gòu)不合理,導(dǎo)航要素不完整,導(dǎo)航界面不統(tǒng)一等問(wèn)題。這些都可能造成用戶的導(dǎo)航障礙。

由此可見,造成信息“迷航”問(wèn)題的主要原因在于缺乏信息空間的合理組織和有效的導(dǎo)航機(jī)制,這也是第二代web網(wǎng)絡(luò)技術(shù)難以克服的困難。為此,人們正在研制第二代web網(wǎng)絡(luò)——semanticweb,它以結(jié)構(gòu)化信息表示為主,為網(wǎng)絡(luò)導(dǎo)航研究開辟了新天地。

2SemanticWeb技術(shù)

TimBernersLee在1998年提出了SemanticWeb的概念。2001年2月,W3C組織正式推出SemanticWebActivity,使網(wǎng)絡(luò)環(huán)境下的語(yǔ)義處理技術(shù)研究漸入佳境。SemanticWeb研究活動(dòng)的目標(biāo)是開發(fā)一系列可由計(jì)算機(jī)理解和處理的語(yǔ)義表示語(yǔ)言和技術(shù),通過(guò)顯式的語(yǔ)義表示和領(lǐng)域本體將網(wǎng)絡(luò)信息空間編織成為一個(gè)巨大的機(jī)器可讀的知識(shí)網(wǎng)絡(luò),以支持自動(dòng)化的信息訪問(wèn)和知識(shí)管理,實(shí)現(xiàn)高質(zhì)量的網(wǎng)絡(luò)信息服務(wù)。目前關(guān)于SemanticWeb的研究主要集中在網(wǎng)絡(luò)信息資源及其內(nèi)容的語(yǔ)義和語(yǔ)義關(guān)系表征,基于語(yǔ)義的數(shù)據(jù)自動(dòng)分析、理解和處理,不同應(yīng)用領(lǐng)域和系統(tǒng)間的數(shù)據(jù)自動(dòng)交換、轉(zhuǎn)換和復(fù)用[3]。SemanticWeb雖然是現(xiàn)有web網(wǎng)絡(luò)的延續(xù),但在信息導(dǎo)航方面具有許多普通web沒有的優(yōu)勢(shì)。SemanticWeb中的節(jié)點(diǎn)既可以代表物理頁(yè)面,也可以代表知識(shí)實(shí)體;SemanticWeb中網(wǎng)頁(yè)的內(nèi)容不但可以被人理解,而且可以被機(jī)器理解;SemafiticWeb中的鏈接不再是任意的,而是遵循一定的語(yǔ)義關(guān)系。通過(guò)SemanticWeb技術(shù),可以改變現(xiàn)有網(wǎng)絡(luò)松散的數(shù)據(jù)結(jié)構(gòu),將信息資源結(jié)構(gòu)化并賦予含義,使網(wǎng)絡(luò)信息的整合和自動(dòng)處理都變得更加容易[4]。

2.1本體

所謂本體(Ontology),實(shí)質(zhì)上是描述特定應(yīng)用領(lǐng)域知識(shí)的公認(rèn)的術(shù)語(yǔ)集。關(guān)于奉體的定義,比較著名的觀點(diǎn)是“本體是概念模型的一個(gè)顯式的規(guī)格說(shuō)明”和“本體是共享概念的一個(gè)形式化的規(guī)格說(shuō)明”,其中,“概念模型(Conceptualization)”是指通過(guò)對(duì)某個(gè)客觀現(xiàn)象的相關(guān)概念進(jìn)行辨析和提取而獲得的關(guān)于該現(xiàn)象的抽象摸型;“顯式(Explicit)”是指對(duì)所使用的概念的類型,以及這些概念在應(yīng)用上的約束都給予明確的說(shuō)明;“形式化(Formal)”表示本體以計(jì)算機(jī)可讀的形式存在;“共享(Share)”表示本體中反映的是共同認(rèn)可的知識(shí)”[5]。

本體通常表達(dá)為一組對(duì)象(概念)、關(guān)系、函數(shù)、定理和實(shí)例。本體中的對(duì)象類按照等級(jí)關(guān)系組織成基本的結(jié)構(gòu)體系。等級(jí)關(guān)系包括例化(is-a)關(guān)系、類屬(kind-of)關(guān)系和整部關(guān)系(part-of)。上層的對(duì)象類為父類,下層的對(duì)象類為子類。對(duì)象類具有各自的屬性,并可依據(jù)父子關(guān)系繼承。對(duì)屬性的取值對(duì)象、取值范圍、取值基數(shù)等都可以加以限制,還可以對(duì)屬性的交換性、對(duì)稱性、傳遞性、唯一性等進(jìn)行定義。除了等級(jí)關(guān)系,本體中的對(duì)象類間還可以具有其他語(yǔ)義關(guān)系,形成語(yǔ)義網(wǎng)絡(luò)形式的概念模型。本體是機(jī)器自動(dòng)推理和智能化高級(jí)信息服務(wù)的基礎(chǔ),對(duì)網(wǎng)絡(luò)而言,一個(gè)簡(jiǎn)單的本體的典型例子就是網(wǎng)絡(luò)的分類索引(如Yahoo!的分類目錄)。本體的應(yīng)用對(duì)于提高網(wǎng)絡(luò)導(dǎo)航的精度和效率具有重要的意義[1,4)。

2.2RDF和RDFS

RDF是由W3C開發(fā)的元數(shù)據(jù)描述機(jī)制,其目的主要是為元數(shù)據(jù)在網(wǎng)絡(luò)上的編碼、交換和重用提供一個(gè)基礎(chǔ)。它允許在XML的基礎(chǔ)上以一種標(biāo)準(zhǔn)化的、互操作的方式對(duì)數(shù)據(jù)語(yǔ)義進(jìn)行定義[4],提供了一個(gè)描述web資源的數(shù)據(jù)模型。RDF包含描述資源的屬性和關(guān)系的聲明。資源是任何用URl(UniformResourceIdentifier)唯一標(biāo)識(shí)的實(shí)體對(duì)象。資源具有屬性,屬性則具有一定的值,該值可能是簡(jiǎn)單的字符串或數(shù)字,也可能是自身也具有屬性的其他資源。這樣,資源、資源屬性和屬性值構(gòu)成了RDF聲明中的三元關(guān)系模式,任何本體或描述性元數(shù)據(jù)都是這種三元關(guān)系模式的具體體現(xiàn)”[1,7]。

為了描述元數(shù)據(jù)元素間的復(fù)雜語(yǔ)義關(guān)系,W3C進(jìn)一步定義了RDFS(RDFSchema)。它可以看成是一個(gè)本體定義語(yǔ)言,用來(lái)建立概念類體系結(jié)構(gòu)、屬性層次和類關(guān)系。

3基于SemanticWeb的智能導(dǎo)航機(jī)制

SemanticWeb的出現(xiàn)為網(wǎng)絡(luò)信息導(dǎo)航提供了新的研究思路,SemanticWeb技術(shù)是解決無(wú)序網(wǎng)絡(luò)空間中“迷航”問(wèn)題的關(guān)鍵技術(shù)。基于SemanticWeb的智能導(dǎo)航是一種以結(jié)構(gòu)化、語(yǔ)義化的概念知識(shí)網(wǎng)絡(luò)為基礎(chǔ),自動(dòng)形成個(gè)性化導(dǎo)航結(jié)構(gòu)的方法。它分為兩個(gè)方面,一是基于SemanticWeb的信息組織,即利用參考本體對(duì)各信息源進(jìn)行語(yǔ)義描述和整合;二是基于SemanticWeb的個(gè)性化導(dǎo)航結(jié)構(gòu)模型的構(gòu)建,即在有序語(yǔ)義組織的基礎(chǔ)上,構(gòu)造用戶語(yǔ)義模型,并據(jù)此建立導(dǎo)航結(jié)構(gòu)。圖1顯示了基于SemanticWeb的智能導(dǎo)航機(jī)制的概念結(jié)構(gòu)[8]。

3.1基于SemanticWeb的信息組織

基于SemanticWeb的信息組織的基本思想是,將來(lái)自于多個(gè)異構(gòu)信息源中的數(shù)據(jù)整合到一個(gè)語(yǔ)義統(tǒng)一的參考本體中。參考本體是通過(guò)分析領(lǐng)域中的各個(gè)信息資源集合,提取公共概念、屬性和關(guān)系而構(gòu)建的本體,它為所有信息資源提供統(tǒng)一的概念集合和通用語(yǔ)義。

信息整合的方法是先分別將各個(gè)信息源中的數(shù)據(jù)轉(zhuǎn)換為通用的數(shù)據(jù)模型,然后建立各個(gè)數(shù)據(jù)模型和參考本體之間的映射關(guān)系。網(wǎng)絡(luò)中的信息源具有各種各樣的數(shù)據(jù)格式,其中大部分是HTML頁(yè)面,有的包含表格和列表。另外還有XML文檔、RDF文檔以及關(guān)系數(shù)據(jù)庫(kù)文檔等。為了解決分布式異構(gòu)信息源的語(yǔ)法相異問(wèn)題,需要將數(shù)據(jù)轉(zhuǎn)換為公用的數(shù)據(jù)模型格式,例如RDF。對(duì)于非RDF格式的信息數(shù)據(jù),可以利用外覆包(wrapper)技術(shù)將其自動(dòng)地轉(zhuǎn)換為基于RDF的數(shù)據(jù)模型。外覆包對(duì)特定格式的數(shù)據(jù)文檔進(jìn)行解析,并采用RDF聲明對(duì)其內(nèi)容進(jìn)行標(biāo)注。下面是三種常用的外覆包:

(1)HTML外覆包。由于HTML頁(yè)面屬于半結(jié)構(gòu)化的信息數(shù)據(jù),因此HTML外覆包采用的是半指導(dǎo)性的標(biāo)注方法。即預(yù)先手工標(biāo)注一組HTML頁(yè)面,然后對(duì)新的HTML頁(yè)面進(jìn)行結(jié)構(gòu)分析,將新頁(yè)面與標(biāo)注頁(yè)面進(jìn)行比較,從中提取相關(guān)信息。HTML外覆包還可以處理異構(gòu)的XML文件[1]。

(2)XML外覆包。根據(jù)DTD和Schema所定義的XML文檔的內(nèi)容結(jié)構(gòu)和內(nèi)容元素,建立概念集與DTDSchema之間的映射關(guān)系,從而自動(dòng)地將XML文獻(xiàn)中的DTD內(nèi)容元素標(biāo)記轉(zhuǎn)換為對(duì)應(yīng)的概念集元數(shù)據(jù)標(biāo)記。

(3)關(guān)系數(shù)據(jù)庫(kù)外覆包。將關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù)元素和二維數(shù)據(jù)關(guān)系映射到概念集中,形成語(yǔ)義基礎(chǔ),以便從關(guān)系數(shù)據(jù)庫(kù)中自動(dòng)創(chuàng)建RDF聲明。

由于不同的信息提供者可能會(huì)使用不同的詞表來(lái)標(biāo)注數(shù)據(jù),因此在建立通用數(shù)據(jù)模型后,還必須在信息數(shù)據(jù)源和參考本體之間建立概念和關(guān)系的映射,以消除語(yǔ)義差別。根據(jù)RDF聲明,在參考本體中注冊(cè)相關(guān)內(nèi)容的來(lái)源,使參考本體成為一個(gè)知識(shí)內(nèi)容的集成文件。另外,采用基于本體的元數(shù)據(jù)發(fā)現(xiàn)和漫游技術(shù),探測(cè)相關(guān)的RDF聲明,可以自動(dòng)地添加新的信息資源[8]。

3.2基于SemanticWeb的個(gè)性化導(dǎo)航

通過(guò)建立參考本體以及進(jìn)行信息整合,無(wú)序異構(gòu)的網(wǎng)絡(luò)信息數(shù)據(jù)通過(guò)語(yǔ)義概念及語(yǔ)義關(guān)系被組織到一起,形成一個(gè)有序的公共語(yǔ)義知識(shí)模型。但是對(duì)于具體網(wǎng)絡(luò)用戶的信息導(dǎo)航,并不直接在全部公共語(yǔ)義模型上進(jìn)行,而是依據(jù)用戶語(yǔ)義模型有針對(duì)性地進(jìn)行。

3.2.1用戶語(yǔ)義模型

用戶語(yǔ)義模型是反映用戶觀點(diǎn)的概念集合和概念關(guān)系。概念集合的確定可以由用戶直接提交或者根據(jù)用戶的注冊(cè)信息(用戶的興趣、愛好和知識(shí)背景等)按照一定的規(guī)則計(jì)算選擇。而構(gòu)建用戶語(yǔ)義模型的關(guān)鍵步驟在于建立用戶概念集合與參考本體間的語(yǔ)義映射,尋找參考本體中與用戶相匹配的概念和關(guān)系。

為了將參考本體映射到用戶語(yǔ)義模型,需要預(yù)先對(duì)參考奉體和用戶概念集合進(jìn)行數(shù)據(jù)訓(xùn)練,方法是為每個(gè)本體概念和用戶概念各標(biāo)注一定的相關(guān)資源作為訓(xùn)練數(shù)據(jù),然后利用向量空間模型為每個(gè)概念生成向量,并計(jì)算其標(biāo)準(zhǔn)權(quán)重。

建立語(yǔ)義映射的過(guò)程通過(guò)計(jì)算用戶概念集合中的概念向量uc與參考奉體中的每個(gè)概念向量間的匹配度來(lái)完成。假設(shè)在n維向量空間中,用戶概念向量uc中第i項(xiàng)的權(quán)重為的匹配度為[9]:

首先將計(jì)算結(jié)果中匹配度高于閥值的若干概念向量與uc建立映射,形成從用戶概念集合到參考本體的一對(duì)多的對(duì)應(yīng)關(guān)系。如果參考本體的一些概念被重復(fù)映射,則需要選擇其中匹配度最高的映射,以保證從參考本體到用戶概念集合的一對(duì)一關(guān)系,即一個(gè)本體概念只能和一個(gè)用戶概念相關(guān),但一個(gè)用戶概念可以和多個(gè)參考概念相關(guān)。在建立用戶概念集合與參考奉體對(duì)應(yīng)關(guān)系的同時(shí),用戶概念也繼承了本體中的概念層次結(jié)構(gòu)和其他語(yǔ)義關(guān)系,成為一個(gè)獨(dú)立的語(yǔ)義模型。

原則上應(yīng)該將參考本體中的所有概念都映射到用戶語(yǔ)義模型中,但是由于用戶語(yǔ)義模型是范圍相對(duì)較小的概念集合,因此參考奉體中的概念實(shí)際上不可能被完全映射。為了保持映射的完整性,可以在用戶語(yǔ)義模型中設(shè)立一個(gè)“其他”概念類,參考本體中的所有沒有被映射的概念將成為它的子概念[9]。

舉例來(lái)說(shuō),假設(shè)用戶提供的信息表明其在體育領(lǐng)域感興趣的概念為“足球”、“足球世界杯”、“足球亞洲杯”、“NBA”、“圍棋”、“奧運(yùn)會(huì)”,圖2顯示了這些用戶相關(guān)概念經(jīng)過(guò)映射后形成用戶語(yǔ)義模型的過(guò)程。

用戶概念集合中的每一個(gè)概念都在參考本體中找到了與之相對(duì)應(yīng)的一個(gè)或多個(gè)概念,將這些概念從參考本體中提取出來(lái),并根據(jù)其語(yǔ)義關(guān)系重新組合,就形成了用戶語(yǔ)義模型的結(jié)構(gòu)。例如:用戶概念“NBA”的對(duì)應(yīng)概念為“籃球”、“籃球賽事”和“美國(guó)籃球職業(yè)聯(lián)賽(NBA)”,因此這三個(gè)概念都被包含在用戶語(yǔ)義模型中,且它們之間的父子關(guān)系(即等級(jí)關(guān)系)保持不變。又如,雖然參考本體中的“其他賽事”概念和用戶概念集合沒有直接對(duì)應(yīng)關(guān)系,但由于該概念和“足球賽事”與“籃球賽事”兩個(gè)概念間有語(yǔ)義關(guān)系,且這兩個(gè)概念均與用戶相關(guān),因此該概念也被包含在用戶語(yǔ)義模型中。另外,“世界杯足球賽”概念實(shí)際上與“足球”和“足球世界杯”兩個(gè)概念間都具有對(duì)應(yīng)關(guān)系。但由于它與后者的匹配度比前者高,因此將它映射到后者。

3.2.2個(gè)性化導(dǎo)航結(jié)構(gòu)模型

導(dǎo)航結(jié)構(gòu)模型顯示了導(dǎo)航系統(tǒng)組織、關(guān)聯(lián)和顯示信息內(nèi)容的方式。站點(diǎn)地圖就是一種最簡(jiǎn)單直接的導(dǎo)航結(jié)構(gòu)模型。個(gè)性化導(dǎo)航結(jié)構(gòu)模型是基于用戶語(yǔ)義模型創(chuàng)建的針對(duì)特定用戶的導(dǎo)航結(jié)構(gòu),是個(gè)性化導(dǎo)航服務(wù)的實(shí)現(xiàn)。

導(dǎo)航結(jié)構(gòu)的設(shè)計(jì)需要考慮三個(gè)基本要素:卡片、頁(yè)面和鏈接。一張卡片只包含一種類型的信息內(nèi)容,是導(dǎo)航結(jié)構(gòu)模型中的最小組成單元。頁(yè)面與物理的web頁(yè)面相對(duì)應(yīng),一個(gè)頁(yè)面上可以包含若干個(gè)卡片。鏈接則用于連接各個(gè)頁(yè)面中的卡片以形成整體結(jié)構(gòu)[8]。通常,導(dǎo)航結(jié)構(gòu)模型總是從一個(gè)缺省的根頁(yè)面開始,每一級(jí)頁(yè)面都包含了到下一級(jí)頁(yè)面的鏈接,信息內(nèi)容通過(guò)卡片和頁(yè)面進(jìn)行分類和聚合,導(dǎo)航通過(guò)鏈接來(lái)進(jìn)行。在個(gè)性化的導(dǎo)航結(jié)構(gòu)建模中,導(dǎo)航結(jié)構(gòu)是根據(jù)用戶語(yǔ)義模型來(lái)確定內(nèi)容和鏈接關(guān)系的。圖3顯示了一個(gè)導(dǎo)航結(jié)構(gòu)的部分示例,它是在圖2中的用戶語(yǔ)義模型的基礎(chǔ)上建立的。

導(dǎo)航結(jié)構(gòu)的建模過(guò)程就是對(duì)各級(jí)貞面中的卡片的內(nèi)容、類型和表示樣式的確定過(guò)程。卡片的內(nèi)容根據(jù)觸發(fā)點(diǎn)和用戶語(yǔ)義模型來(lái)選擇,不同的用戶將獲得不同的信息內(nèi)容。

導(dǎo)航結(jié)構(gòu)中的卡片被分為兩種類型:靜態(tài)卡片和動(dòng)態(tài)卡片。靜態(tài)卡片的內(nèi)容獨(dú)立于數(shù)據(jù)源,主要包含靜態(tài)文本、圖片等。導(dǎo)航結(jié)構(gòu)中的根頁(yè)面通常都包含靜態(tài)卡片,具有預(yù)先定義的錨點(diǎn),指向下一級(jí)的頁(yè)面。動(dòng)態(tài)卡片的內(nèi)容視數(shù)據(jù)源而定,如果數(shù)據(jù)源改變,則卡片的內(nèi)容必須重新計(jì)算生成。動(dòng)態(tài)卡片還可以細(xì)分為四種類型,每一種都代表了對(duì)信息進(jìn)行結(jié)構(gòu)化的一種典型方法:

(1)列表型(List)卡片:顯示實(shí)體的實(shí)例列表,每一條實(shí)例都可具有指向該實(shí)例具體內(nèi)容的鏈接入口。列表中的實(shí)例可以按照某種屬性排序或索引。圖3中的頁(yè)面P2、P3、P4、P5都包含了列表型卡片。

(2)事實(shí)型(Fact)卡片:詳細(xì)地顯示一個(gè)實(shí)例的具體內(nèi)容,如圖3中的頁(yè)面P4包含的“新聞內(nèi)容”卡片和頁(yè)面P5包含的“賽事內(nèi)容”卡片。

(3)幻燈片型(Slide)卡片:順序顯示一組實(shí)例的具體內(nèi)容,每次一個(gè)實(shí)例,且具有瀏覽附近實(shí)例的超鏈接,待顯示的實(shí)例可以按照某種屬性排序或索引。圖3中的頁(yè)面P6包含該類型的卡片,其中每個(gè)足球俱樂部的相關(guān)信息將被依次顯示。

(4)查詢型(Query)卡片:要求用戶先填寫一組實(shí)體屬性的值,然后查詢符合該值的實(shí)例并顯示,通常該類型的卡片用于導(dǎo)航系統(tǒng)中的信息檢索,如圖3中的頁(yè)面P7包含的卡片[8]。

另外,不同的卡片具有不同的表示樣式,表示樣式描述各種表示元素的屬性,例如字體、顏色、布局等。表示樣式可以根據(jù)用戶喜好確定。

個(gè)性化導(dǎo)航機(jī)制的導(dǎo)航方法采用用戶語(yǔ)義模型的查找與語(yǔ)義鏈的觸發(fā)相結(jié)合的方式。當(dāng)導(dǎo)航結(jié)構(gòu)中的一個(gè)鏈接被觸發(fā)時(shí),該鏈接將被賦予一個(gè)查詢式Q(C,T,S),式中三個(gè)變量的含義分別代表卡片的內(nèi)容、類型和表示樣式,在用適當(dāng)?shù)闹堤畛渥兞亢螅纯衫貌樵兪接?jì)算生成鏈接末端的卡片。例如在圖3中,當(dāng)鏈接L1被觸發(fā)后,L1的查詢式為:Q(“體育”,List,Stylel),其計(jì)算結(jié)果為頁(yè)面P2中的卡片。Q中的變量C的值為L(zhǎng)1的觸發(fā)端點(diǎn)的概念“體育”,Q在計(jì)算時(shí)將檢索用戶語(yǔ)義模型,獲取此概念的相關(guān)概念或相關(guān)資源作為卡片的內(nèi)容。Q中變量T的值為L(zhǎng)ist,因此Q生成的卡片將具有列表型的信息結(jié)構(gòu)。同時(shí),由于Q中變量S的值為Stylel,因此Q還要讀取樣式表中名稱為Stylel的表示樣式,并據(jù)此決定卡片的外觀。同理,鏈接L2的查詢式為Q(“足球俱樂部”,Slide,Stylel),其結(jié)果是生成一個(gè)信息結(jié)構(gòu)為幻燈片類型,表示樣式為Stylel,內(nèi)容與足球俱樂部相關(guān)的卡片”[11,12]。

導(dǎo)航機(jī)制采用SemanticWeb技術(shù),揭示和整合網(wǎng)絡(luò)信息資源的深層語(yǔ)義知識(shí)模型,能有效解決無(wú)序、異構(gòu)網(wǎng)絡(luò)信息空間中的“迷航”問(wèn)題。它利用映射方法建立用戶語(yǔ)義模型,可以充分表達(dá)用戶需求的語(yǔ)義知識(shí),以提高個(gè)性化導(dǎo)航的效率。

4結(jié)束語(yǔ)

網(wǎng)絡(luò)信息的利用狀況不容樂觀,迫使人們努力探索更為先進(jìn)更為成熟的導(dǎo)航理論、方法和技術(shù)。第二代web技術(shù)——SemanticWeb在信息服務(wù)中的應(yīng)用,促進(jìn)了網(wǎng)絡(luò)導(dǎo)航新技術(shù)的發(fā)展。它作為導(dǎo)航系統(tǒng)的信息組織框架,能夠使復(fù)雜的信息空間變得有序、清晰和直觀,它采用機(jī)器可讀的形式化的知識(shí)表示方式,有利于知識(shí)內(nèi)容的自動(dòng)獲取。目前,SemanticWeb技術(shù)正獲得越來(lái)越多的應(yīng)用,相信經(jīng)過(guò)不斷地研究和優(yōu)化,以SemanticWeb為基礎(chǔ)的高級(jí)網(wǎng)絡(luò)信息服務(wù)將逐步成熟,智能、高效、個(gè)性化的導(dǎo)航系統(tǒng)將成為開發(fā)網(wǎng)絡(luò)信息資源的主流工具。

【參考文獻(xiàn)】

1叢敬軍,閻輝.數(shù)字圖書館的知識(shí)信息導(dǎo)航技術(shù)研究.中國(guó)圖書館學(xué)報(bào),2003,29(145):51~53

2馬瑞民,衣治安.Web上超文本數(shù)據(jù)導(dǎo)航方法的研究.情報(bào)學(xué)報(bào),2001,20(5):538~544

3張曉林.SemanticWeb與基于語(yǔ)義的網(wǎng)絡(luò)信息檢索.情報(bào)學(xué)報(bào),2002,21(4):413~420

4劉柏嵩.基于知識(shí)的語(yǔ)義網(wǎng):概念、技術(shù)及挑戰(zhàn).中國(guó)圖書館學(xué)報(bào),2003,29(144):18~21

5MikeUschold,MichaelGruninger.Ontologies:Principles,MethodsandApplications.KnowledgeEngineeringReview,1996,11(2):93~155

6JeffHeflinetal.Requirementsforawebontologylanguage./TR/webont-req/

7張平,郭金庚.語(yǔ)義網(wǎng)描述語(yǔ)言分析.電腦開發(fā)與應(yīng)用,2003,16(4):31~33

8OntoWebberModel-DrivenOntology-BasedWebSiteManagement.www-db.stanford.edu/pub/gio/2001/Ontowebber01.pdf

9Ontology-BasedPersonalizedSearchandBrowsing.www.ittc.ku.edu/~sgauch/selectedpapera/WLAS2003.pdf

10畢強(qiáng),劉早學(xué).QUIC——一個(gè)智能超文本導(dǎo)航系統(tǒng).情報(bào)學(xué)報(bào),2002,20(12):1277~1281

11楊衛(wèi)東,施伯樂.基于狀態(tài)圖的Web導(dǎo)航模型及其特征分析.計(jì)算機(jī)研究與發(fā)展,2002,39(8):992~997

12鐘元生.面向?qū)ο蟮腤eb導(dǎo)航模型設(shè)計(jì).計(jì)算機(jī)應(yīng)用,2002,22(12):50~52