基于本體的電子商務思索

時間:2022-04-13 04:50:00

導語:基于本體的電子商務思索一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

基于本體的電子商務思索

一、引言

隨著全球信息化的發展,電子商務(E-commerce-EC)已經成為世界經濟市場必不可少的組成部分。有預測表明,2009年全球電子商貿的總量將超過18000億美元。伴隨電子商貿的蓬勃發展,EC模式呈現出自動化、智能化和移動化的新趨勢。而傳統基于HTML的EC平臺缺乏語義信息,無法將顯示信息與數據分離,難以滿足EC新需要。Web元信息處理和語義化發展,特別是AI成熟的理論、方法和技術,將對EC的發展起到關鍵的作用。

電子商務平臺是使交易雙方的需求及供給信息都可以良好交流和交換的地方,所以構建一個良好的電子商務平臺首要的要求就是交易雙方的信息可以充分地交換和互用。但是,由于交易雙方所使用的計算機系統等一些方面的不同,會產生互用性問題,特別是通過Internet進行商業活動時。計算機系統相互作用時存在的問題大體可以劃分為以下四種類型:系統異構、語法層異構、結構層異構和語義層異構。系統異構包括硬件和操作系統之間的不相容;語法異構指的是不同語言和不同的數據表示;結構層異構指使用不同的數據模型;語義層異構指系統間交換信息時所用術語的含義不同,如同義詞。其中,隨著技術的發展,前三種類型的問題已逐漸得到更好的解決,如使用CORBA,DCOM和不同的中間件產品。XML的出現在一定程度上解決了最后一類問題。XML本身具有的許多優點為電子商務特別是B2B的發展帶來了很大的變化,如XML持國際語言編碼標準Unicode,把業務規則和數據內容、結構分離開來,用戶只需協商數據內容和結構,從而可以自由定義和實現各自的業務規則,企業之間可以靈活方便地建立多對多的連接等。本文著重描述數據內容和結構的元語言XML[1],憑借其強大的定義和表示標記語言能力,正成為互聯網信息表示與交換的標準格式。采用XML作為表示語法,W3C開發了在Web上進行元數據處理和交換的標準RDF(S)[2],RDF(S)的出現使得本體建模技術可以應用于EC內容定義和信息交換,使得開發自動化、智能化和移動化的EC平臺成為可能。然而,XML雖然在定義數據結構和語義方面提供了標準的語法,但它并沒有提供描述商業過程和商品交換的標準的數據結構和術語。因此,使用XML進行交易方之間的數據交換時,首先必須在使用的詞匯,以及用法和語義方面達成一致,這在一定程度上抑制了電子商務特別是B2B的跨領域、跨地區甚至跨國家的擴展性發展。為了更好地解決電子商務中的語義異構問題,引入了人工智能領域中的Ontology(本體)技術。它是不同領域、不同應用系統之間進行交流、協定的可以共享理解的表示。這種協定有助于對內容意義的精確、高效通信,同時又反過來促使系統的交互式操作、重用和共享等一系列的性能得以提高[3]。

二、Ontology的概念及相關理論

Ontology在人工智能領域用于知識的共享,從20世紀90年代初以來,Ontology就已成為許多人工智能研究領域中如知識工程、自然語言處理與知識表示的研究主題。經過多年的發展,如今Ontology在智能信息集成、協作信息系統(CooperativeInformationSystems)、信息檢索、知識管理及電子商務等方面的應用越來越廣泛。其中主要原因就是Ontology提供了對某一領域(Domain)可共享的、通用的理解,從而使不同人員、不同應用系統之間可以進行通信。因為Ontology針對的是領域中達成一致的知識,所以它的發展也常常是參與其中不同的人、不同組織(可能分布在不同地方)之間的協作過程。

(一)Ontology的概念

Ontology作為從哲學領域借鑒過來的術語,在哲學中它是一種存在的系統化解釋。Ontology的概念有很多,但是目前基本上得到認同并能夠較好表明它的本質的概念是:Ontology是對一個共享的概念化的形式的、顯式的規格說明?!案拍罨敝傅氖鞘澜缟夏承┈F象的抽象模型,該模型能夠識別現象的相關概念?!帮@示的”指所使用概念的類型及這些概念在使用上的約束要顯式定義?!靶问降摹敝窸ntology是機器可以處理的。當然,這種形式化的程度可以不同,例如WordNet提供了超過100000的使用自然語言解釋的術語,而CYC提供了常識知識許多方面的形式化、公理化理論?!肮蚕怼闭f明Ontology表明的是達成一致的知識,也就是說,它并不是局限于某幾個個體而是被整體所接受。

1、Ontology的語言有許多語言可用于表示Ontology,其中一些語言是基于XML語法并用于語義Web的,如:OXL(OntologyeXchangeLanguage),SHOE(SimpleHTMLOntologyExtension,最初基于HTML),OML(OntologyMarkupLanguage),以及由W3C工作組創建的RDF(ResourceDescriptionFramework)與RDFSchema。最后,還有建立在RDF與RDF之上的、較為完善的Ontology語言OIL(OntologyInferenceLayer)和DAML+OIL(圖1)。當然,還有其它創建Ontology的語言如傳統的OKBC,OCML等。選擇何種語言表示,要根據具體的應用來定。

2、RDF框架的概念本體需要某種語言來說明,該語言應能以機器可理解的方式準確地定義概念以及概念之間豐富的關系。RDF框架由三個部分構成:①RDFDataModel。其形成對資源的形式描述。它包括三個對象類型:資源、屬性、陳述。任何可以通過URI(UniversalResourceIdentifier)來表示的對象都是RDF資源,它的屬性由屬性類型來標識,每一個屬性類型都有對應的屬性值。RDF采用對象-屬性-值的三元組來描述資源間的相互關系,記為A(O,V),分別對應上面的資源、屬性和屬性值,或者稱為主題、謂詞和對象,意為對象O擁有值為V的屬性A。②RDFSchema。定義描述資源時需要的屬性類及其意義、特性。RDFSchema使用一種機器可以理解的體系來定義描述資源的詞匯。如:rdfs:Resource、rdfs:Class和rdfs:Property類,rdfs:subClassof和rdfs:subPropertyof屬性關系,以及rdfs:domain和rdfs:range的屬性約束關系。該詞匯集構成了一種基本類型系統及該系統的基礎類,這些基礎類包括了定義新類必需的元對象類型,因此RDF具有擴展特性,適合于EC本體建模。③RDFSyntax。盡管RDFDataModel提供了一個抽象的框架來描述資源,Schema定義和聲明了一些屬性類,但要形成人機可讀的具體文件,還需要一個具體的語法體系來完成。RDFSyntax借助其宿主語言XML,把形式化描述轉換成機器可以理解和處理的文件。

(二)Ontology在B2B電子商務信息集成中的應用

電子商務中的B2B[4]主要從事企業與企業之間在線進行商業合作的交易,Internet和基于Web的電子商務為優化商業關系提供了較高水平的靈活性和開放性。這些電子商務B2B平臺為他們的客戶提供了新的機會,可以幫助客戶不需要通過大量的通訊渠道,就可以聯系到許多潛在的商業伙伴。譬如中國的阿里巴巴以全球領先的B2B電子商務網上貿易平臺為許多企業帶來了商機和利潤。當然,B2B電子商務網上貿易平臺在帶來優于傳統商務交易的許多特點的同時也帶來了一些問題,其中成指數增加的交易方提供的大量產品描述、目錄和文檔等,由它們帶來的異構問題成為了B2B電子商務發展的瓶頸,因而對這些不同類型描述信息的有效管理成為B2B電子商務的主要任務。B2B電子商務中包含了三種不同類型的標準之間的相互作用:

(1)描述像購買合同等可交換商業文檔的不同標準(如:XMLCommonBusinessLibraryxCBLandCommerceXMLcXML)。

(2)使用產品種類等級和每一種類的屬性對產品進行詳細說明的內容標準(如:UN/SPSC,ecl@ss4和UCEC)。

(3)根據某個內容標準對產品進行詳細說明的產品目錄,它可以被可交換商業文檔引用(如:Ariba和CommerceOne)。從技術的角度來看B2B的信息集成任務,它主要包括兩種:商業文檔的集成和內容標準管理。其中的關鍵技術是基于本體(Ontology)來實現的。

1、B2B文檔集成隨著XML技術的不斷成熟,大多數進行B2B電子商務的企業使用XML編碼的文檔,從而產生了許多基于XML的電子商務標準。如:CommerceOne提出的xCBL(XMLCommonBusinessLibrary)標準,包含了B2B中進行交互使用的約600種不同文檔類型。雖然在一定應用范圍內,這些文檔具有一致性,可以進行互操作,但是它們在文檔的結構、信息分解、復雜性和應用背景上不同。傳統的轉換技術在效率和應用范圍上均不能滿足要求,但使用具有發展前景的Ontology技術,能夠較好地解決電子商務中的這一問題。以Ontology為中介的信息集成提供了進行文檔集成、將概念結構引入文檔和對基于知識的文檔查詢、檢索進一步集成的良好架構。XSL-T與Xpath結合使用可以轉換任意XML文件,但由于進行的是直接映射,所以規則比較復雜,程序編寫困難、復雜,維護起來不容易,而且實現的映射重用性差。基于Ontology的多層次集成可以解決以上的問題,該方法中將信息的表示分為三個層次:語法層、數據模型層和Ontology層。

(1)語法層對應使用XML序列化表示的文檔實例,該序列化主要說明使用到的XML元素和屬性以及它們的順序。

(2)數據模型層可以看作是語法層與Ontology層之間的橋梁,該層將在語法層中的差異抽取出來進行表示,并用對象—屬性—值對產品進行描述。標準化(Normalization)的進行是根據相應的Ontology進行的,因為在Ontology中表明了按所要求粒度進行元素分解后的元素的語義。該層使用的術語由相應的Ontology進行定義,并且通常必須與在語法層使用到的相符合。然而,前者比后者要詳細得多,如在XML文件描述中,街道名稱與門牌號可以作為一個元素,而在Ontology中,兩者肯定是分開的。該層次可以使用RDF進行描述,也可使用SOAP(SimpleObjectAccessProtocol)。

(3)Ontology層包含每一種文檔類型通用的文檔Ontology,如產品目錄Ontology、購買合同的Ontology等。這些Ontology提供了電子商務B2B中的使用到的術語及術語的形式化語義。如地址在運輸文檔中可能是指運輸地址,而在財務文檔中可能是指賬單地址,在Ontology層這兩種類型的地址必須明確地分開。另外,Ontology中還包含了在一些文檔標準中可選或忽略的元素。按照上述層次描述,可實現電子商務B2B中的較復雜的文檔集成,結構如圖2所示,總的來說可以分為三步:①按照從語法層到數據模型層的轉換要求,從XML描述中抽象出源文檔的RDF數據模型,這樣解決了由于XML語法的多樣性和復雜性帶來的轉換規則的復雜性。②把文檔的數據模型轉化為電子商務B2B中的使用的術語,并在相應的文檔Ontology中詳細說明。在該步驟中,數據模型的粒度水平需要與電子商務B2B中的使用的粒度水平平齊。這意味著可能需要進行一對多的轉化。③電子商務B2B的按照目標文檔標準的術語生成一個相應的文檔,其中由于原子概念的粒度水平的不一致,需要對該文檔進行多對一的到RDF表示的轉換。

2、內容管理內容標準提供了產品描述的等級,并定義了產品類別之間的Subclass-of關系。產品目錄中的每一個產品鏈接到某一特定產品類別,該產品類別對產品進行了詳細描述。內容標準可以分類為“水平型”標準和“垂直型”標準。“水平型”標準提供了高層次的所有可能產品的分類并覆蓋了多個領域。每一個“垂直型”標準提供了某一領域的深入和細致的分類。通?!?,垂直型”一個“水平型”標準的幾個低層次種類的擴展。較著名的“水平型”內容標準UNSPSC,具有超過12000種類的五層分類模式,但它不是描述性的,也就是說,它不包含產品的屬性描述,僅僅只有產品名稱的層次描述。該標準的層次是從產品供應方的角度進行分類的,如打印紙與書寫紙均屬于印刷產品一類,筆則屬于辦公用品這一類,因為從供應方的角度考慮它們完全屬于不同的類別。另一“水平型”內容標準ecl@ss,支持工業企業供應鏈的產品和信息流,是德國企業中主要使用的標準。它根據工業用戶及供應商的需要,提供了約為12700以上的種類,層次的劃分是按照購貨方的需要進行的,如書寫紙與筆都歸于辦公用品供應方一類。ISO,RosettaNe(t主要是為IT產品)是“垂直型”標準的典型例子。從本質上說,內容標準也就是產品Ontology,它們提供產品分類層次和相關產品屬性。因此,電子集市需要進行的內容管理任務實際上是Ontology的管理任務。它包括:①產品分類。按產品Ontology中的類別,對產品進行分類。②產品再分類。由于不同企業有自己不同的需求,因此,往往會造成不同的產品分類,因此這就要求B2B電子商務網上貿易平臺具有根據新的分類模式再分類的能力,根據新的產品Ontology將新類型分配給某一產品。在該任務中需要解決水平型標準之間、垂直型標準之間,以及水平型標準與垂直型標準之間的映射問題。③產品描述層次的個性化并根據不同產品Ontology產生視圖。不同的用戶希望得到不同的產品分類視圖,根據用戶的描述,內容管理過程可半自動化地產生用戶需要的產品目錄視圖。為了更好地實現面向用戶,需要設計和實現兩個產品Ontologies:客觀的與主觀的產品Ontology??陀^的Ontology用于描述被討論域內典型產品目錄中的元素,如打印機重量;主觀Ontology描述有關用戶喜好的產品信息元素,如打印機的打印分辨率。分類規則可以發展成為根據一定主觀的類別對產品信息進行分類,如便宜的家用打印機。Ontologies可以用于模仿(Model)每一產品特性的協商。④不同版本Ontology的維護,確保Ontology的一致性。這主要是由于內容標準的經常變化,如UNSPSC每兩個星期需要進行一次更新。

三、結論

本文介紹了Ontology的概念和相關理論,從較高的層面上研究分析了它在B2B電子商務產品信息集成中特別是文檔集成和內容管理中的作用,在一定程度上幫助解決了B2B電子商務發展的瓶頸問題。隨著Ontology技術(如Ontology表示語言、Ontology學習方法、Ontology庫系統及Ontology工程工具等)的不斷完善,以及語義Web技術的日臻成熟,Ontology技術在B2B電子商務中的應用將更加廣泛。