P2P技術及其資源發現論文
時間:2022-03-18 03:28:00
導語:P2P技術及其資源發現論文一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
摘要p2p主要指計算機之間以對等方式形成的網絡連接,弱化或完全取消了服務器的作用。文章從分析P2P的基本概念、需求和發展入手,討論了P2P與網格和C/S的聯系和區別,并列舉了現今P2P的主要應用,最后,對目前P2P中存在的資源發現與定位問題做了分析和論述。關鍵字P2P、資源管理、Gnutella、哈希查找1P2P技術簡介1.1概念及特征P2P是peertopeer的縮寫,是指:通過使用分布資源,借助于分布計算技術來完成關鍵任務的系統和應用的總稱。這里的分布式資源包括計算能力、數據(包括存儲介質和內容)、網絡帶寬和其它資源(如計算機、人力資源等);分布計算包括算法、數據、元數據等,或者是三者總體;關鍵任務包括分布計算、數據(或內容)共享、通信與協作,或者是平臺服務等。P2P技術的主要特征是弱化服務器作用,甚至取消服務器,使分布式系統中的各個節點邏輯對等,這種技術出現的目的就是希望能夠充分利用網絡中所蘊含的潛在資源。與C/S模型不同,P2P模型中每個節點既可以是服務(或者資源)的提供者,也可以是使用者,充其量就是提供的服務(或資源)的類型不同。1.2需求與背景隨著網絡技術的飛速發展和網絡規模的不斷擴大,接入網絡的主機增加,可用資源豐富,然而目前的互聯網仍然是以C/S模式為主,尤其是Web技術的發展使得許多Web服務器成為信息的主要提供源,整個Internet系統依附于這些少量的服務器節點,而大量的個人主機中的資源卻成了網絡中的信息孤島,無法得到充分利用,能否發揮這些閑散資源的使用效率(或者作用)構成了人們關注P2P的理由。1.3P2P與網格的聯系與區別網格與P2P在技術上沒有本質區別,都是在廣域網條件下實現資源共享和分布計算。正因如此,全球網格論壇(GGF)與對等網絡研究小組(P2PWG)已宣布合并。但二者也有一定的區別。網格類似于電力系統,格點(或者節點)類似發電站,通過整個網絡輸送給用戶,相對于P2P,更象是將一些大型資源組織起來,供社會共享,我國目前正在實施的生物研究網格和網絡教育服務網格都可作為其輔證;P2P則泛指閑散資源的組織。(1)應用面網格較側重于重大科學計算和大型專業性的協同,其一個或多個主要節點仍有較重的服務器色彩;P2P提供普通的信息、計算服務,每個參與者明顯地兼有客戶、服務器雙重身份。(2)訪問對象網格訪問計算資源、數據資源、軟件資源,相對來說,有較固定的目標;P2P完全是隨機訪問,隨機使用。(3)安全性網格中每個節點都有身份鑒定、授權、防火墻保護的能力;P2P每個參與者不保證這些能力,甚至是匿名的。(4)控制網格在資源監視/分配和作業調度上仍有較多的集中控制;P2P僅有很少的或沒有集中控制,主要靠自行組織。(5)服務質量網格確保可靠的服務質量;P2P只有部分的保證,某些參與者甚至是不可信的。以上這些區別是相對而言,隨著不斷發展和改進,這些區別會逐步縮小。1.4P2P與C/S的聯系從某種程度上說,也許不應該將P2P和C/S模式完全的對立起來,就某項特定的應用,以及特定的時間,P2P網絡也許是以C/S方式進行工作的。例如:如果每個用戶都有一些軟件資源(例如文字處理程序)或者硬件設施(例如:打印機),自然,可以采用P2P的方式進行可控共享,此時,提供打印機的客戶(本地的某個進程)就臨時充當了服務器的角色。再分析一下目前的Web工作方式,我們更多的應用是文件(或者資料)的查找,Web頁面成為文件資源的目錄,存儲對應文件的主機成為提供者,原理上,該主機可以獨立于Web服務器,這也可認為是P2P的一種形式。2P2P資源發現與定位目前P2P技術已在文件交換,分布式計算,搜索,信息共享,協同工作,即時通信,網絡游戲等等方面得到了廣泛的應用,還有一些公司在開發基于P2P的平臺。但是,無論是通信、P2P協作、分布式搜索引擎還是共享計算和交互式游戲等功能的實現,都只能以很好解決網內資源的迅速準確定位問題為前提。所以,P2P網絡中資源發現是及其重要的。目前,資源的定位一般采用的是“地址查詢”的方法,即:每個資源有一個全局唯一標識符OID和一個包含其所在地址的指針P,系統將保存起來,當用戶需要訪問該資源時,根據OID來查詢P,從而進行定位。定位機制有不同的實現方法。按照實現系統的體系結構,主要可以分為兩類:集中目錄式、泛洪請求式2.1集中目錄式在集中目錄式(CentralIndexServer)中,有一個類似于服務器的節點集中提供資源索引信息。當用戶共享資源時,需將資源的向索引服務器進行資源注冊,索引服務器中保存著系統中所有資源的標識符和指針列表。當用戶需要查找資源時,首先通過資源標識符查詢索引服務器,服務器返回該資源的指針,用戶通過該指針定位。當定位到資源的存儲位置后,資源的下載在節點之間直接進行,與索引服務器沒有關系。集中式的優點是:簡單、容易實現。大多數的分布式系統采用的都是這種方法,例如:三種分布式對象計算環境(CORBA,DCOM,JAVARMI)提供的分布對象名字服務、大量的通用目錄服務(如X.500、LDAP和NIS)和一些實用分布式系統(如Napster)的資源定位方法等。集中式的缺點很明顯:類似于C/S模式,缺乏可擴展性和存在單點故障問題。圖1集中目錄式圖2泛洪請求式圖3分布式Hash式2.2泛洪請求式與集中目錄式不同,泛洪請求式(FloodingRequest)沒有中央目錄服務器,用戶的請求通過所有連接的節點傳遞,這些節點或者響應該請求,或者在不能滿足請求時,將該請求向與自己相連的其他節點廣播,直到請求得到響應為止(泛洪)。為了減少廣播帶來的網絡帶寬浪費,一般將廣播傳遞限制在7~8跳以內,即如果請求在經過有限的循環廣播之后,仍不能得到響應,則發送請求的節點將得到一個錯誤信息。Gnutella是泛洪的經典之作,Gnutella協議設置了三種機制來控制消息數量的指數增長。機制一:消息生存時間(Time-to-Live簡稱TTL)消息生存時間主要是控制消息在網絡中傳播時能夠生存的時間,是消息頭中的一個字段,在消息生成時被賦予一個初始值。當消息被發送出去,其它主機結點接收到該消息時,首先將該消息的TTL值減1,如果為零,則將該消息丟棄掉。否則,發給它的鄰居結點。TTL值越大,消息能傳播的距離就越遠,反之,就越近。機制二:消息的唯一標識符(UniqueMessageIdentification簡稱UID).消息的唯一標識符是為了避免一個消息在同一個主機節點重復傳播而設計的。UID也被包含在消息頭中,每個消息的標識符都是不一樣的。當消息被發送出去,其它主機結點接收到該消息時,取出它的消息頭中的UID字段,同本地記錄的UID列表相比較,如果該消息的UID己經在列表中,說明該主機結點己經看過這條消息,它將直接把這條消息丟棄掉。否則,如果該消息的UID不在本地列表中,該主機結點將儲存這條消息的UID到本地UID列表,然后將該消息傳播出去。機制三:路徑標識符(PathIdentification)。路徑標識符是為了防止消息循環的出現及指導返回消息按原路返回而設置的。路徑標識符其實是一個地址列表,記錄了該消息所經過的結點的地址。當一個主機結點接收到一條消息后,該主機結點會檢查自己的主機地址是否在消息所經過的地址列表中,若在,說明該條消息已經到過該主機結點,則該主機結點會將這條消息直接丟棄。否則,該主機將自己的地址加入消息的地址列表中,然后發送出去。以上三個控制機制保證了消息在網絡中不會被無限制的擴散,從而確保Gnutella網絡可以正常的運行。但是,這三種控制機制也不是盡善盡美,也會導致很多問題,其中之一便是短路效應。泛洪請求式由于通過廣播方式進行查找和定位,因此一般擴展性差,但在小范圍內效率高,可靠性好。此外如果在系統中存在一些所謂的超級節點(即該節點擁有大量的資源信息),則可以顯著減少帶寬的浪費。目前第二代泛洪請求式的資源定位主要采用分布式Hash表算法:賦予系統中每個節點一個全局唯一標識符NID,通過一個哈希函數建立起資源唯一標識符OID和NID之間的對應關系:NID=HASH(OID),NID與OID是一對多的關系。將資源的定位信息保存到節點標識符為HASH(OID)的節點上。當用戶需要查找對象時,首先通過OID和哈希函數計算出該資源定位信息所在節點的標識符HASH(OID),然后將該請求發送到該節點上,即可找到該對象。由于P2P中,任意兩個節點可以通訊,并且各個節點上的哈希函數都相同,因此,只要知道對象的OID,用戶可以從任何一個節點出發找到該對象。根據節點的NID與OID之間的映射關系不同,分布式Hash表算法有許多不同的實現形式,如Chord、CAN、Pastry、Tapestry等。目前的最好效率是發現資源需要的路由表長度為logN(N為P2P網絡總節點數),查詢資源需要的通圖4短路效應的成因如上所述,Gnutella中存在著短路效應。如圖4所示,假設Gnutella網絡上有A,B,C三臺主機,當有消息M(TTL=t)由主機A發出,假設有兩條路徑可以到達主機B,一條路徑是沿Ll(x1,x2,…,xp),路徑長度為p;一條是L2(y1,y2,…,yq),路徑長度為q。另有一條由主機B到主機C的路徑L3(z1,…,zr),路徑長度為r,其中有pr>t且qr3結束語雖然P2P的概念出現由來已久,但是隨著Internet的迅猛發展近年來對其的研究和應用日益成為熱點。目前Intel,SUN等多家國際IT企業都在投入相當大的力量研究適用的P2P計算模型及其實現。由于P2P技術在對等計算、協同工作方面的強大優勢,今后肯定會在這兩個方面迅猛發展;將P2P技術和C/S模式的互聯網結合起來,在搜索引擎、文件共享方面國內外已經有不少商業化產品投入使用,但由于P2P技術本身存在不易管理、安全性差等缺陷,造成P2P技術自出現以來,并沒有大規模應用,而且這兩個問題如果得不到有效解決,將會成為P2P技術在這兩個方面發展的主要瓶頸。參考文獻1.L.TassiulasandA.Ephremides,Stabilitypropertiesofconstrainedqueueingsystemsandschedulingpoliciesformaximumthroughputinmultihopradionetworks.IEEETransactionsonAutomaticControl,Vol37,No12,Dec.1992,pp:1936~19482.DanaMoore,JohnHebeler著.對等網.清華大學出版社,20033.AndyOram編.Harnessingthebenefitsfoadisruptivetechnolody.清華大學出版社,20034.Peer-to-PeerComputing[EB/OL].www.sics.se/perbrand/,20012112035.KarlA,MagdalenaP.ImprovingDataAccessinP2PSystems[J].IEEEInternetComputing,2002,6(1):58-67..6.呂向辰.P2P技術與應用./01/0128/d/0128d06-1.asp
- 上一篇:無線自組網MAC研究論文
- 下一篇:市音像制品管理制度