信息檢索范文
時間:2023-03-20 13:02:22
導語:如何才能寫好一篇信息檢索,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
2、選擇信息檢索系統,確定檢索途徑。
3、選擇信息檢索系統的方法:(1)在信息檢索系統齊全的情況下,首先使用信息檢索工具指南來指導選擇;(2)在沒有信息檢索工具指南的情況下,可以采用瀏覽圖書館、信息所的信息檢索工具室所陳列的信息檢索工具的方式進行選擇;(3)從所熟悉的信息檢索工具中選擇;(4)主動向工作人員請教;(5)通過網絡在線幫助選擇。
4、選擇信息檢索系統的原則:(1)收錄的文獻信息需含蓋檢索課題的主題內容;(2)就近原則,方便查閱;(3)盡可能質量較高、收錄文獻信息量大、報道及時、索引齊全、使用方便;(4)記錄來源,文獻類型,文種盡量滿足檢索課題的要求;(5)數據庫是否有對應的印刷型版本;(6)根據經濟條件選擇信息檢索系統;(7)根據對檢索信息熟悉的程度選擇;(8)選擇查出的信息相關度高的網絡搜索引擎。
5、選擇檢索詞。確定檢索詞的基本方法:選擇規范化的檢索詞;使用各學科在國際上通用的、國外文獻中出現過的術語作檢索詞;找出課題涉及的隱性主題概念作檢索詞;選擇課題核心概念作檢索詞;注意檢索詞的縮寫詞、詞形變化以及英美的不同拼法;聯機方式確定檢索詞。
6、、制定檢索策略,查閱檢索工具。(1)制定檢索策略的前提條件是要了解信息檢索系統的基本性能,基礎是要明確檢索課題的內容要求和檢索目的,關鍵是要正確選擇檢索詞和合理使用邏輯組配。(2)產生誤檢的原因可能有:一詞多義的檢索詞的使用;檢索詞與英美人的姓名、地址名稱、期刊名稱相同;不嚴格的位置算符的運用;檢索式中沒有使用邏輯非運算;截詞運算不恰當;組號前忘記輸入指令“s”;邏輯運算符號前后未空格;括號使用不正確;從錯誤的組號中打印檢索結果;檢索式中檢索概念太少。(3)產生漏檢的原因或檢索結果為零的原因可能有:沒有使用足夠的同義詞和近義詞或隱含概念;位置算符用得過嚴、過多;邏輯“與”用得太多;后綴代碼限制得太嚴;檢索工具選擇不恰當;截詞運算不恰當;單詞拼寫錯誤、文檔號錯誤、組號錯誤、括號不匹配等。(4)提高查準率的方法有:使用下位概念檢索;將檢索詞的檢索范圍限在篇名、敘詞和文摘字段;使用邏輯“與”或邏輯“非”;運用限制選擇功能;進行進階檢或高級檢索。(5)提高查全率的方法有:選擇全字段中檢索;減少對文獻外表特征的限定;使用邏輯“或”;利用截詞檢索;使用檢索詞的上位概念進行檢索;把(W)算符改成(1N),(2N);進入更合適的數據庫查找。
7、、處理檢索結果。將所獲得的檢索結果加以系統整理,篩選出符合課題要求的相關文獻信息,選擇檢索結果的著錄格式,辨認文獻類型、文種、著者、篇名、內容、出處等項記錄內容,輸出檢索結果。
篇2
桶排序法,先把被排數據所分布的區間[Dmin,Dmax](在這里Dmax,Dmin分別為被排數據的最大,最小值)劃分成N個大小相等的子區間,稱子為“桶”,然后將N個數據根據其大小分配入相應的“桶”內(桶[1],桶[2],…,桶[N])。借簽桶排序中將數據根據其大小分配入相應“桶”的思想,我們在檢索時將已排好序的數據也根據其大小將其分配入相應的“桶”內,然后再在“桶”內進行二分檢索。假設按升序排列的N個數據已存放在data數組的元素data[0]~data[N-1]中,構造一個HASH函數為:
(式中Dmax=data[N-1],Dmin=data[0],N為數據個數)
二、基于HASH函數的二分檢索算法HS
算法HS使用二個數組,data數組的元素data[0]~data[N-1]中存放按升序排列的N個數據,address數組的元素address[1]~address[N]中用來存貯經HASH函數轉換后得到相同地址的數據個數。
算法HS
HS1[清address數組]將ddress[1]~address[N]都置0
HS2[Dmax中置最大值、Dmin中置最小值]Dmaxdata[N-1],Dmindata[0]
HS3[i置初始值]i0
HS4[求數據data[i]的HASH變換后的地址ad]ad
HS5[地址“碰撞”記數器address[ad]加1]address[ad]address[ad]+1
HS6[修改i]ii+1
HS7[比較i與N-1]若i<=N-1,則轉HS4,否則轉HS8。
HS8[address[0]置初值1]address[0]1
HS9[j置初始值]j1
HS10[求地址發生“碰撞”的數據在DATA數組中的首地址]address[j]=address[j]+address[j-1]
HS11[修改j]jj+1
HS12[比較j與N]若j<=N則轉HS10,否則轉HS13。
HS13[輸入一個被檢索的數據X]
HS14[對被檢索數據X用HASH函數得地址ad]
HS15[確定“塊”的下界low,上界high的值]lowaddress[ad-1],highaddress[ad]-1
HS16[在“塊”內進行二分檢索]在給定的下界與上界之間進行二分檢索,若找到,則返“檢索成功”信息,否則返加回“檢索失敗”信息。
HS17[本算法結束]
三、平均檢索長度的分析
在本檢索算法中,首先將被檢索數據X經HASH函數轉換出一個地址,根據這個地址將被檢索的數據直接定位到相應的“塊”中,然后在“塊”中進行二分檢索。因此通過對所有“塊”內二分檢索法的平均檢索長度的計算就可求出本算法的平均檢索長度。二分檢索法的平均檢索長度為:
下面我們來求本算法的平均檢索長度。假設在N個數據均勻分布的情況下,經過本檢索算法中HASH函數轉換,每一個地址出現的概率相同,都等于1/N,因此,有m個數據轉換得到相同地址的概率為:
(m=1,2,…,N)
參考文獻[1]的附錄中已證明:(1)
所以本檢索算法的平均檢索長度為(2)
由上式(1)和式(2)兩個公式即可求得本算法的平均檢索長度,其平均檢索長度小于1.352(當N>100時)。
四、算法分析與實驗結果
1.本算法的創新之處在于通過HASH函數可將被檢索的數據X直接位置定位到相應的“塊”(通過HASH函數轉換后的地址相同的數據區間)中,再在“塊”中進行二分檢索。從而不再需要建立索引順索表檢索算法中的索引表,也就省去了索引順索表檢索算法中查找索引表確定所在“塊”的平均檢索長度。
2.此方法突破了HASH表的平均檢索長度是裝填因子(=(表中填人的記錄數)/(哈希表的長度)的函數,而不是N的函數的弱點。
3.在理想情況下,即數據完全是均勻分布的情況下,本算法的平均檢索長度可達理論極限值ASL=1。即使是在最壞的情況下,當N個數據經HASH函數轉換后的地址均相同,所有數據均落在同一個“塊”中,其平均檢索長度ASL也只會下降到二分檢索法時的平均檢索長度。
4.本算法對于均勻分布的數據是極為有效的,通過計算得出其平均檢索長度小于1.352(N>100時),因此檢索效率很高。
5.本算法中的步驟HS1~HS12僅僅是為檢索作的準備工作,相當于初始化的工作,只需在檢索開始時做一次即可。
6.實驗結果。為了對本檢索算法的檢索效率進行驗證,我們用VB6.0編寫了本算法以及二分檢索法的程序,將二種檢索算法的平均檢索長度進行實際測定,實驗中所用的數據由VB6.0的隨時函數產生,數據的范圍為(0~10000),實驗結果如下表所示:
VB6.0程序二種檢索算法平均檢索長度對比表
我們在實驗中測定平均檢索長度時,通過程序對所有數據逐個檢索,統計出檢索完所有數據需進行比較的總次數再除以數據總數后得出。上表中當N=100時,本算法實際測定的值(1.38)與理論計算(1.352)略有誤差,原因是我們用VB6.0中的隨機函數產生的隨機數在數據量較小時分布不一定很均勻。從表1中可以看到:當數據量稍大一些(N>100),本算法的平均檢索長度的實測結果完全與理論分析一對致,并且遠小于二分檢索法的平均檢索長度。本算法的平均檢索長度隨著數據量N的增加幾乎不變。
篇3
科學文化素質,它是指個體學習和掌握系統的科學文化基礎知識,尤其是現代科學文化的最新成果,形成合理的知識結構;獲得基本技能、發展智能和能力(具備觀察能力、記憶能力、想象能力、思維能力、自學能力、表達能力、組織協調能力,尤其是創造能力和動手操作能力),不僅樂于學習,而且形成會學習,具有求知欲望和勇于探索的精神。通過信息檢索課程教育,授予“魚”與“漁”,使其具有獨立的思考能力與創新能力。努力全面培養受教育者的科學精神與人文精神,使二者密切結合,相互促進。[5]在著眼于基本素質的整體培養和發展,立足于更加綜合、多元、全面的教育因素的同時注重共性和個性的辯證統一。
我國在2010年的《國家中長期教育與改革發展綱要(2010-2020年)》中強調了因材施教,鼓勵個性發展,不拘一格培養人才,強調素質教育。提高受教育者的個性素質是素質教育的重要內容,培養個性素質的最佳途徑是實施主體性教育,開展個別化教學。通過信息檢索課程教學的差別化引導,促使個性由量變到質變的突破,與思想道德素質、科學文化素質并舉。
圖書館信息檢索課是獲取和培養全面的信息素養的重要途徑。使信息檢索課程教育從輔、零重視到普遍性、基礎剛性需求地位的轉變;以教師為主到以學生自主、教師為輔的教學互動的模式的轉變;從枯燥的技術技能教學向多元的教學內容轉變;力爭使接受教育者從被動學習到主動學習、創造性學習的態度的轉變。受教育者每個人都是獨立的個體,在身體和心理素質、遺傳、興趣等方面都各不相同,所表現出來的接受能力、學習能力也不盡相同,因此要注意學生間的個體差異。在教學中,應堅持“以人為本,因材施教”,避免“一刀切”的傳統教育模式,進而引導受教育者的興趣、激發學習和創造熱情,從而充分發揮各自潛在能力與特長。
信息檢索課程教學是培養學生掌握一定的信息檢索知識、技術與方法,以及利用計算機解決本專業領域中問題的能力。它是促進國家科技進步的動力和源泉,是社會和諧穩定的基石。在信息檢索課程學習中不僅要掌握知識、技術和方法,同時要帶著興趣學習,更重要的是使受課者具備在自己相關領域中發現問題、解決問題的能力,同時具有敏銳的信息嗅覺的能力和信心,從而推動社會的進步。科學技術是第一生產力,人類的勞動分為兩種:一種為創造性勞動,一種為重復性勞動。在21世紀,我們置身于競爭日益激烈的市場經濟環境中,歸根結底是人才素質的競爭,是創造性的競爭。在提高學生全面素質中,要重視培養學生的創新精神和創造才能,以及獨立獲取知識并運用知識解決實際問題的能力。信息檢索課程教育體系是一個開放性強,具有良好的發展空間的體系,創新是計算機教育的本質特征。信息檢索課程體系的確立,要充分注重對受教育者興趣的引導,通過對外部信息的感知和判斷,形成內化的創造力。通過在教學中運用發現法和對非智力因素的引導,進而培養學生的創新能力和創新素質。
篇4
>> 化學化工科技查新信息檢索新形勢及策略研究 科技查新報告檢索策略撰寫格式探討 淺析利用網絡信息資源如何加強科技查新檢索工作 試論科技查新中專利文獻及檢索 醫學科技查新與文獻檢索 化學化工課題科技查新質量的控制 淺談STN系統應用于化學化工查新檢索 淺談科技查新與文獻檢索之間的關系 基于SOA架構的交通科技項目查新檢索系統的設計 科技查新檢索服務工作的優化問題探討 科技查新中專利文獻的檢索與對比分析 國防科技查新質量優化策略研究 科技查新質量的優化策略探究 工程碩士文獻檢索課與科技查新相結合的案例教學探索與實踐 化工科技成果簡介 化工科技成果介紹 化工科技創新成果簡介 科技檢索查新工作若干問題研究 從科技查新信息解讀其地方科技創新的特點 科技信息檢索的技巧 常見問題解答 當前所在位置:)、《化工品物性數據庫》(http://.cn/search/template/chemcalwx-tmpl_index.htm)、《化工產品物性辭典》等。再次是進行項目分類分析。若是化工產品,初步判定是屬于無機化工、石油化工、化肥與農藥、涂料與油漆、聚合物、化學試劑、染料及顏料、食品和飼料添加劑、中間體、醫藥與生物化工、日用化工、香精與香料、催化劑及助劑、化工設備等產品類別中的哪一類。化工項目類別范疇相當廣泛,其學科、專業分類方法很多,有針對各種文獻管理的《中國圖書館分類法》、《國際標準分類法》、《國際專利分類法》,有用于政府部門和行業協會經濟管理的《國民經濟行業分類與代碼》,有針對教育、科技統計、學科建設制定的《學科分類與代碼》,有針對化工行業產品分類管理的《中國化工產品目錄》,等等。對于化工類產品,可以利用《中國化工產品目錄》了解分類,從中還可以了解某產品的名稱、商品名、英文名稱、產品代碼、CAS登記號、類屬名稱號、產品用途、產品類別等。通過項目分類分析,可以知道研發項目主題范疇,還可以知道是側重于產品還是方法,是產品性能的提高,還是產品工藝的改進。三是進行項目技術新穎性分析。根據項目資料,結合檢索到的研究綜述,可以初步了解研發項目的技術進展,國內外同類項目技術水平,進而了解其技術特點、技術創新。項目技術新穎性分析伴隨著查新檢索全過程,直至完成查新報告。
2 檢索用信息源選擇
隨著計算機技術、網絡技術的發展,數字化的信息源越來越多。為防止密切相關文獻信息的漏查,也避免盲目搜索的勞命傷財,必須確定最基本、最低限度的科技查新檢索用信息源。這些信息源范疇除了有科技、教育、醫療衛生等管理部門相關政策規定外,國內各科技查新機構都有自定的必檢系統要求。查新員要針對具體化工科技查新項目做出判斷,考慮其相關文獻、相關信息主要貯存于何信息空間,選擇合適的檢索用數據庫、信息源。
對于基礎理論、工藝研發類化工科技查新項目,可以選擇以期刊、專利文獻數據庫為主的檢索系統。因為理論研究、工藝技術研究成果大多于期刊論文、會議論文、專利說明書上。筆者近日受理了一項題為“2-氯煙酸閉環法生產工藝”的科技查新委托項目。通過咨詢項目委托人、閱讀項目研制報告書、檢索《化工辭典》等數據庫后,分析判定,該項目是屬于化工領域的工藝技術研發項目,并了解到項目產品屬醫藥和農藥中間體。可以初步選擇CNKI、維普、萬方期刊文獻型數據庫,會議論文數據庫,專利文獻數據庫,科技成果類數據庫等信息源。
對于查找以產品自身特征信息為主的化工產品,則應以Web搜索引擎和Web產品數據庫為主,前者包括通用搜索引擎、專業搜索引擎、站內搜索引擎。因為網上產品信息大多以網頁HTML文件形式貯存于各產品生產經營企業網站Web服務器中,作為網上產品廣告和產品說明書,而這些網頁HTML信息大多被Web搜索引擎索引。此外,還要充分利用網上Web產品數據庫。
3 檢索策略制定
檢索策略的制定是理解課題內容、選擇檢索系統、設計檢索結構式、考量檢索結果相關性這一過程的反復循環過程,是不斷調整檢索式的檢索過程。檢索策略的具體體現是檢索式,它控制著檢索過程,關系到能否檢索到最相關的信息,關系到查全率和查準率,還關系到信息查詢速度和工作效率。設計合理的檢索式成為控制和提高檢索質量的關鍵。
在基礎理論類、工藝研發類化工科技查新中,主要使用文獻型數據庫檢索系統。由于大型期刊文獻數據庫有完善的檢索功能,應充分應用布爾邏輯檢索方法,選擇利用各種檢索入口,設計合理完善的檢索式。例如,上述“2-氯煙酸閉環法生產工藝”項目,其查新點:(1)以煙酸為起始原料,閉環法生產2-氯煙酸;(2)采用專用閉環催化劑;(3)廢水封閉循環使用,實現廢水零排放;(4)產品總收率≥90%。分析項目內容認為,這是工藝方法類項目,應主要采用期刊文獻、專利文獻和科技成果類數據庫等信息源作為主要檢索系統。在試查中發現同類研究少,相關文獻少。因此決定重點使用CNKI的《中國期刊全文數據庫》,因為該庫有全文字段,特別適用于難檢和要求查全率高的檢索項目。設計檢索式:
#1.(2-氯煙酸+2-氯尼酸+2-氯-3-吡啶甲酸)
#2.#1*煙酸*閉環法
#3.#1*閉環催化劑
#4.#1*(廢水零排放+廢水封閉循環)
上述檢索式的設計,針對了三個查新點。其中,第一檢索式采用題名字段檢索入口,其余采用全文字段,應用復合檢索方式,即快又準又全。結果找到了幾篇相關文獻,其檢索結果很滿意。最后給出查新結論:
檢索結果表明,河北亞諾化工有限公司等生產廠家、大學研究機構進行了2-氯煙酸合成工藝研究。其中,河北亞諾化工有限公司以2-氯-3-甲基吡啶為原料,通過高錳酸鉀的氧化來制備2-氯煙酸,產率提高到65%。西安近代化學研究所、陜西師范大學用煙酸經雙氧水氧化后再用POCl3/PCl5氯化得到2-氯煙酸。氯化時不加水,先加入POCl3,于100℃~110℃反應1h后再加入PCl5回流反應,收率95%,總收率87.5%。
綜合分析相關文獻可知,目前國內主要氯煙酸生產方法:氰基乙酸乙酯氯化后,與丙烯醛邁克爾加成,成環后水解制得;煙酸氮氧化-氯化-水解法;氰基吡啶氮氧化-氯化-水解法等。與國內同類項目相比,本項目技術特點是:采用閉環法生產2-氯煙酸;以氰基乙酸乙酯計,總收率≥90%;廢水封閉循環使用,實現廢水零排放。上述采用閉環法實現廢水零排放的2-氯煙酸生產工藝技術,國內未見有文獻報道。
在化工產品類項目的科技查新中,除了使用期刊、專利文獻數據庫外,還要重點使用Web搜索引擎等檢索系統。譬如,筆者在接受查新委托項目“電子級異氰脲酸三縮水甘油酯(TGIC)”時,首先考慮項目產品屬性,是強調工藝方法還是產品技術參數,具體的查新點,以及國內有無專利等問題。因此首先選用文獻型數據庫,設計檢索式:
#1.(異氰脲酸三縮水甘油酯+異氰尿酸三縮水甘油酯+異氰酸三甘油脂二聚物+三異氰尿酸酯+TGIC)
#2.#1*(電子級+99%純度+超細+氯含量)
#3.#1*(粉末超細比+深冷粉碎)
采用上述檢索式首先在期刊、專利文獻數據庫中檢索查詢;再在諸如化工產品搜索、中國化工搜索、中國化工網、中國化工信息網、中國商品網等網站上的產品數據庫中查詢;最后用google、百度WEB搜索引擎查詢,設計檢索式:(“異氰脲酸三縮水甘油酯”OR“三異氰尿酸酯”)intitle:“有限公司”。最終檢索篩選獲得數篇相關文獻,檢索結果滿意。
總之,國內有生產廠家研制生產出異氰脲酸三縮水甘油酯,但多為普通級TGIC。而本項目通過改進合成、環化工藝,采用深冷粉碎、無水工藝分離鹽等技術,實現了電子級TGIC;產品純度提高到99%以上,氯含量小于650ppm,粉末超細比≤10μm。目前,除本項目產品外,國內尚未見有生產廠家研制生產出電子級異氰脲酸三縮水甘油酯產品的文獻報道。
4 結語
綜上所述,制定化工科技查新信息檢索策略,需要對化工科技查新項目進行技術分析,理解項目主要概念、分類歸屬、技術特點、技術創新等。據此,考量選擇相應信息檢索系統,進而統籌考慮檢索步驟,應用所掌握的檢索技巧,設計出科學合理的一系列檢索式,并不斷在信息檢索過程中加以調整,直至查詢獲取滿意的檢索結果為止。
參考文獻
[1] 謝新洲,等.科技查新手冊[M].科學技術文獻出版社,2004.
篇5
【關鍵詞】 GPU 信息檢索 CUDA
前言
多媒體技術與多媒體網絡,為當前信息時代提供文字、數據、語音、圖形、圖像和音樂等多種信息方式,計算機在處理信息時所面臨的主要問題是如何合理提高檢索速度,實現多媒體信息流的結構化,方便檢索。人們曾經將圖形、視頻等需要大量運算的功能都交與CPU完成,但用戶對圖形計算方面的需求不斷的超出了CPU在計算能力方面的發展速度,需要一個專門的圖形的核心處理器。GPU的出現填補這一空缺,它是相對于CPU的一個概念,GPU英文全稱Graphic Processing Unit, “圖形處理器”。 GPU是顯示卡的“大腦”, GPU具有強大的計算能力,它將能處理的問題由圖形領域擴展到了通用計算領域[1]。使可編程圖像處理器發展成為計算技術領域的主力,與CPU上的串行算法相比,采用基于GPU平臺檢索算法最高可獲得百倍以上的性能提升。已經沖擊并超越CPU獨霸的地位。
1. GPU的計算方法
在繪制圖像時,GPU首先接收宿主系統以三角頂點形式發送的幾何數據。這些數據由一個可編程的頂點處理器進行處理,該處理器進行幾何變換、亮度計算等任何三角形計算。然后,這些三角形由光柵器轉換成能夠顯示在屏幕上的單獨“碎片”,所有碎片都通過可編程碎片處理器計算最終顏色值[2]。由于GPU具有高效的并行性和靈活的可編程性等特點,越來越多的研究人員和商業組織開始利用GPU完成一些非圖形繪制方面的計算,并開創了新的研究領域:GPGPU(通用計算圖形處理單元),實現如何利用GPU進行更為廣泛的科學計算[4]。借助這些軟件和GPU,軟件開發人員可以基于CUDA平臺開發計算軟件,用戶可以用比以往少得多的時間完成很多計算任務。能夠基于GPU平臺排序及線性方程組求解,實現并行的搜索算法[5],離散優化等科學計算。GPU在處理大尺寸圖像時具有絕對的優勢。例如在8192×8192尺寸圖像的直方圖生成中,排除內存分配、讀回的時間和數據加載后,GPU的核心時間消耗僅為19ms左右,計算效率是CPU的17倍還多。
2. 基于關鍵詞的Web圖像搜索
信息檢索技術是現在計算機領域的重要內容,而圖像檢索技術又是其中的重要內容之一。圖像搜索是通過抽取網頁中存在的圖像信息并建立索引供用戶查詢的技術。基于關鍵詞的圖像搜索是指從信息頁中抽取出圖像的文字性語義描述,利用分類器進行計算所述圖像集合中每幅圖像與所述待檢索語義之間的相關度,并進行加工整理和建立索引的搜索方式。
3. 基于GPU平臺的檢索方法
GPU作為一種加速工具不但應用到高性能通用計算領域,也可應用于Web圖像搜索領域。 在文本索引中兩有個關鍵算法:排序和查找。GPU上都能實現。對于排序算法,首先通過CPU的快速排序方法把等待排序的數據分成多個子序列,然后根據文本索引中數據結構的特點,在GPU上對子序列進行局部排序。完成在共享存儲器和顯存上的歸并過程。GPU上的查詢主要利用GPU的SIMT的特點實現多數據并行查詢。 基于GPU平臺的信息檢索過程為:一 通過分析圖像搜索系統中模塊的執行流程,在CPU-GPU集群服務器上可以構建基于內容的圖像搜索系統。 二 利用GPU上的圖像文本語義抽取功能把信息分成多個塊, 利用信息子塊的視覺局部特征和屬性提示來進一步精確提取圖像的文本語義信息。三 對GPU上數據處理流程及編程模型在顯存中構建層次型數據。四 以數據流控制降低CPU相對GPU的數據處理速度的落差。五 利用GPU的優化特性,采用自適應線程分配的方法完成由線程到數據的映射。基于GPU的信息抽取算法方法,能夠使圖像的文本語義信息描述更加細致完整,系統的功能和性能獲得很大提升。
4. 結論與展望
GPU已經突破了很多技術屏障,在信息檢索、數據挖掘計算機病毒碼匹配和生物基因技術領域中都有應用。相對于CPU,以同樣的市場價格選用更高計算能力的GPU是可行的。支持CUDA的GPU可以成為是由若干個向量處理器組成的超級計算機。GPU 的架構還會不斷優化,被越來越多的大型計算采用,在以后的研究中還要對GPU的分支預測能力進行分析,建立簡單的GPU性能模型,對于復雜的分支預測、控制流、數據流等方面,開發適合GPU的算法,以此來充分發揮GPU在圖像搜索領域的檢索能力。
基金項目:吉林省教育廳“十二五”科學技術研究基金資助項目(吉教科合字[2012]第371號)
參考文獻:
[1] Macedonia M. The GPU Enters Computing's Mainstream[C]. IEEE Computer. Michael Macedonia,2003, 36(10):106~108.
[2] 吳恩華.圖形處理器用于通用計算的技術、現狀及其挑戰[J].軟件學報,2004,15(10):1493-1504.
[3] Mark W R,Glanville R S,Akeley K.A system for Programming Graphics Hardware in a C-like Language[J].ACM Trans Graph,2003,22(3):896-907.
[4] John D. Owens1, David Luebke, et al. A Survey of General-Purpose Computation on Graphics Hardware [J].Computer Graphics ,2007,26 (2) : 80-113.
篇6
一、前言
計算機的日益普及和計算機技術日益成熟,使得計算機在工業控制監測中的應用漸漸深入。但工業應用不同于其它方面,它要求有較強的實時性。現在有很多的DOS軟件在運行過程中通過掛接外部中斷方式實現DOS應用軟件與外設的實時通信,這種方法實現起來十分簡單。而在Windows中應用程序能否也能夠利用外部硬中斷實現外設與Windows應用程序的實時通信呢?答案是肯定的。這里的關鍵是要解決好中斷代碼與Windows應用程序相互之間交換信息的問題。
從外設發送異步的硬中斷,通過中斷處理程序傳遞一條信息給Windows應用程序。這時可以初始化相關端口,準備好數據,然后進行數據傳送,從而做到實時通信。
實現Windows應用程序響應外部中斷的方法有很多,如Microsoft公司自己開發的SDK、DDK軟件包,使用嵌入式匯編等等。本文將介紹一種在BC++3.1的基礎上利用Windows3.1擁有的一些功能實現Windows實時通信的實例。
二、中斷代碼的位置
在Windows中,幾乎所有的異步事件都是由中斷處理程序來管理的。中斷處理程序包含在設備驅動程序中,由Windows在環境初始化中安裝。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中斷處理程序,以處理相應的鍵盤、鼠標和串行口的異步中斷。可以仿照標準設備驅動程序,編寫中斷處理代碼,以響應外設的通信請求,從而完成一次實時通信。
中斷代碼既可以包含在應用程序的可執行代碼中,也可以包含在動態連接庫(DLL)中。包含在應用程序中的代碼只能在一個程序中使用,而在動態連接庫中的代碼則可以在Windows系統中所有的應用程序所共享。這樣不僅在整個Windows系統中只有一個中斷代碼的副本,提高了內存的使用效率,更重要的是可以防止由于同時存在多個中斷代碼的副本而發生沖突。本文將在DLL中編制中斷處理程序。
當動態連接庫被裝入時,要調用DLL庫的入口點LibMain(),利用這一點可以執行一些初始化工作,可以分配一些內存塊,可以初始化一些全局變量或者靜態變量,可以安裝中斷服務程序的代碼等等。例如:
voidinterrupt(oldIsr)(--CPPARGS)
/*舊的中斷服務程序地址*/
LibMain(HANDLEhInstance,WORDwDataSeg,WORDcbHeapSize,L
PSTR
lpszCmdLine)
{
…
oldIsr=getvect(IRQNum);
/*IRQNum指中斷號*/
setvect(IRQNum,newIsr);
/*newIsr指新中斷服務程序代碼*/
return(1);
}
函數setvect()既可在實模式下,也可在保護模式下設置中斷處理向量。
上述代碼也可以放在一個由用戶設置的引出(export)函數中,在應用程序中用戶可以調用此引出函數來安裝中斷服務程序代碼。
由于中斷可以在任何時刻發生,中斷代碼必須駐留在內存中,并且在應用程序運行的過程中一直處于某一固定內存中。這一點無論是在實模式還是在保護模式下都是一致的。
在DLL的模塊定義文件中應注意:
1.CODE語句為固定代碼段,即FIXED;
2.EXPORTS語句要引出被應用程序和其它DLL用作入口點的函數。
三、通信機制
編寫實時通信例程關鍵在于必須認識到,異步事件對應用程序的觸發是異步發生的,不在Windows的消息處理機制和多任務范圍內。為了使通信例程能夠正確地工作,通信例程必須通知Windows有異步事件發生,且不能打斷應用程序的任務管理或消息流。要作到這一點,通信例程必須通過調用PostMessage或PostAppMessage函數向應用程序的消息隊列中加入一條消息。
需要注意的是,在DLL中調用PostMessage(HWNDhwnd,…)時,必須先確定hwnd的實際值,可以通過使用引出函數的辦法來實現,如下所示:
staticHWNDhWndApp;
voidFARPASCALSetIsrWin(HWNDhwnd)
{
hWndApp=hwnd;
}
然后在應用程序的窗口函數中,對WM-CREATE消息進行處理時調用此函數來初始化DLL中的靜態變量hWndApp:
CASEWM-CREATE:
…
SetIsrWin(hwnd);/*hwnd指應用程序窗口句柄*/
定義一個在應用程序中使用的消息:
#defineISRM-RUPTWM-USER+255最后在DLL中的中斷服務程序代碼中,調用PostMessage即可完成Windows應用程序和中斷服務程序代碼相互的信息交流:
voidinterruptnewIsr(--CPPARGS)
{
…
PostMessage(hWndApp,WM-RUPT,wParam,lParam);
…
}
四、程序實例
篇7
關鍵詞:高校圖書館信息檢索檢索服務
0引言
隨著網絡技術的迅猛發展,通過互聯網提供的數據庫及種類日漸增多。使得人們對于文獻信息的查詢、加工、存儲、利用等方面有了更新的要求。作為高校圖書館以組織加工數字化信息及技術為廣大讀者提供有效信息服務,信息檢索服務一向是高校圖書館重要工作的組成部分,尤以為教學科研課題的檢索服務尤其顯得重要,提供的文獻信息對保障科研工作順利進行起到不可忽視的作用。信息檢索服務就是把圖書館的館藏資源和網絡資源通過整合和有序化,進行全方位、多途徑為教學科研及廣大讀者提供快、精、準的信息服務和信息導航服務,來滿足廣大用戶的信息需求。
1信息檢索服務對教學科研的保障作用
圖書館作為教學科研的重要基地以及文獻信息中心,是高校辦學的重要支柱。高校圖書館信息檢索的服務對象是教師和學生兩大用戶群。而高校圖書館的文獻資源建設要依據高校的教學任務、教師和學生的信息需求,以及設置的專業學科和所承擔的教學科研任務相適應,滿足特色專業、教學科研建設的需要。信息檢索是科研創新的基礎。科研工作者要想進行某項科學研究,必須了解國內外科技發展水平的新技術、新動向。隨著科學技術的高度發展,學科之間出現的交叉滲透越來越多,只有深入了解研究科學發展規律與相互作用,才能提高科研工作的知識創新點,才能更好得為教學科研提供保障服務。
當今網絡技術的發展。通過互聯網提供服務的數據庫種類日漸豐富。信息量大、分布廣、信息的自由性強,而用戶面對浩如煙海的信息海洋,感到茫然無措,對網絡與數字資源利用能力準備的不足,這就需要圖書館館員通過信息服務為讀者進行信息導航,為讀者提供細致、周到、全方位的信息檢索服務。由于教學科研工作者的精力相對有限,對學術研究的規范性要求較高,而獲取準確、有用的信息需占用大量時間和精力,這將成為制約網絡信息有效利用的瓶頸。高校圖書館開展信息檢索服務正是為教學科研工作者了解各國同行的研究現狀,進行科技追蹤起到導航作用。
2信息檢索的基本方法
高校圖書館信息檢索的服務對象是教師和學生兩大用戶群。要為用戶提供高效、準確、權威的信息資源,圖書館館員需要充分利用自已的專業知識和長期積累的實踐經驗,依靠豐富的信息資源和強大的搜索引擎,靈活運用各種檢索方式、技巧,來滿足用戶對信息的需求。針對用戶需求進行分析是開展信息檢索服務的基礎。當圖書館館員接到檢索課題時,首先要和課題人進行交流探討,對檢索課題的主題結構、專業范圍進行全面、正確的分析,弄清課題的內容實質及所涉及的主要概念及用戶需要信息的具體內容。如用戶需要的是文摘、索引還是全文等,以此來確定檢索的范圍。在掌握基本信息需求以后,還要對檢索信息進行深度確定,只有這樣才能確保檢索信息的質量精準、到位。同時也是檢索信息服務能否取得成功的關鍵。只有真正理解和把握用戶的需求,信息檢索服務與用戶需求才能達到完整同一。
通過借助于網絡檢索工具查找信息,如較成熟的跨庫檢索系統CALIS統一檢索平臺、清華同方USP等重點學科導航庫。利用搜索引擎進行信息檢索。搜索引擎作為主要的網絡檢索工具,在信息檢索中具有重要的地位。搜索引擎能提供用戶進行關鍵詞、詞組或自然語言檢索的工具。用戶提出檢索要求,搜索引擎就代替用戶在數據庫中進行檢索,并將檢索結果提供給用戶。利用搜索引擎查找信息省時省力,簡單方便,檢索速度快、范圍較廣,能及時獲取新增信息。但也存在不足,如利用計算機軟件對信息進行加工、處理,其檢索軟件的智能性不高,檢索的準確性不是很高,與人們的檢索需求及對檢索效率還存在一定偏差。通過在線數據庫查詢,利用在線進行數據庫查詢。訪問網絡數據庫是用戶獲取學術性信息的最有效方法。網上數據庫有很多,比如:超星數字圖書館、萬方數據庫資源系統、中國期刊網、中國維普數據庫等。主題指南與搜索引擎結合使用,主題指南將信息系統地進行歸類,使用戶能方便地查找到某一大類信息,它的搜索范圍要比搜索引擎小許多。搜索引擎查詢較為全面充分,提供最全面、最廣泛的搜索結果,但所提供的信息不如主題指南那樣層次結構清晰,顯得繁多雜亂。由于主題指南與搜索引擎各有優勢,各有特點,通過對兩者合理運用,取長補短以達到產生最佳結果。總之,針對不同目的的檢索,選擇合適搜索引擎是至關重要的一步。通過縮小檢索的范圍,①采用恰當的檢索表達式。就是采用把一個短語作為一整體進行查詢的辦法。②限定檢索范圍,當檢索的范圍過大時,可對檢索詞的年代、語種、數量等檢索范圍進行限定。③采用進階檢索功能,就是利用前一次檢索的結果作為后一次檢索的依據,逐步縮小檢索范圍。④力求搜索具體化,在檢索時明確檢索課題的要求,限定查詢范圍,選擇確切的檢索詞,使其檢索要求具體化,有利于提高信息檢索的準確率。還可通過其它方式如利用組合搜索關鍵詞,利用強制搜索通過添加英文雙引號來搜索短語詞,這對查找名言警句時顯得格外有用。模糊搜索即用*號通配符代替不確定的字或詞等方式對文獻進行信息檢索。總之,只有采用多種方法的綜合使用,才能獲得較好的檢索結果,才能更好地為教學科研及廣大用戶提供滿意的服務。
3提高檢索技術向知識服務發展
隨著信息技術的發展網絡信息資源的劇增,其分布性、異構性和動態性給信息檢索帶來了新的挑戰。傳統的檢索服務已不能滿足科研對文獻信息檢索日益增長需求,對新問題求解為目的的檢索已成一種趨勢,面對這種檢索需求的轉變。需要館員對信息檢索提供的深度要求有了更大幅度的提高。要求館員在信息檢索技術上進行資源整合。采用局部資源整合、文獻資源深層次整合、數據庫存資源層次的整合、異構數據庫的同構化整合、基于文獻內容層次的整合等。通過整合從而大大提高檢索效率和資源利用率。高校用戶在對信息內容綜合性要求的同時,對所提供的文獻信息及信息服務的深度要求也有了更大提高,因此在對用戶提出的某一專業性較強課題時,這就要求館員積極參與到課題的研究中去,從課題所屬的專業角度出發,對其進行一系列的分析,并挖掘其深層含義,從而將分散在本領域和相關領域的專門知識與信息加以集中組織并有序化,從中提煉出有利于用戶需求,具有創新思路的“知識因素”。向用戶提供潛在內容知識、預測分析具有超前性領域的知識和成果,這將有利于檢索質量的提高,也是高校圖書館今后進行信息檢索服務的發展趨勢。
總之,高校圖書館作為高校教學科研和讀者服務的部門,必須進一步明確自身的定位,加強服務意識和創新服務舉措,憑借自身在文獻信息資源特有的行業優勢,充分利用圖書館豐富的館藏文獻信息資源、特色數據庫等資源,為教學科研工作提供優質、周到的服務,推動高校教學科研工作進一步的向前發展。
參考文獻:
[1]楊瑪萍.數字圖書館服務質量初探[J].科技情報開發與經濟.2006(16).
[2]楊曉紅.高校圖書館文獻信息資源開發與服務創新[J].科技情報開發與經濟.2005(21).
[3]劉芳蘭.高校圖書館服務創新的探討[J].湘潭師范學院學報.社會科學版.2005.(2).
[4]張玉峰.論知識檢索與信息檢索[J].中國圖書館學報.2003(5).
篇8
關鍵詞:計算機;信息檢索;應用;研究
中圖分類號:TP391 文獻標識碼:A文章編號:1009-3044(2011)27-6688-02
1 計算機信息檢索特點分析
隨著信息社會的到來,計算機的檢索在各方面得到了有效的應用,信息服務行業已成為推動經濟發展的重要行業和主要的組成部分,信息檢索作為利用信息資源的有效手段,為管理和決策提供了有效的依據,與傳統的手工檢索相比,計算機信息檢索:
1)查找迅速,反饋及時,資源共享。計算機的信息檢索過程中,聯機系統中的中央主機采用分時技術,系統對用戶的響應只需要幾秒。檢索反饋較快,響應的系統還能根據反饋信息,進行檢索策略的調整,網絡檢索實現了信息資源的共享,用戶能通過互聯網與各種文獻信息進行連接,從而獲取所需要的信息資料。
2)檢索全面,主題廣泛,實時性強。計算機的聯機檢索一般能提供數十個到數百個數據庫的檢索,涉及的范圍較廣,覆蓋了人們社會生活的各個領域和各方面。而互聯網的信息檢索則能通過數量龐大的、且處于不斷更新狀態下的信息資源的檢索獲得自身所需要的信息。計算機聯機系統的信息查詢中,大多數數據庫的更新為數周,而金融、科研、社會動態等方面的數據庫則能實現實時更新,從而滿足用戶多樣化的信息需求。
3) 檢索便利,功能完善,靈活組配。計算機的信息檢索采取了邏輯運算模式,在信息檢索過程中,能通過不同類型檢索詞之間的組配實現多樣化的信息檢索。同時還能對檢索位置關系以及短語進行全文查找,建立多途徑多樣化的信息檢索體系。通過使用網絡web瀏覽器以及搜索引擎的利用,從而快速查找了互聯網上的各種信息,檢索便利。計算機信息檢索過程中也存在不足,數據庫的回溯實踐段短,一般只回溯1970年以后的文獻。信息檢索系統的可靠性需要加強,應避免計算機信息檢索過程中由于設備故障造成的信息檢索過程中的障礙,造成時間上和經濟上的損失。計算機信息檢索的費用較高,檢索費用高,對信息檢索人員的知識水平、語言表達能力以及數據庫的了解和掌握情況要求較高。檢索的適應性在一定程度上不均衡。計算機信息的檢索在用戶能明確表示信息需求時具有較高的質量和效果,然而當用戶的信息需求不明朗或是表達不準確時,則難以獲得較好的檢索效果。互聯網上的信息檢索,受到相應檢索技術等各方面的影響,致使計算機檢索的質量也不高。
2 計算機信息檢索的途徑
2.1 聯機信息檢索
聯機檢索服務是當前信息產業的重要組成部分,目前已形成了新興發展的產業,也就是聯機檢索工業。聯機檢索是指用戶通過終端設備的利用,實現信息需求按照一定的規范上的查詢語言和檢索語句進行組織并投入信息檢索,并實現了檢索信息的有效反饋。實現人機之間的實時對話,從計算機系統的數據庫中查找出用戶所需要信息的過程。連接檢索系統通常由中央主機、數據庫和國際通訊網絡等部分構成。聯機檢索系統開發與之配套的聯機檢索軟件,并利用中央主機對信息進行儲存、處理和檢索,以及整個系統的運行和管理。計算機的聯機系統具有多臺主機,從而保障信息檢索的穩定性。聯機數據庫則以特定的方式實現了信息是搜集、整理加工和存儲,并數據庫則以某一特定的方式對信息進行收集、整理、加工和存儲, 含有多種紀錄類型的數據組合, 是聯機檢索操作的直接使用對象,聯機檢索系統是通過為用戶提供數據庫進行信息的搜索服務。數據庫中的數據信息包括數據的記錄、聚合與數據項之間的關系。具有以下幾個特點:
首先,存儲的數據之間存在著一定的邏輯關系,首先,聯機檢索中的數據庫之間的數據是相互關聯的,各數據集或數據項支架存在不同層次的邏輯聯系,由此,數據庫在信息的存儲過程中,不僅僅存儲了信息數據本身,同時記錄了各數據項之間的邏輯關系。其次,聯機系統中的數據具有獨立性,聯機檢索中的數據庫存儲了大量數據及其具有復雜邏輯關系的數據集合體,然而其存儲方式與應用程序相比是獨立的。當對數據庫中的數據進行修改時,不會對應用程序造成影響。第三, 數據實現了集中化控制。數據庫可對數據的增加、刪除、修改、檢索進行集中控制和管理, 去掉重復數據, 提供多種保密性能。如可設置不同級別的通行字, 使機密數據庫或私人數據庫受到嚴格保護。聯機的檢索系統建立了與外界體系相隔的防護體系,從而在各企業的發展過程中起到了重要的作用。
2.2 網絡信息檢索
隨著計算機技術和網絡技術的迅速發展和廣泛推廣應用,世界范圍內的信息交流和知識資源共享成為了可能,同時也給圖書館信息組織、信息檢索以及信息 的獲取方式造成了較大的沖擊和影響。計算機互聯網成為了最大的信息獲取基地。互聯網不僅為人們提供了數量巨大且處于不斷更新發展中的信息資源,同時也提供了信息資源的搜索和服務的工具。據統計,全世界已有186 個國家和地區與互聯網相聯,網上有數億網站和主頁,聯結了數千個大型圖書館、學術數據庫、100 萬個信息網和幾千萬主機,上網人數達1 億。計算機互聯網信息共享模式也為電子商務的發展創造了良好的平臺,數字認證、基于Web 的語言翻譯等技術的發展致使計算機互聯網上的網民迅速增加。相應技術的發展為信息的檢索和發展模式提供了有效的技術支撐,為用戶提供可靠、簡單而快捷的信息服務。網絡信息資源的利用和檢索能有效地提高信息的利用和共享程度,通過多種方式的檢索實現了信息資源的有效交流和發展。
互聯網的發展在很大程度上改變了信息檢索、信息獲取的方式。網上動態信息,也就是結構化信息,已成為互聯網上最為常見以及應用最為廣泛的信息資源。用戶通過信息搜索,建立了滿足自身發展需要的信息資源。新的網絡信息檢索工具便應運而生。互聯網上信息檢索方法有幾種:
1)瀏覽,即在日常的網絡閱讀、漫游過程中,意外發現有用信息。瀏覽方式的信息獲取不具有較強的目的性,由此也難以獲得有效的信息檢索模式。
2)沿著超鏈接進行瀏覽和檢索,也就是利用超文本文檔的鏈接從一網頁轉向另一相關網頁,在轉換網頁的過程中不斷擴大信息檢索的范圍,但沿著超鏈接的檢索方式能在短期內獲得與主題相關的信息,也可能偏離信息檢索的目標。用戶可在信息的瀏覽過程中創建書簽或熱鍵記錄常用站點地址,建立常用的信息檢索目錄,縮小信息查找的范圍。
3)網絡資源指南, 專業人員對網絡信息資源進行采集、整理、過濾控制等手段, 開發出可供瀏覽檢索的網絡資源主題指南,尤其是針對各學科專業的網絡信息資源的指南。
2.3 網絡信息檢索特點
網絡信息檢索有如下特點:
1)擴寬了信息檢索的空間。檢索范圍得到了有效的擴展,網絡信息檢索以互聯網上是所有網絡資源為檢索范圍。具備了其他信息檢索方式不具有的優勢。
2)實施交換式的作業方式。所有網絡信息檢索工具都具有交互式作業的特點,能夠通過對用戶命令的分析中了解用戶的信息需求,反饋給用戶需要的信息,計算機的網絡檢索還具有良好的信息反饋的功能,用戶可以在檢索過程中及時調整檢索策略以獲得更好的檢索結果。
3)具有良好的用戶界面友好和便利的信息檢索和操作方式,網絡檢索采用交互式作業,系統透明、通用的Windows 界面和符合大多數用戶檢索習慣的用戶接口都使檢索變得簡單易行,網絡用戶不需要太多培訓就能上手操作,使用自己熟悉的方式輸入查詢提問,就可以實現對各種系統數據庫的訪問、檢索。而聯機檢索則需要學習和記憶一系列檢索指令和規則,一般用戶只能借助專業人員的幫助才能使用。
3 結束語
計算機信息檢索與傳統的手工檢索相比,具有良好的適應性,實現了高效的信息檢索和利用模式,從而在企業、教育、政府的電子政務建設、電子商務的興起和發展過程中奠定了有效的發展基礎。計算機信息檢索在各方面的應用反映了用戶的多樣化信息需求,而相應計算機檢索的應用則在一定程度上反映了政府、企業以及各行業的發展需求,計算機檢索體系為其發展創造了良好的技術支撐。
參考文獻:
[1] 魏海霞.計算機信息檢索的方法、策略與技巧[J].情報探索,2009(5).
[2] 蔡妍.當前高職院校圖書館讀者工作的問題與對策[J].桂林航天工業高等專科學校學報,2010(2).
[3] 朱寧賢.計算機信息檢索技術與學生信息素養培養[J].科技信息:科學教研,2007(22).
篇9
[關鍵詞]多語言信息檢索 信息可視化 界面設計
[分類號]G354.4
1 引言
在網絡上收集不同語言的資料會面臨一些困難:在檢索不同語言資料時若將不同語言的檢索結果混合排列,很容易互相覆蓋檢索結果或造成混亂。多語言檢索的理想界面設計要能整合多語言檢索結果,并注重多語言檢索用戶的滿意度。如果嘗試在搜索引擎上查詢不同語言的信息,用戶常用的方法是在各語言的檢索界面中分別輸入不同語言的關鍵詞,在得到不同語言的檢索結果之后再自行整理與分類。這樣的步驟既復雜又沒有效率,研究者設計新的檢索界面要能針對用戶需求,設法解決目前使用上的不便。目前已經有許多關于整合檢索信息、信息可視化系統以及不同語言檢索界面設計的研究,但是將多語言檢索與信息可視化概念相結合在搜索引擎的研究上還比較少見。多語言檢索是在網上搜索多種不同語言的資料,而信息可視化系統的運用能幫助用戶分析資料并藉由和系統的互動得到更精確的檢索結果。若能將兩者結合并應用于檢索系統界面的設計上,不但有助于讓用戶得到來自更多方面的信息,也能夠運用圖像幫助讓檢索結果更易于了解。本文的研究目的主要是依據用戶的需要將多語言檢索和檢索可視化相結合,運用可視化技巧協助多語言檢索的進行,并系統化地顯示檢索結果,讓用戶能夠更有效率地得到需要的資料。
2 多語言信息可視化研究綜述
本文首先將與多語言檢索系統界面設計或可視化相關的研究文章進行整理。Chung討論多語言檢索的盛行對于系統設計以及用戶行為的影響,文中檢視現存的中文,西班牙文及阿拉伯文搜索引擎,并依據各搜索引擎的特色、功能與設計做整理與比較。他的研究利用實驗測試了各雙語檢索網站與用戶需要的檢索界面并做可用性比較,透過用戶測試發現網站設計理論是成立的。這篇文章中發表的網站設計概念包括了檢索頁、結果頁以及分類、摘要還有可視化的功能。研究者在這篇文章中多次提及多語言界面設計必須要符合用戶的使用習慣,也建議未來的研究能夠將信息可視化與檢索界面相結合。兒童數字圖書館(ICDL)是一個多國家多語言界面設計的范例,ICDL在設計界面時不做國際化或是地方化的設計,而主要依據網頁的呈現和功能需求。這個研究所帶來的啟發是:圖形的運用能夠增加用戶對系統的了解,并且無論對于不同年紀或是不同國籍的用戶都有幫助。雖然本研究的系統用戶族群和ICDL并非完全相同,但同樣是提供不同語言用戶的界面設計,因此可以從他們的研究中獲得一點心得。
Zhang and Lin在發表的文章中做了三個搜索引擎的評鑒,并且列出了5個評鑒多語言檢索系統的標準:搜索引擎的檢索語言數目、多語言支援功能、翻譯能力、協助功能和界面設計。他們設計出一套測試方式來檢驗搜索引擎的多語言服務,并做進一步的分析和比較,從而找出不同搜索引擎的優缺點。這個研究顯示,大部分的搜索引擎還沒有提供檢索翻譯功能,然而對于一個成功的多語言搜索引擎最重要的兩個要點就是提供檢索的語言數目以及翻譯質量。Chau以及其他學者討論了非英語搜索引擎的使用,并將研究測試結果與英語搜索引擎相比較,發現:有50%的檢索只使用一個關鍵詞,有90%的檢索使用小于七個的關鍵詞;因為字詞的組成方式不同,每個檢索詞的字數會比英文檢索還要多;中文檢索中最常用的運算子是邏輯與“+”。此外,他們也討論了中文檢索的字元使用以及運算子運用議題。這個研究結果提醒其他研究者,不同語言的區域對用戶的網絡檢索行為會產生影響,而信息可視化或許是一種可以用來消除語言隔閡的方法:在不同語言的檢索界面上可以利用圖標和顏色來幫助用戶熟悉界面,再融入依照不同語言用戶習慣設計的可視化技術如分類、階層以及群聚。多語言檢索能夠藉由翻譯功能來幫助用戶查詢。何大慶和吳丹使用相關反饋(relevanee feedback)來輔助多語言信息獲取時的翻譯,這種方式不但能幫助系統在翻譯中摘錄相關文件并且也能將這種方法應用在查詢的翻譯上。實驗證明這是一種有效的方法,而翻譯技術的發展也有助于使多語言檢索系統在使用上更加便利與實用。
多語言檢索也能藉由用戶友好的界面設計來滿足用戶需要,Petrelli設計了一個以用戶為中心的多語言信息檢索系統(cross-lingual information retrieval sys-ten)模型,并要求用戶對模型提出更改建議,然后根據用戶的建議將檢索系統重新設計一次。通過這樣的使用測試他發現用戶的一些偏好,包括:①雖然顯示翻譯過程可以讓用戶更容易修改查詢詞,但是他們還是比較希望能直接看到檢索結果;②不同文化背景的用戶會用不同的檢索詞,對結果也有不一樣的期待;③對語言的了解可以增進檢索結果的精確度。這個系統在設計時與用戶互動,透過結果可知道了解用戶需求對系統設計者來說是很重要的,而且除了文化背景、語言程度及用戶的其他特性之外,界面設計也能影響系統的好用與否。Petrelli的研究突顯出了解用戶意見的重要性,在沒計系統界面的同時也必須收集用戶資料、了解用戶習慣,并且在設計用戶界面時考慮這些信息,此外,其他研究者整理出的用戶需求也能作為系統設計的參考。下面總結以上幾種多語言搜索研究的成果,如表1所示:
3 多語言信息檢索系統可視化設計
本研究的系統設計結合信息可視化和多語言檢索。研究之中所運用的理論包括信息可視化概念以及滿足不同語言檢索界面的設計需求。本研究的目標包括:信息可視化;設計合適的用戶交互界面;支持雙語的呈現。
信息可視化是一種結合圖形、動態圖像以及用戶交互系統的信息表達方式,也是一種將對專業知識的了解與人類對電腦圖像的認知結合的科技。所以在展示數量較多或是較為復雜的資料時,可以用信息可視化技術來協助用戶了解信息。Shneiderman把信息可視化的資料形態分類成一維、二維、三維、時間、多面向、樹狀以及網絡資料;并將信息可視化的功能分類為概觀、放大縮小、過濾、隨選詳細資料、相關、歷史資料、萃取信息。在檢索可視化上比較常用的功能包括樹狀以及網絡狀的資料呈現,并搭配概觀、放大縮小以及隨選詳細資料這些功能來與用戶互動。信息可視化不僅能夠運用圖像將資料用合適的方式呈現,更可以將功能與資料呈現整合。許多搜索引擎都提供多語言檢索功能,但是現有搜索引擎執行多語言檢索時常常發生以下幾種問題:多個語言的檢索結果可能因為條
列式的排序方式而分散在大量的檢索結果之中,或是因為不同語言檢索結果交互出現而產生混亂。以谷歌檢索為例,就算在語言偏好處設定檢索結果的語言,和檢索詞相同語言的檢索結果還是會自動排序在靠前位置。如果將語言也當做檢索結果排序或呈現的一種選項,應該能更符合用戶的需求。此外,對于不同語言的支持也是影響檢索結果的另一個重點。
本文的研究將檢索界面的設計加入信息可視化技術,讓檢索結果能夠更有組織地呈現出來,也更能夠滿足多語言檢索的需要。而要達到這個目標需要滿足下面三個要點:①在界面設計上必須同時滿足多種語言的使用習慣,并且考慮到多種語言不同的使用特性。例如英文是一個詞一個詞分開,中文卻是每個字都有自己的意思,而且中文字的構造比英文相對復雜,如果字型太小會難以辨識。②要提供翻譯或是語言選項來支援多語言服務,讓用戶可以選擇查詢詞的語言和檢索結果的語言。③將檢索與合適的信息可視化系統結合,但要考慮到使用的便利性,不要過于復雜。此外,系統的信息檢索與分類功能也是很重要的一環。要完成這樣的研究必須將檢索引擎的多語言檢索結果使用圖形化展示,讓用戶能夠自行調整檢索結果,并且使簡潔的界面產生最大的功能。此外,未來也可在這樣的系統里結合翻譯以及檢索優化的功能。
4 多語言信息檢索系統可視化界面原型
綜合以前學者所做的研究分析,并且依據多語言檢索和信息可視化的概念,多語言檢索要具備多語言使用的翻譯與協助功能,并結合圖像與資料,本文設計了一個多語言檢索可視化界面見圖1。
這個設計是以容易理解與使用便利性為優先考量的界面,且擁有以下的特點:①將不同語言的檢索結果呈現在同一個界面上;②能將檢索范圍依據檢索結果延伸或是縮小;③將檢索結果做簡易的整理;④引導用戶做進階檢索。
4.1 將不同語言的檢索結果呈現在同一個界面上
本界面嘗試把中文和英文的檢索結果同時顯示,因此用戶可以同時得到中英檢索結果,將中英文的檢索結果互相比較,并依序瀏覽或是從中選擇最適合的信息,節省了重復檢索的時間。
4.2 能將檢索范圍依據檢索結果延伸或是縮小
將檢索結果以信息可視化方式呈現也能將檢索結果延伸,并且在顯示關聯性的同時提供用戶可能需要的關鍵字,這種功能不但能協助用戶探索更大范圍中英文的相關資料,也能讓用戶將檢索范圍集中并提高檢索結果的相關性。
4.3 將檢索結果做簡易的整理
多語言檢索的結果資料筆數會更多,種類也會更繁雜,因此界面的簡潔與容易了解是很重要的。本界面設計不僅能清楚地列出中文和英文的檢索結果,也將檢索結果做了概略的分類,增加用戶瀏覽時的效率。
4.4 引導用戶做進階檢索
在界面上可以看到關鍵字的翻譯,例如輸入檢索詞“春天”時也會同時顯示英語翻譯(spring)的檢索結果,因此用戶能夠把關鍵字修正得更符合他們的想法。例如用戶其實想知道關于春天酒店或是春天旅游的資料,也可以藉由可視化顯示看到各個檢索結果之間的關聯性,用戶可以借此讓檢索更符合他們的需求。
在使用上首先輸入英文或是中文關鍵詞,另一個語文也會自動進行關鍵詞搜尋,并以圖像表現各個主題詞之間的關系,如果滑鼠按下與搜尋有關系的關鍵詞,便能將相關的搜尋結果展開。這個界面延續了其他多語言界面的特性,然而清爽的界面讓使用者更容易使用,圖像也能輔助使用者使用雙語思考,是其他雙語系統所沒有的設計。
5 未來發展方向
本研究為用戶設計了一個可以簡易整理與探索多語言檢索結果的界面,也提供用戶更多可以自行更改的選項。在將來的檢索系統界面以及信息可視化設計中,研究者還可以將此系統界面設計朝以下幾個方向發展:①將雙語可視化技巧應用于不同檢索結果中;②與翻譯或是摘要功能相結合;③依據用戶研究結果改進設計等。
5.1 將雙語可視化技巧應用于不同檢索結果中
目前只將同一個檢索系統中的中英文檢索結果在同一個界面整合,并且使用信息可視化技巧呈現。這種做法不但可以幫助用戶整合檢索結果,也便于比較和深入了解檢索結果。未來更先進的系統設計可以提供更多的語言選項,也能與更多檢索系統合作,讓用戶能自訂檢索引擎,將多語言檢索界面應用到符合他們需求的檢索結果之中。如此,不但可以擴大多語言檢索界面的應用范圍,讓檢索結果更符合用戶需求,也讓此設計的使用更具靈活性。
5.2 與翻譯或是摘要功能結合
將多語言檢索結果展示在同一個界面上之后,用戶能借此機會對比雙語檢索結果并修正關鍵字,不過對于非母語的多語言檢索不只需要展示和簡易的分類功能,更需要翻譯和語言方面的協助。此外,翻譯功能也能協助用戶了解不同語言的網頁內容,進而將檢索范圍做適當的延伸或縮小。多語言檢索在信息爆炸的現在是一種趨勢,然而用戶對于其他語言的了解可能無法滿足他們對于多語言信息的需求。因此翻譯或是簡易的摘要功能都會有所幫助。
篇10
>> 淺談網絡時代的信息安全 試論網絡時代多媒體技術在圖書館信息檢索中的應用 網絡時代下的音樂檢索方法初探 信息時代醫學信息資源檢索的研究 淺談網絡時代的網絡閱讀 網絡時代的信息構建 網絡時代的信息規則 網絡信息檢索淺談 淺談網絡時代的編輯素養 淺談網絡時代的學校建設 淺談網絡時代審計的變化 淺談網絡時代的作文訓練 淺談網絡時代的營銷變革 淺談網絡時代的受眾觀 泛在網絡時代文獻檢索課如何培養學生的學習力 網絡時代文獻檢索課教學內容的創新 淺談信息網絡時代的思想政治工作 淺談信息網絡時代城建檔案價值鑒定工作的發展 網絡時代的強制性信息傳播研究 網絡時代的信息與監管 常見問題解答 當前所在位置:l) GenBank是美國國立研究院(NIH)、美國國立圖書館(NLM)、美國國家生物技術中心(NCBI)于1982年建立的核酸序列數據庫,免費提供所有公開發表的核酸和蛋白質序列及其生物學注釋和書目文獻等信息。它與日本DNA數據庫(DDBJ)、歐洲分子生物實驗室(EMBL)合作,形成國際核酸序列數據庫協作體,每天交換數據,實現數據共享。基因庫的數據來源有:從科學出版物中搜集核酸序列;科學家直接發送數據;測序中心以ESTs成批發送的數據;與其他核酸序列數據庫之間的數據交換。GenBank提供了Entrez瀏覽器(Entrez Browser),用戶可以檢索GenBank、EMBL、PIR、SWISS-PORT、PDB等數據庫的序列信息以及Medline中與序列有關的文獻信息。
3因特網上查找醫學信息的其他途徑
目前常用的中文通用搜索引擎有:①百度搜索(http://)它是目前全球最優秀、更新時間最快、數據量最大的中文搜索引擎。它擁有目前世界上最大的中文信息庫,總量超過8億頁以上,并且還在以每天幾十萬頁的速度快速增長。②Google搜索(http://)它是目前最優秀的支持多語種的搜索引擎之一,也是萬維網上最大的搜索引擎,現能搜索80多億網頁,課用多種語言進行搜索。③搜狐公司搜狗搜索(http://)到目前為止,搜狗搜索收錄的中文網頁近20億,并且實現了4~5d全部網頁更新,重要網站和鏈接每日更新,大大降低了死鏈接,空鏈接。④雅虎中國(http://.cn)曾是純粹的分類列表時搜索引擎的代表。目前已經實現搜索全球38種語言網頁并抓取10億中文網頁。
通用搜索引擎提供的是包羅萬象的查詢,為了快速、準備的獲得所需的醫學信息,需要選擇適當的檢索策略。如選擇合適的關鍵詞,縮小或擴大檢索范圍等。
網絡信息的多樣性、分散和無序,影響了網絡信息的檢索質量。2001年出臺的MPEG-7國際標準解決了多媒體信息描述的標準問題,實現了快速有效的搜索。標準化是網絡信息檢索的根本性技術保證。[1]智能檢索是基于自然語言的檢索形式,它把現代人工智能的技術與方法引入信息檢索系統,機器根據用戶提供的以自然語言表述的檢索要求進行分析,而后形成檢索策略進行搜索,使信息檢索系統具有一定程度的智能特征,在更高的層次上完成其功能。[2]因此,網絡醫學信息檢索將向著規范化、智能化的方向發展。
網絡與數據庫的應用與發展,為醫學的快速發展提供了條件。在網絡時代,充分利用信息資源是實現醫學事業快速發展,提高醫療水平的關鍵因素之一。了解現存的信息獲得途徑,并掌握合適的醫學信息檢索方法,對醫務工作者具有重要意義。
參考文獻:
相關期刊
精品范文
4信息簡報