把握好搜索引擎關(guān)鍵字提高搜索效率論文

時(shí)間:2022-11-12 09:17:00

導(dǎo)語:把握好搜索引擎關(guān)鍵字提高搜索效率論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

把握好搜索引擎關(guān)鍵字提高搜索效率論文

【摘要】:與搜索引擎進(jìn)行對話需要用到關(guān)鍵字,表面上看,人類的自然語言構(gòu)成了搜索引擎的關(guān)鍵字。但搜索引擎獨(dú)特的搜索語法又決定著對自然語言的使用,不能簡單復(fù)制到利用搜索引擎進(jìn)行的信息搜索中。從實(shí)際應(yīng)用的角度看,搜索引擎的關(guān)鍵字依不同的標(biāo)準(zhǔn)可以有不同的劃分,包括按語言要素的大小、關(guān)鍵字的使用頻率、關(guān)鍵字的屬性特征和不同的文件類型進(jìn)行劃分。

【關(guān)鍵字】:搜索引擎關(guān)鍵字單字詞短語句子

根據(jù)中國互聯(lián)網(wǎng)信息中心的第14次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r的調(diào)查報(bào)告,截止到2004年6月30日,中國的上網(wǎng)用戶已達(dá)到8700萬,在用戶使用的各種網(wǎng)絡(luò)服務(wù)中,搜索引擎列第二位,其被使用的頻率僅次于電子郵件[1]。這一數(shù)據(jù)顯示搜索服務(wù)市場有巨大的潛在商業(yè)利益。從使用者的角度來說,用戶不管是在雅虎、新浪、搜狐的分類目錄里查找信息,還是在google、百度、中國搜索等專業(yè)的搜索引擎網(wǎng)站上搜索信息,都離不開關(guān)鍵詞語,即通常所說的搜索引擎中的關(guān)鍵字。

可以說關(guān)鍵字是用戶與搜索引擎對話的直接語言,搜索引擎如果沒有關(guān)鍵字,龐大的網(wǎng)絡(luò)信息就無法接近;真正需要的信息也只能是望網(wǎng)絡(luò)信息這個(gè)海洋而興嘆。搜索引擎中的關(guān)鍵字,與圖書館的索引目錄有異曲同工之妙,但顯然,搜索引擎通過關(guān)鍵字的搜索提供了比圖書館更多的信息,如果掌握了使用關(guān)鍵字的技巧,結(jié)合各不同搜索引擎的搜索語法,則搜索引擎給用戶帶來的海量信息的方便程度、快捷程度則要遠(yuǎn)遠(yuǎn)超越傳統(tǒng)的圖書館。但究竟什么是關(guān)鍵字,搜索引擎里的關(guān)鍵字究竟有那些特征,如何針對不同的搜索內(nèi)容,合理快捷的搜索信息,怕就不是表面看起來的那么簡單。通俗來說,關(guān)鍵字就是在搜索引擎網(wǎng)站頁面的輸入框里所要輸入的文字,通常人類的各種自然語言構(gòu)成搜索引擎的關(guān)鍵字。如果粗略的對關(guān)鍵字進(jìn)行分類的話,每一種有文字的語言從理論上都構(gòu)成搜索引擎的關(guān)鍵字,如英文、中文、法文、德文、俄文、西班牙文、日文等關(guān)鍵字,有只支持一種語言的搜索,比如國內(nèi)的中國搜索基本以支持中文搜索為主,有的支持?jǐn)?shù)種語言,比如通過百度可以搜索到中英文兩種語言的信息,國外的teoma可支持10種語言,wisenut可支持25種不同的語言,而google更是可以支持34種語言。

搜索引擎公司通過分析用戶使用的字、詞組、短語、句子的內(nèi)容、種類、頻率,可以直接分析用戶網(wǎng)上的搜索行為,揭示用戶對網(wǎng)上信息的興趣所在。并把這些有用的信息提供給廣告主,廣告主依據(jù)自身的需要,可以向搜索引擎公司購買某個(gè)或某幾個(gè)關(guān)鍵字,以期用戶在用這些關(guān)鍵字搜索時(shí),能在搜索結(jié)果頁面展示自己企業(yè)的廣告信息。這種作為搜索引擎的關(guān)鍵字廣告越來越被商家所接受,從這個(gè)角度來分,關(guān)鍵字可以分為可商用的關(guān)鍵字和非商用的關(guān)鍵字,比如"英語培訓(xùn)"這個(gè)關(guān)鍵字就具有一定的商業(yè)價(jià)值,對那些英語培訓(xùn)機(jī)構(gòu)有很大的吸引力,事實(shí)上,當(dāng)用戶用這個(gè)詞在google上搜索時(shí),同一搜索結(jié)果頁面的右側(cè)區(qū)域從上到下列有八家公司;百度也用有商業(yè)價(jià)值的關(guān)鍵字進(jìn)行搜索結(jié)果的"竟價(jià)排名"。相反,一些關(guān)鍵字則因?yàn)樘胀ɑ驔]有任何直接或間接的商業(yè)聯(lián)想,就不具有商業(yè)價(jià)值,比如走路、吃飯、穿衣、坐車等等。

搜索引擎關(guān)鍵字除了按語種和有無商業(yè)價(jià)值進(jìn)行劃分外,從網(wǎng)絡(luò)用戶具體搜索時(shí)的行為看,關(guān)鍵字還可按不同的劃分標(biāo)準(zhǔn)區(qū)別。在實(shí)際應(yīng)用中,搜索引擎中的關(guān)鍵字可以按語言要素的大小、關(guān)鍵字的使用頻率、關(guān)鍵字的內(nèi)容、搜索的文件類型四個(gè)標(biāo)準(zhǔn)來劃分。

一、按語言要素的大小,搜索關(guān)鍵字包括的種類有:

1、單字,是一種自然語言的基本構(gòu)成單位,比如英文中的game、book、idea、welcome等,中文中的鞋、書、想、棒等。單字是關(guān)鍵字的基本構(gòu)成單位,也是最小的搜索關(guān)鍵字。

2、詞,在搜索引擎里指一種自然語言中由兩個(gè)或兩個(gè)以上單字構(gòu)成的關(guān)鍵字,如:searchengine、keyword、marketingresearch、服裝、學(xué)生、拖拉機(jī)、英語學(xué)習(xí)等。

3、短語:由一種自然語言中的兩種或兩種以上的語言成分構(gòu)成的關(guān)鍵字,但還沒構(gòu)成一句完整的話。比如:最好的大學(xué)、英語的學(xué)習(xí)方法、互聯(lián)網(wǎng)絡(luò)具有、學(xué)生喜歡。用短語進(jìn)行搜索,用戶往往能找到更加準(zhǔn)確的相關(guān)信息。4、句子:由一種自然語言中完整的一句話進(jìn)行搜索時(shí)構(gòu)成的關(guān)鍵字。比如:什么是搜索引擎、互聯(lián)網(wǎng)通訊的原理是什么、怎樣提高word的使用技巧,等等。當(dāng)然,這種用自然語言進(jìn)行的智能搜索,目前的效果還強(qiáng)差人意。美國的askjeeves搜索引擎支持提問方式的句子搜索,但搜索結(jié)果的相關(guān)性不能令人滿意。

需要注意的是,有些單字,在語法上往往起代詞、介詞、助詞、虛詞的作用,在一些搜索引擎里往往做忽略處理,比如在google里用中文的"地、得、的、了、之、嗎"等進(jìn)行搜索時(shí),會被提示沒有列入搜索范圍,同樣英文中?quot;i、www、com、the、of、in、is、are、was、that"等也被作為忽略關(guān)鍵字。如果用短語或句子進(jìn)行搜索時(shí),所在的短語或句子包括這些字符,則可以通過特殊的搜索語法進(jìn)行強(qiáng)制搜索,比如,在google里,可以對這個(gè)短語或句子添加引號。

二、按關(guān)鍵字的使用頻率,關(guān)鍵字可以分為:

1、常用關(guān)鍵字:是一種自然語言中最常用的而且是人們?nèi)粘I钸M(jìn)行溝通經(jīng)常使用的部分,常用關(guān)鍵字可以是單字、詞、短語、句子。用戶搜索通常都用常用關(guān)鍵字進(jìn)行搜索。

2、高頻關(guān)鍵字:是指用戶進(jìn)行搜索時(shí)經(jīng)常頻繁使用的字詞,而且依社會群體、階層的不同而有所差異。比如對大學(xué)生群體,在搜索引擎里出現(xiàn)的高頻關(guān)鍵字可能會是:考研、出國、留學(xué)、托福、就業(yè)等,而對一個(gè)已有身孕的婦女,高頻關(guān)鍵字更可能出現(xiàn)的是:胎教、寶寶、孕期保健之類的詞匯。3、熱門關(guān)鍵字:是指在一定時(shí)期被網(wǎng)絡(luò)用戶普遍搜索的字詞,該熱門關(guān)鍵字反映當(dāng)前社會關(guān)注的熱點(diǎn)問題,比如:倒薩、非典、SARS、神五、奧運(yùn)等。百度的搜索風(fēng)云榜,就有熱門搜索top50;或反映一個(gè)群體關(guān)注的熱點(diǎn),同樣是百度的搜索風(fēng)云榜,就有十大影視作品風(fēng)云榜、十大美女風(fēng)云榜、十大IT品牌風(fēng)云榜、十大數(shù)碼產(chǎn)品風(fēng)云榜等二十幾個(gè),這種熱門關(guān)鍵字的排行根據(jù)不同主題依次列出。

三、按關(guān)鍵字的屬性特征來劃分,關(guān)鍵字可以分為:

1、專有名詞:指人名、地名、品牌名稱、或其它事物的專有名詞,如NBA、GMAT、北京、張柏芝、西湖、中國移動、清華大學(xué)等等,百度的搜索風(fēng)云排行榜所依據(jù)的關(guān)鍵字多數(shù)就是專有名詞這一類型,如軟件名、游戲名、風(fēng)景名勝名、大學(xué)名、富豪名、汽車名、IT品牌名、數(shù)碼產(chǎn)品名等等。

2、普通名詞:包括在前面所說的除專有名詞之外的單字、詞之中。

3、錯別字:是指網(wǎng)絡(luò)用戶在使用關(guān)鍵字進(jìn)行搜索時(shí),輸入拼寫錯誤的關(guān)鍵字。用英文進(jìn)行搜索時(shí),一些搜索引擎對錯誤有糾偏功能,比如在google中想搜索的關(guān)鍵字是freehand,結(jié)果卻輸入成feerhand,并按這個(gè)輸入進(jìn)行了搜索,英文中當(dāng)然沒有feer這個(gè)字,在返回的結(jié)果頁面,搜索引擎會問用戶是否找的是freehand。或者在百度里搜"一心一意",結(jié)果輸成"一新一意",百度搜索引擎一方面會把含有"一新一意"這一關(guān)鍵字的頁面返回來,同時(shí),也會問用戶要找的是否是"一心一意"。公務(wù)員之家

四、按搜索的不同文件類型,關(guān)鍵字還可以劃分成:

1、搜索超文本標(biāo)置語言(html)網(wǎng)頁的關(guān)鍵字:搜索時(shí),可使用單字、詞、短語、句子進(jìn)行搜索,但用短語或句子往往更能得到精確的結(jié)果。因?yàn)橛脩羲阉骶W(wǎng)站,強(qiáng)調(diào)的是搜索結(jié)果的相關(guān)度,即搜索的質(zhì)量,而不是數(shù)量。目前的互聯(lián)網(wǎng)站點(diǎn)已多不勝數(shù),截止到2003年底,光中國就有近60萬個(gè)萬維站點(diǎn)。用一兩個(gè)單字、詞往往不能查到很精確的網(wǎng)站。

2、搜索文本文檔的關(guān)鍵字:搜索時(shí),可使用單字、詞、短語、句子進(jìn)行搜索,從搜索的效果來看,以單字和詞為主的搜索效果較好,并且可以配合使用專有名詞。這樣,會使搜索的范圍擴(kuò)大,能返回更多的搜索結(jié)果。目前網(wǎng)絡(luò)上存在的文檔類型主要有doc、pdf、txt、ppt、zip等。與搜索html頁面不同,搜索這類文件,需要一定的搜索語法,比如在google里就可以用filetype這個(gè)語法加關(guān)鍵詞進(jìn)行搜索。如要搜doc格式的包括"電子商務(wù)"關(guān)鍵字的文件,可在google搜索輸入框里輸入:filetype:doc電子商務(wù)。北京大學(xué)的天網(wǎng)搜索引擎有專門的文件搜索分類。

3、搜索多媒體文件的關(guān)鍵字:包括圖片、聲音、動畫、視頻文件等。搜索時(shí),可使用單字、詞,以名詞為主,可以是專有名詞,也可以是一般名詞。多媒體信息是互聯(lián)網(wǎng)上的重要資源,而且隨著計(jì)算機(jī)、網(wǎng)絡(luò)和通訊軟硬件性能的提高,這部分資源呈現(xiàn)出加速增長的趨勢。不少搜索引擎對這部分資源進(jìn)行單獨(dú)分類,google有"圖象"的分類,百度有"MP3"、"圖片"的分類,中國搜索有"圖片"、"MP3"和"flash"的分類。還有專門的這類搜索引擎,比如:英文網(wǎng)站中搜索視頻的altavista;中文網(wǎng)站中搜索動畫和聲音的sogua等。

除了以上四種分類,在實(shí)際搜索中還可以按不同專題進(jìn)行劃分:比如購物、游戲、軟件、人、大學(xué)等,一般是以單字、詞、短語為主,在實(shí)際操作中,更多的是以專有名詞的形式出現(xiàn)。比如要買某一品牌的電腦,可直接用其品牌名稱進(jìn)行搜索。門戶網(wǎng)站雅虎有人員搜索,google目前提供專門的購物搜索和大學(xué)搜索,但尚不支持中文。天網(wǎng)支持產(chǎn)品搜索,而8848目前則把自己標(biāo)榜為全球最大中文購物搜索引擎,可搜索網(wǎng)上的800多萬件商品。

與網(wǎng)絡(luò)信息對話的工具越來越依賴搜索引擎,而與搜索引擎對話要靠關(guān)鍵字。搜索引擎既被一般網(wǎng)絡(luò)用戶使用,也被商業(yè)界普遍看好。但不管是哪一方,對這個(gè)對話的語言"關(guān)鍵字"都不應(yīng)該輕易放過,它不象表面看來的那么簡單。通過更好運(yùn)用搜索關(guān)鍵字,同時(shí)掌握各相關(guān)搜索引擎的搜索語法,普通個(gè)人可以極大的提高搜索效率,在最短的時(shí)間找到相關(guān)信息;商家則可發(fā)掘搜索關(guān)鍵字巨大的商業(yè)價(jià)值,這個(gè)價(jià)值通過關(guān)鍵字廣告,可能體現(xiàn)在短期的銷售增長上,更可能是長期企業(yè)品牌形象的提升上。

[參考文獻(xiàn)]

[1]中國互聯(lián)網(wǎng)信息中心.中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)[EB/OL].