文獻分類與檢索

時間:2022-03-24 11:44:00

導語:文獻分類與檢索一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

文獻分類與檢索

【內容提要】索引的研究、編制與文獻流通形式變化息息相關。以計算機為主體的新技術在文獻流通領域廣泛應用,對索引理論研究及編制形成沖擊,同時也帶來變革的要求。10年來我國索引編制研究的起伏波動,說明索引研究應順應社會文獻流通需要而變革的重要性。書目編制、數據庫建設及文獻標引、檢索語言方面等研究的發展趨勢,也說明新技術運用對于文獻整理帶來的新特點、新要求。索引理論研究和編制要適應新形勢、新情況,使索引編制更好地為社會服務。

索引是利用文獻的工具,與文獻流通形式的變化息息相關。10年來在索引編制理論研究方面發生了波動,說明我們關于索引編制的理念正隨著文獻整理現代化進步而發生深刻地變化。以往文獻以紙質載體為主,索引編制靠人工,編排技術百多年沒有發生多大改變,理論研究相對穩定。自從計算機及其相關電子技術應用于文獻領域并成為新流通載體后,索引編制手段及索引形式發生了巨大變化,對傳統理念產生很大沖擊,這是造成索引研究波動的根本原因。本文就10年(1993-2002)來索引研究的狀況進行剖析,以求得一二看法,為索引研究深入發展籌謀。

1索引理論研究低落,相關研究發展強勁

我國很早就有索引的編撰和理論研究。上世紀二三十年代,現代索引編制理論和方法傳到我國,曾掀起索引編制和研究的高潮,成果輝煌。新中國建立后,安定的社會環境,先進的政治制度,為學術研究提供了良好氛圍,索引的理論研究和編制才真正掀起高潮。雖然影響了索引事業的發展,但撥亂反正后,索引研究與編制又蓬勃興起。尤其是80年代末期中國索引學會成立,領導索引研究,組織索引開發,開展學術交流,使我國索引事業走向規范化道路。

20世紀90年代初,是我國學術界研究索引理論的高峰期,1996年以后研究數量相對減少。《全國報刊索引(哲社版)》報道的信息顯示了這種趨勢(見表1)。但這種滑動并不表明我國索引研究衰退,而只能說明傳統理論研究在減少,這是索引研究走向成熟的轉折。能說明問題的是與索引研究相關學科或索引應用理論研究走向強勁。

表1索引編制理論研究情況(按《全國報刊索引》報道時間統計)

年代1993199419951996199719981999200020012002共計

總共38443625203129012226

傳統編制37423225202928012216

自動化編制124002100010

1.1書目的編制研究

書目編制在我國歷史悠久,從漢代劉向著《七略》麇集眾書始,書目便成為人們查檢文獻的重要工具。其六分群書并以此編排的方法,雖然有些幼稚,但已開索引先河。書目對保存文獻并提供文獻利用的功能,在兩千多年歷史中影響巨大。書目功能雖然主要不是用于文獻查檢,可在漫長歲月中人們主要靠書目來檢索文獻,以至許多學者將索引理論在中國的不完善歸咎于書目的影響。直到現在關于書目編制的研究一直不衰。論述書目編制和數據庫的文獻就非常之多(不包括目錄學理論、各種目錄研究、圖書館編目及目錄組織等文章,見表2)。尤其是運用自動化手段編制書目的研究逐漸增強。

表2書目編制理論及數據庫研究狀況(按《全國報刊索引》報道時間統計)

年代1993199419951996199719981999200020012002共計

總共25173210275149365651374

書目編制11611251649121288

傳統編制11510248468664

自動化編制011018034624

數據庫研究35106174941183227208

1.2書目數據庫建設研究

數據庫是計算機技術應用于文獻存儲后的文獻形態,大多數數據庫就是電子版的書目。其多種檢索途徑又使它成為一部多功能索引。對它的研究90年代初期較少,而末期達到高峰,至今不減(見表2)。

1.3文獻標引研究

文獻標引是揭示文獻的途徑,書目和索引的編制都離不開它。書目標引在于揭示群書篇目,索引標引所揭示的包括文獻提名在內的各種知識點。在標引技術上沒有本質區別,對它的研究一直是常見的選題。10年來研究文章比較多(見表3,不包括圖書館分類、編目所涉及的標引問題)。計算機技術大規模運用書目和索引編制以來,討論自動化標引技術的文章越來越多,說明我國文獻處理技術的研究已跟上世界發展的趨勢。

表3文獻標引研究情況(按《全國報刊索引》報道時間統計)

年代199319941995199619971998199920

0020012002共計

總共28393426466448285039402

傳統理論22362921424936163329313

自動化標引63554151212171089

1.4文獻檢索語言研究

檢索語言是人與文獻對話的媒介,沒有這種語言就無法做到文獻規范化處理,就無法與文獻溝通。特別是計算機技術運用以后,檢索語言成為人機對話的途徑。檢索語言是具有一定規范標準的人工語言。例如《中國圖書館圖書分類法》、《漢語主題詞表》、以及各種形式的“關鍵詞表”、“著者號碼表”等。如今人們又提出用自然語言標引和檢索計算機整理的文獻,研討熱烈,有許多文章頗有見地,代表了檢索語言的方向。如何在網絡環境下進行文獻檢索的探討日益見多(見表4,數據不包括圖書館日常使用的分類法、主題法等)。

表4文獻檢索語言研究狀況(按《全國報刊索引》報道時間統計)

年代1993199419951996199719981999200020012002共計

總共15372516412925353719279

傳統理論15352415382521272911240

自動化語言021134488839

相關學科研究的強勁勢頭,是索引研究和編制的必然結果,是索引研究實用化的反映,也是索引科學與各學科交叉和融合的結果。它告示我們對應用科學理論的探討更應注重于實踐。

2索引研究發展曲線描述了電子技術應用文獻流通領域的歷程

10年中,關于索引編制、書目編制、書目數據庫、文獻標引、檢索語言等研究,都經歷了低→高→低的波動。駝峰從1995年開始至1999年,峰頂在1997-1998年。這正是以計算機為主體的現代電子技術在文獻出版、存儲、流通各環節普遍應用時期。計算機網絡已成為人們實際使用的文獻形式。其功能齊全、傳播速度快、存儲量大、收藏豐富、檢索方便,準確率高,都是紙質文獻所不及,有替代書本式文獻之趨勢。在人們心理(接受新生事物)、生理(適應并掌握操作技術)上產生了解、掌握、運用的欲望,因此關于新技術運用的研究探討是必然現象。這種研究的熱化,勢必對傳統理論形成沖擊。但也要經歷由淺入深、由一般介紹到深刻研究的進程。隨著新技術的普及和運轉穩定后,該方面研究就會減少,因而形成曲線。這個曲線記錄著計算機及其網絡技術在文獻流通領域應用的歷程。

2.1計算機技術應用對傳統索引理論研究的沖擊

1994年研究索引理論的文章最多,隨之逐漸減少(見表1)。與研究數據庫建設、文獻標引技術和檢索語言的文章從1997年逐漸增多形成反差。形成這種反差的原因,就是學術界對計算機技術在文獻流通領域普遍應用的反映與研究探討。1994-1996年是這類研究的醞釀、寫作、發表周期。傳統理論逐漸減少合乎學術研究發展趨勢,但“0”發展不正常,重視一種研究而忽視其他研究的傾向不可取。傳統索引編制理論是一切新索引編制和索引形式的理論基礎,對其研究不可輕視。

2.2書目數據庫研究的發展曲線(見圖1),明顯表明計算機及其網絡在圖書館和其他文獻傳播行業中運用的過程

關于數據庫研究的文章始見于80年代末90年代初,主要以介紹其功能作用為主。隨著計算機在文獻流通領域普及速度加快,文章數量開始增多,探討數據庫編制、檢索以及制作技術等方面內容。1995年以后研究文章開始驟增,標志著計算機在以圖書館為主體的文獻流通領域大規模應用。之后的三四年是計算機及其網絡技術普及應用的高峰,至90年代末基本穩定,于是研究的文章相對減少。

附圖

圖1文獻標引、檢索語言、書目數據庫研究情況示意圖

2.3文獻標引的研究與檢索語言的研究相依共存,都是揭示文獻的方式和手段

檢索語言是人與文獻載體(印刷體、電子形式等)溝通的語言,通過這種語言或代表這種語言的標識符號,把文獻主體概念及其他有檢索意義的特征表示出來,作為文獻存儲和檢索的依據。沒有檢索語言,標引無法做到。不進行標引,檢索語言便毫無用處。這是索引編制的重要途徑。尤其是計算機技術應用于文獻整理后,這兩方面的研究尤為需要。從圖1可以看出,研究的高峰恰恰也在計算機技術普遍應用時期,表明了學術界對文獻標引及其檢索語言編制的重視,同時也反映出這些學者與時俱進的學風和進取精神。計算機應用是索引理論研究史上最重大的事件,它不僅隨著文獻載體轉變而變換其形態,而且關系到編制方法、操作過程等環節的改革與創新,更重要是索引編制的觀念必須改變。這是索引編制史上一場重大的革命。

3索引理論研究步伐不大但視野開闊

索引研究在眾學科中是小字輩,成果相對較少。研究內容大都屬于功能介紹、編制方法等探討。隨著科學研究深入發展,人們對文獻需求廣泛,索引理論研究便向著多元化、專深化發展。特別是新型文獻載體的出現,開闊了索引理論研究的眼界。人們從多角度多方面探求揭示文獻的途徑,10年來總體研究步伐邁得不大,但研究視野比以前開闊了許多,這本身就是索引理論研究的進步。

3.1總體趨勢是傳統理論研究在減少,但反映的是對新形勢下索引研究的呼喚

索引理論研究在90年代還很穩定。表1中1993-1999年間研究文章數量起伏不大,而且較多。說明我國學術界中有一批學者在關心索引事業的發展。在這較好的氛圍中,中國索引學會功不可沒,組織學術研究,與國內外學界交流互通,做了許多工作。在90年代中期,中國索引學會編輯了《索引研究論從》叢書,包括《索引的昨天與明天》、《索引技術和索引標準》、《論索引和索引方法》、《報紙索引和新聞數據庫》、《索引編制自動化》5個分冊,共收論文114篇,聘請相關專家撰寫了有關索引編制原理及自動化編制技術、文獻標引及自動化標引技術、檢索語言編制及計算機語言識別技術、書目數據庫技術等方面的論文,論及問題之深,引用資料之多,學術見解之新,是索引理論研究多年未曾有過的,為中國索引理論發展起了導航作用。但近幾年研究文章驟減的狀況應該引起學術界注意,反思以往的研究是否適于新形勢、新局面的需要,如何盡快改變傳統觀念,建立起新技術研究體系等,為網絡環境下索引事業的發展奠定基礎。

3.2索引研究視野逐步擴大,適應了科學技術發展的大趨勢

10年間報刊上共發表研究索引編制理論的文章203篇(這個數字是按原始文獻發表時間統計),內容包括索引編制的一般理論、自動化編制、國外索引編制、各種類型索引研究、索引史研究、對著名索引學者和編制機構研究、索引專著研究、各種檢索工具索引編制、古籍和現代著作索引編制等(見表5)。一般理論研究只占31.5%,其他專門研究占2/3還強。在64篇理論文章中談功能作用類27篇,編制原理類26篇,論索引事業發展8篇,對中外索引編制理論進行比較研究的3篇。從各種角度來研究索引編制,反映出索引研究的生命力,能夠適應科學技術進步而發展。

表51993-2002索引理論研究分類狀況(按原始文獻發表時間統計)

項一般自動國外索引學者索引索引檢索古籍現代總

目研究化索引類型機構史專著工具索引著作共

數量6412136267221034203

3.3索引類型的研究數量較多,表明了索引學仍是一門實用科學

只要社會需要文獻就有使用索引的要求。不論什么時候索引都是使用文獻最便捷的途徑。研究各種類型索引編制的文章62篇,幾乎占1/3,論述了10多種索引的編制(見表6)。雖然平均文章不多,但反映出學術界給予的關注。這些索引功用不同,但都是人們所需要的。

表6類型索引研究情況(按原始文獻發表時間統計)

附圖

3.4計算機技術趨于穩定后,自動化方面的研究會減少,而研究索引類型、為學術著作編制索引會增多

新文獻載體出現,文獻利用形式發生變化,對這方面的研究必然要出現,但一旦普及并趨于穩定后,介紹或說明性文章就會減少,而逐漸轉向深層次探討,文章數量就要下落。研討數據庫文章逐漸減少就是例證。而在書目編制、文獻標引、文獻編排、檢索語言等領域自動化研究逐漸增多則表明人們正在擺脫一般理論的研究,轉向實用理論、專門編制方法的探討。這也是計算機技術從應用到理論研究進展的過程。因此研究計算機應用于具體領域的文章會逐漸增多,逐步加深。

3.5對索引史、索引研究與編制方面有貢獻的學者或機構的研究逐漸減少,而對索引著作和檢索工具索引編制研究的增多,反映出學術界更重視索引應用理論的研究,重視索引檢索功能的探討

雖然近3年這方面研究出現空白,但是暫時現象,是由于文獻載體變換中出現的調整期。當計算機技術運行穩定后,由于機編速度快、抽詞準確、編排規范等優點,節省大量編制成本和人工,勢必會出現編撰索引的高潮。包括為古今中外各種學術研究而編制索引。索引成果不一定是印刷型,但功能一樣。

只要文獻功能沒有消失,索引作用就不會消亡。從索引功利性能上講,計算機在文獻領域里廣泛運用,為索引編制開辟了無限光明的前景,以往可望不可及的鴻篇巨著的索引編制,如今可能在俄傾之間,輕松愉快之中成就。文獻使用步入了嶄新的時代。

4走出“理論”的困惑,建立大索引觀,放眼于索引的實際應用

索引是“完備文獻”的重要組成部分,“完備文獻”應該是既有原始文獻又兼有檢索工具,使用起來非常方便。索引就是檢索工具,依附于文獻而存在。如今文獻形態發生了巨大變化,索引研究也要洗心革面,使其適應新形勢下人們對文獻的需求。就索引研究的現狀有幾方面應引起我們重視。

4.1應突破傳統觀念的束縛,樹立創新思維

深刻研究當今人們利用文獻的特點,研究計算機及其網絡發展對文獻傳播的影響,網絡環境下人們對文獻使用的需求,以使索引編制適應人們未來利用文獻的需要。索引理論研究既要適應文獻形式變化,也應符合人們對所用文獻的了解認知、心理適應和使用習慣。不能固守傳統理論不放,理論與實用脫節,而失去指導實踐的意義。建立創新思維,不能指望在短時間建立一套完備的新理論,應該樹立新的思維方式方法,敢于創新,敢于超前,以社會需求為研究目的,充分發揮索引在揭示文獻上的作用,為文獻利用提供快車道。

4.2沖破“太平研究”的藩籬,增強其理性探索

現在許多研究是以發表文章為第一需要,所以在理論探討上,都愿說“套話”,打“貫腔”,生怕新東西叫不準,新提法不被編輯認同,因此眾云亦云,以求太平。還有個傾向,不論什么樣內容都把它寫成“理論”型,帶有“理論”味,把特征、規律、功能等大談一番。這實不可取。理論研究就是為了解決實際問題,不要拘于一定的形式,內容深淺皆可,只要論述明白一個問題就是好文章。索引是一門實用科學,應注重編撰技術的研究與探討。可在10年中關于書目、索引編排技術(不包括圖書館目錄組織)的研究只有44篇(見表7),這個數量是討論索引編制和書目編制理論314篇文章(見表1、2)的14%,占這次在《全國報刊索引》查閱1247條信息的3.5%,表明對編制技術方面的忽視。重“理論”,輕技術,是理性不足的顯現。反映出業界習慣于約定俗成的運作,不善于開發與創新。

表7關于書目索引編排技術研究(按《全國報刊索引》報道時間統計)

年代1993199419951996199719981999200020012002共計

總共425536262944

傳統323423041224

自動化102113221720

4.3相當研究人員對先進技術了解不足,對索引未來發展認識模糊

表1中研究傳統理念數量與研究自動化編制之比為216:10,不能不說明學術界對新技術反映生疏。許多選題和論述,都不談計算機運用于文獻整理后產生的影響,而談那些已被許多人談過的問題。這是因為對新技術運用不甚了解,自然就不會對未來發展有清醒認識。90年代初期計算機在我國應用較少,而西方先進國家已大規模使用,這時理論界就應有個介紹的高潮,可實際上這種文

章很少。說明我國索引界對新技術應用反映不夠,學術研究相對滯后。這種局面必須改變,不然的話我們索引研究與編制就會落伍,就會影響國家和民族科學文化事業的發展。

4.4首先要深刻了解日新月異的新技術帶來的挑戰,需要我們不時地更新、探索、追求,才能跟上時代的步伐,才能為文獻充分服務于社會保駕護航

要根據新形勢下社會對文獻的需要,開發出實用性強的索引產品,為社會服務。索引研究和編制要因時、因書、因人、因社會需求而宜,真能如此,社會怎不認同。

4.5理論研究要與時俱進,與實踐相結合,以社會實際需要為前提

對于原理的討論是必須的,而專門編撰理論的研究更為重要。索引編制不順應時代,脫離實際需求,就分文不值。要形成良好的研究氛圍,建立需求→研究→新需求→新研究的機制,研究有針對性也就有了生命力。編制方法有了科學性,索引成果就會產生很大的社會效益。

4.6樹立大索引觀,開闊研究領域,為振興國家的科學、技術、文化及經濟建設服務

一不能把眼光局限于印刷型文獻,雖然電子型文獻目前人們不常見,但它終會成為文獻主流載體,所以要加強數據庫檢索方式方法研究的力度,使電子文獻更科學的為人們服務。二不能只重視社會科學方面文獻的索引編制,要把眼界擴展為流通于整個社會的文獻,比如經濟建設、工業生產、商業服務業等方面,凡是能通過整序而流通于社會的文獻,或者說通過整序后有利于社會流通的文獻,都應該納入我們的視野。比如產業名錄、商品名錄等。三要注重與索引研究交叉學科的研究,這些學科間研究目的相近,技術相關,功能相連。諸如文獻的分類、編目、標引、校仇、考證以及數據庫制作技術等。雖然整理目的不同,但許多技術相近,可以相互利用,共同完成文獻的揭示與整理。

4.7中國索引學會應加強力量引導學術研究

除組織學術活動外,更應該在索引理論研究方向上起導向作用,介紹世界上先進的編制技術和索引研究動態,引進成果,翻譯有影響的學術著作,加強學術交流,使社會各界了解索引的新發展。學會也應吸收工商界有關技術人員參加,使索引研究更加實用化,直接與工農業生產和國家的經濟建設掛鉤,更好地服務于國民經濟建設。

總之,10年來索引研究有喜也有憂,憂中也有喜。喜,研究成果頗豐。憂,后幾年傳統研究滑坡。滑坡的原因是社會對新技術廣泛應用的關注,人們要有個了解熟悉的過程。在這個過程中,人們會對傳統技術進行重新審視、評價、借鑒并與新技術融會。后幾年傳統研究減少就是新舊技術融會調整的時期。今后定會出現個新理論蓬勃發展期,因此憂中又有喜。讓我們做好理論準備,迎接新索引編制高潮的到來。

【參考文獻】

1《全國報刊索引(哲社版)》,1993-2002年

2侯漢清主編.索引技術和索引標準.北京:北京圖書館出版社,1997

3葛永慶主編.索引的昨天今天和明天.中國索引學會出版.1994

4葛永慶主編.論索引和索引法.中國索引學會出版,1994

5葛永慶主編.索引工作自動化.中國索引學會出版,1994

6葛永慶主編.報紙索引和新聞數據庫.中國索引學會出版,1999