文獻計量學論文范文
時間:2023-03-14 03:42:21
導語:如何才能寫好一篇文獻計量學論文,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
(一)我國中央銀行的會計核算基礎———收付實現制。
我國中央銀行業務由于具有特殊性,所以會計核算采用的是收付實現制。一是應收利息、待攤費用等科目沒有在表內設置。雖然設有“暫收款項、暫付款項”等科目,但其核算內容與企業會計具有不同的資金性質,其性質僅是臨時性、過渡性的。二是再貸款、再貼現這類資產是根據國家執行貨幣政策的需要而操作和發放的。發行債券時也是按債券面值計價,所發生的各類費用直接計入當期業務支出列損益。三是對固定資產計價時,僅在購建時一次性列支,除規定的特殊變動外一般不做調整,存續期間也不計提折舊,清理時一次性核銷原值。四是各項財務收入的確認,以我國中央銀行實際收到的各項收入計入相應賬戶。五是所有支出全部納入財務支出核算,財務支出不準預提虛列,一律據實列支。按國家有關規定制定費用開支范圍及標準,上報財政部批準后實施。每一會計年度的本期收入減去本期支出、減去按照國務院財政部門核定的比例提取總準備金后,所得凈利潤全部上繳中央財政。六是固定資產只在表外計算折舊額。七是應收未收利息在表外反映。
(二)我國中央銀行的會計計量屬性———歷史成本。
我國中央銀行遵循歷史成本原則對各項資產進行確認、計量,按各項財產取得時的實際成本入賬,存續期間財產價值不做調整。歷史成本計量主要體現在以下幾個方面:一是外匯儲備占款和貴金屬不隨價值變動和匯率波動定期調整賬面價值,只按歷史成本進行核算。二是再貸款按發放時的實際金額入賬,不采用重估價值,不進行減值測試,不計提損失準備,對其應收未收利息不納入表內核算,只在表外反映。三是固定資產按購建時成本計價,存續期間不計提折舊,只對規定的特殊變動原因做價值調整。四是有價證券的入賬價值按實際支付的價款列賬,溢價、折價不做攤銷,存續期間不按市價法或攤余成本法對賬面價值進行調整。五是國際金融組織資產按出資時實際支付的金額入賬。
(三)我國中央銀行現行會計標準的歷史成因。
我國中央銀行長期采用收付實現制作為會計核算基礎和采用歷史成本作為會計計量屬性有其歷史成因。收付實現制核算基礎和歷史成本計量屬性的長期存在是由我國中央銀行單位性質所決定的。我國中央銀行作為行政性單位不以盈利為目的,對利潤指標的重視程度遠不及企事業單位。我國中央銀行以防止國有資產流失為目標,更加注重資金使用的真實性,從會計信息的客觀性和相關性角度出發,我國中央銀行更偏重于會計信息的客觀性。
二、我國中央銀行現行會計標準質量現狀
我國中央銀行遵循收付實現制會計核算原則,實行獨立的財務預算管理制度,實行“統一領導、預算管理、分級核算、統負盈虧”的財務管理體制。資產項目中外匯儲備經營管理必須堅持安全性、流動性和盈利性的原則,再貸款、再貼現根據國家執行貨幣政策的需要操作和發放;負債項目均按實際發生額計價,發行債券按債券面值計價,發行債券發生的各種費用計入當期業務支出;財務收入項目的確認按實際收到各項收入后計入相應賬戶;支出項目全部納入財務支出核算,財務支出一律按規定的核算內容據實列支,不得預提虛列。利潤等于各項收入減去各項支出,利潤按財政部批準的比例提取總準備金后,凈利潤全部上繳中央財政,凈虧損首先由歷年提取的總準備金彌補,不足彌補的部分由中央財政撥補。所有者權益全部由國家所有,未經財政部批準不得變動。財務決算報告年度終了后按規定期限逐級上報上級行和財政部派出機構。財務收支、會計事務接受國務院審計部門和財政部門的審計和監督。我國中央銀行的現行會計標準雖然發揮了積極、有效的作用,但也存在一定問題。
(一)未跟進會計制度改革和金融全球化步伐。
2003年英國倫敦中央銀行出版社對全球159個中央銀行的會計實務調查表明,各國中央銀行對國際會計準則是認同度高達82%,大多直接或間接采用了國際會計標準。2006年我國新頒布的會計準則實質上實現了與國際的趨同,相續頒布的金融機構會計準則也確立了權責發生制和公允價值作為會計確認基礎的地位。伴隨日益全球化的經濟金融環境,我國國際經濟金融活動的參與程度日趨頻繁,我國中央銀行與其他國家中央銀行的交流也在不斷增加,對各國中央銀行會計標準的趨同性要求越來越高,如果差異較大將會造成會計信息的不可比性,直接形成交流障礙。
(二)與當前業務需求相比會計核算基礎相對落后。
我國中央銀行作為國務院組成部門、實行由政府主導的財務預算管理體制直接決定了收付實現制的核算基礎,收付實現制能夠實現年度預算安排與財務收支的有效配比。收付實現制雖然能夠較好反映預算收支的執行情況,但是不能完整反映中央銀行的資產狀況。當前我國中央銀行資產種類日趨多樣化、市場交易日益頻繁,僅采用收付實現制已經不能滿足真實、完整、準確地反映中央銀行全部資產狀況的要求。
(三)不符合會計信息相關性和謹慎性要求。
我國中央銀行持有相當數量的外匯儲備、金銀和有價證券,它們是有效執行貨幣政策的必要工具,上述資產的價格受國際、國內多項因素的綜合影響,幣種、供求、利率和匯率等的波動都將對其價格造成較大影響。對外匯儲備、金銀和有價證券等資產實際發生減值時,由于沒有引入客觀的計量方法,對其現行的真實價值無法準確衡量,從而減值準備也無法相應計提,實際價值會與賬面價值產生嚴重不符時,隱藏了較大的財務風險。上述資產如仍按現行歷史成本法計價,將導致中央銀行這些資產的賬面價值嚴重脫離其市場價值,這將不利于會計信息使用者做出決策判斷。
三、我國中央銀行現行會計標準的會計學選擇方向
我國中央銀行現行會計標準正在經歷多項核算改革,借鑒國外中央銀行會計準則,與國際會計準則逐步趨同,積極探索適合中國國情、能夠真實公允地反映中央銀行經營成果的會計標準是大勢所趨。雖然這些年來我國中央銀行已形成了一套較為完善的會計和財務準則,由于實行獨立的財務預算制度和采用收付實現制會計核算基礎,其會計反映和監督的能力目前遠遠不能滿足新準則后的需求,完善我國中央銀行會計標準勢在必行。與現行國際會計準則以及國外許多中央銀行執行的會計標準相比,我國中央銀行會計標準還存在不足之處,亟待改進。
(一)合理借鑒發達國家中央銀行會計標準。
隨著經濟一體化、金融全球化的發展,我國中央銀行與外國中央銀行、商業銀行及其他金融組織的交流日益緊密,參與國際經濟、金融活動日益頻繁,正因如此,我國中央銀行會計標準改革已勢在必行。我國中央銀行要高度關注國內外會計準則新動態,認真研究各國中央銀行國際會計準則的運用效果,找準我國中央銀行運用國際會計準則的切入點和范圍,成功借鑒發達國家會計標準改革的先進經驗,結合我國中央銀行的實際情況和經濟金融業發展的內在規律,明確我國中央銀行會計標準改革的具體內容和發展方向,制定符合我國中央銀行自身特點的新會計標準,并將研究成果積極運用到中央銀行會計實踐活動中去。借鑒國外中央銀行會計準則經驗,逐步靠攏國際會計準則,采用謹慎性原則,真實、公允地反映中央銀行經營成果是中央銀行會計標準改革的必然選擇。
(二)制定中央銀行會計標準改革制度支撐。
在借鑒國際會計準則、發達國家中央銀行會計標準和我國企業會計準則的基礎上,我國中央銀行應制定一套適合我國國情又與國際接軌的新會計標準制度或準則。具體應從以下幾個方面考慮:一是為準確計量各期間的成本和收益情況,引入權責發生制作為中央銀行會計核算的基礎;二是完善中央銀行會計核算原則,引入配比性、實質重于形式等原則;三是根據資產持有目的不同,采用歷史成本、重置成本、可變現凈值、公允價值等多種計量屬性計算資產價值;四是建立健全會計信息對外披露機制,保障會計信息披露的質量和有效性。
(三)我國中央銀行會計標準改革具體設計
1.我國中央銀行會計基礎宜采用收付實現制和權責發生制并用的“二元結構”模式。
會計基礎僅僅是一種計量標準,它脫離了會計體系這一整體,是不可能發揮出應有作用的。只有在有效的財務報告和政府會計制度框架設計下,應計制的應用才有其實際意義。目前我國政府部門尚未明確財務報告的范圍標準,從成本效益原則角度出發考慮,我國中央銀行完全采用權責發生制短期內尚不具備條件。因此,我國中央銀行近期內還是采取以收付實現制為主,以修正的權責發生制為輔的“二元結構”模式為宜。
2.對跨年度結算財務資金業務采用權責發生制計量更科學。
在現行收付實現制下,我國中央銀行跨年度結算財務資金業務如跨年度結算采購資金、工程款等,存在會計核算無依據、預提虛列和賬務處理不真實等問題。采用權責發生制,增設“待清算支出”、“應付支出”等類似科目,核算當年已安排未支出或應付未付的款項,項目發生時直接從費用賬戶將相關費用轉入。在下一年度實際支付時,直接做沖減“待清算支出”、“應付支出”賬務處理,不再列支費用科目。在當前部門預算制下,這種做法我國中央銀行可以更為科學的安排費用開支。
3.對再貸款業務計提減值準備,實施更為嚴格的監管手段。
我國中央銀行應根據再貸款業務的風險程度大小,計提相應的減值準備,減值準備金額與風險大小成正比。對再貸款業務應根據不同種類定期進行風險評估,對不同類別再貸款業務存在的逾期或無法收回的風險程度大小做出評估,可參考借鑒商業銀行貸款的五級分類標準做法,分別計提相應減值準備。由于我國中央銀行發放的再貸款金額較大,如果計提減值準備則相應的計提數額會較大,減值準備計入當期損益會造成損益的巨大波動,不利于客觀評價。考慮此因素,我國中央銀行再貸款減值準備可計入權益核算。
4.暫緩對固定資產計提折舊,保持現有固定資產會計核算方式不變。
篇2
>> 國內知識檢索研究的文獻計量學分析 國內鈉離子通道研究現狀的文獻計量學分析 我國電子文件元數據研究的文獻計量學分析 2000-2010年國內信息共享空間研究文獻計量學分析 國內心理治療效果的文獻計量學分析 對國內“壓力”主題體育類論文的文獻計量學分析 辦公自動化與電子文件研究文獻計量學分析 電子商務網站評價研究 醫院文獻計量學分析及創新能力研究的啟示 語義網應用研究的文獻計量學分析 1900~2010年農業發展研究的文獻計量學分析 基于文獻計量學分析的我國酸棗研究現狀 我國檔案服務體系研究的文獻計量學分析 我國學習倦怠研究現狀的文獻計量學分析 2003年~2012年我國檔案學對電子政務研究的文獻計量學分析 中醫體質文獻計量學分析 農業標準文獻專業分布與熱點領域的文獻計量學分析 國內焦慮癥文獻計量學研究 高校二級學院黨政聯席會研究現狀的文獻計量學分析 胚胎干細胞研究文獻計量學分析 常見問題解答 當前所在位置:
[3]周述文,郭曉軍,孫愛平,湯海洪.電子商務網站的分類及評價初探[J].中國管理科學,2000,S1:748-754
[4]蔣穎,金碧輝,劉筱敏.期刊論文的作者合作度與合作作者的自引分析[J].圖書情報工作,2000,12:23-28
[5]汪傳雷,潘珊珊,熊月霞.2007-2011年國外企業孵化器文獻計量分析[J].銅陵學院學報,2012,03:11-14
篇3
[關鍵詞] h指數 文獻計量學指標 機構學術評價
1 引 言
文獻計量學的方法可以把復雜現象簡化為指標及相關數據,從而可以對研究活動進行數值上的客觀比較,能得到客觀可信的定量的評價結果。在文獻計量學中,科學家或科研團隊的學術成果主要體現在發表學術論文的數量和學術論文的被引頻次兩個方面。論文的數量和論文被引的頻次本身包含了很多有用的信息,從中可以獲得科學家或科研團隊n年發表的論文數量、每篇論文得到的引文數、的期刊以及期刊的影響參數等。而且,不同的人會使用不同的標準對科學家或團隊的研究活動進行評估。
2005年,美國物理學家J.E. Hirsch 提出一種新的非常簡單有效的數字指標——“h指數”,用以評價科學家個人的學術成就。Hirsch將h 指數定義為:“一個科學家的分值為h,當且僅當在他/她發表的Np篇論文中有h篇論文每篇獲得了不少于h次的引文數,科學家剩下的(Np-h)篇論文中每篇論文的引文數都小于h次”[1]。 h指數作為引文影響力和論文產出力二者結合的新的評價指標,Hirsch 認為h指數優于其他一般用于評價科研人員學術成果的傳統的單項指標[1]。他認為論文總數可以直接測度科研生產力,但不能測度論文的重要性和影響力;被引總數可以測度論文的總體影響力,但論文的被引次數不太容易找到,作者的影響力可能被少數重要的合作論文夸大,這些合作論文有可能是與許多其他作者共同完成的,因此并不代表作者的實際影響力,同時,該參數往往不能恰當分配被引次數較高的評論性文章與原創性研究成果的權重;篇均被引次數可以比較不同時代科學家的影響力,但數據不容易獲得,容易造成獎少懲多。Hirsch認為h指數可以避免上述所有缺陷。
h 指數的絕妙之處,就在于它具有制衡被引頻次和論文數量兩個指標的特點。因此這項指標確實在一定程度上能夠彌補傳統的文獻計量學指標在學術評價中的局限性。鑒于此,該指標一經問世,立即引起學術界的廣泛關注。2006年,h指數的數學模型被建立[2-3],獨立的類h指數-g指數也被發現[4],使h指數和類h指數的研究成為信息計量學的前沿研究領域,并顯示出了發展成為下一代核心評價參數之一的可能性,因而及早對h指數和類h指數進行系統研究具有重大現實意義和學術價值[5]。
Hirsch 教授提出h指數的初衷是為了衡量科學家的個人學術成就,但h指數并非只限于評價科學家個人,也可以評價一個科研團隊、一種學科或一所大學、一種學術期刊、一個地區或國家等群體[1]。利用h指數進行大學以及學科的評價時,顯現出其他計量指標所不具有的特點。因而大學h指數顯現出什么樣的特點、h指數與傳統文獻計量指標是否存在相關性以及h指數對大學學術成果評價的可行性是值得探討和研究的問題。
2 方法與數據
本研究以2009年上海交通大學的Academic Ranking of World Universities (ARWU)為依據,選取排名前100名的大學以及醫學、生命科學、物理和化學4個學科排名前50名大學學科發表的國際論文作為分析樣本價值[6],并以Thomson Scientific 制作的ISI Web of Science平臺中的科學引文索引擴展版( Science Citation Index Expanded,SCIE) 、社會科學引文索引( Social Sciences Citation Index,SSCI)和藝術與人文科學引文索引(Arts & Humanities Citation Index,A&HCI)三大引文數據庫為來源數據庫,統計作為研究對象的每個大學及學科的論文總數和被引總數,并計算了h指數和篇均被引次數。
挑選上海交通大學ARWU中的大學作為實證研究對象,原因有兩個:①ARWU的排名過程完全透明。ARWU以國際可比的科研成果和學術表現作為主要指標,采用可以驗證的客觀數據,進行全球性的大學排名,所采用的排名方法和數據來源完全透明,所有信息都公布在排名網站上(省略)。學術排名每年一次,其排名指標體系保持了較好的穩定性,大學名次的變化完全取決于它們在不同年份的表現。②排名受到廣泛關注。自2003年開始排名結果以來,其以評價體系的客觀和透明引起了國際社會的廣泛關注[6],美洲、歐洲、澳洲等主要國家的主流媒體、歐盟等一批機構以及加州大學等一批世界名校進行了報道或引用。各國政府、大學從該排名出發,分析對比本國、本校的情況和發展態勢,并在此基礎上制定戰略規劃,采取各種舉措促進一流大學建設。
篇4
具體的數據采集方法是:登錄中國知網首頁,點擊“評價”進入評價中心,選擇“中國學術期刊國際國內影響力統計分析數據庫”,并輸入用戶名和密碼,點擊“登錄”,對18種綜合類農業學術期刊的下載量逐一檢索并匯總。需要說明的是該數據庫只提供2006年至今各期刊的下載量統計值,因此,本研究的下載量半衰期的統計數據是2006年至2015年的數據。其它文獻計量學指標,如復合他引影響因子、期刊他引影響因子、復合即年指標、期刊即年指標、基金論文比、引用半衰期、被引半衰期、Web即年下載率、總下載量等,均是來源于《中國學術期刊影響因子年報(自然科學與工程技術•2016版)》。
2期刊下載量半衰期計算方法
期刊下載量半衰期是指某種期刊的所有論文被下載的總次數中,較新的一半是距離發表當年多長一段時間內累計達到的,其計量單位為年其中:HD是指所求的下載量半衰期,X為累計百分比小于且最接近50%的年份序號(統計當年年份序號為0),A為統計年至X年的下載量累計百分比,B為統計年至X+1年的下載量累計百分比。以《中國農業科學》為例(表1),其具體算法如下:HD=2+(50%-49.77%)/(61.29%-49.77%)=2.02003數據處理和分析方法采用的統計學處理軟件為spss18,下載量半衰期、引用半衰期和被引半衰期數據正態性檢驗采用單樣本Kolmogoro-Smirnov檢驗,三者的差異性比較和多重比較分別采用單因素方差分析和LSD檢驗。各指標間的相關檢驗采用Spearman等級檢驗,檢驗水準α=0.05。
3綜合類農業學術期刊
2015年下載量半衰期及其他文獻計量學指標的比較據統計,18種綜合類農業學術期刊的總下載量達170.66萬次,Web即年下載率為44次/篇,基于下載量的半衰期HD(Half-lifePeriodofDownloads)的范圍是2.0359~3.4167年,極差為1.3808年。由附圖可知,在被統計的18種期刊中,2<HD<2.5的有4種,2.5<HD<3的有8種,HD>3年的有6種,可見有44.44%的期刊HD集中在2.5~3年之間,有33.33%的期刊HD分布在3~4年之間,其中以《華南農業大學學報》的HD值最高,達3.4167年。
4下載量半衰期與引用半衰期和被引半衰期的比較
引用半衰期的范圍是7.2~9.1年,均值和中值分別為8.261、8.200年;被引半衰期的范圍是5.1~10.4年,均值和中值分別為8.317、8.850年;下載量半衰期的范圍是2.02~3.4128年,均值和中值分別是2.8560、2.9185年,可見引用半衰期和被引半衰期的值均明顯高于下載量半衰期,平均高出5~6年。該結論符合人們引用文獻的習慣。如在綜合類農業學術期刊中較有影響力的《中國農業科學》,其下載量半衰期為2.02年,被引半衰期為7.0年,相差5年左右,說明《中國農業科學》的文章從被讀者下載到被學者引用大約需要5年的時間。在互聯網快速發展的情況下,文獻被引用從下載到引用,需要一定的沉淀,而下載是整個過程的開始,也是最能較快反應期刊以后被引情況的重要指標,因此,該指標被用于期刊評價時具有較強的時效性。
篇5
閱讀本作,感到有以下特點:
1 研究視角新
科學計量學研究專著,在中國從上世紀80年代中期趙紅州的《科學能力學》第二篇,到90年代初,谷興榮先生《科學技術發展的計量研究》出版發行,至今已有相當一批科學計量學學術成果。但絕大多數專著都是運用文獻計量學的方法進行研究。谷先生對它的整體結構功能規律進行探討,采用的是計量經濟學與數理經濟學的研究方法。谷興榮認為:用文獻計量學研究科學計量學主要是研究科學技術的文獻資料的分布結構和結構變化規律,這只是科學計量學研究內容中的一部分。另外還有科技機構、科技人員、科研經費的分布結構和演變規律問題,社會環境、科技經費、科技人才與科技成果的數量、質量之間的因果關系,科技發展對經濟社會的影響關系,這些內容的研究是文獻計量學方法不能解決的,只有計量經濟學方法能解決。反過來,計量經濟學、數理經濟學的方法可以研究科技文獻與科技成果的分布問題。而且,年輕一代的管理學者,運用經濟數學與管理數學方法寫了不少科學學與科技管理的計量研究論文。可見這是一個大的發展方向,谷先生在本作中概括出一個龐大而系統的論著是有重要意義的。
2 觀點新,創新程度大
此專著運用計量經濟學方法,對科學學與科技管理的結構、功能、發展規律等提出了一系列的理論觀點,并用數學方法給予表述。在第34頁把全書的基本論點的來源列了一張表。從表中可見,全書共有61個論點,其中,由本書作者在過去首次提出,并且先后以論文形式發表過的有42個論點,占68.8%;吸收其他學者的論文論點有19個,占31.2%。由此說明本書作者對科學學與科技管理計量研究的理論創新程度是相當大的。而且,多數論點都是有理論與實際意義的基本理論問題。比如:科學技術區際結構三大發展規律(兩極分化、梯度轉移、中心轉移規律)的統一性原理等等,提法新穎,論證清晰, 很有意義。
3 內容廣泛,涉及到科學學與科技管理領域多方面的基本理論問題
任何學科都是討論研究對象的結構,外在表現形式和自身活動的方式,活動功能、演變和發展規律三個問題,此專著對科學技術體系各方面的結構和結構演變規律都作了詳盡的定量探討,如科技研發的要素結構及其演變機制,科學技術的門類結構、學科結構、知識結構、區際結構及這些結構的演變規律,以及這些結構的內在各部分的彈性替代關系等。這部分內容將近30萬字,是目前科技結構研究中最廣泛最詳細的研究成果之一。
關于科學技術的運作方式、運作機制和經濟社會功能與研究效益問題,從五個方面寫了近15萬字。包括科學技術發展的三大動力機制,科學技術與經濟的鏈鎖關系與替代關系,科學技術的社會經濟功能及作用規律的定量研究,科學技術的社會經濟功能及作用規律的定量研究,科學技術研發效益的歷史變化規律等,都進行了系統的量化分析。
在科學技術的傳播、滲透、轉化發展及其評價方面, 分為五個方面寫有20多萬字。包括科技傳播與滲透效應的幾個問題研究, 科技發展與科技轉化的質量指標和質量診斷問題, 科學技術發展歷史規律與新陳代謝機制的定量研究; 科學技術活動的三大基本法則與行為邊界的定量研究; 科學技術評價的四大指標與四大環節, 四大指標即數量指標, 質量指標, 效益指標和綜合指標。四大環節即指標的選取與選取標準環節, 指標分類環節, 指標的組合建模環節, 指標的測算與檢驗環節等, 都作了全面的量化研究。
由此可見, 本作是科學學與科技管理領域中涉及面較廣的大部頭基礎研究成果之一。
4 內容的系統性與邏輯性強,全書結構有科學性和合理性
由于研究時間較長,內容較多,相互之間已經構成了完善的理論體系。從編的層次看,第一編是討論科學技術結構及其演變規律,是科學技術的橫向結構,以及橫向結構在科學技術發展中的變化。第二編討論科學技術運行發展的機制和社會功能,前者是橫向的,后者是縱向的。但都是指科學技術體系內在各部分之間的空間結構和各部分之間的時間依存關系和變化關系。第三編討論科學技術傳播發展與評價理論,這是科學技術體系的整體性發展規律,科技發展狀態和科技活動結果的測評,與第一、二編相對應。每一編的各章之間,每一章的各節之間等都具有互為聯系的系統性,相互間有較強的邏輯性。
5 計量分析的普及面較廣,定量分析的程度較高
篇6
[關鍵詞] 共詞分析 專利引文分析 知識關聯
[分類號] G255.53
1 科學―技術知識關聯的概念
“科學―技術知識關聯”是近年來專利計量學領域的重要研究內容之一,在Scientometrics、World PatentInformation等權威期刊的相關文獻中通常被表述為Science Technology Linkage、Science Technology Interac-tion、Science Dependence of Technology。研究科學一技術知識關聯的意義在于:通過揭示哪些基礎研究學科與哪些技術發明領域之間存在知識關聯,預見二者間可能的推動或啟示作用,從而為國家創新體系的管理者提供科技資源配置方面的決策參考,以便目標明確地扶持更具產出能力的基礎學科,發掘已具備基礎儲備的未來技術創新領域。
2 揭示科學一技術知識關聯的各種途徑和方法
目前,揭示科學一技術知識關聯的途徑多種多樣,不同學科都在為此作出各自的貢獻。
在科學社會學和技術社會學視野下,研究公共基礎研究機構(公共科研院所、研究型大學、國家重點實驗室)與企業的合作研發活動,是揭示科學一技術知識關聯的有效途徑。技術社會學認為,公共基礎研究是技術變遷過程的基本要素,它通過提高社會整體創新水平間接推動企業的開發活動。科學社會學的雙螺旋理論(Double Helix Model)認為,科學與技術是一對舞者(a pair of dancer)的關系,二者在相互推動下呈螺旋狀上升發展。基礎研究與技術開發之間的知識交互過程和合作活動是實現技術突破的能量儲備過程,是實現技術躍遷的重要前提。文獻[1―3]通過統計大學及公共基礎研究機構與企業的合作研發活動,揭示了激光、分子生物學等領域的科學一技術知識關聯、知識擴散和成果應用情況。
在技術經濟學視野下,挖掘基礎科研機構和技術開發機構(各類企業)在地理空間分布上所表現出的關聯規則,是揭示科學一技術知識關聯的又一途徑。技術經濟學認為,區域經濟管理者在制定科技政策時,通常會從有利于本地經濟和技術發展的角度出發,利用基礎科研對本地技術創新的影響,在同一地域范圍內統籌規劃創新型企業和基礎科研機構,從而構建起兩者間知識關聯和轉移的通道。基于上述技術經濟基礎,基礎科研機構和企業的地理鄰近性與兩者間的知識關聯和轉移強度之間通常會表現出明顯的相關性。文獻[4―6]分別通過研究美國、法國、東歐范圍內基礎科研機構和創新型企業的地理空間凝聚現象,揭示了對應的科學一技術知識關聯和知識轉移強度。
在科學計量學和文獻計量學視野下,解析科研期刊論文與技術專利文獻間的關聯關系,也是揭示科學一技術知識關聯的另一途徑。科學計量學家Verbeek認為,企業創新人員對科研文獻的理解、認同和利用是引發科學一技術知識關聯和最終造就技術轉化的關鍵環節。Garfield指出,發明不可能來源于魔術或真空,它是發明人對若干已有的概念進行重新組合的知識成果。Narin等認為,幾乎所有的科技成果都是在前人工作的基礎上發展起來的,知識的關聯性在專利引文中有著明顯的體現。科研期刊論文與技術專利文獻之間的共詞關系和引用關系是新知識向技術部門轉移的顯性表現。
3 利用共詞分析法揭示科學一技術知識關聯的局限
共詞分析法以某一(或一系列)主題檢索詞(科學概念或技術術語)為“關聯點”,分析該詞在科研論文和專利說明書中的“共現”情況,從而推理和判斷基礎科學學科與技術創新領域之間關聯關系的方法。共詞分析法直觀、有效,但同時也存在著明顯的問題和局限。
3.1 科學概念與技術術語之間存在部分不對應問題
盡管INSPEC和INPADOCDB等詞表能夠提供某一科學概念和技術術語的多種詞匯表達,但它們不能解決“部分科學概念與技術術語不對應”的基本矛盾。例如:專利說明書中的技術術語thin film(納米絕緣薄膜)及其同義術語ion sol-gel(離子溶膠凝膠)、polyerys-talline film(硅多晶薄膜)等在科研論文中并沒有絕對對應的概念,通常只能被近似地映射為chemical vapordeposition(化學氣相沉積)、carbon nanotubes(納米碳管)、amorphous nitride(無定形氮化膜)等詞匯形式。
3.2 同一概念術語在科研論文和技術專利中的表達方式各不相同
科研論文中的化合物名稱在專利說明書中往往以分子式、化學鍵結構式或馬庫什結構式(Mm-kush strue-ture)表示,例如,pantoprazole作為一種常用的抗潰瘍藥物的化學名稱常出現在科研論文中,但在專利說明書中這一詞匯很少出現,取而代之的是其馬庫什結構式,如圖1所示:
3.3 專利技術的核心特征詞難以被確定
科研論文由作者給出關鍵詞,指明論文的核心知識概念,但專利說明書中沒有“關鍵詞”,發明人沒有歸結出專利的核心技術特征。目前的共詞分析主要依據“詞頻”和詞出現在專利說明書中的“位置”來間接推斷某術語是否表達了技術的核心特征。但核心特征詞的“詞頻”的分布閾值和詞出現在專利說明書中的什么“位置”能否代表技術的核心特征也還是一個爭論性話題,如有人重視“標題”、“摘要”位置,也有人重視“權利要求條款”位置。
3.4 語種差異有時會引發技術術語缺失
例如,中國專利中的中醫治療方法專利和中藥配方專利所涉及的人體穴位和草藥名稱等都沒有對應的英語詞匯。
目前,上述問題都還沒有有效的解決方案,這就局限著共詞分析法在揭示科學一技術知識關聯方面的效度和信度。
4 利用專利引文揭示科學一技術知識關聯的優勢
本文所討論的專利引文主要是指專利說明書所引證的相關科研期刊論文。Jaffe等將“專利引文分析法”(patent citation analysis)定義為:利用各種數學與統計學的方法,對專利引文進行分析并揭示其中存在的數量特征和內在規律的方法。1994年Narin首創了“專利計量學”(Patentbibliometric)并構建了專利計量指標(Science Linkage,sL),用以度量技術發明與基礎研究之間的關聯強度。利用專利引文揭示科學一技術知識關聯的方法,以專利引文為紐帶,通過專利說明書對科研期刊論文的引證映射,揭示對應的基礎研究學科與技術創新領域之間的知識關聯,其基本原理如圖2所示:
篇7
按照《教育部學科門類、一級學科、二級學科目錄》,公共衛生與預防醫學的二級學科為:流行病與衛生統計學、勞動衛生與環境衛生學、營養與食品衛生學、兒少衛生與婦幼保健學、衛生毒理學、軍事預防醫學等。筆者對2006年-2010年間我國部分地區高校公共衛生與預防醫學二級學科科技論文統計與分析的文獻簡要評述如下。
目前,國內外對于2006年-2010年期間,我國高校公共衛生與預防醫學二級學科的科技論的統計與分析比較少,僅有山西醫科大學孔瑞珍的學位論文《高等院校公共衛生與預防醫學科技論文產出的綜合評價》對篩選出的27所高校在2003年—2007年間產出的科技論文,經秩和比法逐年統計分析后得知,北京大學、四川大學、復旦大學、華中科技大學等高校具有較高的論文產出能力,提示這些高校在公共衛生與預防醫學學科方面具有較強的科研能力,成績突出。對27所高校預防醫學下屬二級學科的科技論文產出數量運用秩和比法統計評價后,得出了在各二級學科方面各大學的科研情況以及優勢所在:流行病與衛生統計學以第四軍醫大學和復旦大學為優,勞動衛生與環境衛生學方面復旦大學和華中科技大學表現突出,營養與食品衛生學是第三軍醫大學和中山大學名列前茅,兒少衛生和婦幼保健學以華中科技大學和安徽醫科大學最強,衛生毒理學突出的是第三軍醫大學和吉林大學[1]。在進行橫向比較后發現,各高校5年間每年的論文產出數量相對起伏不大,但高校在各學科的論文產出能力并不均衡,需要發揮所長,彌補不足,既要全面發展,也應重點突出。
其他文獻主要是對以某地區的衛生機構或某一高校的公共衛生與預防醫學進行研究,例如:溫州醫學院圖書館趙麗紅的《2002-2007年溫州醫學院醫藥衛生科技論文產出的計量分析》一文中應用文獻計量學的科學方法,對2002-2007年溫州醫學院(溫醫)教師在國內生物醫藥期刊上發表學術論文及SCIE收錄國際論文進行定量研究,提供各項指標的統計數據和測評結果。文中利用中國生物醫學文獻數據庫和美國《科學引文索引》按照論文機構分布、論文作者分布、載文期刊分布、基金資助項目產出論文情況統計分析等,得出2002-2007年間,溫州醫學院國內發文和SCIE論文量均呈現出顯著增長的趨勢,在數量上和質量上均有很大程度的提高,但就目前而言,與國內一流醫學院校尚存在一定的差距[2]。浙江省醫學情報所的舒暢和《移植雜志》編輯部的沈敏共同完成的《浙江省各地區醫學科技論文計量分析》一文中用中國生物醫學文獻光盤數據庫(CBMdisc)對浙江省11個省轄市在2002-2007年發表的生物醫學文獻進行統計,按照11個省轄市的總量、省轄市在核心期刊上發表的文獻量、11個省轄市排名前五位的學科等進行統計,根據統計結果對浙江省各地區的生物醫學水平進行分析,發現浙江省生物醫學水平有長足的進步,但地區發展不均衡的現象十分明顯,尤其是省屬單位占居了主導地位,市級醫療單位難以與他們競爭,該文對以后這些地區的發展提出了建議。
篇8
1、核心期刊與統計源期刊
對某一主題而言,將科學期刊按照其登載相關論文數量的減序排列時,可以分出對該主題最有貢獻的核心區以及論文數量與之相等的幾個區,位于核心區的期刊稱為核心期刊。廣義的統計源期刊是指被各類檢索系統、數據庫等收錄而作為其文獻統計來源的期刊。
《總覽》是國家社會科學基金項目“學術期刊評價及文獻計量學研究”的子課題———中文核心期刊評價研究的成果,研究人員采用文獻計量統計與定量評價,同時結合學科專家對定量評價結果的定性評審形成最終研究成果。《總覽》所確定的核心期刊表在國內具有較強的權威性,應用范圍比較廣泛。
《報告》是按照美國科學情報研究所(ISI)《期刊引證報告》的模式,結合中國期刊發展的實際情況,確定了在中國出版(不含港、澳、臺)的1576種(2004年版)科技期刊列為《中國科技論文統計源期刊》,又稱為中國科技核心期刊,學科范疇主要為自然科學領域,是目前國內比較公認的科技統計源期刊目錄。因其受科技部委托,帶有官方色彩,權威性名列國內首位,人們習慣稱其為“統計源期刊”,下文所說統計源期刊即指此目錄。
2 、《總覽》與《統計源期刊》的相同點
2.1、理論依據相同:兩者都以加菲爾德引文分布規律與布拉德福分布規律為理論依據,因此可以認為都是經過嚴格的文獻計量學標準而獲得的核心期刊。
2.2、均采用多指標的定性、定量評價指標體系:2004年版《總覽》采用定性與定量相結合的方法,其中定量評價指標體系由7 個評價指標組成。2004《統計源期刊》評價計量指標選擇了期刊引用計量指標與來源期刊計量指標兩部分共15項指標。
2.3、兩者研究成果均不能作為金標準使用:核心期刊與統計源期刊都是一種相對統計的概念,由于文獻計量學理論的局限性、數據采集的不完整性以及統計方法的不全面性,都會使評價出現這樣那樣的缺點和不足,其研究結果不可能像自然科學那樣精密,因此兩者只能起參考工具作用,不能作為檢驗期刊質量的“金標準”,過分夸大其作用只會帶來負面影響。
3、《總覽》與《統計源期刊》的區別:
3.1、編輯出版單位不同:《總覽》由北京大學圖書館與北京高校圖書館期刊工作研究會聯合研制而成,屬于民間性質;而《統計源期刊》由國家科技部委托中國科技信息研究所完成,具有一定官方性質。
3.2、學科分類原則不同:兩者都采用分學科統計評價指標數據的方法。學科劃分對期刊評價結果影響很大,學科劃分過大,小學科學術性強的期刊會被淹沒;劃分過細,小學科的一般性期刊就會進入核心區。《總覽》基本依據《中國圖書館分類法(第4版)》劃分學科,同時考慮學科期刊的數量、期刊性質等多種因素,共設學科類目74個。《統計源期刊》則根據國家技術監督局的學科分類國家標準和《中國圖書資料分類法(第4版)》的學科分類原則,同時考慮綜合性期刊情況及各學科期刊數量與學科性質差異,增設了綜合類和理工大學、工業綜合類、管理學類,對農業學科及醫藥衛生類學科作了進一步細分,共設55個學科類目。
3.3、期刊的來源與范圍不同 《總覽》以52種數據庫或文摘刊物作為評價指標統計源,統計文獻量總計達943萬篇,涉及期刊1.2萬種,通過多指標綜合評價的定量評價方法及定性評價,取各學科專業期刊數量的15%和進入統計的期刊數量的2%,共評選出1798種核心期刊。覆蓋的學科范圍廣泛,包括社會學科(社會學、政治、法律、軍事、經濟、文化教育、歷史等)與自然學科(醫藥、農業、工業技術等),但未收錄港、澳、臺及國內出版的英文刊物。
《統計源期刊》來源期刊的選擇綜合參考了國外重要檢索數據庫收錄國內期刊的情況及國內已有文獻計量分析成果、國內大型檢索工具、各學會學報及其重要期刊等各種期刊表,并征詢了專家意見,每年根據期刊文獻的被引用情況等因素對來源期刊表進行一定的調整。期刊入選原則是:①期刊文獻的同行評審;②期刊文獻計量指標;③期刊的社會和學科影響;④期刊文獻是否反映了本學科的研究成果;⑤照顧新興學科和高技術學科;⑥ 適當的地區性考慮;⑦在國際和國內的顯示度。《統計源期刊》僅包括國內出版的科技類期刊,包括國內出版的英文刊物,但不包含社會學科期刊。
3.4、評價指標體系不同:《總覽》采用定性與定量相結合的方法,核心期刊選擇了52種數據庫或文摘刊物作為評價指標統計源,評價指標體系由7個評價指標組成:被索量、被摘量、被引量、他引量、影響因子、被摘率、獲獎或被重要檢索工具收錄。專家定性評審力度大,共選聘1871位評審專家參加了核心期刊的評審。而《統計源期刊》定性評價力度相對小,雖然經過一定的同行評審,但以定量研究為主,強調研究結果的客觀性。2004年評價計量指標選擇了兩部分共15 項指標:①期刊引用計量指標:總被引頻次、影響因子、擴散因子、引用期刊數、即年指標、他引率、被引半衰期。主要顯示期刊被讀者使用和重視的程度,以及在科學交流中的地位與作用。②來源期刊計量指標:來源文獻量、參考文獻量、平均引用率、平均作者數、地區分布數、機構數、國際論文比、基金論文比。通過來源文獻的統計分析,全面描述該期刊的學術水平、編輯狀況和科學交流程度
3.5、收錄期刊數量:
《總覽》核心期刊表收錄期刊總數1798種,其中生物科學類44種,醫藥衛生類223種。《統計源期刊》收錄期刊總數1576種,其中生物科學類51種,醫藥衛生類423種。223種生物醫學期刊既是《總覽》中確認的核心期刊,又是統計源期刊。兩者在特種醫學、耳鼻咽喉、皮膚、神經病學與精神病學、腫瘤學、兒科、婦產科、口腔醫學、外科、皮膚與性病等學科類目中所收刊種完全一致。
3.6、出版周期不同 《總覽》每4年出一新版,出版時間比數據統計大約滯后2.5年,反映期刊變化不夠及時。《統計源期刊》每年更新,能夠較快反映期刊發展動態。
3.7、對綜合性學科與邊緣性、交叉性學科期刊評價效果不同,由于《總覽》是分學科評價的,因此綜合性和交叉學科期刊會因為刊載的論文學科分散而難以進入核心期刊表。2000年版開始通過增加綜合性學科類目,將綜合性期刊分散在各學科的數據匯總一起進行評價,產生綜合性核心期刊表,較好解決了綜合性期刊問題。但邊緣性、交叉性學科的優秀期刊進不了核心區的問題仍未能很好解決。
《統計源期刊》選擇入選期刊時給新興學科和高技術學科一定考慮,并適當照顧期刊的地區性。因此諸如《中華男科學》、《頸腰痛雜志》、《循證醫學》、《中華航海醫學與高氣壓醫學雜志》、《中華老年多器官疾病雜志》、《聽力學及言語疾病雜志》等邊緣性、交叉性學科期刊能入選統計源期刊。
篇9
[關鍵詞]信息計量學 網絡計量學 文獻計量學
[分類號]G350
1 引言
“信息計量學(Informetrie)”這一學科名稱首次由德國學者O.Nacke在1979年提出,與之對應的英文術語“Informetrics”則最早見于1980年美國科學基金會公布的年度研究項目的標題中,并隨后得到了國際文獻聯合會的認可。1984年,B.C.Brookes撰文提出要大力發展信息計量學,并就信息計量學的一些基本理論問題進行了較詳細的論述。1987年,在第一屆“文獻計量學與信息檢索理論”國際研討會上,布魯克斯又提議將術語“Informetrics”補充到第二屆會議的名稱中去,得到了與會學者的普遍贊同,自此每兩年舉辦一屆的國際學術會議及其出版的會議論文集都在名稱中使用了“信息計量學”。1995年起,會議名稱被正式確定為“科學計量學與信息計量學國際會議”,由“國際科學計量學和信息計量學學會”(ISSI)負責主辦。1997年,T.C.Almind和P.Ingwersen首次提出用“Webometrics”一詞來描述將傳統文獻與信息計量學方法應用于WWW信息計量研究,使信息計量學的研究活動拓展到了網絡空間。2007年1月,由L.Egg―he擔任主編的《Journal of Informetrics》創刊,為新世紀更趨繁榮的學術研究提供了獨立和更加專業化的國際學術交流平臺。
從1979年學科名詞的提出,到1987年成為國際學術會議的主題、奠定自身的學科地位,再到1997年“Webometrics”的出現,信息計量學終于從早期對文獻計量學和科學計量學的依賴、繼承與交流中獲得了長足的進步,并在21世紀的網絡化環境中開辟出更為廣闊的學科發展空間。本文試圖對新世紀以來信息計量學的研究活動進行較為全面的概括和評述,但限于篇幅,重點討論的內容主要包括信息計量學在理論、方法和應用方面取得的重要研究進展,以及當前所面臨的問題與挑戰。
2 理論研究進展
2.1網絡信息計量學研究的全面推進
自1997年“Webometrics”被提出后,基于Web的網絡信息計量問題即廣受關注。根據作者對中國期刊網全文數據庫(2000―2008年)的文獻調查,在以“信息計量學”為標題關鍵詞的檢索結果中,超過90%的中文文獻都是關于網絡信息計量的內容。而在2007年4月對Web of Science數據庫進行的國外文獻調研中發現,網絡信息計量主題的核心文獻數量呈現逐年激增趨勢,其中高品質的學術文獻約占18.5%,被同行引用的次數普遍超過了30次。可以說,網絡信息計量領域的確立及各項研究活動的全面推進,已成為新世紀以來信息計量學理論研究取得的一個最令人矚目的重要成就。
目前,大量的網絡信息計量研究活動又以“網絡鏈接分析”為中心議題。由于網絡鏈接與傳統學術期刊文獻之間的引用關系具有某種天然的相似性,研究人員不僅將文獻計量學的引文分析思想廣泛移植、應用到了網絡信息計量研究中,而且賦予了相應的研究工作和成果以極其鮮明的引文分析“烙印”。這種“烙印”從以下網絡計量指標的設計和使用上即可得到充分的印證,例如“Sitation”、“Web Impact Factor”、“Webcoupling”、“Co-citation”、“Co-link”、“Co-authorship”、“Self-linking”、“Self-linked”等。另外,在具體的研究成果方面,例如網絡鏈接分析與引文分析的異同、網絡鏈接的目的與類型、網絡影響因子的定義與應用、核心網站測定等,也都表現出了與傳統引文分析的緊密映射關系。
除借用引文分析法外,近年來網絡鏈接分析開始采用另一種重要研究方法――來自社會學的社會網絡分析(SNA),并在具體應用中取得了一定進展。
隨著研究活動的深入,Web環境下更多更具挑戰性的信息計量問題正在不斷被提出,并賦予信息計量學新的研究使命。例如,(具商業價值的)網絡流量分析及其軟件工具的研制;各種網絡用戶行為(例如瀏覽、查詢、下載、標注、訂閱等)的跟蹤、計量與分析;虛擬社區(包括成員角色、社區結構、主題/話題及其態度/傾向性等)的發展、監測和演變趨勢分析;網絡空間的知識結構及相關站點群落的識別等。面對這些問題與挑戰,信息計量學的研究內容將更具交叉性和豐富性。
2.2“信息基本循環圖式”的構建及對信息計量學理論基礎的探討
1967年,布魯克斯曾將情報學的研究任務抽象為如下的基本知識方程:K[S]+I=K[S+S]。2005年,國內學者王宏鑫基于該知識方程,提出“信息基本循環圖式”的構建:
圖式中各元素含義分別是:W表示人們認識和改造的對象;K’[S]表示社會/他人的主觀/客觀的知識結構;K[S]表示個人/團體的知識結構;I表示個人/團體從社會實踐活動中得到的信息;而K[S+S]則表示吸收I后形成的新的知識結構;“+”表示作用與聯系。
這一“信息基本循環圖式”的提出,不僅具有較為完善的哲學基礎和情報學理論基礎,而且為研究人員對信息計量學邏輯起點的認知與理解以及規范、定義、預測信息計量學的研究內容、研究方法、發展方向、學科增長點等提供了較為有效的觀察視角。此外,該信息基本循環圖式對于形成信息計量學更加多元化的研究范式也很具啟發性。例如,可據此分別從傳播學、認知科學、經濟學、決策學等不同視角展開相應的研究工作。
3 研究方法/工具的集成與創新
在長期的發展過程中,信息計量學逐漸建立了三大核心研究方法:指標計量法、引文分析法和數學模型法。其中,指標計量法簡單實用,通過統計某一項或多項指標的數量(累積)值,經數學處理后即可得出不同指標值的關系或指標值的頻率、時間等分布規律;引文分析法形成于20世紀50年代,它通過對科學文獻之間存在的引用與被引用現象的分析來揭示文獻集合的數量特征和內在規律,是信息計量學獨有的高效研究方法;而數學模型法則是現代科學的核心方法,并成為研究各種復雜系統和社會問題的關鍵性方法。在信息計量學中,對“布-齊-洛分布”問題已基于數學模型法取得了一系列重要研究成果,包括:西蒙的斜分布函數組(1955年);普賴斯的累積優勢分布(1976年);布魯克斯的混合泊松模型(1977年);西切爾的通用逆高斯-泊松分布模型(1982年);巴瑞爾的貝塔-負二項分布(1988年);布克斯坦的經驗負冪分布(1990年)
等。它們對于完善信息計量學的理論基礎,有效解釋、預測文獻流、信息流的變化及相關現象均具有重要的理論意義。
進入新世紀以來,信息計量學在研究方法和研究工具方面不斷取得新的進展,以下主要從4個方面進行說明。
3.1對傳統研究方法的綜合與集成
不可否認,每一種研究方法都有自身的優缺點。以引文分析法為例,由于文獻引用具有一定的滯后性,通過文獻之間的共引關系來研究、分析學科發展的前沿與熱點問題時,結果很可能會有所遺漏;而隨著作者合著現象的日益普及,只針對第一作者進行作者共引分析,研究結論的失真程度也將會日益嚴重。因此,在近期所進行的文獻引文分析研究中,研究人員已越來越多地考慮將多種不同的引文分析方法加以綜合利用,例如把共引分析和文獻耦合分析、共詞聚類、詞頻統計等方法結合起來;或者同時運用第一作者共引分析和全作者共引分析等。
由于不同方法之間的較強互補性以及不同方法形成結果的可比較性,多種方法的綜合運用和集成可以得到更準確可靠的研究結果。調查發現,國內外近年來進行的引文分析研究中,基于不同引文分析指標、集成多種不同引文分析方法的文獻占據了大多數,引文分析已進入了一個具有更大規模和復雜性的研究階段。
3.2社會網絡分析方法的引進
社會網絡分析(SNA)是20世紀70年代以來在社會學、心理學、人類學、數學、通信科學等領域逐步發展起來的一個新的研究分支。作為一種新的方法論和研究范式,SNA主要使用社群圖、矩陣等形式化表達工具和所定義的中心性、權力指數、聚類簇/派系、網絡結構、社會角色等基本概念(或指標),從整體網絡分析、自我中心網絡分析等不同方向開展研究工作。
目前,信息計量學研究對SNA方法的引進和應用,主要表現在對Web環境下較大范圍內的網站超鏈接的分析與計算上,并與基于傳統引文分析法建立起來的網絡鏈接分析研究模式形成一種對照和互補。概括起來,基于SNA方法開展的主要研究活動有:基于網站之問的超鏈接分析,識別社會系統之間的各種聯系;基于政府組織、非政府組織和私人公司之間網站的超鏈接網絡分析,發現組織間聯合的意向;對某一特殊專題不同類型網站之間的超鏈接追溯,用以理解問題解決過程、辨別社會熱點問題等;基于網站主頁內容、鏈接結構和E-mail成員列表等,預測社會成員之間的聯系等。
SNA方法通常涉及大范圍內社群網絡結構的分析問題,指標計算和數據處理比較復雜,不過相應的軟件工具開發已取得了很多成果。以下是幾個較為重要的社會網絡分析軟件:Pajek、Ucinet、NEGOPY、Sociometryplus、Socio Metrica Suite。它們可在SPSS、SAS等統計分析軟件功能之外提供更多的專項分析功能。例如,Ucinet軟件能夠讀取多種不同形式的數據,可處理32767個網絡節點,同時還能計算各種SNA測度指標值,并能進行凝聚子群和核心一邊緣結構分析等。
3.3可視化工具的廣泛應用
在早期的信息計量學研究工作中,研究人員為了把經過繁雜數據處理后得到的計量分析結果,進行直觀和形象的展示比較重視各種可視化方法(或手段)的運用。MDS散點圖、基于等級聚類的樹狀圖、雷達圖、切諾夫臉(Chernoff-face)等,都是一些比較常見的可視化展示方法。1997年,T.Braun等人就利用一個4維的切諾夫臉,把多維空間的科學計量指標數據(活動指數、吸引指數、平均期望引文率、相對引文率等)用一個由計算機繪制的卡通臉的面部特征表示出來,成功地完成了對1990―1994年間世界科學發展狀況的分析和說明。
各種可視化方法(或工具)充分利用了人類對可視模式快速識別的自然能力,可將人類對信息閱讀、判別和理解等認知負擔轉變為簡單、直觀的視覺感知,對于科學研究工作的重要性日益凸顯。特別是近年來由于問題研究規模和復雜性的日益增長,在對研究結論和成果進行展示、說明時,普遍存在著對各種可視化工具的迫切需求。
當前,各種功能豐富的可視化工具在信息計量學研究中已得到廣泛使用,并漸成趨勢。如Pathfinder、CiteSpace Ⅱ、HistCiteTM、VxInsight等以及Pajek和Uci―net的使用都是比較流行的。
3.4網絡引文分析工具的研制
根據國內學者以Web of Science(WOS)和Google Scholar作為引文分析工具進行的實證研究和結果對照,未來的引文分析研究再單純依賴傳統的WOS等工具,將越來越難以獲得全面、真實的引文數據,并會導致引文分析結果產生日益嚴重的偏差。為此,各種新型的網絡化引文索引工具的編制逐漸被提上了議事日程,以適應e-Science時代引文分析的研究需求。
1998年,第一個網絡引文索引CiteSeer開始研制,并于1999年正式投入使用。作為一個主要面向計算機和信息科學領域學術資源的網絡引文索引與檢索工具,CiteSeer主要基于自動引文索引(ACI)技術編制而成。2004年,Google Scholar也在學術搜索服務中成功引入引文分析方法,并提供功能完善的引文鏈接服務。同年,全球最大規模的文摘和引文數據庫服務系統Elservier’s Scopus正式推出,它涵蓋了由4000余家出版商出版發行的科技、醫學和社會科學方面的15100多種期刊資源,并基于文獻計量學原理開發、整合了豐富的學術計量評價功能,可廣泛服務于科研人員、圖書館員、編輯和審稿人、學術機構管理者等。
伴隨著CiteSeer、Scopus等新型引文分析工具的出現,2004年以來,比較它們和傳統WOS工具之間異同的各類研究活動十分踴躍,而目前多數的研究結論是:它們要完全取代WOS或者作為一種權威性的引文分析工具來使用,都面臨著一定的困難或障礙,例如:收錄范圍的不明確;覆蓋的學術資源領域受限;回溯年代較短;各學科開放獲取運動發展的不平衡;ACI技術與網絡搜索技術的缺陷等。
4 主要應用實踐及進展
信息計量學的傳統應用領域主要涉及文獻管理、學科發展分析與評價、科研管理等,而近年來取得的應用進展則大量集中于網絡環境,以下選取幾個較有影響的網絡應用予以說明。
4.1網絡流量分析
隨著網絡發展及其對社會生活的全面滲透,商業網站為擴大自身影響力,吸引更多網絡廣告客戶和電子商務客戶,都非常注意對自身網站訪問流量進行計量和宣傳。早期,網站通常采用自行統計、網絡流量分析報告的方式,但由于日志文件數據比較容易篡改,廣告客戶常常對網站提供的流量數據心存疑慮。另外,各網站在流量分析過程中所采用的標準、計量指
標和工具等的不同,也使得各網站的流量統計結果之間缺乏可比性。為此,制定網絡流量分析的行業標準和報告規范,并由此提供第三方流量認證服務,成為隨后網絡流量分析的發展主流。
目前,市場上專門提供對網站流量和日志數據計量分析的相關軟件以及流量認證服務的提供商越來越多,如WebTrends Log Analyzer、FlashStats、AcessWatch、OneStatPro和BPA International、Nielsen//NetRatings等。商業化軟件和第三方流量認證服務的推出有效促進并形成了信息計量學的一個網絡化新興應用領域。
4.2核心網站評測
對“核心”問題的研究始終得到信息計量學的高度關注,例如早期對學術期刊、文獻作者、詞頻等分布的集中與離散現象的研究以及由此建立起來的一系列經典定律。進入21世紀以來,對“核心”問題的研究仍在繼續,其中尤以核心網站評測最具代表性。
核心網站評測主要由核心期刊評選活動引發而來。除了全面分析和比較核心期刊與核心網站評選方法的異同外,如何建立合理的核心網站評選程序進而形成關于核心網站評選的理論與方法體系更為重要。2005年,國內學者袁毅經過系統、深入的研究,提出了“發現、過濾、評價、擴展和更新”的核心網站評選基本流程,并對該流程進行了實證研究和分析,初步驗證了其合理性和有效性。
4.3 網絡標簽分布的計量分析
網絡自由分類法出現于2004年,而大量使用則在2005年以后。基于自由分類法原理提供Web2.0服務的眾多新興網站中用戶標簽的使用及數量、頻率等分布狀況逐漸成為網絡信息計量研究的一個熱點領域。
目前,網絡標簽計量分析研究主要以Del.icio.us、Flickr、Connotea、CiteUlike、Bibsonomy等網站作為實例,從中抽取一定時間范圍內的標簽樣本數據,利用統計描述、聚類、共詞分析等方法進行計量分析,試圖揭示、說明自由分類法及其網絡協作標注系統的運行機制、用戶標注行為規律及行為模式以及互聯網環境下新興的長尾分布現象等。已實施的網絡標簽計量分析研究主要有:①標簽、用戶、資源三者之間的關聯分析;②各種標簽的頻率和比例分布分析(包括高頻標簽與低頻標簽、規范詞與非規范詞、拼寫變化等);③標簽共現分析;④標簽詞語集合的規模及增長變化;⑤基于標簽的用戶標注行為和用戶相似性分析等。
5 面臨的問題與挑戰
5.1基本概念缺乏清晰定義,研究內容龐雜,學科邊界模糊
信息計量學的基本計量分析對象應是“信息”,但由于“信息”概念的難以定義,時至今日,實際研究工作中大都是以各種各樣的信息“替身”為計量對象的。另外,信息(尤其是數字信息)所具備的一些特性,例如無窮性、載體依附性、易復制易傳播性、脆弱性等,也為計量分析帶來更多的困難。
“信息基本循環圖式”對信息計量學理論基礎的建立雖然有所貢獻,但也存在著明顯的缺陷,例如對信息計量與知識計量的關系、各組成要素之間具體的聯系與作用方式(即“+”)等都缺乏明確的定義和說明。此外,基于基本循環圖式而形成的眾多不同的研究范式,也會導致信息計量學研究內容的日益龐雜,并使學科邊界相對模糊。如果多元研究范式長期并存不能形成主流(或核心)的研究體系,則有可能使學科研究主題進一步出現被模糊或被淡化的危險。
5.2研究方法有待繼續創新,專用研究工具比較缺乏
雖然目前信息計量學在研究方法、工具和指標設計等方面已取得不少進展,研究視野得到拓展,但對傳統方法的依賴依然較為嚴重,尤其是在新興的網絡鏈接分析方面,引文分析的“烙印”十分明顯,而針對網絡特性所進行的創新和改進遠遠不如繼承的成分更多。繼承之上如何超越正成為信息計量學急需解決的一個方法論難題。
研究工具方面,不論是網絡抽樣、原始數據下載還是網絡鏈接解析與統計,都還缺乏較為有效的專用工具,很多情況下只能依靠搜索引擎來獲取樣本數據,由此造成研究中存在種種偏差。
5.3應用研究活躍,但影響力和應用效果都比較局限
與信息計量學研究中存在的理論基礎薄弱、方法/工具創新不足形成鮮明對照的是當前各種應用研究活動十分活躍。不過,大部分的應用活動不僅研究方法簡單,而且應用效果不確定,難以形成較強的示范效應或者對理論基礎和研究方法的完善形成有益的促進。而影響力較大的少數研究活動則仍較多局限于教育、科研等學術性領域,這與網絡對當今社會的全方位影響、滲透相比,研究思路還顯得過于狹窄。
篇10
關鍵詞:主題詞表;詞頻統計;知識圖譜;研究熱點;研究趨勢
Abstract:Based on word frequency statistics and visualization of knowledge mapping and other methods of comparative analysis and research in two periods of 1980—2003 and 2004—2011, the article shows the areas of research focus and trends of Thesaurus in China. That is: there is a clear dividing line in two periods, and trends show that the evolution process of knowledge organization system, Thesaurus based on semantic description language ontology conversion is currently a focus of academic research and future research trends.
Keywords:Thesaurus; Word Frequency Statistics;Knowledge Mapping;Research Focus;Research Trends
1 引言
主題詞表(敘詞表)是一種情報檢索語言,它在早期情報檢索和知識組織中發揮著非常重要的作用。早在1876年,美國圖書館學家卡特發表了他的《字典式目錄條例》 [1]。而隨著計算機技術的發展,主題詞表的功能也發生了相應的變化。另外,不斷更新的網絡技術,以及語義網等概念的技術實現,也為主題詞表的發展注入了活力。
國內主題詞表研究雖然起步較晚,但從《漢語主題詞表》的問世,到《中國分類主題詞表》的出版,均取得了卓越的成就。國內的研究主要集中在主題詞表的介紹、評價、編制、修訂、標引方法、應用及分類主題一體化等領域[2][3][4],另外,隨著計算機網絡技術的發展,各類詞表被大量應用到了信息檢索技術、知識組織與管理等領域之中[5][6]。
那么,這些年來國內對主題詞表的研究都觸及了哪些主題?其研究的趨勢和熱點又在哪里?本文試圖通過對發表在期刊上的學術論文進行研究,旨在為該領域同行了解和掌握研究方向提供些許幫助。
2 樣本獲取與研究方法
2.1 樣本獲取方法。本文獲取數據樣本的方法是:在 “中國學術期刊網絡出版總庫”中,用關鍵詞“主題詞表 OR 敘詞表”,檢索出1980年~2011年間發表在“核心期刊”上的論文,因為《中文核心期刊要目總覽》第一版在1992年才出版,上述檢索結果僅命中了1992年~2011年數據;因此,作者又補充了1980年~1991年的相關主題數據。經過人工篩選,最后,獲得樣本數為480篇(檢索日期:2012年2月12日)。
2.2 研究方法。本文主要應用文獻計量學領域的詞頻統計方法和基于共詞的可視化知識圖譜方法。
通過關鍵詞詞頻的動態統計與分析,可以反映出某時間段內研究主題的動態變化過程,如高頻關鍵詞的發展期、高峰期及衰退期等。詞共現(共詞)分析方法最早是在1986年由法國文獻計量學家M.Callon等學者提出的[7]。在詞共現分析方法的基礎之上,我們可以運用社會網絡分析方法及軟件(如Pajek),繪制出各主題之間的相互聯系的學科知識圖譜。
3 研究結果
3.1 歷年情況
對480篇論文進行按年度統計,見圖1。由圖1可以發現,論文數量基本上呈上升趨勢:1980年~2003年為緩慢上升階段,但1994年和1999年均有突出表現;2003年以后,呈現出了快速發展的態勢。究其原因,一方面,隨著計算機技術的發展,出現了諸如本體等語義網概念的應用研究,使得主題詞表研究重新得到了重視;另一方面,有關主題詞表的研究得到了更多的基金資助,2004年以前,僅有8篇資助論文,而2004年及以后,資助論文達113篇,尤其是近兩年,基金資助論文比例均達50%以上。