職稱報告的技術修正
時間:2022-08-15 03:54:16
導語:職稱報告的技術修正一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。
2011年浙江省率先在職稱評定方面新增了參評文章的學術不端檢測要求,并規定一般由該市較權威的高校圖書館負責第三方檢測。[1]檢測系統為以北大方正開發的cnki學術不端檢測系統,擁有幾個端口,分類依據為文章類型:學位論文抄襲檢測系統、科技期刊抄襲檢測系統、社科期刊抄襲檢測系統、大學生論文抄襲檢測系統等。[2]現在檢測系統還專門開發了一個全新的端口———“已發”,目前是收費端口,只有被cnki審核通過的機構才有權進行已發,用這個通行證嚴控職稱者的檢測權,以保證檢測的公平合理性。從上面的介紹可以看出來,學術不端檢測系統既可以按照學科進行分類,也可以按照論文是否發表分為已發系統和未發系統。
一、職稱系統的檢測原理
將待評審的職稱論文進行學術不端檢測是cnki學術不端檢測系統的一大新應用,其檢測原理是和未發系統的原理相同,只是檢測手段稍有不同。
(一)檢測原理———“文字比對”20世紀90年代后,隨著互聯網技術的發展,信息內容迅速增多,復制粘貼變得越來越容易與普遍。文本復制(抄襲)是學術不端文獻的重要特征。隨著內容管理與版權保護的需要,文本復制的檢測研究也得到進一步發展,陸續提出數字指紋、VSM等檢測方法。[3]筆者通過對檢測原理的深入研究發現,目前國內外的學術不端檢測系統都是以“文字比對”———提供文字復制比率為基本原理,也就是說出現了初級的文本復制類型的抄襲,系統可以輕易地識別。以這種“文字比對”為識別基礎的學術不端檢測系統采用的是“外形”對比以及針對文字、字母與數字的排列組合進行形式上的比對,如果被比對的兩段文字的句式、用詞、排列順序相同,就可以被檢測出來。但如果是意義抄襲就比較隱蔽,系統基本無法檢測出來。
(二)檢測手段的改進將一篇待檢測的職稱論文放在未發系統中會發現全篇皆紅,系統會提示這篇論文和該作者的已發表的論文重復率為100%,也就是說未發系統是沒有辦法對已經發表的論文進行檢測的,主要是因為該系統缺少一個時間模塊判定功能,即自動刪除該文章發表時間以及以后的“相似”論文。基于此,已發系統特別設置了時間功能,并要求委托人提供論文的發表時間。據此時間,去除了發表時間在所測時間之后(含發表時間在同一天)的“相似”論文,最終獲得由系統自動生成的“文字復制比”結論。這個結論雖然不包含所測時間之后(含發表時間在同一天)的抄襲結果判定報告,但是對該文章發表之前,它是否存在抄襲的現象是可以檢測的,這部分的功能和未發系統是一致的,所以我們可以適當借用未發系統部分適用的研究成果來探討對檢測結果的判斷。
二、抄襲判斷的量化指標
由上面的分析可知,檢測方只負責提供第三方檢測報告,真正使用報告的是各校的負責職稱評定的人事部門,到目前為止,筆者尚未見到各人事部門有關于對檢測系統結果統一、公開的量化標準。因此我們可以借用較為通行的未發論文的量的檢測標準,這個畢竟是通過大量的檢測最終被實踐證明的較為合理的標準。通常情況下,對于待發來說,各期刊社和圖書出版社根據自己的具體情況有不同的規定。有的編輯部認為,論文中超過10%的重復率即視為抄襲,而有的編輯部規定“雷同比例達20%為抄襲”,還有的放寬到了30%,對有爭議的結果大部分都采取個別處理的方式,沒有制定出可以適用的行業標準,基本上各編輯部根據投稿論文的平均水平制定適合本部門的比例。對于學位來說,高校將這個重合比的限度定為25%-30%。若檢測發現超過這個比率,論文就會被提交至該校學術委員會來判定是否存在抄襲行為。[4]例如中南大學為了保證檢測結果的公正性,會將檢測結果公示,對有異議的結果和超出規定值的結果,組成相應學科的專家評議組,對檢測系統所得出結果做進一步的分析和審議。[5]總體來說,使用機構對檢測結果判定方面較為通行的數字方面的標準為,“一篇論文與數據庫的文字重合率大于或等于10%,屬于句子抄襲;30%到50%之間屬于段落抄襲;50%以上則被判斷為整體抄襲。”[6]綜上所述,這個可以借用的標準看似操作簡單方便,標準明確,但實際還有一些值得探討的部分,如果不具體問題辯證分析,只是以最終檢測數據為唯一判斷文章是否抄襲的標準,恐怕是有失公允,特別對像職稱評定這樣對人生有重大意義的事情,還需慎重,當然人事部門還有一個專家評議環節,但是對部分可能面臨在前面關卡就被槍斃的稿件存在一定的不公平。在筆者長期的檢測工作中,發現即便檢測者并不了解一篇檢測文章是否抄襲,用筆者總結出來的一些經驗仍然可以對結果進行科學修正,但首要條件是搞清楚影響已發結果存在哪些因素。
三、影響職稱結果的因素
(一)提供的待檢測文檔的類型及出處Cnki期刊學術不端文獻檢測系統目前以“中國學術期刊網絡出版總庫”為全文比對數據庫,當前,可對DOC、TXT、CAJ、KDH、NH、PDF等多種格式的文件進行比對,從詞、句子到段落等方面,可檢測抄襲、偽造、一稿多投、篡改、不正當署名、一個成果多篇發表等多種學術不端行為。[6]同時,職稱評審文件中規定:優先從圖書館“中國知網CNKI數據庫”中下載CAJ或PDF格式電子版論文(專著、譯著、教材及外文刊物上發表的論文除外)。如未在該數據庫中檢索到提交論文,可以從圖書館其他數據庫中繼續查找并下載PDF格式電子版論文,如仍然沒有,方可提供WORD文檔。提交論文原件和完整論文的電子版(須PDF格式,著作、教材除外)。[7]經過筆者的了解,在實際操作中,也是按照這個文件的規定做的,待檢測文獻的電子文檔,并沒有一定要求使用PDF格式,只要提供的電子文檔能夠正常地從中復制出文本來,PDF、DOC、CAJ(及其系列文檔類型)、RTF及DOCX都可以。首先是從cnki學術網絡中下載,可是受技術水平的限制,很多早期的文章是以PDF照片———圖片的形式存在的,不能復制文本,還有部分編輯部提供的原稿采用了密碼或版權保護也不能復制,另外一種情況是由于編輯部新發論文上網需要一定周期,新發論文也沒有原始文檔,只能向送檢人索要編輯部的修改文檔,當然,非cnki下載所得的文檔,所有的文檔類型要在檢測匯總表中予以說明。由以上的復雜情況來看,不同類型、不同情況下提供的電子文檔,在檢測中會出現檢測比例的不同。如一位研究者反映,他在《航空學報》個人比對庫中的一篇文章(.doc格式,為作者提交的錄用定稿)已經在中國期刊網上(具體采用的比對文件格式未知),新提交的一篇稿件被檢測出與這2篇文章有文字重合的問題,但檢測結果中該稿與個人對比庫中的稿件間的文字復制比為46%,而與同一篇文章在中國期刊網中的版本的文字復制比為26%,不同的格式竟然造成檢測結果間20個百分點的差別。[8]可見不同的文檔形式會對檢測結果產生較大的影響,這種現象需被重視。
(二)第三方檢測模式毋庸置疑,檢測系統在程序上是非常容易操作的,但任何一種程序設計都會存在一些設計沒有考慮周全的部分和現有的技術水平和使用條件無法達到的要求。檢測方式是圖書館的第三方檢測,由于學科的限制,檢測者對文章水平沒有直觀感受只能信賴軟件,以系統檢測結果出一份報告。一般來說,檢測者不會對檢測結果的百分比多少做一個結論,只是提交結果,評價者是由職稱管理部門和專家來確定的。當然學術不端檢測系統是一個初步的檢測,后期還有專家評議一個環節來判斷文章的優劣。但是對于一些處于臨界值的稿件,如果只是看到其檢測結果超標就進行清退對被檢測者是不公平的,因為它已經沒有資格進入下一道環節了。第三方檢測者只是在出具匯總報告時添加的一個說明文字,提示一些具體情況,筆者認為可以使用一些可以共通的原則,對檢測結果要出具更具體的修正報告,包括剔除系統誤判的部分和系統未發現問題的部分,為參評者提供公正的服務。
四、對職稱報告的修正
要制定可以通用再研判的標準,首先要搞清楚“文字復制比”與“文字抄襲率”的關系,我們通常看到的學術不端檢測系統提供的是“文字復制比”,但它絕對不等于“文字抄襲率”。“文字復制比”是系統提供的有抄襲嫌疑的地方,“文字抄襲率”是我們已經定性的抄襲的文章的比例,兩者性質是截然不同的。[9]基于此,筆者認為真正的文章抄襲率應該如下修正:文章抄襲率=文字復制比—系統誤判+系統漏判這里,“文字復制比”是系統提供的百分比,“系統誤判”是指雖然被系統檢測出來有抄襲的嫌疑,但并不能算作抄襲的部分,“系統漏判”是指雖然系統沒有檢測出來,但是存在隱性抄襲的部分。
(一)減掉系統誤判的抄襲率
1.系統收錄不全。所有的檢測系統只默認首次在文獻庫中出現的文章為原創,在其以后提交的論文中出現了相同的文字并且沒有標注出的,即被認定為抄襲,如果2位作者一先一后引用了如書籍、引用較早論文、引用未被系統收錄的論文中的部位文字,后引用者一定會被系統認定抄襲,這種情況導致的抄襲率在出具的報告中建議適當減掉,否則有失公允。
2.作者誤引了抄襲文字,必要時通知作者申訴。對這點,職稱檢測政策中規定了“論文中有明確注明為引自其他論文中的內容,不計入”。雖然注意到了這種情況,但統統減掉還會有漏網之魚的嫌疑,在后面會具體討論。
3.按目前政策,下列特殊情況可免于計入相似比中:[10](1)與本人數據庫中的同一文章相似的,不計入。這種情況也存在,有時系統對同一篇文章會多次錄入,對這個原因導致的相似比應剔除。(2)與本人碩士、博士畢業論文中相似的,不計入。博士、碩士論文雖然被收錄到了cnki文獻庫中,但是并不屬于印刷及公開發表的文章,對這個原因導致的相似比應剔除。(3)與本人后,他人引用本人論文中的內容,不計入。(4)論文中有明確注明為引自其他論文中的內容,不計入。(5)送檢論文中的同一段文字內容,和其他多篇文章相似的,則該段文字造成的相似比,按一次計入,不重復累加。以上幾種條款起到了保駕護航的作用都應該在檢測報告中適當刪減,但也有一些情況雖然沒有被系統檢測出,但一旦被查到是要嚴厲指出的。
(二)增補系統漏判的抄襲率:設定各種抄襲情況的權重系數有的文章雖然檢測的抄襲率很低,但是文章若存在以下一些狀況,應適當建議增補權重系數一項,具體為:
1.有對句義、觀點、主題抄襲現象,無個人觀點,及對外文文獻套改翻譯抄襲等。這種抄襲手段隱蔽,比較難發現,性質也比較惡劣,對此,可以增加公示環節,以增強被檢測者間互相監督,更有利于發現比較隱蔽的抄襲,一旦發現并查實,在所出具的報告中應明確指出:對檢測結果乘以適度的權重系數,以增加其抄襲率。
2.有對圖表、實驗方法抄襲現象,情節嚴重的。對于這點,曾有研究者指出檢測系統對于含數學公式的PDF、WORD格式的文件具有一定的局限性,檢測效果不理想。就目前檢測的情況來看,對含公式、圖表較多的論文,該系統的作用仍然存在很大的局限性[11-12],所出具的報告中應明確指出對這類型的文檔建議另請專家評審。
3.論文中有明確注明為引自其他論文中的內容,不計入,在實際的檢測過程中會發現有的作者明明沒有引用,也亂標參考文獻引用以顯示所看論文數量較多,對這種情況,發現了一定要在檢測報告中明確指出。
4.文章的后部重合度(ER)項較高,即在文章中的“解決問題”部分和文章的核心句子部分抄襲率較高,但全文抄襲率較低。這種情況應視情況加一個權重系數,拉高全文的抄襲率,因為文章核心部分的抄襲性質比較嚴重。這一定要在出具的檢測報告中明確指出。Cnki檢測系統是智能很強的系統,能幫助檢測者高效檢測稿件,但是,稿件的情況非常復雜,應該具體情況具體分析,對檢測所出具的報告一定要慎重,準確判斷報告中哪些是依據原則要減掉的系統誤判百分比,哪些是要增加或建議加重權重的抄襲率,建議有關部門盡快做出統一的標準供檢測者操作。另外對檢測結果要實行公示制度和作者申辯制度,有利于發現比較隱蔽的抄襲,以做到對檢測結果的完全的公正和客觀。
- 上一篇:信息產業職稱制度變革
- 下一篇:衛生專業人員職稱申報建議