大數據下科技期刊知識服務成效與發展

時間:2022-11-11 09:48:15

導語:大數據下科技期刊知識服務成效與發展一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

大數據下科技期刊知識服務成效與發展

[摘要]以大數據為代表的信息技術是當前我國科技期刊高質量發展的新機遇,通過技術賦能推動產業變革是科技期刊轉型升級和實現知識服務功能的關鍵。文章從平臺搭建、技術手段、知識服務產品三個方面總結大數據背景下科技期刊知識服務的實踐與成效,分析科技期刊在科技、社會、人文環境下的發展機遇,探究大數據背景下科技期刊知識服務的發展趨勢,并提出發展建議。

[關鍵詞]大數據;科技期刊;知識服務;實踐成效;發展趨勢

大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,其作為一切信息、資訊、資料的基礎,與移動互聯網、云計算、人工智能、物聯網、VR/AR等技術相結合,使不同學科和領域在整理、獲取、儲存、傳遞、分析和共享方面得到了質的飛躍,推動了科技期刊進入信息資源兼具海量性與即時性、功能實現兼具智能性與互動性、服務范疇兼具多樣性與開放性的智媒出版階段[1]。為此,學者們就科技期刊大數據的應用意義[2-4]、應用需求[5]、應用模式[6-7]以及實現路徑[8]等方面進行了探討,認為大數據可以更快地挖掘科研工作者的前沿研究價值,通過更精準的用戶畫像和廣泛的協作物理空間,為科研工作者提供更好的決策支持[9],也指出大數據應用還存在有效數據獲取、元數據分析模式建立、平臺數據對接、版權數據安全等方面的實施難點[10],但大數據的發展應用無疑有助于推進科技期刊核心資源建設,加速出版流程再造[2,9],從而實現出版業由內容服務向知識服務轉型[11],使知識資源的數量和形式更加豐富,處理復雜程度更高,知識服務形式更個性化,知識服務盈利模式更有效[6]。近年來,知識服務已成為科技期刊轉型升級的重要內容,也是海量學術資源環境下廣大期刊用戶的切實需要。因此,文章在分析大數據背景下我國科技期刊知識服務的實踐與成效的基礎上,探討以大數據技術為支撐的科技期刊知識服務的發展機遇與未來趨勢,并提出發展建議。

一、大數據背景下科技期刊知識服務的實踐與成效

我國科技期刊知識服務的發展起步較晚,存在知識服務的理念發展超前于知識服務實踐進程的困局[12],但知識服務發展將向“信息—知識—智能”邁進,知識服務只有通過“數據+算法”,才能實現作者、內容、讀者三方的高效匹配,這已然成為業界的廣泛共識。自2015年國家新聞出版行政主管部門啟動全國知識服務模式試點工作以來,國內科技期刊積極整合資源技術,在平臺、技術、應用等方面展開部署,并在試點示范、技術支持、科研支撐、標準研制等方面取得了卓有成效的業績[13]。

(一)平臺搭建

1.科技期刊牽頭的知識資源服務平臺科技期刊牽頭的知識資源服務平臺根據參與期刊主體數量、規模的不同可分為單刊知識資源服務平臺和學科刊群知識資源服務平臺。一般而言,單刊知識資源服務平臺通常存在知識內容領域單一、規模數據儲備量小、更新緩慢以及運營薄弱等問題[14];而學科刊群知識資源服務平臺由于數據資源儲備更加豐富、建設資金更加充足,能更好地實現個性化、定制化、專業化的深層次知識產品服務。但總體來看,科技期刊牽頭的知識資源服務平臺出版流程業務數據更豐富,極易融入科研創新環境,能夠動態、連續、精準地為科研生產全流程提供知識服務[15]。具體來看,第一,在數據資源上,數據采集是大數據應用的基點。科技期刊牽頭的知識資源服務平臺除了具有期刊的數字化文獻資源數據,還擁有圖表、音頻、視頻、試驗數據等相關科研內容數據,以及期刊在長期經營活動中積累的選題數據、用戶信息數據、生產流程數據、用戶反饋數據等業務數據,為拓展知識服務業態儲備了更豐富的底層數據[16]。第二,在平臺架構上,平臺架構通常包括網站PC端和移動端。其中微信公眾平臺是大多數單刊知識服務選擇的應用平臺,也有部分單刊知識服務選擇微博、抖音等應用平臺,而運營成本投入相對更大的移動客戶端App則常見于學科刊群知識服務。第三,在平臺功能上,針對大數據應用特點,科技期刊牽頭的知識資源服務平臺進一步強化了多端協同、用戶行為分析與社交功能,從而可實現在內容生產環節上作者、讀者、審稿人、編輯的多元主體協同和知識傳播環節的精準關聯、檢索與分發,以及基于用戶個性化需求的產品業態拓展。例如,中華醫學會雜志社打造的中華醫學期刊網,提供中華醫學期刊全文數據庫、中國臨床案例成果數據庫、優秀科研成果優先出版平臺等多樣化的服務。2.數據庫牽頭的知識資源服務平臺數據庫牽頭的知識資源服務平臺可分為兩類:一是以中國知網、萬方數據、維普資訊為代表的綜合性專業文獻內容服務商,二是高校、企事業單位、國家公共服務單位所轄的知識資源服務平臺,如人大復印報刊資料數據庫的“壹學者”學術科研一站式移動服務平臺、中宣部主管的國家知識資源服務中心。相比科技期刊牽頭的知識資源服務平臺,數據庫牽頭的知識資源服務平臺在數字資源與技術應用上具有更深厚的積累,面向的用戶群體更為多元,知識服務內容也更加豐富。具體來看:第一,在數據資源上,由于更早開展數字化文獻信息服務,因此數據庫牽頭的知識資源服務平臺擁有更完備的結構化、碎片化數據以及個人、機構用戶的消費業務數據;第二,在平臺架構上,數據庫牽頭的知識資源服務平臺更傾向于選擇自主研發的網站PC端及移動客戶端App;第三,在平臺功能上,除了全方位、便捷的知識信息供給,數據庫牽頭的知識資源服務平臺更注重面向機構用戶,提供科研創新、科研評價及知識解決方案。例如,中國知網的平臺架構包含知網研學平臺、大數據研究平臺、協同研究平臺和在線教學服務平臺等內容。

(二)技術手段

1.數據挖掘及倉儲技術隨著海量科研數據被結構化處理為XML存儲形式,人工智能技術在知識服務領域的應用不斷深入,學術搜索從模塊量化比對進入基于大數據、深度學習的文獻科學統計分析階段,可通過用戶行為分析,智能比對預測學術熱點趨勢,為相關人員推送合適的搜索結果,例如,《西安交通大學學報》采用清華大學AMiner智能期刊服務來監控文獻推送成效,構建專家畫像和知識圖譜[17-18]。在數據倉儲方面,云存儲技術已成為主要手段。云存儲技術通過分布式信息存儲系統實現數據信息的大容量整合、更新、共享,極大地提升了數據庫的穩定性和利用率,節約了運行成本,為科技期刊開展知識脈絡分析、學術統計分析、學術不端監測、用戶行為分析、產品優化設計提供了穩定的數據基礎,并主要依靠中國知網、萬方數據、維普資訊等期刊出版平臺以及SciCloud、ScholarOne、北京瑪格泰克、北京仁和匯智等技術服務商進行部署[19]和技術實現。2.數據管理技術目前,基于語義出版技術的數據分析與處理已被眾多數據庫與科技期刊編輯部所采用,語義出版可實現文獻數據的結構化處理、建立專業化本體庫、開啟更多樣的應用接口,從而實現數據管理的內容結構化、數據融合化、信息可視化和對象關聯化[20]。在應用上,科技期刊牽頭的知識資源服務平臺更多的是依靠北京瑪格泰克、北京仁和匯智等技術服務商來實現結構化XML元數據管理與富媒體網頁制作等,如《作物學報》的RichHtml發布[21]、《自動化學報》知識服務系統所呈現的知識路徑、知識拓撲、作者拓撲等功能[22];各大數據庫牽頭的知識資源服務平臺則在文獻元數據組織、分析、關聯,形成知識服務產品方面做得更為出色[23],如中國知網提供的數據論文、增強論文等論文出版服務[24],以及基于語義分析技術與內容信息指紋技術的科研誠信管理系統等[25]。3.出版流程優化技術在用戶體驗上,各科技期刊也做了嘗試和創新。例如,在產品生產階段,《中國科技期刊研究》通過ORCID系統驗證了科研人員單位、項目、論文、同行評議等學術活動信息,增強了作者和審稿人信息的可靠性,有效規避了署名學術不端行為;《福建農業學報》應用北京仁和匯智的XML在線數字生產云平臺可滿足文獻出版階段作者、編輯、審稿人三方協同修訂以及生產進度的多方同步[26],實現出版流程的智能化、協同化。在產品呈現形式上,各科技期刊也主動應用音頻、視頻、動畫、AR、VR等技術來提供更直觀的信息。例如,上海大學期刊社的14本期刊共同搭建的移動出版平臺對以上技術進行了集成應用[27];《航空知識》應用VR技術進行信息傳播,為用戶提供沉浸式的知識體驗[28]。在產品反饋上,各科技期刊還利用新媒體和實時通訊技術打造以科技期刊為中心的網站、微信、視頻號、今日頭條號、抖音、微博、QQ社群、微信社群等社交信息矩陣,提供交互式支持服務,及時滿足用戶需求。

(三)知識服務產品

國內科技期刊的知識服務產品除了具有知識檢索、知識拓撲、知識關聯等知識信息服務和熱點推送、趨勢分析、學術評價、知識本體等知識發現服務,還推出極具個性化的微社交服務和知識解決工具、方案,主要包括以下幾類。第一,數字決策分析工具,即以科技期刊長期積累的專業技術文章和由審稿人、讀者組成的專業技術人員智庫為依托,以直接解決專業技術問題為目的的決策分析工具。例如,北京卓眾出版有限公司的《汽車與駕駛維修》OTO應用服務平臺“修車幫”,提供維修技能知識資源和專業人員在線問答服務。第二,技能與素養提升服務,即科技期刊發揮知識資源儲備和品牌影響力、公信力提供技能素養等教育類的知識服務。例如,《金屬加工》的“金粉講堂”在線課程學習平臺、《現代農藥》的“農化學院”系列農藥品質提升系列培訓課程、《中國海洋大學學報(自然科學版)》的寫作指導等。第三,學術支持與科研服務,即深入科研創新過程,為從成果孵化到產出過程提供相應的信息對接和問題解決的知識工具與服務。例如,《航空學報》與企業聯合,以產學研論壇的形式推動企業與人才的精準匹配[29];《中國艦船研究》提供的項目立項與申報服務[30];人大復印報刊資料數據庫“壹學者”學術科研一站式移動服務平臺提供課題立項助手、會議服務、著作出版、隨手筆記等學術科研工具[31];《浙江大學學報(英文版)》微信公眾號提供英文潤色服務[32]等。第四,社交與知識分享服務,即充分發揮科技期刊橋梁作用,打破讀者、作者、審稿人等不同學者群體間的交流壁壘,滿足用戶知識分享的需要。例如,人大復印報刊資料數據庫“壹學者”學術科研一站式移動服務平臺提供實名學者圈、“壹學者”互動社區等社交工具[31]。第五,商業拓展服務,即通過對接其他相關產業,拓展知識服務業態,提供更豐富的知識服務產品。例如,重慶課堂內外雜志社推出游學研學、活動大賽等教學教研方案;《中國果樹》提供助農直播微店服務等。

二、大數據背景下科技期刊知識服務的發展機遇與未來趨勢

(一)大數據背景下科技期刊知識服務的發展機遇

1.科技環境當前,科技的飛速發展推動出版實踐進入智慧出版階段,出版功能由知識傳播向知識服務轉變。一方面,“數據”將會成為科技期刊未來競爭的核心資源,科技期刊可通過“數據+算法”為用戶高效匹配更具實用性、適用性的服務,解決用戶難以獲得有價值信息的問題[12]。另一方面,智慧技術的應用和產業融合將成為科技期刊知識服務的核心要義。基于人工智能滲透于選題策劃、內容生產、精準營銷等方面,各類智能型產品已覆蓋知識服務全流程,科技期刊知識服務與其他產業間聚合也不斷深入,從數據平臺到評價指標、管理工具、教育服務、學術支持都在不斷革新[33]。2.社會環境如今,隨著5G技術、物聯網技術以及智能終端等持續發展,社會正步入智能體時代,呈現對知識的渴求和對技術創新的積極響應,特別是2020年新冠肺炎疫情暴發以來,知識與多種媒體、產品相融合,知識付費經濟模式被人們廣為接受,人與人、人與物、物與物通過互聯網技術連接在一起,實現數據的實時流動與全域分析。知識將以數據的形式直接解決問題,與人們的生活更加密不可分。3.人文環境在大數據環境下,科學數據資源已成為國家和企業實現科技創新的重要資產,成為促進數字經濟的重要生產要素,且隨著交叉學科的不斷發展和移動智能設備的普及,科學研究也越來越依賴系統、高可信度的基礎數據分析,社會公眾也對獲取高質量的科學數據提出更高要求,對科學數據的發布渠道、發布頻率、表現形式更加敏感[34]。自20世紀90年代起,各國相繼加強部署科學數據共享服務,隨著開放科學不斷深入和開放獲取科技期刊數量不斷增加,基于大數據的科學數據共享模式和基于問題解決的數據深度分析與應用的知識服務模式成為未來科學數據資源應用的必然。

(二)大數據背景下科技期刊知識服務的未來趨勢

1.數據信息容量持續擴增隨著大數據技術發展及其在科技期刊出版行業中的應用,科技期刊知識服務的數據信息容量持續擴增,具體體現在:第一,數據來源顯著擴充,既包含科技期刊數字出版的文獻資料信息,也包含科技期刊紙媒時代的文獻信息,還包含科技期刊出版活動相關的一系列物聯網信息;第二,數據結構類型多樣化,更多更復雜的數據結構類型被處理,如結構化數據、半結構化數據及非結構化數據等,可大大增加原有數據囊括的類型;第三,數據增長速度快,圍繞科技期刊數字出版平臺的廣泛搭載產生的出版活動、科研交流、研究開發數據能夠通過多種終端、平臺被實時記錄、保存和精細劃分。2.數據處理能力顯著提升隨著數據傳輸、存儲、處理技術(算法)的發展以及行業標準的完善,科技期刊知識服務的數據處理能力將顯著提升,主要表現在:第一,5G技術廣泛應用于數據高速處理,大量的非結構化數據也得以深度應用,進一步擴展知識服務的價值空間;第二,科技期刊出版平臺和技術服務商把對象和文件存儲技術、離線計算、流式及實時計算、分布式協調服務、集群管理與監控等存儲技術與各類數據管理工具應用于數據處理,有效提高數據處理時效;第三,算法發展與出版行業數據的結構特點將進一步獲得匹配,有利于在較短時間內充分挖掘和應用數據價值。3.需求匹配更加智能豐富隨著交叉學科的不斷發展,科技期刊用戶對知識服務的訴求更加精準,要求能直接、具體地解決實際問題或給出明確建議[29]。而大數據的精準性、預測性和智能性,既能滿足用戶這一需求,又能借助人工智能的自我學習與分析能力,精準預判用戶需求,搶先提供相應服務,具體體現在:第一,更加精準的數據輸出能力,如通過信息數據挖掘和分析技術進行用戶畫像分析,通過區塊鏈和知識標引技術建立用戶細分篩選機制,通過代幣發行和分配獎勵機制形成去中心化的全鏈區域傳播;第二,更加多樣的數據輸出方式,如通過群體智能算法提供個性化、定制化的知識解決方案,依靠LBS、VR、AR等技術建立對象化、可視化的立體輸出渠道,提升用戶體驗[31]。4.應用場景更加移動多元學術信息資源數字化的深度發展將使用戶更加依賴網絡。同時,以云傳輸為基礎、以AI智能為核心的智能體系統正逐步應用于城市建設。未來,通過全域感知、物聯網、云計算、人工智能和機器學習等技術的綜合應用,數據信息將直接嵌入用戶生活的實際場景,以數據分析、知識化處理解決用戶在生活中的實際問題。科技期刊知識服務將從與移動通信設備的媒體融合跨越到與其他產業深度融合的新模式、新業態,形成主動預見、預測控制、有效應對的智能化、高效化的精準場景定制化服務產品[35]。

三、大數據背景下科技期刊知識服務的發展建議

(一)重視數據資源分類積累與應用

科技期刊作為傳統出版資源提供商,要憑借自身的專業性規避信息資源具有的數據價值密度低、數據可靠性弱的不足,重視數據資源的分類積累與應用,提供更加真實、可靠、有效的信息資源。第一,擴大數據資源體系,多維度豐富基礎數據。基于原有數據資源體系,科技期刊知識服務應進一步挖掘和轉化科技期刊隱性資源,細分整理顯性資源,重新梳理基礎數據,將其擴展為內容數據,包括期刊論文以及論文涉及的科研數據、圖表、音視頻等相關附件,“兩微一端”的刊載信息,出版物元數據(ISBN、ISSN等),期刊的裝幀設計信息;發行數據包括期刊銷售量、銷售額、庫存、印刷數據等;網絡傳播數據包括“兩微一端”的頁面瀏覽量、獨立用戶數、訪問次數、下載率等;第三方平臺的用戶行為數據、消費數據、社交數據等。第二,加強數據質量控制,建設高質量基礎數據庫。科技期刊知識服務應建立以AI及大數據技術為核心的數據處理平臺,充分利用智能工具,統一元數據標準和元數據模型,提高多源異構數據的采集、匯聚、融合[36]。第三,優化數據處理流程,構建科學高效的數據管理體系。科技期刊知識服務應逐步構建覆蓋數據生態全生命周期的數據治理體系,實現數據收集、清洗、整理、分析的可視化監控,實現分階段的數據標準化控制與管理。

(二)推進構建知識服務技術創新體系

技術領先決定了科技期刊知識服務在全面競爭生態系統中的主導優勢。因此,科技期刊知識服務應積極推進構建全域化知識服務技術創新體系,提高知識的傳播速度。第一,各級政府、科協應加強頂層設計,通過資金激勵、共建共享等多種機制,鼓勵技術企業及數據庫、期刊聯盟等深化大數據應用技術研發,優化底層基礎數據收割、清洗、集成、標引與融匯技術,重點實現數據處理技術(算法)的突破和升級。第二,各科技期刊應積極從期刊集群、大型出版商、數據資源服務商、技術服務商等引入新技術,通過申請財政補貼、共擔成本、項目合作等途徑,以購買或合作等方式尋求互利共贏的技術研發模式[29]。第三,科技期刊編輯應轉變思維,積極參與知識服務產品的優化設計,構建更科學全面的學習樣本和訓練模型,突出知識服務的差異化、創新性和前瞻性[17]。

(三)推動產品研發與用戶需求匹配

準確理解用戶需求,提供高效、有效的服務是大數據時代科技期刊知識服務的重點。第一,科技期刊知識服務可通過應用大數據、算法、深度學習、圖像識別等人工智能技術,結合計算機軟件開發與應用,推進協同化、智能化的出版流程再造,精準預判用戶需求,打造個性化、定制化、差異化的推送服務內容和知識解決方案。第二,基于載體和渠道的變化,科技期刊知識服務應適應不同場景,提供新媒體、App、音視頻、VR、AR、操作系統、分析報告、教育培訓等多樣化的精準知識服務產品。第三,順應科研活動發展規律,科技期刊知識服務應轉變知識服務產品開發重點,積極彌補不足,打破內容生產規則,積極解決用戶的需求痛點。

作者:陳文靜