人工智能圖書館理性思考

時間:2022-04-22 04:00:38

導(dǎo)語:人工智能圖書館理性思考一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

人工智能圖書館理性思考

〔摘要〕人工智能是當(dāng)下圖書館界討論的熱門議題。但究竟什么是人工智能?我國人工智能的真實發(fā)展水平如何?圖書館應(yīng)用人工智能技術(shù)會帶來哪些風(fēng)險?哪些人工智能技術(shù)能夠為圖書館所用等,需要理性思考和認識。運用文獻分析法發(fā)現(xiàn),現(xiàn)階段我國人工智能技術(shù)應(yīng)用成就顯著,但仍有諸多局限性,與美國等發(fā)達國家差距頗大。圖書館應(yīng)用人工智能應(yīng)事先進行全面評估,識別和控制好倫理與法律風(fēng)險,做好應(yīng)用場景分析,培養(yǎng)圖書館員的人工智能知識素養(yǎng)。

〔關(guān)鍵詞〕人工智能;圖書館;機器學(xué)習(xí);深度學(xué)習(xí);大數(shù)據(jù);倫理風(fēng)險

1引言

2016年AlphaGo戰(zhàn)勝人類棋手,引發(fā)了又一波人工智能熱潮。深度學(xué)習(xí)理論上的突破,使人工智能技術(shù)終于實現(xiàn)了商業(yè)化應(yīng)用。而人類發(fā)展的巨大需求推動了人工智能與生產(chǎn)、生活的深度融合:人工智能+制造、人工智能+醫(yī)療、人工智能+教育、人工智能+服務(wù)等遍地開花。人工智能作為新一輪產(chǎn)業(yè)革命的重要驅(qū)動力量,已成為國家發(fā)展戰(zhàn)略。生產(chǎn)的傳統(tǒng)杠桿——資本投資和勞動力推動經(jīng)濟增長的能力顯著下降。作為一種新的生產(chǎn)因素,人工智能極有可能推動新的增長[1]。面對智能時代的到來,學(xué)者們也在積極探討如何將人工智能技術(shù)應(yīng)用于圖書館,期待著人工智能給圖書館帶來變革。然而,什么是人工智能?哪些技術(shù)屬于人工智能?目前我國人工智能的真實發(fā)展水平如何?與發(fā)達國家有哪些差距?現(xiàn)階段人工智能技術(shù)有哪些局限性?哪些人工智能技術(shù)能夠為圖書館所用等等,我們在欣喜地看到新技術(shù)帶來變革機遇的同時,也要清醒地認識到產(chǎn)生的問題。文章希望通過分析探討上述問題,有助于圖書館抓住人工智能發(fā)展機遇,安全、合法利用人工智能技術(shù),從而使其更好服務(wù)于圖書館未來。

2人工智能及其發(fā)展簡述

人工智能是人類創(chuàng)造的一種機器智能。理想的人工智能應(yīng)該擁有類人大腦,可以思考、判斷和推理,能通過知識的自我學(xué)習(xí)不斷進化,像人類一樣能舉一反三融會貫通,并按要求完成指定任務(wù)。但機器智能的產(chǎn)生機理與人類智能完全不同。它是通過傳感器感知外部環(huán)境,借助相當(dāng)于人腦的GPU、TPU、ASIC等芯片處理獲得的信息,預(yù)測結(jié)果,然后以機器人、機器狗、顯示器等完成既定任務(wù)。人工智能研究范圍可歸納為:機器學(xué)習(xí)、計算機視覺、自然語言處理、認知和推理、機器人、博弈與倫理六個領(lǐng)域。各領(lǐng)域間相互交叉、相互融合。人工智能自1956年誕生至今的60多年中,經(jīng)歷過三次發(fā)展高潮兩次低潮。目前第三次高潮的興起得益于深度學(xué)習(xí)的革命性突破。1950年,計算機科學(xué)之父阿蘭•圖靈在雜志Mind上發(fā)表了名為ComputingMachineryandIntelligence文章,提出了圖靈測試、機器學(xué)習(xí)、遺傳算法等概念[2]。1980年夏,美國卡內(nèi)基梅隆大學(xué)舉行了第一屆機器學(xué)習(xí)國際研討會,標(biāo)志著機器學(xué)習(xí)研究在世界范圍內(nèi)興起。1986年,MachineLearning創(chuàng)刊,標(biāo)志著機器學(xué)習(xí)逐漸為世人矚目并開始加速發(fā)展[3]。機器學(xué)習(xí)是通過計算模型和算法從數(shù)據(jù)中學(xué)習(xí)規(guī)律的一門學(xué)問[4]16,它包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強化學(xué)習(xí)等,早期的機器學(xué)習(xí)算法包括決策樹、聚類、貝葉斯分類等。2006年,杰弗里•辛頓提出了“深度學(xué)習(xí)”的概念,并因此獲得2019年圖靈獎。深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,以人工神經(jīng)網(wǎng)絡(luò)為理論基礎(chǔ),是基于多層神經(jīng)網(wǎng)絡(luò)的新算法。深度學(xué)習(xí)之所以備受關(guān)注、應(yīng)用廣泛,是因為相較于早期的機器學(xué)習(xí),它具有處理大數(shù)據(jù)的性能優(yōu)勢。用海量數(shù)據(jù)樣本訓(xùn)練機器,讓機器通過自我學(xué)習(xí)從數(shù)據(jù)中尋找規(guī)律,進而作出預(yù)測。當(dāng)前的語音識別、圖像識別(包括圖片識別、指紋識別、人臉識別、虹膜識別等),以及無人駕駛和著名的AlphaGo等均是深度學(xué)習(xí)的應(yīng)用成果。深度學(xué)習(xí)的成功,離不開三個核心要素:超級算力、算法和大數(shù)據(jù),以及存儲器、光纖、移動通信等底層技術(shù)的革命。機器學(xué)習(xí)只是實現(xiàn)人工智能的核心技術(shù)之一,不是全部。人工智能還有很多領(lǐng)域有待于探索和突破。中國科學(xué)院院士、中國人工智能奠基人之一、清華大學(xué)人工智能研究院院長張鈸教授認為:人工智能發(fā)展經(jīng)歷過兩代,第一代是符號推理,第二代是目前的概率學(xué)習(xí)(或深度學(xué)習(xí)),現(xiàn)正在進入第三代。人類智慧的源泉在于知識、經(jīng)驗、推理能力,這是人類理性的根本。因此,知識表示、不確定性推理等才是人工智能的核心。當(dāng)前人工智能尚處于發(fā)展的初級階段[5]。未來人工智能的目標(biāo)是要發(fā)展具有理解能力、推理能力和魯棒性(穩(wěn)健性),安全、可靠、可信的通用型人工智能技術(shù)。人能理解機器,機器也能理解人,最終實現(xiàn)人機共處、人機協(xié)同、人機融合。

3國內(nèi)外人工智能發(fā)展近況

3.1國外人工智能發(fā)展近況。美國人工智能研究一直處于全球領(lǐng)先地位,尤其是基礎(chǔ)理論研究。截至目前,人工智能領(lǐng)域的原創(chuàng)成果均來自于美國。人工智能領(lǐng)域十一個圖靈獎得主中,十個是美國人,一個是加拿大人[6]5。美國政府是人工智能研究的主要推動者。20世紀(jì)70年代美國國防部高級研究計劃局DARPA就已成為人工智能的重要資助者。2016年10月DARPA了“可解釋的人工智能”項目,欲建立一種能產(chǎn)生可解釋模型的機器學(xué)習(xí)技術(shù)。2018年9月DARPA啟動了“下一代人工智能”(AINext)計劃,欲打造具有常識、能感知語境和具有更高能效率的人工智能系統(tǒng)[4]96-97。2019年2月,美國推出國家層面的人工智能促進計劃,要求聯(lián)邦政府機構(gòu)把更多的資源和投資用于人工智能研究、推廣和培訓(xùn)[7]。世界500強企業(yè),著名管理咨詢公司Accenture的InstituteforHighPerformance與FrontierEconomics合作,建立了人工智能對美國、芬蘭、英國等12個發(fā)達國家的影響模型,預(yù)測人工智能將使美國年經(jīng)濟增長率從2.6%提高到2035年的4.6%,折合約增加了8.3萬億美元的總附加值(GrossValueAdded,GVA)[8]。美國的人工智能應(yīng)用已經(jīng)滲透到科研、生產(chǎn)等各領(lǐng)域。在基礎(chǔ)科學(xué)理論研究上,2018年1月,美國加州大學(xué)與馬薩諸塞大學(xué)合作開發(fā)的人工智能平臺,能自動分析材料科學(xué)研究文獻,并根據(jù)文本中提及的合成溫度、時間、設(shè)備名稱、制備條件及目標(biāo)材料等關(guān)鍵詞進行自動分類。2017年誕生于硅谷的Landing.AI與中聯(lián)重科攜手研發(fā)人工智能驅(qū)動的農(nóng)機產(chǎn)品,減輕農(nóng)民勞動強度,提高農(nóng)業(yè)生產(chǎn)效率。在改善人類生存環(huán)境方面,2016年開始,谷歌旗下的DeepMind引入人工智能工具,利用神經(jīng)網(wǎng)絡(luò)識別模式系統(tǒng)預(yù)測電量變化,采用人工智能技術(shù)操控服務(wù)器和散熱系統(tǒng),成功幫助該公司節(jié)省了40%的能源,整體能效提升了15%。2017年7月微軟啟動“人工智能地球計劃”,利用物聯(lián)網(wǎng)、云計算和人工智能技術(shù)保護地球及自然資源[4]69,74,76-77。人才是決定人工智能競爭優(yōu)勢的最關(guān)鍵因素。為解決人才短缺問題,谷歌2017年提出了“忍者計劃”,讓所有產(chǎn)品都提升智能化程度,擴大內(nèi)部精英人才儲備,甚至讓機器學(xué)習(xí)成為谷歌員工的必備技能。Facebook創(chuàng)建了AIAcademy,對內(nèi)部員工進行免費人工智能技能培訓(xùn)。課程完成后,還可到FAIR中進行一至兩年的項目實踐[9]。加拿大是這波人工智能浪潮的重要貢獻者,而加拿大政府扮演了關(guān)鍵角色。1987年,杰弗里•辛頓受加拿大高等研究院(CIFAR)邀請任教于多倫多大學(xué),參與了該院資助的“人工智能、機器人與社會研究”項目。通過與計算機科學(xué)、生物學(xué)、神經(jīng)科學(xué)等科學(xué)家的跨領(lǐng)域合作,終于在2006年提出“深度學(xué)習(xí)”概念[4]98?!吧疃葘W(xué)習(xí)+大數(shù)據(jù)”實現(xiàn)了人工智能技術(shù)的商業(yè)化落地。2017年8月的《歐洲人工智能公司生態(tài)報告》顯示,英國的人工智能生態(tài)系統(tǒng)在歐盟國家中功能最強大,其次是德國、法國,擁有的人工智能初創(chuàng)公司數(shù)量分別為121家、51家和39家,占歐洲總量的50%以上。其中大多數(shù)專注于數(shù)據(jù)分析市場。物流、教育和旅游領(lǐng)域中鮮有人工智能公司[10]。2018年12月,歐盟委員會呼吁其成員國加倍努力,計劃到2019年夏季歐盟各國都要有一項真正有著專項預(yù)算的國家戰(zhàn)略。到2020年底,人工智能方面的麻思蓓、許燕:人工智能在圖書館應(yīng)用的理性思考公共與私人投資至少達到200億歐元,接下來的10年中每年也要達到此數(shù)字。歐委會還將依據(jù)專家組最終報告,判斷是否要對人工智能做出立法規(guī)范,如在機器人制造方面出臺一些技術(shù)性限制[11]。除上述國家外,俄羅斯總統(tǒng)普京已簽署命令,批準(zhǔn)2030年前俄羅斯國家人工智能發(fā)展戰(zhàn)略,以確保俄羅斯在人工智能領(lǐng)域的技術(shù)優(yōu)勢[12]??梢?,歐美各國政府都在大力支持和推進人工智能發(fā)展戰(zhàn)略。人工智能已成為國際間競爭的新焦點。3.2國內(nèi)人工智能發(fā)展近況。我國政府高度重視人工智能技術(shù)在經(jīng)濟轉(zhuǎn)型和創(chuàng)新型國家發(fā)展中的戰(zhàn)略地位和引領(lǐng)作用。2016年5月,國家發(fā)改委等四部門聯(lián)合了《“互聯(lián)網(wǎng)+”人工智能三年行動實施方案》,以提升國家經(jīng)濟社會智能化水平為主線,著力加強人工智能應(yīng)用創(chuàng)新,促進人工智能在國民經(jīng)濟社會重點領(lǐng)域的推廣[13]。2017年7月,國務(wù)院了《新一代人工智能發(fā)展規(guī)劃》,將發(fā)展新一代人工智能上升到國家戰(zhàn)略[14]。2018年10月31日,在中共中央政治局就人工智能發(fā)展現(xiàn)狀和趨勢舉行第九次集體學(xué)習(xí)會上強調(diào):人工智能是驅(qū)動和引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的重要力量和戰(zhàn)略性技術(shù),加快發(fā)展新一代人工智能是事關(guān)我國能否抓住新一輪科技革命和產(chǎn)業(yè)變革機遇的戰(zhàn)略問題,是我們贏得全球科技競爭主動權(quán)的重要戰(zhàn)略抓手,是推動我國科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的重要戰(zhàn)略資源[15]。Accenture報告《人工智能:助力中國經(jīng)濟增長》深入研究了人工智能技術(shù)對中國經(jīng)濟的影響,認為作為全新的生產(chǎn)要素,人工智能有望變革中國經(jīng)濟發(fā)展的基礎(chǔ),將中國經(jīng)濟年增長率從6.3%提速至2035年的7.9%,有潛力將經(jīng)濟總增加值提升7.1l萬億美元,有望推動中國勞動生產(chǎn)率提高27%[16]。高校承擔(dān)了人工智能人才培養(yǎng)的重任。中國科學(xué)院大學(xué)開國內(nèi)高校先河,于2017年9月率先成立人工智能技術(shù)學(xué)院。2018年4月教育部了《高等學(xué)校人工智能創(chuàng)新行動計劃》[17]。截至2019年4月底,國內(nèi)已有31所高校成立了人工智能學(xué)院,24所高校成立了人工智能研究院[18]。其中,清華大學(xué)在人工智能基礎(chǔ)理論研究方面處于國內(nèi)頂尖水平。該校發(fā)表的人工智能論文在2018年3月全球高校排名中僅次于美國卡內(nèi)基梅隆大學(xué),位列第二,北京大學(xué)排名第五[19]。我國積極跟進國際上人工智能發(fā)展趨勢。研發(fā)機構(gòu)利用大數(shù)據(jù)優(yōu)勢在人工智能應(yīng)用端著力探索。工業(yè)機器人已被廣泛應(yīng)用于制造業(yè)。人工智能技術(shù)在交通、時尚、農(nóng)業(yè)、醫(yī)療、物流等領(lǐng)域也取得了令人矚目的成績。如:首都機場與商湯科技聯(lián)合開發(fā)的、應(yīng)用面部識別技術(shù)的智能旅客安檢系統(tǒng),可自動完成旅客人、票、證三合一核驗,顯著提升了安檢效率。又如:深蘭科技研發(fā)的熊貓智能公交車已經(jīng)在德陽、常州、衢州和池州內(nèi)部道路投入使用。該車比傳統(tǒng)內(nèi)燃機動力公交車至少降低43%~45%的電耗等運營成本,并通過智能零售、智能廣告等為政府和公交公司帶來經(jīng)濟效益[20]。全球知名創(chuàng)投研究機構(gòu)CBInsights評選出的100家最有前景的人工智能初創(chuàng)企業(yè)中,中國有6家企業(yè)入選,其中5家來自于北京中關(guān)村,包括商湯科技、第四范式等[21]。顯示出北京人工智能研發(fā)的區(qū)域?qū)嵙ΑN覈斯ぶ悄艿臉?biāo)準(zhǔn)化也在進行中。2018年1月,國家人工智能標(biāo)準(zhǔn)化總體組成立,2019年4月召開第二次全體會議,《國家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》進入審改完善階段[22]。盡管如此,我國與發(fā)達國家在人工智能基礎(chǔ)理論研究、人才教育、產(chǎn)業(yè)鏈布局等方面仍存在不小差距。如:國外很多大學(xué)都設(shè)置了邏輯推理課程,但國內(nèi)一般把機器學(xué)習(xí)等同于人工智能[23]。在人工智能基礎(chǔ)算法研究上,中國仍與美國、加拿大和英國存在明顯差距;在產(chǎn)業(yè)鏈分布上,中國更加集中于應(yīng)用落地端,在基礎(chǔ)算法、芯片等產(chǎn)業(yè)環(huán)節(jié)占比較低[24]。據(jù)清華大學(xué)中國科技政策研究中心統(tǒng)計,截至2018年6月,中國人工智能企業(yè)數(shù)量已達1011家,但美國的同類企業(yè)數(shù)量是2028家[4]006。從技術(shù)分布看,中國人工智能領(lǐng)域20個獨角獸30個準(zhǔn)獨角獸企業(yè),近80%都跟圖像識別或語音識別有關(guān),而對于人工智能其他領(lǐng)域涉足較少[6]2。中國作為芯片消費大國,90%以上芯片仍要依賴進口。阿里巴巴、百度、騰訊、華為、浪潮等互聯(lián)網(wǎng)及IT巨頭都在使用Nvidia的VoltaGPU或VoltaHGX架構(gòu),為企業(yè)自身或用戶構(gòu)建人工智能應(yīng)用或系統(tǒng)[25]。歐洲科學(xué)院院士、亞太神經(jīng)網(wǎng)絡(luò)學(xué)會最高獎杰出成就獎獲得者、上海交大人工智能研究院首席科學(xué)家徐雷教授認為:現(xiàn)在還不到聲稱中國人工智能在應(yīng)用方面已經(jīng)領(lǐng)先的時候。在語音識別和語言翻譯方面,谷歌的水平優(yōu)于國內(nèi)企業(yè),特別是在英文和其他文字領(lǐng)域更是如此。在機器人行業(yè),尤其是類人或特種機器人,與美國的波士頓動力機器人相比,國內(nèi)水平遠遠落后,可能差一、二十年都不止。在芯片方面,芯片設(shè)計人才濟濟,但芯片制造卻有很長一段路要趕。在算力方面,盡管中國的神威和天河超級計算機仍位列全球前四,但在量子計算機方面,谷歌和IBM都在商用化方面推進很快。在下一代計算材料和芯片方面,我國的短板可能更大。尤其令人擔(dān)憂的是,大多數(shù)大學(xué)和研究機構(gòu)發(fā)出的論文,還都是用別人的開源程序計算的[26]3-4。

4現(xiàn)階段人工智能技術(shù)的局限性及其引發(fā)的倫理挑戰(zhàn)

4.1現(xiàn)階段人工智能技術(shù)的局限性。人工智能技術(shù)雖然取得了重大突破,但并不完美,存在著明顯的局限性。主要體現(xiàn)在以下幾方面:一是當(dāng)前人工智能的理解能力、推理能力很差,不適合做決策。機器學(xué)習(xí)的理論基礎(chǔ)是概率統(tǒng)計,建立計算模型,通過計算得出結(jié)論,而不是在理解語義的基礎(chǔ)上給出答案。所以,利用機器學(xué)習(xí)打造的智能體有強大的計算能力,但沒有理解能力。例如:AlphaGo學(xué)習(xí)了上千萬棋局,卻并不知道什么是圍棋,取勝完全是靠計算得出最優(yōu)方案。又如:國內(nèi)一些圖書館設(shè)置的咨詢機器人或網(wǎng)站聊天機器人,其原理是在對話系統(tǒng)中建立了相關(guān)知識庫,提問的問題若知識庫里有答案,或提問時所用關(guān)鍵詞、字恰好有存儲,系統(tǒng)將其組合匹配后能很快回答。這種信息處理方法實際上就是我們圖書館學(xué)中的文獻檢索或網(wǎng)絡(luò)檢索方法,無智能可言。假如是事先無準(zhǔn)備的臨時提問,或需要機器人推理判斷后再回答時,機器往往答非所問。如:在知識庫里存入“特朗普—總統(tǒng)—美國”三組詞,然后提問:誰是美國總統(tǒng)?機器馬上回答:特朗普;再問:特朗普是一個人嗎?美國有沒有總統(tǒng)?機器則回答不了[6]8。顯然,機器智能與人類智能還相差甚遠。概率統(tǒng)計的另一個缺陷是,基于數(shù)據(jù)統(tǒng)計尋找重復(fù)出現(xiàn)的規(guī)律,若摻入虛假信息或偽造的數(shù)據(jù),則很難得出可靠的結(jié)果。二是內(nèi)存、功耗大,抗干擾能力差。大數(shù)據(jù)需要大存儲空間,需要巨大的計算資源,功耗大;在視覺處理上,輸入的圖片加上一點點噪聲,系統(tǒng)就將一張明顯是熊貓的圖片以99.3%的置信度識別成長臂猿[27]。三是雖然人工智能應(yīng)用日趨多元化,但現(xiàn)階段技術(shù)對應(yīng)用場景的選擇依然有諸多限制,需滿足下列5個條件,缺少其中任何一條都難以實現(xiàn):①數(shù)據(jù)樣本量多且信息完整無殘缺,如AlphaGo;②信息具備確定性,不能模棱兩可;③需要完全信息,如適合棋類,不適合盲打的4人撲克或麻將;④需要靜態(tài)環(huán)境,對無法預(yù)知的情況很難處理;⑤適合單一任務(wù),如圍棋算法不支持下象棋。4.2現(xiàn)階段人工智能技術(shù)引發(fā)的倫理挑戰(zhàn)。隨著應(yīng)用領(lǐng)域的擴大,人工智能技術(shù)帶來的倫理道德、技術(shù)安全以及隱私保護等問題逐漸顯現(xiàn),引發(fā)了社會的高度關(guān)注甚至是擔(dān)憂。一些專家、學(xué)者認為已經(jīng)到了必須高度重視人工智能環(huán)境的時候了。2019年秋開學(xué)季,多所高校利用人臉識別系統(tǒng)代替登記流程辦理新生報到程序,一些學(xué)校甚至采取姿態(tài)評估、表情識別、語言識別、人臉識別技術(shù),對學(xué)生上課情況進行監(jiān)控、識別。對于這種人工智能+教育的應(yīng)用方式,教育部科技司司長雷朝滋表示:人臉識別進校園,既有數(shù)據(jù)安全問題也有個人隱私問題,要加以限制和管理,并已經(jīng)組織專家論證研究[28]。網(wǎng)絡(luò)上人工智能開源代碼的出現(xiàn),使得換臉制作費價格大幅下降,降低了應(yīng)用門檻,但也帶來了很大的安全隱患,給模仿、惡搞、偽造、移花接木等不良甚至是違法行為創(chuàng)造了便利條件。利用語音合成技術(shù)可以制作出與目標(biāo)聲音極為相似的語音,讓人難辨真?zhèn)巍_@種極為危險的技術(shù)若被不法之徒利用,可以讓任何一個人特別是名人身敗名裂,從而達到侵害他人合法權(quán)益(尤其是對女性的傷害),擾亂社會公共秩序的目的。中國傳媒大學(xué)政治與法律學(xué)院副院長王四新說:“目前,通過人工智能技術(shù)深度偽造他人的肖像、聲音主要用于網(wǎng)絡(luò)‘惡搞’,但仿真效果已逼近真?zhèn)坞y辨的邊界……如果使用不當(dāng),會產(chǎn)生很強的負面作用?!盵29]人工智能還可能置人于死地:國外有人做出蝴蝶或蜻蜓般大小、攜帶烈性炸藥的飛行器,通過人臉識別技術(shù)尋找特定對象實施謀殺[26]10。為避免可能帶來的法律風(fēng)險,國內(nèi)外一些企業(yè)已經(jīng)著手采取措施應(yīng)對。如:微軟已刪除其2016年建立的世界上最大的公開人臉識別數(shù)據(jù)庫——MSCeleb。該庫通過“知識共享”許可方式搜集了近10萬人的面部信息,超1000萬張圖像,而這些圖像未必直接得到了照片與視頻中人物的授權(quán)許可。國內(nèi)一些技術(shù)公司也開始審視人工智能的倫理性。2018年7月在深圳召開的全球人工智能創(chuàng)業(yè)者大會上,多家高校及人工智能企業(yè)聯(lián)合發(fā)起了《新一代人工智能行業(yè)自律公約》,旨在增強行業(yè)整體自律意識[30]。

5人工智能在圖書館應(yīng)用的理性分析

《新媒體聯(lián)盟地平線報告(2017圖書館版)》指出,“AI已成為圖書館未來5年最重要的技術(shù)之一,圖書館機器人的研發(fā)與應(yīng)用,將推動圖書館服務(wù)方式的變革?!盵31]將人工智能技術(shù)有機融入圖書館工作,提升智能時代圖書館的價值,已經(jīng)是大勢所趨。但在應(yīng)用之前須進行理性分析。重點從以下幾方面思考:5.1全面評估人工智能技術(shù)及其對圖書館發(fā)展戰(zhàn)略的影響。應(yīng)從圖書館整體發(fā)展戰(zhàn)略的角度做好全面評估和規(guī)劃:包括對人工智能技術(shù)及其發(fā)展的評估,對本館工作流程、工作方法、服務(wù)手段、軟硬件設(shè)施現(xiàn)狀的評估,對組織機構(gòu)變革的評估,對管理和服務(wù)能力影響的評估,人工智能帶來的新崗位需求的評估,對圖書館員知識結(jié)構(gòu)或素養(yǎng)的評估,以及人工智能的風(fēng)險評估等等。在此基礎(chǔ)上作出利用人工智能技術(shù)改變圖書館未來的整體規(guī)劃,包括確定哪些工作可以用人工智能代替,哪些暫時不能而未來有可能;人機協(xié)同的設(shè)計;引進人工智能技術(shù)資金投入計劃;人工智能人才培訓(xùn)計劃等,以確保智能時代圖書館的可持續(xù)發(fā)展。合理的人工智能技術(shù)發(fā)展應(yīng)該是人類可控的,以人為本的。圖書館員的工作不可能被人工智能完全取代,其崗位不可能因人工智能技術(shù)而完全消失,但部分取代是可能的,如基礎(chǔ)性的、重復(fù)性的體力勞動。圖書館應(yīng)該是學(xué)習(xí)與創(chuàng)造知識、具有濃厚人文色彩的文化場所,這一點不應(yīng)由于智能體的加入而改變。機器的作用一方面是解放勞動力,提高勞動效率,改善人類工作環(huán)境和工作條件;另一方面是為用戶提供現(xiàn)有技術(shù)無法提供的更高質(zhì)量的服務(wù),提升需求的滿足率,這也是圖書館應(yīng)用人工智能的最終目的。新技術(shù)應(yīng)用的最終受益者一定是用戶。機器應(yīng)作為人類的得力助手,讓圖書館員的工作變得更加生動有趣、更富有情感、富有創(chuàng)造性,更有意義和價值。這也是圖書館的魅力所在。同時,圖書館員的權(quán)利不應(yīng)由于智能體的加入而受到損害?!叭斯ぶ悄艿牟渴饝?yīng)當(dāng)服務(wù)于人并以增強人的能力為目的。”[32]未來隨著更高級人工智能技術(shù)的出現(xiàn),圖書館員與智能體合作共事、有機協(xié)同將成為圖書館的一道亮麗風(fēng)景線。5.2識別、規(guī)避法律及倫理風(fēng)險?,F(xiàn)在,國內(nèi)有的圖書館采用人臉識別技術(shù)借還書籍。圖書館在此過程中實際上已成為用戶信息的采集者與使用者。不管用戶同意不同意,都得采用刷臉方式借還書,這種做法將用戶置于別無選擇的境地。如果說機場安檢采用人臉識別技術(shù)是出于安全考慮,那圖書館借還書籍完全沒有這種必要。2019年6月17日,國家新一代人工智能治理專業(yè)委員會了《新一代人工智能治理原則——發(fā)展負責(zé)任的人工智能》,提出了人工智能發(fā)展應(yīng)遵循公平公正、尊重隱私、安全可控、共擔(dān)責(zé)任等八項原則。明確要求尊重和保護個人隱私,保障個人的知情權(quán)和選擇權(quán),建立人工智能問責(zé)機制;人工智能的研發(fā)、使用應(yīng)嚴(yán)格遵守法律法規(guī)、倫理道德和標(biāo)準(zhǔn)規(guī)范;人工智能應(yīng)用過程中應(yīng)確保人類知情權(quán)[33]。2019年8月22日,民法典人格權(quán)編草案已提請十三屆全國人大常委會第十二次會議進行第三次審議。草案對公民隱私權(quán)和個人信息保護規(guī)定設(shè)立了專門章節(jié)。草案將“隱私”的定義修改為“自然人不愿為他人知曉的私密空間、私密活動和私密信息等”;將個人信息的范圍作了明確界定,包括自然人的姓名、出生日期、身份證件號碼、個人生物識別信息等等[34]。其中,個人生物識別信息就是指指紋、面部、虹膜、聲音等個人生物特征信息。民法是我國法律體系中的基本法,一旦頒布實施,將對于我國人工智能使用行為的規(guī)范,對相關(guān)政策法規(guī)的制定,對于保護公民個人利益不受侵害都將是重要的參考依據(jù)。而未經(jīng)許可授權(quán)采集用戶個人信息的行為,將可能涉嫌侵犯用戶的隱私權(quán)等人格權(quán)。因此,圖書館應(yīng)在法律、政策、規(guī)范等指導(dǎo)下應(yīng)用人工智能技術(shù),建立相關(guān)監(jiān)管與評估機制,防止出現(xiàn)用戶信息泄露、未經(jīng)授權(quán)的數(shù)據(jù)訪問,甚至是技術(shù)惡意利用等管理上的漏洞,處理好數(shù)據(jù)開放獲取與隱私權(quán)保護之間的關(guān)系,控制好人工智能技術(shù)可能給自身帶來的法律與倫理風(fēng)險。5.3做好大數(shù)據(jù)積累與建設(shè)。大數(shù)據(jù)是此次人工智能浪潮興起的核心動力之一。為此,有學(xué)者將這波人工智能稱為數(shù)據(jù)智能。據(jù)預(yù)測,人類最近兩年產(chǎn)生的數(shù)據(jù)相當(dāng)于之前歷史上所有數(shù)據(jù)量的總和。到2020年,人類產(chǎn)生的數(shù)據(jù)量將達到40ZB[4]231。數(shù)據(jù)中有很多知識或規(guī)律有待于挖掘。數(shù)據(jù)是智能時代圖書館管理與服務(wù)創(chuàng)新的重要基礎(chǔ)資源。開放獲取環(huán)境下,圖書館數(shù)據(jù)來源大幅擴展,如機構(gòu)知識庫聯(lián)盟、圖書館聯(lián)盟等共享形式,數(shù)據(jù)生成方式多樣化且更加快速。為此,研究型圖書館必須發(fā)揮數(shù)據(jù)管理者的作用,必須具有更強大的數(shù)據(jù)管理能力,包括數(shù)據(jù)搜集能力、存儲規(guī)劃能力、處理能力、使用能力和服務(wù)能力,建立用于大數(shù)據(jù)研究的支持系統(tǒng),確保實現(xiàn)數(shù)據(jù)價值最大化。這些數(shù)據(jù)不僅為智能時代圖書館學(xué)理論與實踐的創(chuàng)新探索提供了“養(yǎng)料”,也提供了一條新的研究路徑。同時為圖書館自身組織機構(gòu)變革,為圖書館科學(xué)決策,提供精準(zhǔn)化、精細化服務(wù)奠定堅實的資源基礎(chǔ)。大數(shù)據(jù)分析是對某一領(lǐng)域的全樣本分析,比抽樣調(diào)查更精準(zhǔn)可靠、更有說服力。定題服務(wù)是圖書館受用戶委托,就某一課題或項目需求收集相關(guān)資料交給用戶。用戶拿到資料后需再作整理、歸納、提取、分析等工作。而大數(shù)據(jù)分析用戶直接拿到的就是結(jié)果,兩種服務(wù)有質(zhì)的區(qū)別。大數(shù)據(jù)分析能讓圖書館人的視野更加開闊,它不僅對于跟蹤、分析本館和國內(nèi)其他圖書館用戶需求、用戶心理、用戶行為及其變化提供依據(jù),也讓洞察和跟蹤國外圖書館及其學(xué)科發(fā)展趨勢、資源建設(shè)等信息成為可能。而大數(shù)據(jù)分析的技術(shù)支撐就是人工智能。圖書館可建立不同內(nèi)容的動態(tài)數(shù)據(jù)知識庫,與國內(nèi)實力人工智能研發(fā)機構(gòu)合作,利用深度學(xué)習(xí)技術(shù)開展大數(shù)據(jù)分析與挖掘。未來,大數(shù)據(jù)建設(shè)將成為圖書館資源建設(shè)的重要組成部分,而大數(shù)據(jù)分析與挖掘作為智能服務(wù)手段,將成為圖書館服務(wù)的常態(tài)。5.4與研發(fā)機構(gòu)合作開發(fā)人工智能應(yīng)用場景。深度學(xué)習(xí)技術(shù)在應(yīng)用端是有很大開發(fā)潛力可以挖掘的。不過只靠圖書館自身的能力無法實現(xiàn),必須與人工智能研發(fā)企業(yè)合作開發(fā)。鑒于目前人工智能技術(shù)的局限性,圖書館須事先做好場景分析,這是應(yīng)用能否成功的關(guān)鍵。圖像識別和語音識別是目前國內(nèi)應(yīng)用較廣泛、相對較成熟的人工智能技術(shù)。圖書館可以利用這兩項技術(shù),尤其是圖像識別技術(shù)代替人工勞動。例如:目前借還書的下架、還架和新書上架是由圖書館工作人員到書庫靠眼睛查找、體力完成,中外文期刊也是如此。書、刊的排架信息是靜態(tài)的,每本書、刊在書架上的位置是按照分類號順序排列的,不能亂放;排架規(guī)則明確,沒有二義性;排架信息是一目了然的完全信息;整個書庫或期刊庫的排架情況可以構(gòu)成樣本信息完整無殘缺的數(shù)據(jù),符合前述4.1中所說的5個應(yīng)用條件。利用深度學(xué)習(xí)處理大數(shù)據(jù)的優(yōu)勢,分別建立書、刊排架信息數(shù)據(jù)庫,以該庫為依據(jù)建立計算模型,結(jié)合圖像識別技術(shù)識別不同書、刊在書架上的位置,然后用機器人完成書與刊的上、下架。機器人作業(yè)可大大縮短查找書刊的時間,降低還架錯誤率,提高工作效率和圖書館的智能管理水平。圖書館還可將圖像識別技術(shù)用于內(nèi)部管理。圖書館作為各種媒介、媒體相融合的知識平臺,既要做好公共服務(wù),又要做好安全管理。一些要害部門,如善本室等部門可采用圖像識別控制人員的進出,根據(jù)人員的調(diào)動變化,隨時進行調(diào)整,確保珍貴典藏在防火、防盜方面的安全。咨詢機器人是比書庫機器人智能化程度要求更高的智能體,不僅要能與用戶對話交流,還應(yīng)該能夠講解和介紹視頻內(nèi)容。其智能化程度高低,一方面取決于機器人的大腦——知識庫中的知識存儲量,另一方面取決于研發(fā)機構(gòu)對語音識別與邏輯推理等技術(shù)的綜合研發(fā)和運用能力。圖書館需要圍繞咨詢內(nèi)容構(gòu)建相關(guān)知識庫,做初步嘗試。今后,隨著人工智能核心技術(shù)的不斷突破,咨詢機器人應(yīng)進行相應(yīng)升級換代,提高智能化水平。利用人工智能開展知識挖掘與服務(wù)。嘗試?yán)蒙疃葘W(xué)習(xí)開展大數(shù)據(jù)分析,包括圖書館學(xué)基礎(chǔ)理論研究、領(lǐng)域分析、專題分析、行業(yè)分析、用戶行為分析、館藏結(jié)構(gòu)分析、資源布局分析等。人工智能技術(shù)可以幫助圖書館更加準(zhǔn)確地了解用戶意圖,更加精準(zhǔn)地滿足企業(yè)等創(chuàng)新主體的需求。在全民閱讀的大環(huán)境下,圖書館還應(yīng)該借助人工智能學(xué)習(xí)平臺或工具,如智能穿戴設(shè)備等,改善弱勢群體的閱讀條件,為弱勢群體提供更加公平、便利,更加人性化的學(xué)習(xí)環(huán)境;為全民提供終身學(xué)習(xí)的機會,滿足不同年齡層、不同性別的學(xué)習(xí)需求。凸顯圖書館服務(wù)的公平性、包容性,應(yīng)成為圖書館利用人工智能的一個重要努力方向。5.5關(guān)注人工智能發(fā)展動向,加強圖書館員人工智能知識素養(yǎng)首先,圖書館對館員進行人工智能知識培訓(xùn),可以有效解決本館人工智能人才短缺問題。圖書館從決定引進人工智能技術(shù),到選擇合適的人工智能企業(yè)合作,再到確定具體應(yīng)用場景,自始至終都需要圖書館員參與其中。館員的人工智能知識素養(yǎng),是人工智能技術(shù)與圖書館工作相融合的重要基礎(chǔ)。未來,圖書館與人工智能研發(fā)機構(gòu)的合作關(guān)系將更加緊密,而掌握人工智能技術(shù)的公司并不了解圖書館工作及其需求,需要圖書館員與人工智能研發(fā)公司通力合作,充分溝通,在此基礎(chǔ)上才能設(shè)計出最大限度滿足本館需求的智能體。這其中,圖書館員的人工智能知識水平至關(guān)重要。假如館員只了解自身需求,而缺少人工智能知識,包括對人工智能技術(shù)本身、對當(dāng)前國內(nèi)人工智能技術(shù)進展?fàn)顩r,以及國內(nèi)人工智能產(chǎn)業(yè)發(fā)展水平等方面缺乏了解,這將成為圖書館應(yīng)用人工智能的障礙,技術(shù)融合很難達到預(yù)期效果。其次,雖然目前相對成熟的人工智能技術(shù)集中在機器學(xué)習(xí)、計算機視覺等領(lǐng)域,但未來,隨著自動推理、知識表示等其他領(lǐng)域的突破,特別是通用人工智能的出現(xiàn),圖書館的應(yīng)用場景必將進一步拓展,人機協(xié)調(diào)、人機融合將成為圖書館工作常態(tài)。未來的人工智能是有理解、有推理、有決策能力的人工智能,所以,圖書館員必須要掌握一定人工智能知識,才能理解這些智能體的工作原理和行為,才能依據(jù)人機共存、人機配合的需要設(shè)計出更加合理、更加高效的工作機制、工作流程。否則,不但這些智能體很難融入到圖書館的工作流程與環(huán)境當(dāng)中,難以實現(xiàn)管理與服務(wù)的人機協(xié)調(diào)、人機融合,而且還可能會出現(xiàn)一些意想不到的問題或狀況。因為有理解、有推理、有決策能力的智能體的行為,有些我們能預(yù)料,有些也許是我們無法事先預(yù)料到的。所以,掌握一定人工智能知識是圖書館安全利用人工智能技術(shù)的前提和保障。最后,圖書館員在利用人工智能技術(shù)時,不但要規(guī)避已經(jīng)出現(xiàn)的法律和倫理風(fēng)險,而且要隨著該技術(shù)其他領(lǐng)域的突破,不斷學(xué)習(xí)新的人工智能知識。只有這樣,才能及時發(fā)現(xiàn)和識別尚未出現(xiàn)的、潛在的各種風(fēng)險,才能及時采取措施有效防范和應(yīng)對。智能時代,圖書館員不僅要有圖書館學(xué)專業(yè)素養(yǎng),也要有人工智能知識素養(yǎng)。圖書館應(yīng)為館員創(chuàng)造各種人工智能知識的學(xué)習(xí)機會,做好人才儲備工作,迎接智能時代的到來。

6結(jié)語

新技術(shù)的更新?lián)Q代讓人應(yīng)接不暇。人工智能技術(shù)在給圖書館帶來巨大挑戰(zhàn)的同時,也帶來了變革機遇,圖書館需做好充分的應(yīng)對準(zhǔn)備。圖書館的發(fā)展一定是以新技術(shù)為主導(dǎo)的,過去是,現(xiàn)在是,將來也一定是。人工智能技術(shù)將引領(lǐng)圖書館向智能型圖書館邁進。

作者:麻思蓓 許燕 單位:中國科學(xué)技術(shù)信息研究所