人工智能在司法領域的作用

時間:2022-07-17 04:00:37

導語:人工智能在司法領域的作用一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

人工智能在司法領域的作用

摘要:2016年7月,中辦、國辦印發了《國家信息化發展戰略綱要》,明確提出“實施科技強檢,推進檢察工作現代化”,2019年1月16日,中央政法工作會議提出要“推動大數據、人工智能等科技創新成果同司法工作深度融合”。近年來,人工智能、大數據為代表的數字技術快速發展,在教育、醫療、交通、商業、金融等方面取得了巨大的進步,展現出了跨時代的技術理性力量。本文以人工智能和大數據技術的介紹為切入口,以實例展示人工智能和大數據技術在治安、刑偵、合同、預測、量刑等司法領域或環節取得的進展,彰顯人工智能與大數據技術對司法領域的深遠影響,進而呼吁司法人員了解科技前沿信息,更新既有知識體系,深刻理解人工智能的底層邏輯,掌握數據算法本質規律,應對未來的職業挑戰。

關鍵詞:人工智能;大數據;司法領域;深度融合

活字印刷,蒸汽機,電力,互聯網……每一次技術革新,都引發人類對自身新的認知。《2019年世界發展報告:工作性質的變革》中,對人工智能等科學技術對未來的就業、經濟發展、社會影響等進行了深入探討。在人類歷史上,傳統職業不斷地被新職業、新崗位替代,ETC取代了高速公路收費員,語音輸入取代了打字員,無人超市取代了售貨員,2016年5月,美國紐約律師事務所Baker&Hostetler宣布雇傭IBM公司研發的機器人律師Ross來幫助律所處理破產案件,更多的工作內容可重復性量化的職業都面臨著被機器替代的可能。人工智能在醫療、教育、交通等多個領域不斷開花結果,科技進步帶來的資源整合并不以人的意志為轉移。但隨之而來的問題是:智能時代,人類怎樣才能不被機器打敗?恩格斯在《共產黨宣言》中這樣描述“事情已經發展到了這樣的地步:今天英國發明的新機器,一年之內就會奪取中國國千百萬工人的飯碗。”①,關于機器使工人失業的世紀之問是否會成為現實?筆者在智能語音與人工智能聯合實驗室擔任研究員的工作期間,深感每一個法律人在面對新時代司法職業迭代轉型的大變局,必須要學會與機器相處,不斷了解科技前沿信息,不斷更新既有知識體系,只有當法律人做到深刻理解了人工智能的底層邏輯,掌握了數據算法的本質規律,才能真正應對未來的職業挑戰。

一、何為人工智能技術

1956年,在美國達特茅斯學院的討論會上,“人工智能”(AI)這一概念被正式提出,標志著人工智能學科技術的誕生。人工智能是包括十分廣泛的科學,它由不同的領域組成,如機器學習,自然語言學習,計算機視覺、文字編輯、自動駕駛等等,總的來說,是讓機器具備能夠和人一樣進行感知、認知、決策、執行的人工程序或系統②。人工智能概念被普通大眾熟知的標志性事件是2016年谷歌公司DeepMind團隊的AlphaGo程序以4:1戰勝世界圍棋冠軍李世石。從人工智能的發展程度上來看,人工智能可以分為三個階段,第一個階段是弱人工智能階段,第二個階段是強人工智能階段,第三個階段是超人工智能階段。目前,所有的人工智能都還屬于弱人工智能階段,即通過機器學習在某一個領域內收集人類大量行為數據,加以分析,找出規律,提供服務。當前弱人工智能技術的發展主流是連接主義,技術核心是神經元網絡與深度學習,即仿造人的神經系統,通過人工構建神經網絡的方式來模擬人類智能,以工程技術手段來模擬人腦神經系統的結構和功能,通過大量的非線性并行處理器來模擬人腦中龐大的神經元,用處理器之間的層級連接來模擬人腦中眾多神經元之間的突觸行為,其中,連接主義取得的最重要的成果就是人工神經網絡(ANNs)③,人工神經網絡是一組數學模型,通過一個基于數學統計學類型的學習方法(LearningMethod)得以優化,用來解決模式識別問題。比如:一個人要去買蘋果,但不知道什么樣的蘋果最好吃,最簡單的方法就是每一個蘋果都親口嘗一嘗,吃完以后就知道紅色圓潤的蘋果比較好吃,再買的時候選這種蘋果就可以了。現在把這個方法套用到電腦上,讓電腦“嘗”一遍所有的蘋果,它就能夠總結出關于蘋果好吃判斷標準的一套規律,有了這套規律之后,一旦把新上市蘋果的特征輸入,電腦就能根據已有的規則判斷出蘋果的好壞。人工神經網絡的特點和優越性主要表現它具有自學習功能,例如,在進行圖片識別時,把海量的圖像數據和對應的標簽輸入,人工神經網絡就會通過自我學習功能,慢慢學會識別,以后碰到類似的圖像就能自動識別出來。2006年以來,在人工神經網絡基礎之上,又發展到了深度學習(DeepLearning)階段,即建立、模擬人腦進行分析學習的神經網絡,它模仿人腦的機制來解釋數據,尤其適用于計算機視覺識別,語音識別和自然語言處理。

二、何為大數據技術

2012年,英國牛津大學教授舍恩伯格出版了《大數據時代》一書,他在書中指出,大數據所帶來的信息風暴,正在變革我們的生活,工作和思維,開啟重大的時代轉型。根據馬丁.希爾伯特的總結,大數據是指21世紀以來因為信息交換、存儲、處理三個方面能力大幅度增長而產生的數據。在數字化信息爆炸式增長的過程里,每個參與信息交換的節點都可以在短時間里接受傳送大量數據,而全世界存儲數據的成本在過去的50年里每兩年減少一半,存儲密度增加5000萬倍。④在過去,人們受限于取得數據的手段不足,獲得經驗的途徑主要依賴抽樣數據和局部數據,甚至在無法獲得實證數據的時候,求助于自然法和宗教啟示,試圖去發現未知領域的規律,因此,人們對于世界的認識往往是表面的和錯誤的。舍恩伯格指出,在大數據時代,人類第一次有機會在廣泛的領域獲得海量數據、完整數據、多樣化數據,可以實現深入探索現實世界的規律,獲取過去不可能獲取的知識,得到過去無法企及的機會。大數據技術的出現和普及,也使得普通的企業和政府部門通過數據分析,獲得知識,提升服務社會能力。大數據技術和之前的所有數據技術相比,具有四個方面的特點,第一,大數據技術分析與某些事物有關聯的所有數據,而不是依靠少量的樣本數據;第二,大數據本身可以被反復利用,大數據的潛在價值往往深藏在表面收集目的之下,必須借助新算法和新工具來解鎖大數據的“隱藏價值”;第三,大數據技術接受數據的多樣性和復雜性,不追求數據的精確性,大數據技術接受的數據既可以是傳統的文字數據、音像數據,也可以是位置數據、運動數據、生物數據等包羅萬象;第四,大數據技術不去試圖探求事物間的因果關系,而將焦點聚集在關注事物之間的相關關系上。⑤

三、人工智能與大數據技術之間的關系

人工智能技術發展到了深度學習階段后,其實質是用數學模型對真實世界中的特定問題建模,加以海量的訓練數據,來學習更有用的特征,從而提升分類或者預測的準確性,最終解決該領域內問題的過程。從本質上來說,深度學習只是手段,特征學習才是目的,根據連接主義的觀點,機器的深度學習借鑒的正是人類的學習、訓練的過程,也是智能形成的必由之路,而大數據就扮演著最重要的訓練角色,大數據技術的飛速發展,讓深度學習有了無比豐富的數據資源來完成特定功能的訓練。前文中所提到的谷歌AlphaGo就是古今中外的海量圍棋對局大數據訓練出來的結果。由此可見,人工智能要實現跨越式的發展,除了深度學習算法自身升級之外,還需要海量大數據。簡單點說,現階段的人工智能=深度學習+大數據。在人工智能時代,深度學習和大數據成了密不可分的一對,一方面,大數據是人工智能的基石,目前的機器學習和深度學習主要是建立在大數據的基礎之上,即對大數據進行訓練,并從中歸納出可以被計算機運用在類似素質上的知識規律;另一方面,深度學習技術及其他算法可以幫助我們從大數據中挖掘出以往難以想象的有價值的數據知識或者規律,從而著手于社會實踐。英國有一家叫做CambridgeAnalytica的數據分析公司,研發出了一種被稱為大數據挖掘和心理側寫的人工智能技術,并以此項技術為基礎提供廣告信息精準投放業務。CambridgeAnalytica公司從2014年開始使用軟件從Facebook收集數據,前后共獲得了5000萬Facebook用戶的海量數據,在2016年美國大選期間,CambridgeAnalytica公司受雇于共和黨團隊,在掌握5000萬用戶海量大數據基礎之上,根據其自己擁有的人工智能算法技術,設計出了一套分析和輿論引導的軟件來影響總統選舉情況,這個系統可以自動收集和分析互聯網上的選舉進展信息,評估人們對于總統候選人的滿意度,并且通過向用戶投放信息,自動發送虛假新聞等技術手段,宣傳自己所支持的候選人,還可以通過對照實驗準確判斷每個州的選民特征,為自己所支持的競選團隊提供第一手的數據資料和決策依據⑥,5000萬用戶的海量大數據,在經過人工智能算法模型的挖掘之后,爆發出了驚人的能量,幫助特朗普戰勝希拉里,繼AlphaGo之后,再次展示了算法+大數據的威力。

四、人工智能與大數據技術在司法領域的初步

成果2017年4月11日,美國最高法院首法官約翰.羅伯茨接受了一次采訪,有人問他“你能否預見將來有一天,人工智能技術驅動的機器將協助法庭認定事實,甚至頗具有爭議地介入司法裁決程序?”羅伯茨回答道“這一天其實已經到來,而且,這已經讓司法實務的運作方式面臨著巨大的壓力。”近年來,不僅僅是復雜的人工智能和大數據技術,還包括智能設備、信號技術、生物遺傳技術等,這些新技術的出現給傳統的司法證據采信和事實認定帶來巨大的沖擊,以至于不少法官離開了專業人員的鑒定意見就無法做出判決,同時,司法實務中的法律條款在人工智能技術革命的新環境下開始做出改變。當掌握國家機器的司法機關使用甚至依賴技術行使裁量權時,每一個具有遠見的法律人都必須開始觀察這些現象,思考科技進步與公平正義之間的微妙關系。(一)人工智能在社會治安領域的成就。人工智能系統通過深度學習成千上萬張的人臉照片,掌握認識和分辨人類面孔的基本規律,之后,系統再進入全國通緝犯照片大數據庫,記住所有通緝犯的面孔,全國的安防系統只要接入了這套識別通緝犯相貌的系統,通緝犯在公共場合一露面,系統就可以通過監控攝像頭采集的圖像,從海量的監控視頻數據中將通緝犯的面孔準確識別出來。2017年5月份,武漢市東湖警方在東湖綠道景區部署人臉大數據系統,7月6日,警方指揮中心收到實時預警,人臉識別系統比對出一組全國在逃人員圖片,相似度高達97.44%。武漢警方立即使用人臉識別系統生成嫌疑人的行動軌跡,分析研判出犯罪嫌疑人的實時位置,僅用了半個小時,警方便成功抓獲嫌疑人。⑦而這種高效率的記憶、識別和預警,是人類警察無法做到的。(二)人工智能在刑事偵查領域的成就。大數據技術為指控犯罪提供了全新的偵查思路和證據種類。2016年的一天晚上,57歲的澳大利亞婦女默娜•尼爾森死在家中的洗衣房里,她的兒媳卡洛琳•尼爾森向警方作證:當天晚上默娜回家的時候,有一群男子開車跟著她,其中一名男子和默娜發生了爭執,并在20分鐘的爭吵后給了默娜致命的一擊,殺死默娜后,這群男子發現了卡洛琳,把她綁了起來,然后逃離了犯罪現場。聽起來,這是一起有因沖突產生的殺人案件,但澳大利亞阿德萊德地方檢察官卡門•馬泰奧并不相信卡洛琳的證詞,因為他看到了另外一份證據———被害人默娜的電子手表AppleWatch,案發當晚,默娜戴著的這塊智能手表整個晚上都在默默地測量并記錄她的運動和心率。根據這些數據,檢察官卡門•馬泰奧認為:“死者是在晚上6:38左右就遭遇了襲擊,6:45左右去世的。”手表記錄的運動數據意味著卡洛琳所陳述的死者和男子在洗衣房外爭執了20分鐘是虛假事實,進而判斷卡洛琳參與了這起殺人案。⑧2016年9月,澳大利亞阿德萊德地方檢察院以謀殺罪對嫌疑人卡洛琳•尼爾森提起刑事訴訟。在過去,刑事案件的時間起止線也許只能由目擊者的證詞來佐證,警方和公訴檢察官經常會面臨證據不足、事實不清的困境,但在今天,隨時上傳保存的位置數據、運動數據和生物數據,甚至包括每一個輕輕的敲擊,每邁出的一步,每一次心跳,科技所提供的海量數據記錄已經成為了全新的犯罪證據種類,甚至有可能是未來最重要、最客觀、最具有關聯性的證據種類。(三)人工智能在民商事合同審查制作領域的成就。人工智能的深度學習技術成功的將合同中的所有關鍵問題都一一標注,并用人類難以企及的速度進行審查和修改。2016年10月15日,在杭州云棲大會上,無訟創始人蔣勇現場對其主持研發的法律機器人“法小淘”進行功能演示,“法小淘”通過自然語言理解了解了當事人的法律訴求,并分析出案件事實屬于不正當競爭,然后通過數據搜索,從30萬名律師信息中找到了3名合適的律師,并提供了律師所在的律所、同類案件數量、案件標的額區間等信息。2018年2月26日,斯坦福大學、杜克大學法學院和南加州大學的法學教授們與法律人工智能公司LawGeex合作,開發了一款法律人工智能程序機器人,并組織了20名有經驗的律師與機器人比賽合同審查業務的準確性和效率。比賽內容是在四小時內審查五項保密協議并確定30個法律問題,包括仲裁,關系保密和賠償。機器人在26秒內完成了任務,而人類律師平均需要92分鐘,機器人的準確率達到了95%,而人類律師的平均準確率是85%,人類律師完敗。⑨(四)人工智能在審判結果預測方面的成就。隨著機器學習的高速發展,用人工智能算法預測法官或者法官群體的判決結果成為機器學習領域的一大熱門。2017年,美國伊利諾伊理工大學教授丹尼爾•卡茨的團隊利用美國最高法院數據庫中的歷史數據,為每個投票標注若干個屬性標簽,包括法官任期長短、管轄法院、口頭辯論權利保障等,創建了一種“隨機森林”的機器監督學習算法。“隨機森林”模型學習了1816年到2015年最高法院的案例,按年份研究每個案例的特征并預測裁決結果,自主分析案例特征與判決結果之間的關聯關系,最后再標注出正確的結果對機器分析予以修正,通過這種方法逐步優化算法,再繼續進行下一年的預測。經過測試,該模型對于28000項判決結果預測的正確率為70.2%,對24萬張法官投票預測的正確率為71.9%,對1816年到2015年美國最高法院的判決的預測準確率超過70%,超過法律專家66%的預測準確率。(五)人工智能在量刑輔助決策方面的成就。目前,美國多州刑事司法系統已開始頻繁使用智能算法生成的風險評估,鑒定評估犯人今后犯罪的機率。2013年2月,美國威斯康辛州的埃里克•盧米斯(EricL.Loomis)因飛車開槍被捕,一審法院進行判決前進行了量刑前調查,量刑前調查報告中包括一個COMPAS系統風險評估附件。COMPAS是一款風險評估軟件,供不同的司法機關在出入監決策、是否假釋、量刑判斷用來提供決策支持,COMPAS報告的風險評估部分會生成條形圖顯示(如下圖)的風險登記評分,三個條形格分別代表審前再犯風險、一般再犯風險和暴力再犯風險。判決前,法官收到了Compas系統生成的風險評分報告,該報告判定盧米斯可能會在未來實施暴力犯罪,對社區具有“高級別風險”。但是,由于涉及公司競爭核心機密,Compas系統的算法并未公布,盧米斯無法查看。因此,盧米斯聲稱Compas的算法細則違反了既定的法庭程序,提起上訴。2016年5月,威斯康辛最高法院認為Compas系統的風險評估遵循了法院所有既定規定,操作均屬合法。⑩進而維持了一審的判決。毫無疑問,現代社會通過司法來維持和調節各種復雜的社會關系,維系社會運轉,但隨著人工智能技術的發展,算法地位的上升,各種自動化系統通過算法潛移默化的調節社會關系。雖然在當前階段,人工智能技術在司法領域還處在“專家系統”階段,即收集儲存法律專家的大量專業知識,構建法律專家分析法律問題的思維導圖,模仿法律業務專家的思維來解決結構化、定制化的特定問題,只是用來輔助法律實務人員的工作。但是,人工智能算法正逐漸融入律法,技術理性深刻影響著法律理性,人工智能與大數據技術正對司法領域起著深遠的影響,司法正在面臨一個迅速變革的時代。

作者:繆成 單位:安徽省人民檢察院智能語音與人工智能聯合實驗室