人工智能在支付清算風險管理中的設計
時間:2022-07-07 11:26:18
導語:人工智能在支付清算風險管理中的設計一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
內(nèi)容摘要:央行支付清算系統(tǒng)是國家重要金融基礎設施,是社會資金流動的“大動脈”,系統(tǒng)安全高效運行事關(guān)金融穩(wěn)定及經(jīng)濟發(fā)展。近年來,隨著金融科技的蓬勃發(fā)展,以人工智能為主要代表的創(chuàng)新技術(shù)正逐步深入到金融風險管理的核心領域,推動著行業(yè)監(jiān)管向智能化方向發(fā)展。本文通過對人工智能技術(shù)在支付清算風險管理工作中的應用設計,以探索實現(xiàn)運用人工智能技術(shù)對支付清算系統(tǒng)進行智能化監(jiān)控及預警,從而提高支付清算系統(tǒng)安全運行的管理效能。
關(guān)鍵詞:人工智能;支付清算;風險管理;研究
一、人工智能在支付清算領域的發(fā)展現(xiàn)狀
人工智能是指對人類智能的模擬、延伸和擴展,其在金融領域的主要應用方向為機器學習、生物特征識別、語音語義識別及知識圖譜等,在支付清算領域可應用于智能賬戶、智能支付工具、智能清算系統(tǒng)、智能監(jiān)管等。人工智能技術(shù)不僅可以輔助支付清算主體提供便捷、高效的服務,還可以在風險監(jiān)管等方面為支付清算工作提供保障。
(一)國外人工智能技術(shù)在支付清算領域的應用
印度CiCl銀行、HDFC銀行已在行內(nèi)反洗錢、支付交易管理等不同領域引入人工智能技術(shù)。新加坡星展銀行利用生物識別及人工智能集成等技術(shù)開創(chuàng)了純數(shù)字銀行DigBank,創(chuàng)造了新的支付方式,開啟了支付銀行的創(chuàng)新革命。意大利尤克利德利用人工智能技術(shù)試圖獲得用戶支付體驗,以實現(xiàn)業(yè)務自動化。摩根大通將人工智能技術(shù)應用于投行、交易和清算股票。Fraugster是德國和以色列的合作伙伴,使用人工智能來檢測支付欺詐和準確預測欺詐行為。Yandex利用深度學習計算技術(shù)對安全和惡意網(wǎng)站進行分類,以確保網(wǎng)絡支付的安全性。英國銀行NatWest通過iPhone應用程序中的人臉識別實現(xiàn)了使用人臉識別登錄銀行APP的能力。
(二)國內(nèi)人工智能技術(shù)在支付清算領域的應用
在“金融科技”興起的大環(huán)境下,國內(nèi)銀行和非銀行支付機構(gòu)采用的人工智能技術(shù)按照降低成本和提升效率兩條路線,正重塑著支付行業(yè)。平安銀行通過手機銀行首創(chuàng)“智能語音”支付功能,實現(xiàn)“語音支付”、“語音取現(xiàn)”等操作,同時實現(xiàn)“智能錢柜”,完成系統(tǒng)記賬與出納分離的現(xiàn)金自動處理模式。交通銀行開發(fā)的“能聽、會說、能思考、會判斷”的智能理財機器人,能夠為客戶提供專業(yè)的金融服務。與此同時,非銀行支付機構(gòu)也加快了人工智能在支付業(yè)務的融合。支付寶利用人臉識別技術(shù),完成了支付流程的身份認證工作,還利用人工智能技術(shù)對轉(zhuǎn)賬行為進行評估,用以判斷是否有詐騙風險。財付通、支付寶等支付機構(gòu)還推出了“無感支付”業(yè)務。
(三)內(nèi)蒙古自治區(qū)人工智能技術(shù)在支付清算領域的應用
內(nèi)蒙古自治區(qū)五家地方性法人銀行支付系統(tǒng)直接者中,自治區(qū)農(nóng)村信用社聯(lián)合社自2019年7月起,陸續(xù)對自助設備、智能柜員機、手機銀行等交易渠道加入人臉識別技術(shù)進行了相關(guān)系統(tǒng)開發(fā),截至2020年共有自助柜員機試運行機構(gòu)93家、接入設備3958臺,智能柜臺試運行機構(gòu)93家、接入設865臺,手機銀行網(wǎng)貸服務平臺全面加入人臉識別技術(shù);蒙商銀行于2015年將指紋識別技術(shù)應用于柜員登錄業(yè)務系統(tǒng),隨后將OCR識別技術(shù)應用于手機銀行App中,并使用廳堂智能機器人與客戶進行簡單對話、傳遞物品、查詢等互助功能,除此之外,智能投顧系統(tǒng)、貸款審批輔助分析系統(tǒng)等智能創(chuàng)新系統(tǒng)也已陸續(xù)在分支機構(gòu)推廣應用。內(nèi)蒙古支付系統(tǒng)呼和浩特城市處理中心CCPC,以首府生產(chǎn)系統(tǒng)運行主中心和旗縣災備系統(tǒng)運行副中心的系統(tǒng)架構(gòu)設計,并在兩地兩中心雙活模式下生產(chǎn)運行,供配電系統(tǒng)、消防系統(tǒng)、暖通系統(tǒng)以及動環(huán)系統(tǒng)等支付系統(tǒng)基礎環(huán)境的運行監(jiān)控,不同程度地運用了智能化,支付系統(tǒng)的輔助系統(tǒng)實現(xiàn)異常情況下的自動預警提示,支付系統(tǒng)清算風險科技管理手段得以應用。綜上所述,作為與信息技術(shù)融合最深的行業(yè)之一,金融業(yè)積極推動人工智能應用落地,在確保業(yè)務連續(xù)性、提升業(yè)務效率、優(yōu)化成本控制、完善風控體系、推動產(chǎn)品創(chuàng)新等方面取得了明顯突破。
二、人工智能在支付清算風險管理中應用探析
風險是指某一特定危險情況發(fā)生的可能性和后果的組合。對于應用系統(tǒng)而言,風險的發(fā)生主要是指由于各種確定或不確定的因素導致的應用系統(tǒng)沒有按照設定方式運行,以至于運行結(jié)果沒有達到預期效果的各種情況。支付系統(tǒng)風險不僅對其運行構(gòu)成威脅,還會對支付業(yè)務連續(xù)性有一定影響,甚至可能引發(fā)系統(tǒng)性金融風險。
(一)人工智能應用的路徑選擇
1.利用系統(tǒng)日志進行風險檢測。系統(tǒng)日志是記錄系統(tǒng)中硬件、軟件和系統(tǒng)問題的信息,是系統(tǒng)性能以及異常監(jiān)控的重要數(shù)據(jù)來源。在系統(tǒng)風險管理中,異常檢測是構(gòu)建安全可靠系統(tǒng)的重要一步。實踐中,通常會使用安全軟件對系統(tǒng)進行風險檢測,而安全軟件提示的問題時常會提及系統(tǒng)日志信息,一般情況下的處理方式是按照軟件指示進行刪除操作,但系統(tǒng)管理者并不了解問題的根源。使用安全軟件雖然可以在一定程度上對系統(tǒng)進行保護,但同時也為風險的發(fā)生添加了新的可能。而直接對日志信息加以利用不僅可以解決系統(tǒng)運行中存在的問題,還可以預防潛在風險的發(fā)生。
2.系統(tǒng)日志檢測方法選擇。因系統(tǒng)日志具有非結(jié)構(gòu)化、強時效性和出現(xiàn)異常類型較多的特點,所以在選擇日志檢測方法時應重點考量以下幾個方面的因素:一是因日志信息在各式和語義方面與系統(tǒng)之間均有著較大的差異,故不可普遍使用基于規(guī)則的檢測方法。二是對日志信息的監(jiān)測必須要及時,但日志數(shù)據(jù)是以數(shù)據(jù)流的形式進行輸入和傳輸,意味著對全部數(shù)據(jù)進行分析的方法不適用。三是可以對系統(tǒng)所產(chǎn)生的全部異常信息進行捕捉和分析,且對未知的異常信息也要有一定的判定能力。基于上述考量,本文選擇了基于深度學習的日志異常檢測方法,該方法通過對執(zhí)行路徑進行異常檢測、對參數(shù)和性能進行異常檢測、對工作流進行異常檢測三個步驟進行,然后綜合其判斷結(jié)果最終對系統(tǒng)異常進行確定。
(二)人工智能應用于日志檢測的模型構(gòu)建
面對現(xiàn)代系統(tǒng)正在以每小時約50Gb的速度生成大量日志以及大規(guī)模并行使得現(xiàn)代系統(tǒng)行為日漸復雜等問題,針對系統(tǒng)日志信息所做的自動異常檢測方法就顯得尤為重要。計算機技術(shù)就是為幫助使用者解決重復且大量的工作,而人工智能技術(shù)的目的則是使得計算機技術(shù)在解決重復且大量工作的基礎上,可以學習之前工作過程中的經(jīng)驗,完成計算之外的“判斷”和“決定”,甚至可以為使用者“提出建議”等一系列操作。從而幫助工作人員實時監(jiān)控支付系統(tǒng)運行情況,為技術(shù)人員提供更多的參考信息,以此保障支付清算系統(tǒng)平穩(wěn)運行。
1.日志信息異常檢測的步驟。針對系統(tǒng)日志信息的異常檢測主要分為四個步驟:一是日志信息的搜集。搜集的方式有多種,可以利用系統(tǒng)運行本身所產(chǎn)生的日志信息,但由于日志信息一般不輕易用作他處,故通常實驗所使用的日志信息來源于互聯(lián)網(wǎng)的公開數(shù)據(jù)集或者通過程序模擬生成相關(guān)日志信息。二是日志信息的解析。解析的目的是將日志信息按一定模板進行提取,使得日志信息可以按照統(tǒng)一格式進行存儲,從而構(gòu)造模型訓練所需的原始日志信息。三是日志信息特征提取。由于模型所識別的信息是數(shù)字信息,所以日志信息解析為單獨的事件之后,需要將文本信息轉(zhuǎn)化為數(shù)字特征向量,使得機器學習模型可以利用日志信息。四是日志信息異常檢測。檢測方法可以分為有監(jiān)督異常檢測和無監(jiān)督異常檢測。有監(jiān)督異常檢測是指模型通過數(shù)據(jù)的標記來“學習”日志信息的正常和異常狀態(tài),訓練模型時所得到的訓練數(shù)據(jù)越多,模型的精確度就越高;而無監(jiān)督異常檢測則是指模型訓練時所得到的訓練數(shù)據(jù)沒有人為的數(shù)據(jù)標記,通常在模型訓練過程中通過歸一化、聚類等方式進行多次修正,使模型在訓練過程中自主學習日志信息所包含的正常和異常狀態(tài)。有監(jiān)督模型中常用且成熟的有LR、決策樹和支持向量機(SVM);無監(jiān)督模型有LOF、IsolationForest、PCA、InvariantsMining(不變量挖掘)、CLustering(聚類)、DeepLog和AutoEncoder(自動編碼器)。
2.模型模擬訓練。(1)訓練環(huán)境。模型訓練所使用的HDFS數(shù)據(jù)和BGL數(shù)據(jù)基本都來源于生產(chǎn)系統(tǒng)并由相關(guān)領域的專家手動標記,共有15923592條日志信息,同時其中也包含365298條異常日志信息,用于模型訓練和模型驗證時的訓練數(shù)據(jù)和測試數(shù)據(jù)。HDFS數(shù)據(jù)集中包含11175692條數(shù)據(jù),其來源于AmazonEC2平臺,這一數(shù)據(jù)集中的數(shù)據(jù)記錄每項操作,是唯一表示某一時刻的特定操作,因為可以很容易地被分為日志序列,經(jīng)過處理將日志序列進行特征提取,生成575061個向量,其中被標記為異常數(shù)據(jù)的數(shù)據(jù)樣本有16838個。BGL數(shù)據(jù)集中包含4747963條數(shù)據(jù)信息,由LawrenceLivermore國家實驗室的BlueGene超級計算機記錄,這些數(shù)據(jù)沒有標識符,所以通過固定大小將數(shù)據(jù)按特定長度切位日志序列,然后進行向量提取,其中包含348460條異常信息。本文中所使用的方法是在python環(huán)境下實現(xiàn)的檢測方法,對于使用有監(jiān)督的方法,利用機器學習中常用的Scikit-learing實現(xiàn)Logistic回歸、決策樹和SVM的學習模型。模型中所使用的參數(shù)是在實驗過程中多次手動調(diào)節(jié)得到的最優(yōu)值。其中,SVM中還嘗試了核函數(shù)和相關(guān)參數(shù),發(fā)現(xiàn)線性核函數(shù)支持向量機與核函數(shù)進行比較精確度高。同時,對于Logistic回歸進行了不同參數(shù)的嘗試,并對其進行了調(diào)整以便獲得模型的最佳性能。(2)模型訓練及結(jié)果評估。關(guān)于模型的性能,使用精確度、召回率及F-measure(這一系列實驗中常用的度量標準)來對模型性能進行評估,精確度測量的是異常數(shù)量與正常數(shù)量的百分比(如2-1),召回率測量的是實際異常的百分比(2-2),F(xiàn)-measure測量精度與召回率的諧波率(2-3)。根據(jù)現(xiàn)有數(shù)據(jù)集,我們將其中的80%作為訓練集,剩余的20%作為測試集。由于時間及模型訓練所需的環(huán)境等問題,本文只進行了一個方法的調(diào)試和測試。由于不同方法所使用的的原理及算法本身的側(cè)重點不同,所以結(jié)果會有不同。從圖1中表示日志數(shù)據(jù)的聚類可視化解析結(jié)果,大類表示準確的日志數(shù)據(jù),小類表示準確率不太高的日志數(shù)據(jù),但也表示數(shù)據(jù)集中一部分日志數(shù)據(jù)的走向,而零星分散的點表示異常的日志信息。在訓練過程中,將圖中小圈標記位置的數(shù)據(jù)進行剔除后再次進行聚類操作,得到最終的分類標準。同時,由于數(shù)據(jù)的稀缺,還可以將位置較為異常(小圈標注的數(shù)據(jù))標記為異常數(shù)據(jù),以供后續(xù)工作的開展。從圖2中可以看到在訓練的不同階段,不同規(guī)模的數(shù)據(jù)集在準確率的評估條件下的表現(xiàn)結(jié)果。可以看出,數(shù)據(jù)量大的數(shù)據(jù)集相較于小規(guī)模的數(shù)據(jù)集表現(xiàn)搖號,比較符合人工智能模型在訓練過程中數(shù)據(jù)集越大,模型的訓練效果越好的特點。500M和100M的數(shù)據(jù)集在訓練的不同階段有著不一樣的表現(xiàn),但整體趨勢可以看到,隨著訓練迭代的進行,模型的訓練結(jié)果逐漸趨近于平穩(wěn),但不同數(shù)據(jù)集所訓練的模型效果還是有所差異。型使用三個判斷標準得到的相應的結(jié)果。100M數(shù)據(jù)集所訓練的結(jié)果相較于500M和1G的數(shù)據(jù)集結(jié)果要好,通過觀察訓練集和測試集發(fā)現(xiàn),由于所用數(shù)據(jù)集屬于同一來源,所以類型相似,同時小規(guī)模數(shù)據(jù)集的測試集也較小,訓練時所劃分的分類也更細更小,所以小規(guī)模數(shù)據(jù)集所得到的結(jié)果更好,但是使用1G的數(shù)據(jù)集所得到的模型更加穩(wěn)定。
三、人工智能在支付清算風險管理中的策略展望
通過人工智能在支付系統(tǒng)清算風險管理中的應用驗證,基于支付清算系統(tǒng)日志檢測方法,分析日志信息的異常檢測結(jié)果,得出系統(tǒng)日志異常檢測支持支付系統(tǒng)風險研判的理論依據(jù)。
(一)深度論證
本文所嘗試實現(xiàn)的模型論證數(shù)據(jù)是基于互聯(lián)網(wǎng)公開的數(shù)據(jù)以及爬蟲的相關(guān)結(jié)果,由于支付清算系統(tǒng)運行所產(chǎn)生的日志信息較為敏感,所以不能在實驗階段進行使用,這樣也會導致模型無法直接應用于系統(tǒng)中進行模型性能驗證。同時,基于深度學習的日志異常檢測方法分為有監(jiān)督和無監(jiān)督兩種方法,本文所驗證的實驗使用的是有監(jiān)督的方法,從兩種方法的原理來看,無監(jiān)督方法更適用于訓練數(shù)據(jù)和驗證數(shù)據(jù)較少的實驗中。但是,無監(jiān)督方法的不確定性、可失敗的可能都比較大,需要通過多次訓練進行糾正誤差來調(diào)整模型,通常使用無監(jiān)督方法的基于深度學習的模型訓練所需時間是使用有監(jiān)督方法的一倍甚至更多,但所需數(shù)據(jù)是有監(jiān)督模型所需數(shù)據(jù)量的一半甚至更少,數(shù)據(jù)量與模型訓練時間成反比。兩種方法各有其優(yōu)勢,也有其劣勢,可以嘗試通過不同的方法對系統(tǒng)日志檢測模型進行建模、訓練以及驗證,使其實現(xiàn)最優(yōu)選擇。
(二)應用展望
人工智能模型的訓練需要大量的真實數(shù)據(jù)輸入進行模型構(gòu)建,為了保證實驗所得出的模型適用于支付系統(tǒng)清算風險防控,可以根據(jù)支付清算系統(tǒng)所產(chǎn)生的日志信息進行數(shù)據(jù)構(gòu)建,或者可以在安全的情況下使用支付清算系統(tǒng)所產(chǎn)生的日志信息進行模型構(gòu)建,這樣訓練所得到的模型會更具針對性且在更短的時間內(nèi)得到實際應用。但需要關(guān)注的是,人工智能技術(shù)應用研究必然會需要海量數(shù)據(jù)的收集與處理,這樣就可能造成數(shù)據(jù)安全隱患,同時存在信息泄露的風險,支付清算系統(tǒng)日志信息對于支付系統(tǒng)安全穩(wěn)定有著重要作用,所以對于數(shù)據(jù)的使用應慎之又慎。人工智能、大數(shù)據(jù)、云存儲、區(qū)塊鏈等技術(shù)持續(xù)推進金融體系的數(shù)字化轉(zhuǎn)型,金融科技的進步為支付清算行業(yè)的發(fā)展注入了強大的動力,隨著相關(guān)技術(shù)的逐漸成熟,未來支付清算風險管理也會更加智能化,不斷減少人工大量成本,逐步提高科技管理投入,從而降低支付系統(tǒng)風險發(fā)生的可能性。
作者:范玉民 單位:中國人民銀行呼和浩特中心支行