當前位置:首頁>宏觀經濟
索信達控股:央行《人工智能算法金融應用評價規范》解決方案先行者
發布時間:2021-04-07 17:14:44 文章來源:晶報網

日,中國人民銀行發布金融行業標準《人工智能算法金融應用評價規范》,發布之日起正式實施。索信達控股有限公司(索信達控股,股票代碼:03680.HK)作為金融行業大數據與人工智能解決方案提供商,早在“規范”實施前,于2019年面向國內金融行業率先推出應對AI算法可解釋的“模型翻譯機-可解釋機器學”,并已在金融機構成功落地應用。應對AI算法精確能和安全推出“模型工廠”、“模型管理臺”等全棧解決方案,索信達成為推動人工智能算法金融應用規范管理的先行者。

WechatIMG2494.png

據悉,《規范》針對當前金融行業人工智能技術應用存在的算法黑箱、算法同質化、模型缺陷等潛在風險問題,建立了人工智能金融應用算法評價框架,從安全、可解釋、精準能等方面系統化地提出基本要求、評價方法和判定準則,為金融機構加強智能算法應用風險管理提供指引。

《規范》指出,AI算法精準能是計價算法應用效果及目標的主要因素,一般而言精準能越高算法應用效果越好。算法可解釋是判斷算法是否適用的重要依據,可解釋越高,算法內在邏輯、技術實現路徑、決策過程、預期目標越明晰,算法更易于被理解、匹配、應用和管理。AI算法安全為算法在金融行業應用提供安全保障,是決定AI算法是否可用的基礎,只有在滿足安全要求的前提下,才能在金融領域開展應用。

就人工智能算法和技術如何融入到銀行的日常應用規范管理和業務中,索信達控股首席科學家張磊博士總結為“四大能力、八類應用”,并介紹了索信達在銀行業的實際的AI應用案例。

助力銀行業發展的人工智能四大能力

人工智能這個話題很火,如何和銀行業務需求打通,把人工智能技術移駕到銀行業本身,這是很多銀行客戶都很關心的問題。以下是張磊博士基于索信達客戶最佳實踐,總結構建自身人工智能能力的“四大能力”:

WechatIMG2495.png

第一,業務能力:以業務能力為出發點,所有技術都要解決業績問題。索信達已梳理出金融行業可以用AI解決的業務問題,如市場營銷、風險管控、財務人事、運營績效相關的,針對問題進行歸類就可以圈出銀行業用人工智能數據分析解決問題的范圍。

第二,數據能力:以數據為基礎,各種數據加工能力為手段,將數據利用起來。人工智能技術和其他的技術有一些不同,它完全依賴數據,若無數據支撐所有先進算法都無作用,所以要有數據儲存、加工的能力。

第三,分析能力:以各種先進算法為工具,發現數據中蘊含的有價值的規律。算法的類型像可解釋機器學、自然語言處理、圖分析、圖計算等,這些算法目前在金融領域用的比較多。

第四,思維能力:索信達幫助企業構建分析思維能力,更加合理有效地發現和解決問題。這點要特別強調!因為總被忽視,很多人掌握了技術也知道業務能力,但是還是解決不了問題,因為缺少思維能力。如何將梳理好的數據、算法、業務問題貫通起來,這就需要分析思維能力。

銀行業務問題的分類體系與AI技術的對應關系

銀行業面臨的業務問題主要分八大類:

分類問題,將輸入樣本分類到對應類別中。判斷客戶質量,購買意愿。

估值問題,根據輸入信息估算某個指標的數值。如,某家分行下個月存款余額會到多少?

聚類問題,根據實例的相似度進行歸類,銀行有上億客戶,想將其分成不同的客戶客群,還有網點、支行等的分行也是聚類問題。

優化問題,基于目標函數和約束條件生成最優解。如,我有預算100萬如何將其花出去達到最大效益?

異常偵測,發現異于常規的實例。如,一筆金融交易是否有問題,是否是欺詐交易,賬戶間互相的聯動是否是洗錢聯動。

評級問題,對實例進行排序評級,像信用評級是標準問題。

推薦系統,生成下一步的最佳行動建議。

數據生成,基于已有的數據分布仿真出類似數據。

通過調研可以清楚看到,八類問題的重要程度和價值回報也各有不同。

銀行業使用的重點分析技術

銀行業會用到很多分析算法,最常用的重點技術包括:隨機森林、前饋神經網絡、回歸分析、分類器、聚類、統計推斷、循環神經網絡、強化學。圖中越深的顏色代表使用頻率較高。

分析專題和數據類型有一定的對應關系,張磊博士認為,無論是做潛客獲取或是智能客服或反欺詐、現金庫存優化等都是人工智能可以大顯身手的領域。

在銀行業,AI應用需要重點關注回報最大的業務領域

對于銀行業來說,AI應用需要重點關注回報最大的業務領域。盲目地做人臉識別或文檔OCR等無法帶來明顯的業務價值。其中獲得回報最大的是市場營銷,其次是風險管控。

建立模型工廠,打造五庫合一的分析模型生產流水線

索信達打造五庫合一的分析模型生產流水線,通過模型工廠,幫助企業進行數據分析建模的現代化生產流水線。它融合了分析建模生產所需的全部裝備,做到五庫合一:模型庫、模板庫、代碼庫、知識庫、課件庫。只需裝填數據原材料,即可自動化生產出可用的標準模型,同時支持個化定制。

索信達將八大類問題梳理了50多個專題,通過大量實踐發現它成型的套路,比如要做資產提升大概分為7個步驟可以分析出來,要做反欺詐可以做9個步驟分析出來,索信達希望通過構建金融業的模型工廠,把銀行遇到的每個問題都可以標準化自動化解決。

打造模型管理臺 全局掌控企業模型管理

隨著大數據和分析算法的蓬勃發展,金融機構在營銷管理、風險管理和決策支持的過程中,研發了大量模型來支持企業的運營與管理。但由于模型數量眾多,模型管理的問題隨之而來。索信達控股基于多年來在金融行業大數據領域的技術沉淀及經驗,率先業界發布了模型管理系統。對企業級投產上線的模型進行評有效的評估、測試、監控以及版本和權限管理。助力金融機構搭建完善的模型管理系統,大幅提升企業統籌管理及運行模型的效率。

WechatIMG2496.png

模型管理系統以自動化的方式計算各種評估指標,根據模型衰退和數據變化自動預警。通過監控模型的定時驗證數據,可在系統每執行一次模型的定時任務后,在模型詳情頁中查看驗證后的指標值數據和對應的圖表數據。如果驗證失敗,則本系統不會生成模型的指標值,且在首頁的“事件消息”模塊中會顯示該模型定時任務運行失敗的消息。

索信達模型管理系統有效地解決金融機構等企業模型管理的痛點,大幅度降低模型失控、模型資產管理混亂和依靠人工操作所帶來的風險。打造出企業級自動化模型工廠,全方位、自動化、標準化地掌控企業模型管理。

模型翻譯機 可解釋機器學

索信達控股率先業界發布推出的可解釋機器學,是金融行業企業級數據挖掘方案。該方案通過融合多種模型和算法,致力于解決銀行金融機構現有機器學模型“黑箱”的問題,幫助銀行提升模型透明度,滿足監管需要,同時增強模型精度和決策的可靠程度。保證模型高精度條件下,針對客戶不同應用場景均能做出深度解釋,幫助客戶降低模型風險合規風險

據張磊博士介紹,⽬前已在產品精準推薦、客戶挖掘、流失預警等多個⾦融類營銷場景中開展應⽤和落地,并取得了優秀的成果,使得⼈⼯智能算法和技術能夠更好的融入到銀行的日常應用規范管理和業務中。

12步搭建客戶微細分模型,客戶名單命中率最高可提升75%!

索信達通過將結構化數據進行合理的圖像化,并創新地運用深度學算法,挖掘反映客戶資產偏好的深層特征,從而有效提升銀行現有各個模型的準確,并通過客戶在不同圖像狀態之間的轉移概率,預判出客戶資產配置的發展趨勢,為一線客戶經理提供覆蓋全客戶的營銷方向。

通過引入索信達客戶微細分產生的新圖像特征,將上線模型(大額存單、結構存款)前10%名單的命中率提高20%~40%;無論采用何種預測算法,模型均有明顯提升,前5%名單的命中率最高提升3/4;直接產生的營銷效益高達數百萬至上千萬。

基于深度學的客戶微細分分析建模流程

客戶微細分,是運用算法把客戶數據變成圖像,以更加細致、更加創新的模型為客戶精準畫像,給銀行業務的開展帶來更有價值的決策依據。索信達客戶微細分的全部流程分為12個步驟,這是個思考、模擬、反復驗證的過程,很是有趣。

第一,以數據圖像化為橋梁

人工智能年來比較火的是深度學,但深度學算法主要是做圖像識別,適合處理圖像,而銀行基本上都是結構化數據,例如賬戶數據、交易數據等,結構化數據無法直接被深度學算法所用,需要借助數據圖像化,把結構化數據變成合理的圖像就可以用到這個技術了。

第二,客戶的產品資產結構化數據

先來看銀行最典型的數據,比如我們拿到了500萬富裕零售客戶過去12個月的數據,AUM月日均超過5萬以上,數據量是每月500萬客戶,包含的字段信息有AUM、活存余額、定存余額、基金余額、理財余額等。

第三,數據標準化與離散分箱

下圖列出5條客戶數據,每位客戶給出了各項產品的余額。比如第一個客戶活存11.8萬,定存只有1767元,這是銀行常見的數據,數據拿來后會先做標準化,因為一個客戶活存余額有10萬并不一定代表這個客戶喜歡活存,如果他的資產有1000萬,把900多萬放在定存10萬放在活存,顯然不能說明他喜歡活存。

第四,相關分析

接下來我們希望將這個數據變成一幅圖,才能使用圖像識別技術。這個數據可以變成瓦片圖,按照比例高低,最高的放在最左邊,但是瓦片圖最大的問題是沒有考慮產品之間的關系,只是簡單按照數字大小排。如何把產品之間的關系引用進來呢?比如說理財基金是不是有互斥的關系。通過相關分析,就可以看出變量之間的相關是正相關、負相關,哪些相關系數強或弱。

第五,太陽系與萬有引力定律

算出相關系數之后,再來看如何改造前面得到的“瓦片圖”。張磊博士聯想到太陽系九大行星,地球、金星、火星圍繞太陽轉,這之間的軌道不是很快形成的而是慢慢形成的,是星球間的萬有引力才使其形成的,所以運用這種“引力”定位行星的運行軌道。我們只需將活存、定存、國債、基金理財這些產品視作星球,將彼此間的相關系數視作引力,就可以通過迭代來構造出產品的星系圖。

第六,網絡布局算法與斥力模型

運用斥力算法,把一堆產品想象成一堆球丟在桌上,相互之間會有引力斥力,當斥力達到衡時得到最終結果。活存和理財離的比較代表比較相關,貴金屬離的比較遠,則相當于很遙遠的冥王星。現在可以發現我們已經將剛才的數據變成更有意義的圖像了,但這個時候還不適合做深度學。如果現在是把100張這樣的圖擺在你面前,你一定會看的眼花繚亂,但是如果把瓶子或椅子放在這里,離100米就能看出大概什么區別,是因為從其輪廓上很自然就能識別出來。目前的圖像還沒有鮮明的輪廓,所以需要對這些圖進行改造。

第七,等高線投影與顏色映射

可以把這些小球想象成一個個山頭,可以看到這些山頭高高低低的,高高低低的山峰如果想畫到二維上通常會用等高線,于是把一堆球變成一堆山峰,再變成一些二維等高線,就得到最開始我展示的那張圖。中間最紅最亮的就是客戶最關心的產品如活存、理財、定存。

第八,一人一圖像百花齊放

下面羅列了20張圖,有一些圖比較類似,比如說倒數第二列第一行第二行,像兩塊石頭堆在一起。有的客戶很不一樣,有的客戶很類似。例如,左上角這個客戶只有一塊亮就是定期存款,右下角這個客戶是重財惜命型,他的資產主要放在人身險和財產險;還有的客戶是惜命愛基型,財產放在人身險和基金;再是貸款型以貸款為主,少量活存,大量資產放在貸款,另外有一定的活期存款用來還款;還有白領型,活存和薪金煲為主,其次是人身險,該客戶是標準的代發工資客戶,工資發下來后會買薪金煲,同時還會買基金,收入應該不會太低,還會買人身險。什么樣的代發工資客戶在這家工資用信用工資做理財還買人身險,通常來說收入水會達到一定水

第九,圖像的自動特征編碼

很多圖做出來發現比較類似,所以很自然會想到把類似的圖像聚類在一起。圖像聚類通常會采用自動編碼器,算法的輸入是這張圖像,輸出還是這張圖像,中間做壓縮編碼和解碼,用幾個數字來表示這張圖像的主要特征。

第十,密度聚類為客戶微狀態

把圖像變成數字特征后就可以采用聚類算法進行聚類,把類似的圖像聚到一起,最開始索信達采用的是AP算法,但是效果太慢,后來又換成了密度聚類算法,原來跑的AP算法大概跑40多分鐘,但是換了DBSCAN算法只需要6秒,把類似的圖放在一起,就聚成了1616個個類。

第十一,狀態隨時間的轉移概率

索信達發現聚類效果還不錯,類中心的代表比較強,由此就得到了1616個微細分群。如果把每一個微細分群看成一個狀態,可以發現每個月客戶的狀態在不斷地變,大部分時候變的很慢,從一張圖變成另一張圖有業務的含義,先是日常消費,然后嘗試買理財,然后申購基金辦理理財卡。

第十二,狀態轉移全景圖

索信達將狀態演變做成動畫,看起來很炫,但是實際有沒有用,是否有業務價值呢?張磊博士進行了驗證,如果這個圖畫的比較有意義,用來進行營銷應該能帶來幫助。銀行以前做了結構化存款的響應預測模型,用常規數據丟進去跑一個模型,現在我們用客戶微細分之后得到更多的圖像特征,如果有提升就代表有價值,最后驗證結果是前5%的名單命中率提高25%,前10%名單命中率提高14%,驗證了產生的這些圖像特征可以給業務明顯幫助。

索信達控股首席科學家張磊博士認為,人工智能是銀行業把握科技變革對商業社會重塑的奇點機遇,重新認知和構建銀行的生態和企業價值鏈,重塑銀行與社會和客戶的鏈接。《規范》的發布有助于引導金融機構充分發揮人工智能“頭雁效應”,加快金融數字化轉型步伐,持續推動金融服務更為貼心、更加智慧、更有溫度,打造數字經濟時代金融創新發展新引擎,助力健全具有高度適應、競爭力、普惠的現代金融體系。索信達將會攜手銀行金融機構共同把握未來銀行的機遇,賦能金融生態,共享金融AI未來。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

關鍵詞:
精彩文檔:
最近更新:
熱文
焦點