文:?鄂維南
轉(zhuǎn)自:普林科技
導(dǎo)讀:2016年3月24日,“第九屆中國城市商業(yè)銀行信息化發(fā)展創(chuàng)新座談會”召開。可以說,大數(shù)據(jù)已經(jīng)成為金融發(fā)展轉(zhuǎn)型的動力源泉。大會為此專門邀請了國際著名數(shù)學(xué)家,人稱“大數(shù)據(jù)院士”的中國科學(xué)院院士、北京大數(shù)據(jù)研究院院長、普林科技技術(shù)指導(dǎo)委員會主任鄂維南教授就“大數(shù)據(jù)在銀行業(yè)如何務(wù)實落地”發(fā)表了主題演講。
作為著名學(xué)者,鄂院士首先表示這是首次看到整個社會對一項技術(shù)產(chǎn)生強烈的興趣,這背后的深刻原因正是中國經(jīng)濟(jì)的轉(zhuǎn)型升級。谷歌的Alpha?Go戰(zhàn)勝了人類圍棋最強選手,其背后的機理便是大數(shù)據(jù)技術(shù)。可以說,這是人類社會一個前所未有的機會,通過大數(shù)據(jù)技術(shù)可以幫助我們做出更加智慧的決策。
就整個大數(shù)據(jù)應(yīng)用產(chǎn)業(yè)鏈條而言,首先隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的發(fā)展,企業(yè)經(jīng)營活動、消費者行為產(chǎn)生了海量數(shù)據(jù);于是數(shù)據(jù)采集、傳輸、存儲技術(shù)應(yīng)運而生,Hadoop、Spark等大數(shù)據(jù)分布式基礎(chǔ)架構(gòu)風(fēng)生水起。
隨后在數(shù)據(jù)基礎(chǔ)上進(jìn)行基本的運算處理,獲得對數(shù)據(jù)的初步認(rèn)知。
最后便是應(yīng)用數(shù)據(jù)挖掘技術(shù),找到數(shù)據(jù)背后的規(guī)律,形成新的業(yè)務(wù)認(rèn)知。當(dāng)完成這最后一步,大數(shù)據(jù)的價值才真正被完全釋放。
在這方面,除了大家熟知的谷歌,美國還有一家專業(yè)從事大數(shù)據(jù)建模分析的公司Palantir,據(jù)傳正是他們協(xié)助美國政府找打了本拉登的藏身之所。
中國也有一家公司普林科技專業(yè)從事這方面的工作,他們幫助央行打造新一代評分模型,幫助證監(jiān)會構(gòu)建資本市場征信體系等。
說回到銀行業(yè),目前銀行業(yè)主要面臨三方面的挑戰(zhàn)。
首先,經(jīng)濟(jì)下行,需求不足,這對銀行業(yè)的精細(xì)化管理提出了更好的要求。
其次是新技術(shù)的沖擊,互聯(lián)網(wǎng)加大數(shù)據(jù)催生除了互聯(lián)網(wǎng)金融、大數(shù)據(jù)風(fēng)控等全新的金融業(yè)態(tài),傳統(tǒng)銀行所秉承的經(jīng)營理念、技術(shù)手段遭到了前所未有的挑戰(zhàn)。
最后,相比于美國,可以說我國的銀行業(yè)基礎(chǔ)設(shè)施還是不夠健全,個人征信報告的覆蓋人群僅3.7億,這也就意味著大部分中國人沒有任何核心的金融履約行為記錄。
具體到城商行,面對這樣的大形勢,有四方面的問題更為突出。
那么,大數(shù)據(jù)技術(shù)可以如何幫助城商行應(yīng)對這些挑戰(zhàn)呢?
首先,我們來看信貸風(fēng)控。
信貸風(fēng)控是銀行業(yè)務(wù)最核心的一環(huán)。要達(dá)到好的風(fēng)控效果,好的風(fēng)控模型和好的數(shù)據(jù)源都很重要。
就數(shù)據(jù)源而言,我國有3.7億人在央行有個人征信報告,這種金融履約行為是對一個人進(jìn)行授信最核心的數(shù)據(jù)源。
其次,個人在銀行內(nèi)部的交易數(shù)據(jù)、理財賬戶開通數(shù)據(jù)、存款數(shù)據(jù)等等可以作為個人金融行為數(shù)據(jù)的補充,對用戶進(jìn)行更豐富的描摹。
最后,互聯(lián)網(wǎng)社交行為、手機通訊行為、電商平臺交易行為等,可以作為對個人信用描摹的外圍補充數(shù)據(jù)。
這里舉一個例子,大家都知道,我國有征信報告的人總共有3.7億,那么那些沒有任何金融履約行為記錄的人,在申請貸款時該怎么辦呢?
傳統(tǒng)的信用評估方法本質(zhì)上其實一直秉持的是相同的理念,即假定難以得到大量數(shù)據(jù)、存儲大量數(shù)據(jù)成本過于高昂,或者說不可能使用大體量的數(shù)據(jù)。所以基于銀行本身數(shù)據(jù)的、基于經(jīng)驗的審貸方法一直占據(jù)了主流。
但是大數(shù)據(jù)時代改變了這一切。傳統(tǒng)的信用評估只關(guān)注信用歷史等幾個變量,因而那些“金融活動不足者”便難以獲得貸款。于是美國一家公司收集了許多看起來微不足道的數(shù)據(jù),甚至包括打字速度在內(nèi)的上千維度的信息,再通過機器學(xué)習(xí)的方法建立這些信息和違約率之間的聯(lián)系。結(jié)果顯示,這種基于大數(shù)據(jù)和機器學(xué)習(xí)的評估模型較業(yè)內(nèi)一流信用評分改善了40%。
可見,相對外圍的個人行為數(shù)據(jù),結(jié)合大數(shù)據(jù)新算法,可以化學(xué)反應(yīng)出非常神奇的結(jié)果。說回中國,其實現(xiàn)在也有很多互聯(lián)網(wǎng)征信企業(yè),試圖通過借款人在網(wǎng)上的行為記錄來輔助放貸決策;也有公司試圖通過覆蓋面達(dá)到了12.3億人的手機,來“增厚”個人信用報告。
比如普林科技就打通了三大電信運營商,通過一個人的手機消費金額、通話對象、停機次數(shù)等眾多維度手機使用行為信息,來對信貸申請人進(jìn)行信息核驗和風(fēng)險評估。
我們再來看一下面對金融詐騙、網(wǎng)絡(luò)詐騙案件增多的情況,大數(shù)據(jù)可以如何幫助城商行?
基于行為標(biāo)簽化的行為分析與異常識別是一點。通過對用戶的個人信息、交易偏好、交易習(xí)慣等大量信息的分析,可以清楚地描摹每一個用戶,甚至可以得出許多借貸人本人都不清楚的習(xí)慣。一旦這個賬戶出現(xiàn)了某些不符合分析結(jié)果的異常交易行為,就能夠被精準(zhǔn)地識別出來。
關(guān)聯(lián)分析和社交網(wǎng)絡(luò)分析也是數(shù)學(xué)模型在金融反欺詐中的絕佳應(yīng)用。比如詐騙團(tuán)伙常常通過電話、郵編、身份證號、地址等不同類型的信息互相關(guān)聯(lián),這些不同的關(guān)聯(lián)關(guān)系對應(yīng)著特定類型的圖結(jié)構(gòu),通過大數(shù)據(jù)建模分析技術(shù),可以構(gòu)建基于圖的典型欺詐團(tuán)伙模式庫,從而識別不同模式的詐騙團(tuán)伙。
此外,在對申請人的信息進(jìn)行處理時,其背后也用到了自然語言處理技術(shù)和中文模糊匹配技術(shù),從而實現(xiàn)精準(zhǔn)的分析匹配黑名單。
城商行目前面臨的第三個問題是,對客戶了解不夠,細(xì)分不夠,從而難以進(jìn)行有效的產(chǎn)品營銷。那么我們?nèi)绾握J(rèn)識我們的客戶呢?
這時就需要用到基于標(biāo)簽化的用戶畫像技術(shù)。用戶畫像本質(zhì)就是從業(yè)務(wù)角度出發(fā)對用戶進(jìn)行分析,了解用戶需求,幫助尋找目標(biāo)客戶。這里舉個例子幫助大家理解。
普林科技通過大數(shù)據(jù)分析和用戶畫像,為某商業(yè)銀行深入分析用戶的基本信息、消費行為、交易流水等,結(jié)合業(yè)務(wù)場景,將用戶細(xì)分,業(yè)務(wù)部門再據(jù)此設(shè)計產(chǎn)品、制定營銷策略,從而節(jié)省了45%的營銷成本。
最后,目前銀行內(nèi)部數(shù)據(jù)之間,內(nèi)部和外部眾多數(shù)據(jù)源之間難以進(jìn)行數(shù)據(jù)整合和共享。我們以對公業(yè)務(wù)為例,傳統(tǒng)想要了解一個公司,需要投入大量的人力和精力去獲取各種信息,再根據(jù)經(jīng)驗做出判斷。
而在大數(shù)據(jù)時代,通過互聯(lián)網(wǎng)爬蟲技術(shù),我們可以獲取并整合包括工商、法院、稅務(wù)、互聯(lián)網(wǎng)輿情、企業(yè)招投標(biāo)、招聘等海量數(shù)據(jù),再通過建模分析將之歸結(jié)為信用歷史、運營指標(biāo)、輿情指標(biāo)等多維度,最后輸出綜合評分。其背后的技術(shù)則是網(wǎng)頁解析技術(shù)、圖像識別技術(shù)、自然語言處理技術(shù)和大數(shù)據(jù)建模分析技術(shù)。
首先,打造核心的風(fēng)控與反欺詐系統(tǒng),提高核心競爭力。
其次,將數(shù)據(jù)分析成果與營銷優(yōu)化的具體方案結(jié)合,切實落地。
最后,立足本行數(shù)據(jù),結(jié)合外部數(shù)據(jù)源,與專業(yè)分析團(tuán)隊合作,有效實現(xiàn)數(shù)據(jù)共享、信息整合與技術(shù)融合。