文:?鄂維南
轉(zhuǎn)自:普林科技
導(dǎo)讀:2016年3月24日,“第九屆中國(guó)城市商業(yè)銀行信息化發(fā)展創(chuàng)新座談會(huì)”召開(kāi)。可以說(shuō),大數(shù)據(jù)已經(jīng)成為金融發(fā)展轉(zhuǎn)型的動(dòng)力源泉。大會(huì)為此專(zhuān)門(mén)邀請(qǐng)了國(guó)際著名數(shù)學(xué)家,人稱(chēng)“大數(shù)據(jù)院士”的中國(guó)科學(xué)院院士、北京大數(shù)據(jù)研究院院長(zhǎng)、普林科技技術(shù)指導(dǎo)委員會(huì)主任鄂維南教授就“大數(shù)據(jù)在銀行業(yè)如何務(wù)實(shí)落地”發(fā)表了主題演講。
作為著名學(xué)者,鄂院士首先表示這是首次看到整個(gè)社會(huì)對(duì)一項(xiàng)技術(shù)產(chǎn)生強(qiáng)烈的興趣,這背后的深刻原因正是中國(guó)經(jīng)濟(jì)的轉(zhuǎn)型升級(jí)。谷歌的Alpha?Go戰(zhàn)勝了人類(lèi)圍棋最強(qiáng)選手,其背后的機(jī)理便是大數(shù)據(jù)技術(shù)。可以說(shuō),這是人類(lèi)社會(huì)一個(gè)前所未有的機(jī)會(huì),通過(guò)大數(shù)據(jù)技術(shù)可以幫助我們做出更加智慧的決策。
就整個(gè)大數(shù)據(jù)應(yīng)用產(chǎn)業(yè)鏈條而言,首先隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的發(fā)展,企業(yè)經(jīng)營(yíng)活動(dòng)、消費(fèi)者行為產(chǎn)生了海量數(shù)據(jù);于是數(shù)據(jù)采集、傳輸、存儲(chǔ)技術(shù)應(yīng)運(yùn)而生,Hadoop、Spark等大數(shù)據(jù)分布式基礎(chǔ)架構(gòu)風(fēng)生水起。
隨后在數(shù)據(jù)基礎(chǔ)上進(jìn)行基本的運(yùn)算處理,獲得對(duì)數(shù)據(jù)的初步認(rèn)知。
最后便是應(yīng)用數(shù)據(jù)挖掘技術(shù),找到數(shù)據(jù)背后的規(guī)律,形成新的業(yè)務(wù)認(rèn)知。當(dāng)完成這最后一步,大數(shù)據(jù)的價(jià)值才真正被完全釋放。
在這方面,除了大家熟知的谷歌,美國(guó)還有一家專(zhuān)業(yè)從事大數(shù)據(jù)建模分析的公司Palantir,據(jù)傳正是他們協(xié)助美國(guó)政府找打了本拉登的藏身之所。
中國(guó)也有一家公司普林科技專(zhuān)業(yè)從事這方面的工作,他們幫助央行打造新一代評(píng)分模型,幫助證監(jiān)會(huì)構(gòu)建資本市場(chǎng)征信體系等。
說(shuō)回到銀行業(yè),目前銀行業(yè)主要面臨三方面的挑戰(zhàn)。
首先,經(jīng)濟(jì)下行,需求不足,這對(duì)銀行業(yè)的精細(xì)化管理提出了更好的要求。
其次是新技術(shù)的沖擊,互聯(lián)網(wǎng)加大數(shù)據(jù)催生除了互聯(lián)網(wǎng)金融、大數(shù)據(jù)風(fēng)控等全新的金融業(yè)態(tài),傳統(tǒng)銀行所秉承的經(jīng)營(yíng)理念、技術(shù)手段遭到了前所未有的挑戰(zhàn)。
最后,相比于美國(guó),可以說(shuō)我國(guó)的銀行業(yè)基礎(chǔ)設(shè)施還是不夠健全,個(gè)人征信報(bào)告的覆蓋人群僅3.7億,這也就意味著大部分中國(guó)人沒(méi)有任何核心的金融履約行為記錄。
具體到城商行,面對(duì)這樣的大形勢(shì),有四方面的問(wèn)題更為突出。
那么,大數(shù)據(jù)技術(shù)可以如何幫助城商行應(yīng)對(duì)這些挑戰(zhàn)呢?
首先,我們來(lái)看信貸風(fēng)控。
信貸風(fēng)控是銀行業(yè)務(wù)最核心的一環(huán)。要達(dá)到好的風(fēng)控效果,好的風(fēng)控模型和好的數(shù)據(jù)源都很重要。
就數(shù)據(jù)源而言,我國(guó)有3.7億人在央行有個(gè)人征信報(bào)告,這種金融履約行為是對(duì)一個(gè)人進(jìn)行授信最核心的數(shù)據(jù)源。
其次,個(gè)人在銀行內(nèi)部的交易數(shù)據(jù)、理財(cái)賬戶(hù)開(kāi)通數(shù)據(jù)、存款數(shù)據(jù)等等可以作為個(gè)人金融行為數(shù)據(jù)的補(bǔ)充,對(duì)用戶(hù)進(jìn)行更豐富的描摹。
最后,互聯(lián)網(wǎng)社交行為、手機(jī)通訊行為、電商平臺(tái)交易行為等,可以作為對(duì)個(gè)人信用描摹的外圍補(bǔ)充數(shù)據(jù)。
這里舉一個(gè)例子,大家都知道,我國(guó)有征信報(bào)告的人總共有3.7億,那么那些沒(méi)有任何金融履約行為記錄的人,在申請(qǐng)貸款時(shí)該怎么辦呢?
傳統(tǒng)的信用評(píng)估方法本質(zhì)上其實(shí)一直秉持的是相同的理念,即假定難以得到大量數(shù)據(jù)、存儲(chǔ)大量數(shù)據(jù)成本過(guò)于高昂,或者說(shuō)不可能使用大體量的數(shù)據(jù)。所以基于銀行本身數(shù)據(jù)的、基于經(jīng)驗(yàn)的審貸方法一直占據(jù)了主流。
但是大數(shù)據(jù)時(shí)代改變了這一切。傳統(tǒng)的信用評(píng)估只關(guān)注信用歷史等幾個(gè)變量,因而那些“金融活動(dòng)不足者”便難以獲得貸款。于是美國(guó)一家公司收集了許多看起來(lái)微不足道的數(shù)據(jù),甚至包括打字速度在內(nèi)的上千維度的信息,再通過(guò)機(jī)器學(xué)習(xí)的方法建立這些信息和違約率之間的聯(lián)系。結(jié)果顯示,這種基于大數(shù)據(jù)和機(jī)器學(xué)習(xí)的評(píng)估模型較業(yè)內(nèi)一流信用評(píng)分改善了40%。
可見(jiàn),相對(duì)外圍的個(gè)人行為數(shù)據(jù),結(jié)合大數(shù)據(jù)新算法,可以化學(xué)反應(yīng)出非常神奇的結(jié)果。說(shuō)回中國(guó),其實(shí)現(xiàn)在也有很多互聯(lián)網(wǎng)征信企業(yè),試圖通過(guò)借款人在網(wǎng)上的行為記錄來(lái)輔助放貸決策;也有公司試圖通過(guò)覆蓋面達(dá)到了12.3億人的手機(jī),來(lái)“增厚”個(gè)人信用報(bào)告。
比如普林科技就打通了三大電信運(yùn)營(yíng)商,通過(guò)一個(gè)人的手機(jī)消費(fèi)金額、通話對(duì)象、停機(jī)次數(shù)等眾多維度手機(jī)使用行為信息,來(lái)對(duì)信貸申請(qǐng)人進(jìn)行信息核驗(yàn)和風(fēng)險(xiǎn)評(píng)估。
我們?cè)賮?lái)看一下面對(duì)金融詐騙、網(wǎng)絡(luò)詐騙案件增多的情況,大數(shù)據(jù)可以如何幫助城商行?
基于行為標(biāo)簽化的行為分析與異常識(shí)別是一點(diǎn)。通過(guò)對(duì)用戶(hù)的個(gè)人信息、交易偏好、交易習(xí)慣等大量信息的分析,可以清楚地描摹每一個(gè)用戶(hù),甚至可以得出許多借貸人本人都不清楚的習(xí)慣。一旦這個(gè)賬戶(hù)出現(xiàn)了某些不符合分析結(jié)果的異常交易行為,就能夠被精準(zhǔn)地識(shí)別出來(lái)。
關(guān)聯(lián)分析和社交網(wǎng)絡(luò)分析也是數(shù)學(xué)模型在金融反欺詐中的絕佳應(yīng)用。比如詐騙團(tuán)伙常常通過(guò)電話、郵編、身份證號(hào)、地址等不同類(lèi)型的信息互相關(guān)聯(lián),這些不同的關(guān)聯(lián)關(guān)系對(duì)應(yīng)著特定類(lèi)型的圖結(jié)構(gòu),通過(guò)大數(shù)據(jù)建模分析技術(shù),可以構(gòu)建基于圖的典型欺詐團(tuán)伙模式庫(kù),從而識(shí)別不同模式的詐騙團(tuán)伙。
此外,在對(duì)申請(qǐng)人的信息進(jìn)行處理時(shí),其背后也用到了自然語(yǔ)言處理技術(shù)和中文模糊匹配技術(shù),從而實(shí)現(xiàn)精準(zhǔn)的分析匹配黑名單。
城商行目前面臨的第三個(gè)問(wèn)題是,對(duì)客戶(hù)了解不夠,細(xì)分不夠,從而難以進(jìn)行有效的產(chǎn)品營(yíng)銷(xiāo)。那么我們?nèi)绾握J(rèn)識(shí)我們的客戶(hù)呢?
這時(shí)就需要用到基于標(biāo)簽化的用戶(hù)畫(huà)像技術(shù)。用戶(hù)畫(huà)像本質(zhì)就是從業(yè)務(wù)角度出發(fā)對(duì)用戶(hù)進(jìn)行分析,了解用戶(hù)需求,幫助尋找目標(biāo)客戶(hù)。這里舉個(gè)例子幫助大家理解。
普林科技通過(guò)大數(shù)據(jù)分析和用戶(hù)畫(huà)像,為某商業(yè)銀行深入分析用戶(hù)的基本信息、消費(fèi)行為、交易流水等,結(jié)合業(yè)務(wù)場(chǎng)景,將用戶(hù)細(xì)分,業(yè)務(wù)部門(mén)再據(jù)此設(shè)計(jì)產(chǎn)品、制定營(yíng)銷(xiāo)策略,從而節(jié)省了45%的營(yíng)銷(xiāo)成本。
最后,目前銀行內(nèi)部數(shù)據(jù)之間,內(nèi)部和外部眾多數(shù)據(jù)源之間難以進(jìn)行數(shù)據(jù)整合和共享。我們以對(duì)公業(yè)務(wù)為例,傳統(tǒng)想要了解一個(gè)公司,需要投入大量的人力和精力去獲取各種信息,再根據(jù)經(jīng)驗(yàn)做出判斷。
而在大數(shù)據(jù)時(shí)代,通過(guò)互聯(lián)網(wǎng)爬蟲(chóng)技術(shù),我們可以獲取并整合包括工商、法院、稅務(wù)、互聯(lián)網(wǎng)輿情、企業(yè)招投標(biāo)、招聘等海量數(shù)據(jù),再通過(guò)建模分析將之歸結(jié)為信用歷史、運(yùn)營(yíng)指標(biāo)、輿情指標(biāo)等多維度,最后輸出綜合評(píng)分。其背后的技術(shù)則是網(wǎng)頁(yè)解析技術(shù)、圖像識(shí)別技術(shù)、自然語(yǔ)言處理技術(shù)和大數(shù)據(jù)建模分析技術(shù)。
首先,打造核心的風(fēng)控與反欺詐系統(tǒng),提高核心競(jìng)爭(zhēng)力。
其次,將數(shù)據(jù)分析成果與營(yíng)銷(xiāo)優(yōu)化的具體方案結(jié)合,切實(shí)落地。
最后,立足本行數(shù)據(jù),結(jié)合外部數(shù)據(jù)源,與專(zhuān)業(yè)分析團(tuán)隊(duì)合作,有效實(shí)現(xiàn)數(shù)據(jù)共享、信息整合與技術(shù)融合。