原題:大數據征信的黑白兩面:社交數據能否做依據
“從放貸人那里采集借款人信息”,這是中國人民銀行征信中心副主任王曉蕾對于“征信”的理解,也是學院派對于征信的經典界定,然而革新者已經拋棄了這一界定,與之一同被拋棄的還有征信數據采集限于“金融屬性信息”的范疇和“采集者與信息產生沒有任何關系”的獨立第三方原則。
非金融屬性的數據能做征信嗎?
7月11日下午,在上海外灘舉辦的“2015上海新金融年會”上,央行征信中心副主任王曉蕾、美國征信巨頭FICO中國CEO陳建,以及四家即將拿到個人征信牌照機構的負責人坐在一起,就中國互聯網金融和征信的發展展開了激烈的討論。
“我不知道你們說的‘征信’是指什么,”王曉蕾首先表達了困惑,互聯網金融的發展放大催生了征信的“新業態”,這種“新業態”讓像王曉蕾這樣全程參與了央行征信中心設計和建設的征信老兵也開始看不懂了。
追本溯源,基于銀行借貸信息建立起來的個人征信中心,其初衷在于建立一個“放貸人之間的信息共享數據庫”,原則上由放貸人上傳所有借貸人的真實信用信息。但互聯網企業所宣傳的“大數據征信”早已不再是這種傳統意義上的“征信”,其直接表現就是采集數據的范疇已經突破了“金融屬性”,從僅收集真實借貸人的信息,延伸到未發生借貸的信息,如社交數據、電商數據等沒有金融屬性、缺乏驗證性、弱關聯的互聯網大數據。
與此同時,征信機構“獨立第三方”的邊界也被模糊了。征信機構恪守的“數據從第三方來給第三方用”的絕對獨立第三方原則,與民營機構數據的采集和使用都與自身有千絲萬縷的聯系形成了鮮明的對比,如騰訊征信用微信、QQ的社交數據,服務騰訊的放貸業務;芝麻征信使用的是阿里的電商數據,服務阿里的放貸業務。
在這種擴展了信息收集范圍又模糊了獨立第三方原則雙突破的“新業態”下,不僅征信在風險管理上的效力有待檢驗,個人享受的公平信用權利也面臨風險。
“新業態”下的信用風險
就數據有效性而言,有人已經提出直接的懷疑。
今年初,央行印發《關于做好個人征信業務準備工作的通知》,要求芝麻信用、騰訊征信、前海征信、鵬元征信、中誠信征信、中智誠征信、考拉征信、華道征信這8家民營征信機構做好個人征信業務的準備工作,準備時間為6個月。如今6個月已到,第一批民營征信機構牌照發放在即。
對于使用互聯網大數據做征信,中智誠征信有限公司CEO李萱并不樂觀,“迄今為止,沒有一個國家,沒有一家真正的征信機構做出來的基于互聯網的征信產品,能夠應用于較大的人群。”擁有19年征信從業經驗的李萱進一步從技術評分的角度解釋道,“我們沒有見過一個基于互聯網大數據做出的(征信)模型KS評分能夠超過35分。”KS(Komolgorov-Smirnov)指數是衡量模型辨別能力的普遍方法,數值在0—100之間,數字越大模型越有效,35分為模型是否有效的地平線。
但在一線開拓業務的互聯網金融企業對“大數據征信”依然擁有熱情和信心,就在此次峰會召開的半個月前,6月26日,京東正式對外宣布投資Zestfinance,這是一家用互聯網大數據做征信的美國新創公司,雙方成立了合資子公司,欲為京東金融業務提供征信支撐。
京東金融戰略發展部副總裁姚乃勝,親自操刀促成此次合作的大數據征信擁護者,向記者表達了觀點,“如果電商數據(做征信)都沒用,那么什么數據有用?說電商數據不行的人怕是已經過時。”
對像京東金融一樣長期無法接入央行征信系統,又不可能停止業務拓展腳步的互聯網金融公司而言,“大數據征信”是一門好生意,盡管效用依然存在爭議,但總比“裸奔”要強,而且這種征信一旦被廣泛采納,作用將不僅僅限于風險管理。
潛在的個人利益損失
人們早就領略過央行征信中心的威力,有時甚至不惜拆借高息貸款及時還清銀行欠款,以免被計入央行征信系統黑名單中,影響以后諸如房貸等貸款的獲得。
“新業態”下數據采集范圍的擴大無疑將這種麻煩從金融領域帶到整個網絡生活中。盡管在2013年3月15日實施的《征信業管理條例》中規定,未經同意,平臺不得收集、使用個人信息,但人們為了獲得平臺提供的服務往往輕易就“同意”了。
令人擔憂的是,如果這種“新業態”的服務對象不是信貸業務,那么征信機構在出具報告時并不需要嚴格遵守征信報告的標準,但它所出的產品仍可能影響其他機構對你的態度,例如它從你的網絡行為預測你是否有違約的傾向,或者用更為隱蔽的手法——給你的這種傾向一個綜合的評分,一個較低的芝麻信用分或許將來會影響你的求職。在美國1970年制定的《公平信用報告法》中,一份信用報告的制作、傳播、對違約記錄的處理等等都有很嚴格的規定。
這意味著利用互聯網大數據做征信產品的機構無形中獲取了某種權力,而由于“第三方原則”被模糊,對個人而言可能是獲得更高征信分值成本的提高。仍以芝麻信用分為例,隨著芝麻分被越來越多地使用在非阿里系的業務中,如租車、旅游、辦簽證等等,而其來源數據卻仍大多來自阿里系,這意味著個人為了提高芝麻分,必須在阿里體系的生態圈里做更多的事情,比如尋找更多支付寶還款記錄良好、芝麻分高的人并成為好友。
監管層期待:做銀行做不了的事
監管者并非沒有預見風險,實際上王曉蕾在會上反復強調自己“不了解8家民營征信公司具體的產品”,能不能起作用尚有待觀察。
王曉蕾對P2P的理解是,“P2P是獨立出來的專業化的信用風險管理機構”,這種理解高估了當前P2P平臺的能力,但反映了監管層對金融創新的期望。
不止一位P2P平臺的管理層曾向記者表達過希望能接入央行征信中心的愿望,征信數據的缺失讓平臺在發展過程中捉襟見肘。在會上,王曉蕾從另一個側面印證了這一事實,即大量P2P平臺將沒有央行征信報告的客戶拒之門外。
監管層長期對互聯網金融持包容態度的基礎在于,“P2P是在為中國的普惠金融做貢獻,做銀行不做的事”。其含義在于,監管層希望互聯網金融能夠將銀行體系服務不到的中小微企業服務好,將央行征信系統中5億沒有覆蓋到的人群的信用記錄補齊。
倘若它們不能做到這一點,甚至盯著央行征信系統里已有的2.9億用戶,和銀行搶奪客戶,而放棄服務小微企業的努力,類似“新業態”這種創新所帶來的風險,監管層的包容將失去意義。
來源:IT時報? 作者:張程
]]>主講嘉賓:王曉蕾
主持人:中關村大數據產業聯盟副秘書長陳新河
承辦:中關村大數據產業聯盟、金融大數據專業委員會
嘉賓介紹:
王曉蕾:現任中國人民銀行征信中心黨委委員、副主任;從事征信工作10余年,研究方向為個人數據保護、金融教育和征信;擁有中國人民銀行研究生院金融學碩士(89級)、美國霍普金斯大學國際公共政策碩士學位;先后在中國人民銀行國際司、貨幣政策司、征信管理局工作。
以下為分享實景全文:
王曉蕾:大家好,我是人民銀行征信中心的王曉蕾,很榮幸能夠跟大家匯報我在征信領域、信貸風控領域的一點心得,今天我跟大家分享的主題是中國征信市場發展,相關內容只代表本人在該領域一些初淺的看法。比起前幾次的分享,我的內容應該是大家熟悉的內容了。
我先從征信的概念說起吧,因為這個概念曾經讓我很抓狂。放貸機構之“征信”是放貸機構基于內部信息的風險管理過程,而征信行業之“征信”是為放貸機構的風險管理提供外部信息支持的活動,包括來自征信系統的通用化征信報告和來自資信調查機構的定制化資信調查報告兩大類。
圖1 征信活動服務于信用風險管理
征信系統通過放貸人之間的信息共享機制,為放貸人提供了僅以自身永遠無法獲得的信息,服務于放貸活動和信貸市場。征信系統堅持兩大原則:第一是互惠原則,只有首先報數據才能查數據。第二是全面共享原則,同質信息的共享是全面(正面信息和負面信息都有)對等的。此外,通過征信系統業已建立的信息共享渠道,集中采集、使用公共信息,可滿足放貸機構“雖能獲得、但成本高”的那部分信息需求,也是征信系統的潛在作用。征信系統主要有以下幾個特點。
圖2 征信系統的主要特點
資信調查是由授信機構發起的、針對被調查對象的信用調查、信息采集和加工的活動,其主要產品也由標準化的信用報告演化為量身定制的資信調查報告等,服務的對象也由信貸市場中的放貸機構,逐步延伸到社會經濟生活的其他方面。
2013年,世界銀行國際征信業委員會制定的《征信國際通用原則》指出,征信系統促成放貸機構共享其客戶的借貸信息,有效降低了單個放貸成本和整個社會融資信息的成本。《原則》也為各國征信系統建設制定了指引,具體包括:征信數據要準確、及時和充分,信息來源制度化、系統化,數據保存足夠長的時間;二是數據處理要安全、可靠、高效;三是在法律和監管環境上要確保清晰、可預測、非歧視性、恰當并支持數據主體權利;四是在征信機構的治理上要確保機構治理科學有效等;五是在條件允許時促進數據的跨境流動。
圖3征信體系國際通用原則
《原則》也為評價一個征信體系的發展狀況制定了相應的指標。一個完善的征信系統,應該包括:在信息覆蓋面上,盡可能地對放貸機構、借款人群和地域上的全覆蓋;在數據采集、挖掘中滿足放貸機構、信息主體、監管部門等征信系統參與各方對信息的需求;征信系統要盡可能在保障信息主體的知情權、使用權、異議權等征信權益和促進公平信貸之間的平衡,在促進信貸市場發展、保障公平信貸權利、促進信貸市場有效競爭等方面發揮積極的作用。這為各國征信業的發展提供了有效的指導性綱領。
再說說我國征信系統的基本情況
我國的企業征信系統1992年起源于深圳的企業貸款證,個人征信1999年在上海試點,人民銀行歷時20多年,建成了世界最大、全國統一的企業和個人征信系統。
圖4 我國征信系統的模式
目前,全國集中的數據庫,通過與公安部身份聯網核查和質檢總局組織機構代碼聯網核查,與金融機構一點接入,達到秒級響應的高效率訪問,實現全國范圍內統一的制度、標準、授權和管理。
圖5《征信業管理條例》對征信系統的定位
目前,我國征信系統主要采集身份信息、信貸信息、非金融負債信息三大塊,涵蓋了貸款、貿易融資、保理、票據貼現等各類企業授信產品,以及個人消費貸、住房抵押貸款、信用卡、個人經營性貸款等個人信貸產品。
圖6 我國征信系統的信息覆蓋范圍
從借款人來看,征信系統收錄的企業和自然人數已居全球前列。截至2014年底,企業和個人征信系統分別收錄近2000萬戶企業、其他組織和8.6億自然人,其中,有信貸記錄的自然人3.5 億人。
從接入和服務的機構來看,基本覆蓋各類放貸機構。截至2014年底,企業和個人征信系統接入機構分別達1724 家和1811 家。
圖7 征信系統對放款機構的覆蓋情況
為小貸公司、融資性擔保公司和村鎮銀行等小微放貸機構開辟互聯網接入征信系統的新渠道,簡化接口規范。2014年,新增接入企業和個人征信系統的小微機構分別為982家和1032家,通過互聯網平臺接入的分別有693家和642家。
圖8 征信系統對小機構的互聯網接入形式
在對外服務上,目前的產品和服務體系主要是信用報告基礎服務和增值產品服務兩大塊。在信用報告查詢上,截至2014 年底,企業征信系統當年累計查詢量9950萬次,個人征信系統當年累計查詢4.1 億次,信用報告被廣泛深入地應用于信用風險管理領域。
增值產品有關聯企業的關聯查詢服務,有將本機構好客戶在其他機構變壞的信息提供給機構用戶的重要信息提示服務。還有利用個人信用報告中信貸交易和查詢信息建模,研究開發個人信用風險量化評估工具,預測借款人未來逾期的可能性、我們稱之為“個人信用報告數字解讀”服務。此外,為了服務于金融機構貸后管理,提高信貸政策制定的科學性和準確性,信貸資產結構分析、歷史違約率等產品也正在研發中。
圖9 征信系統的主要產品和服務
征信系統的應用成效不斷凸顯。2014年,清華大學李稻葵教授帶領的團隊,對征信系統的應用成效進行定量研究發現,2012年,征信系統促進了0.33個百分點國內生產總值增長和142萬新增就業,促進大、中、小微企業新增貸款分別為347億元、370億元和6750億元。從商業銀行報送的應用成效來看,2014年,各銀行利用征信系統拒絕授信4890億元,對高風險客戶進行風險預警4588億元,壓縮企業授信規模1214億元,開展不良貸款清收370億元。在世界銀行全球信用信息指數評價中,我國信用信息指數由2007年的3分上升到2014年的5分,離滿分6分更進一步。
圖10 我國征信系統的應用成效
對未來征信市場的發展,我是這樣看滴。
第一,信貸市場、經濟活動和社會交易三大方面,未來對于了解交易對手、緩解交易過程中信息不對稱問題的潛在需求大,第三方征信潛力很大。僅從信貸市場而言,中國有很多的個人和小微企業對信貸需求很大,信貸市場的藍海主要在于沒有跟銀行發生借貸關系的個體和企業,需要發展有效的征信方式為其服務,這也正是對所謂的互聯網、大數據征信業發展的期待。
互聯網記錄了借款人以前不可記錄的行為,獲得了以前無法、或成本很高的數據,有利于為放貸人了解借款人是誰、有沒有還款能力和還款意愿提供了新的渠道和方法。但是,相關的信息究竟如何使用有待進一步研究驗證。
在2014年,美國政策與經濟研究委員會(PERC)對于非金融信息(也成為替代性信息)在信貸決策中作用的研究表明:一是諸如水、電、煤、有線電視、手機等非金融信息納入征信系統,顯著地提高了薄信用檔案人群的信貸獲得能力,但對于厚信用檔案人群而言邊際作用不大;二是研究初步發現,社交信息對于判斷借款人的還款意愿和能力暫無預測力。(ResearchConsensus Confirms Benefits of Alternative Data,MichaelA.Turner, ect)
第二、互聯網在網絡借貸(P2P)中發揮中介的作用,把有錢的人和需要錢的人匹配在一起,通過互聯網實現了借貸雙方之間的直接交易。在資金匹配過程中的風險管理和風險選擇上,網貸平臺投資者和銀行存款人、小貸公司出資人之間存在一定的區別。
圖11 網絡借貸(P2P)模式的資金匹配
肩負對平臺上借款人信用風險進行管理的網貸平臺,在信息使用、貸前調查等方面可借助互聯網的優勢,但本質上與其他從事信用風險的放貸機構并無二致,核心還是充分利用內外部各種信息做好客戶征信和增信,提高對風險的控制和管理水平。
圖12 網絡借貸的創新性和本質
從放貸業務的網貸平臺依照《征信業管理條例》的規定應該納入征信系統,在目前網貸機構法律地位未界定的情況下,我們在兩年前通過上海資信公司建立了一個網貸機構之間的網絡金融征信系統(NFCS),目前全國已經有近500家網貸機構正在接入、或準備接入這個系統中,194家網貸機構提供數據、涉及借款人63萬、余額305億,累計查詢110萬次。未來,隨著政策的進一步明確,打通其與征信系統之間的聯系技術上不是問題。
圖13 網絡金融征信系統(NFCS)概況
第三,隨著社會多層次征信服務需求的興起,征信市場主體、征信服務方式也應該是分層和多樣性的,從總體上,讓市場化的征信機構逐漸發揮主導作用符合長期可持續發展的需要。
近年來,美國征信市場逐漸形成了一類非傳統征信機構,與傳統征信機構主要從放貸機構、公共部門等采集信息不同,非傳統征信機構奉行的是“消費者可以更主動參與到自身信用檔案的建立”,它的核心業務模式是“由信息主體本人提供信息,征信機構對信息進行驗證、核實,最終出具信用報告向信息使用方提供”。
當前,我國市場上已經出現了這類專業征信機構的雛形,它們要求借款人通過互聯網或手機填報基本信息并上傳證明材料,經借款人授權后,與相關外部數據庫鏈接實現信息驗證,并通過多種方式獲取銀行卡消費記錄、信用卡賬單信息等,通過信息交叉驗證和分析,提供借款人信用風險評估服務。
最后,對發展我國征信市場的幾點建議。
作為一個與數據打交道的行業,征信業始終繞不開的兩大核心問題:一是公共信息的公開問題,包括政府信息的公開可得和企業財務信息的準確、可得;二是對個人隱私的保護問題,在大數據征信業態下,個人隱私保護的問題更為突出。
圖14 四大類公共信息
迫切需要加強政府信息公開的相關立法,推動政府信息公開要走法治化道理。從2005年開始,我們推動了社保、公積金、司法、工商、環保等公共信息的采集工作,部分地區的公積金、電信繳費、環保和司法判決等信息業已進入系統。但是,由于缺乏法律支持和制度保障,公共信息的可持續性有待進一步提高。一直以來的實踐證明,加強政府信息公開的相關立法,進一步推動政府信息公開,提高為社會提供公共信息服務的意識,要走法制化的道理。
在隱私保護方面,在傳統的模式下,借款人讓渡了一些個人隱私,主要是借款還錢的信息,換來了公平信貸交易的機會,在長期的過程中形成了一個基本平等的交易模式。但在大數據的征信模式下,很容易打破讓渡隱私和獲得信貸之間的平等交換模式。
為此,世界各國對隱私保護的力度越來越強,如在歐洲個人數據保護立法實踐中提出的一個核心觀點是“技術可行并非是道德的,大數據意味著更重的責任。”在數據使用的過程中,特別注重透明性原則和個人權利的保護:誰在收集和使用數據,為什么這么干,數據保存多久,數據將與誰共享;個人對信息的使用權,對信息處理流程的知情權和被遺忘權是大數據下個人權益的核心內涵。
互聯網時代數據的使用是否應該遵守以下基本原則:一是目的性原則,建立數據庫要有明確的目的;二是適當性原則,采集與目的間要適當;三是本人同意原則,在采集、使用數據時本人要同意(1與0的選擇);四是知情原則,對數據的采集、使用、過程、結果等要有知情。為促進互聯網時代我國征信業的健康發展,在制定中國的數據保護法的規則規范中,一方面可以借鑒國際經驗,另外一方面行業自身、行業自己也是責無旁貸,從行業自律開始,再上升到規章,最終到法律。
原題:【大數據100分】王曉蕾:大數據時代的金融征信 ? ? ? ? ? ?文章來源:中關村大數據產業聯盟
]]>2015年1月5日,央行發文,要求騰訊征信、芝麻信用等八家機構做好個人征信業務的準備工作,準備時間為6個月。這表明,個人征信市場正式向互聯網企業開放。享受此次征信開放業務的由8家機構承擔,分別是芝麻信用管理有限公司、騰訊征信有限公司、深圳前海征信中心股份有限公司、鵬元征信有限公司、中誠信征信有限公司、中智誠征信有限公司、拉卡拉信用管理有限公司、北京華道征信有限公司。
?
什么是個人和企業征信
?
所謂征信,就是專業化的、獨立的第三方機構為個人或企業建立信用檔案,依法采集、客觀記錄其信用信息,并依法對外提供信用信息服務的一種活動,它為專業化的授信機構提供了一個信用信息共享的平臺。征信的數據要素主要包括三個方面。一是個人基本信息,包括姓名、證件類型及號碼、通訊地址、聯系方式、婚姻狀況、居住信息、職業信息等;二是信用交易信息,包括信用卡信息、貸款信息、其他信用信息;三是其他信息,包括查詢記錄等。
當前,由中國人民銀行組織商業銀行建成的企業和個人征信系統,已經為全國1300多萬戶企業和近6億自然人建立了信用檔案。這也就是說,這些企業和個人從事經濟金融活動的信用狀況將被記錄到“經濟身份證”上,成為與企業和個人永遠相伴的檔案。如果逾期還貸或有其他違反合同的規定,那么“經濟身份證”將被抹上灰色的一筆,今后向銀行申請貸款就可能面臨更加謹慎和挑剔的目光。
征信建設遭遇什么瓶頸
?
當前,網購已經觸及到社會經濟行為的各個角落,以P2P為代表的互聯網金融正在對傳統金融行業發起沖擊,基于網絡的互聯網經濟成為一個重要的經濟形勢,而主體虛擬化的交易方式使得信用的重要性越來越突出,于是征信業務作用性越發迫切。與此同時,互聯網發展給個人征信行業帶來了跳躍式的發展。隨著互聯網的發展,人的行為變成24小時可記錄,這就導致跟傳統征信業的數據相比,互聯網征信的數據涉及范圍更廣,種類更多。因此,傳統的征信模式很難實現大數據時代的要求,大數據征信是征信體系的發展趨勢。
從互聯網征信的特征來看,其獲取的主要是信息主體在線上的行為數據,包括網上的交易數據、社交數據以及其他互聯網服務使用中產生的行為數據等,甚至可以是在信息主體之外的第三方評價、信用口碑等信息。這些代表信息主體的互聯網行為軌跡和細節更多反映人的性格、心理等更加本質的信息,都可以用來對信息主體的信用狀況進行推斷。
然而,隨著互聯網大數據時代的到來,傳播與網上的數據信息增量驚人。有數據顯示,阿里芝麻信用信用數據日處理量在30P B以上,相當于5000個國家圖書館的數據總量,其中包含了用戶網購、還款、轉賬以及個人信息等方方面面數據。而與互聯網上傳播的日數據量相比,阿里芝麻信用的這些數據真算是九牛一毛。面對分布在各種平臺、網站、社區、數據庫的數據量龐大的,甚至是零散、零碎的征信建設可用數據信息,如何實現這些信息數據的收集、清洗、匯總,也算是當前互聯網個人及企業征信建設的一個瓶頸了。
在業內看來,無論是阿里還是騰訊,布局征信業務主要優勢在于手上握有的大數據。但是,面對抓取阿里生態圈外數據的瓶頸,阿里芝麻也只能通過購買或者合作等方式采集外部數據,包括政府機構數據以及金融機構數據等來彌補互聯網征信在數據上的不足。于是,在自有生態圈外實現個人和企業信用信息的采集、整理、保存、加工工作,已經成為互聯網大數據時代征信建設必須要突破的困局。
點擊閱讀全部內容:http://www.07zn.com/ab/key/xinxicaiji_gerenzhengxin.html?
]]>