來源:中國(guó)征信雜志 時(shí)間:2017-10-20 12:16:18 作者:李銘
近年來流行一個(gè)“一切數(shù)據(jù)都是信用數(shù)據(jù)”的說法,用各種“非傳統(tǒng)”數(shù)據(jù)做信用風(fēng)險(xiǎn)評(píng)估受到不少國(guó)內(nèi)信貸機(jī)構(gòu)的青睞。然而與許多人的猜想不同,國(guó)外的征信機(jī)構(gòu)幾乎沒有一家使用這些數(shù)據(jù)。這篇短文討論為什么這些數(shù)據(jù)難以被征信機(jī)構(gòu)使用,以及是否存在變通的辦法。在討論問題之前,筆者想先給本文要討論的數(shù)據(jù)確定個(gè)范圍。一般而言,可以將征信機(jī)構(gòu)感興趣的數(shù)據(jù)分為信用數(shù)據(jù)和非信用數(shù)據(jù)兩大類。信用數(shù)據(jù)又可以進(jìn)一步區(qū)分為信貸信用數(shù)據(jù)和非信貸信用數(shù)據(jù)兩個(gè)子類。最近十幾年來受到國(guó)際征信行業(yè)廣泛關(guān)注的所謂替代信用數(shù)據(jù)或非傳統(tǒng)信用數(shù)據(jù),例如電信、有線電視和公用事業(yè)的繳費(fèi)數(shù)據(jù),可列入非信貸信用數(shù)據(jù)范疇。本文談?wù)摰臄?shù)據(jù)主要屬于非信用數(shù)據(jù),具體說來,就是指用于信用風(fēng)險(xiǎn)評(píng)估目的的不具有信用交易特征的數(shù)據(jù);相應(yīng)的模型和評(píng)分則分別被稱為非信用數(shù)據(jù)模型和非信用數(shù)據(jù)評(píng)分。
非信用數(shù)據(jù)在個(gè)人征信機(jī)構(gòu)使用所面對(duì)的最大障礙是其很難滿足征信行業(yè)對(duì)于數(shù)據(jù)的基本要求。世界銀行2011年發(fā)布的《征信通則》中指出,征信機(jī)構(gòu)的數(shù)據(jù)要“相關(guān)、準(zhǔn)確、及時(shí)、充分”,要“在系統(tǒng)化的基礎(chǔ)上向所有可靠、適宜和可用的來源采集”,并保存“足夠長(zhǎng)的時(shí)間”。非信用數(shù)據(jù)要滿足這些要求還真是不太容易。
一百多年里征信行業(yè)走過漫漫長(zhǎng)路,最終從“報(bào)告?zhèn)髀劇焙汀爸饔^評(píng)估”轉(zhuǎn)變到“報(bào)告事實(shí)”和“科學(xué)評(píng)估”上來。這里面,“報(bào)告事實(shí)”主要是通過報(bào)告契約(合同)信息和信貸機(jī)構(gòu)賬戶信息來實(shí)現(xiàn),數(shù)據(jù)中可能存在的錯(cuò)誤開放給借、貸雙方去質(zhì)疑;“科學(xué)評(píng)估”是通過統(tǒng)計(jì)學(xué)的理論和方法對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,模型準(zhǔn)確性允許用實(shí)驗(yàn)手段去度量。非信用數(shù)據(jù)的情況如何呢?非信用數(shù)據(jù)的真實(shí)性(Veracity)通過多層面、多角度、大數(shù)量的數(shù)據(jù)交叉比對(duì)和相互影響來實(shí)現(xiàn),證偽求真針對(duì)的是一個(gè)數(shù)據(jù)分析過程而不是數(shù)據(jù)元素本身。于是數(shù)據(jù)的相關(guān)性和準(zhǔn)確性驗(yàn)證困難,也很難開放給信用主體去檢查和質(zhì)疑。
在更深的層次上,非信用數(shù)據(jù)帶來的最大問題是征信機(jī)構(gòu)無法實(shí)現(xiàn)對(duì)數(shù)據(jù)的控制。這反映在以下幾個(gè)方面:
首先,非信用數(shù)據(jù)幾乎沒有可能采集。如同在替代信用數(shù)據(jù)采集時(shí)遇到的問題一樣,數(shù)據(jù)源與數(shù)據(jù)使用者的分離成為妨礙信息共享的最大障礙。 數(shù)據(jù)源不是整合后數(shù)據(jù)的使用者,不從數(shù)據(jù)共享的實(shí)踐中獲益,這使得數(shù)據(jù)源機(jī)構(gòu)缺少數(shù)據(jù)共享的動(dòng)力和積極性,數(shù)據(jù)源機(jī)構(gòu)需要在共享活動(dòng)中尋求其他利益(例如有償共享)。由于非信用數(shù)據(jù)通常散落在許多機(jī)構(gòu)手中,其數(shù)量龐大、規(guī)模增長(zhǎng)迅速、內(nèi)容蕪菁混雜,以全量采集為目的數(shù)據(jù)購(gòu)買行為沒有經(jīng)濟(jì)上的合理性和技術(shù)上的可行性。因此,期望將非信用數(shù)據(jù)像信貸交易數(shù)據(jù)一樣采集到征信機(jī)構(gòu)來,恐怕只是種奢望。
其次,使用非信用數(shù)據(jù)的征信機(jī)構(gòu)可能要承擔(dān)侵犯消費(fèi)者權(quán)益的法律責(zé)任。既然征信機(jī)構(gòu)不能通過數(shù)據(jù)采集實(shí)現(xiàn)對(duì)數(shù)據(jù)的完全控制,也基本不可能通過契約手段將數(shù)據(jù)的管理和控制責(zé)任完全轉(zhuǎn)嫁給數(shù)據(jù)源機(jī)構(gòu),因此征信機(jī)構(gòu)沒有辦法履行自己的法律責(zé)任,保障信用主體對(duì)征信數(shù)據(jù)的知情權(quán)、訪問權(quán)和糾錯(cuò)權(quán)。換句話說,如果決定在征信業(yè)務(wù)實(shí)踐中使用非信用數(shù)據(jù),征信機(jī)構(gòu)從第一天開始便要做好準(zhǔn)備,去承擔(dān)可能存在的侵害消費(fèi)者權(quán)益的法律責(zé)任。
最后,使用非信用數(shù)據(jù)評(píng)分的征信機(jī)構(gòu)可能需要承擔(dān)更多的法律責(zé)任。在傳統(tǒng)上,由于評(píng)分模型被看作商業(yè)秘密而不能向消費(fèi)者披露,征信機(jī)構(gòu)主要的法律義務(wù)之一是要向消費(fèi)者披露分?jǐn)?shù)計(jì)算所使用的全部數(shù)據(jù)。消費(fèi)者無法向模型的數(shù)學(xué)公式提出異議,但消費(fèi)者可以檢驗(yàn)分?jǐn)?shù)計(jì)算所使用的數(shù)據(jù)。如果數(shù)據(jù)中存在錯(cuò)誤,消費(fèi)者就有權(quán)要求糾正這些錯(cuò)誤、重新計(jì)算分?jǐn)?shù)。在非信用數(shù)據(jù)的情況下,使用非信用數(shù)據(jù)評(píng)分的征信機(jī)構(gòu)可能無法或不便向消費(fèi)者披露計(jì)算評(píng)分所使用的數(shù)據(jù),于是在相當(dāng)程度上摧毀了非信用數(shù)據(jù)評(píng)分的使用者規(guī)避自身法律責(zé)任的可能性。
那么,征信機(jī)構(gòu)在簡(jiǎn)單地宣示“拒絕使用非信用數(shù)據(jù)和非信用數(shù)據(jù)評(píng)分”之外,面前是否存在其他選項(xiàng)呢?
我們注意到,數(shù)據(jù)的多樣性是非信用數(shù)據(jù)的基本屬性之一。有些類型的非信用數(shù)據(jù)其實(shí)仍然屬于“事實(shí)數(shù)據(jù)”。這些數(shù)據(jù)雖然難以采集,但并非不可以向消費(fèi)者報(bào)告,例如電商交易數(shù)據(jù)或手機(jī)呼叫數(shù)據(jù)等。這里暫且將這類數(shù)據(jù)稱為可報(bào)告非信用數(shù)據(jù)。另一些類型的非信用數(shù)據(jù)不屬于“事實(shí)數(shù)據(jù)”,不可能或不適合向消費(fèi)者報(bào)告,例如社交媒體數(shù)據(jù)等由信用主體主動(dòng)提供、真實(shí)性難以驗(yàn)證的數(shù)據(jù),以及一些至少?gòu)谋砻嫔峡此坪鯂?yán)重不“相關(guān)”的數(shù)據(jù)。暫且將這類數(shù)據(jù)稱為不可報(bào)告非信用數(shù)據(jù)。
如果評(píng)分模型僅使用信用數(shù)據(jù)及可報(bào)告非信用數(shù)據(jù),可以按照傳統(tǒng)的方式處理“非信用數(shù)據(jù)評(píng)分”的法規(guī)依從性問題。我們只需要給使用到不可報(bào)告非信用數(shù)據(jù)的評(píng)分模型(權(quán)且稱作“黑盒模型”)尋找一個(gè)規(guī)避法律責(zé)任的辦法。
如前所述,使用“黑盒模型”的主要目的是解決沒有信用歷史或信用歷史信息不足的消費(fèi)者人群的信用風(fēng)險(xiǎn)評(píng)估問題。替代信用數(shù)據(jù)的相關(guān)研究表明,這個(gè)人群中的多數(shù)人是信用狀態(tài)良好的人,包括一部分信用狀態(tài)非常好的人。如果“黑盒模型”有較好的預(yù)測(cè)能力,可以認(rèn)為前述人群中的多數(shù)人會(huì)從“黑盒模型”的使用上受益。這部分人應(yīng)該不會(huì)很在意非信用數(shù)據(jù)評(píng)分是否侵犯信用主體的權(quán)益。因此,需要考慮的僅是被“黑盒模型”認(rèn)定為高信用風(fēng)險(xiǎn)的少數(shù)人,包括被錯(cuò)誤認(rèn)定為高風(fēng)險(xiǎn)的人和被正確認(rèn)定為高風(fēng)險(xiǎn)的人。
對(duì)于這部分人,一個(gè)簡(jiǎn)單的處理方式是允許他們拒絕非信用數(shù)據(jù)評(píng)分給出的評(píng)估結(jié)果。這相當(dāng)于是賦予信用主體“拒絕被自動(dòng)化決策”的權(quán)力,即宣示信用主體有權(quán)要求信貸機(jī)構(gòu)采用傳統(tǒng)信用評(píng)分、使用信用報(bào)告或使用附加提供的數(shù)據(jù)人工判斷信貸產(chǎn)品申請(qǐng)人的信用風(fēng)險(xiǎn)狀況。在一些歐洲國(guó)家的個(gè)人信息保護(hù)法律中,“拒絕被自動(dòng)化決策”的權(quán)力已經(jīng)存在。有條件地許可金融消費(fèi)者行使這一權(quán)力不會(huì)給信貸行業(yè)帶來太大的壓力和負(fù)擔(dān),與此同時(shí),可以保障信貸機(jī)構(gòu)在傳統(tǒng)法律和法規(guī)的框架內(nèi)通過非信用數(shù)據(jù)的使用而獲益,是件雙贏的事。
簡(jiǎn)單歸納起來,個(gè)人征信機(jī)構(gòu)使用非信用數(shù)據(jù)大致可遵循這樣一種模式:
1.放棄采集數(shù)據(jù)的傳統(tǒng)做法,征信機(jī)構(gòu)與相關(guān)數(shù)據(jù)源簽署協(xié)議,按需獲取非信用數(shù)據(jù)。
2.征信機(jī)構(gòu)使用自己擁有的信貸交易數(shù)據(jù)對(duì)非信用數(shù)據(jù)評(píng)分模型的準(zhǔn)確性和穩(wěn)定性做充分驗(yàn)證,而后在自己的平臺(tái)上部署非信用數(shù)據(jù)評(píng)分產(chǎn)品。
3.如果所部署的非信用數(shù)據(jù)評(píng)分模型是“黑盒模型”,征信機(jī)構(gòu)與信貸機(jī)構(gòu)要簽署關(guān)于非信用數(shù)據(jù)評(píng)分產(chǎn)品使用的附加協(xié)議,明確承諾消費(fèi)者享有“拒絕被非信用數(shù)據(jù)模型自動(dòng)化決策”的權(quán)力。
4.當(dāng)信貸機(jī)構(gòu)向征信機(jī)構(gòu)查詢非信用數(shù)據(jù)評(píng)分時(shí),征信機(jī)構(gòu)從簽約數(shù)據(jù)源處實(shí)時(shí)獲取所需非信用大數(shù)據(jù),與征信機(jī)構(gòu)自有的其他征信數(shù)據(jù)一起(如果必要)計(jì)算非信用數(shù)據(jù)評(píng)分。
5.如果征信機(jī)構(gòu)部署的非信用數(shù)據(jù)評(píng)分模型不是“黑盒模型”,征信機(jī)構(gòu)應(yīng)將獲取的非信用數(shù)據(jù)融入信用報(bào)告,和非信用數(shù)據(jù)分?jǐn)?shù)一起交付給查詢?nèi)?,同時(shí)將非信用數(shù)據(jù)保存下來以供審計(jì)。
6.如果信貸產(chǎn)品申請(qǐng)人不滿意使用“黑盒模型”的非信用數(shù)據(jù)評(píng)分結(jié)果,要求審批人員忽略非信用數(shù)據(jù)評(píng)分,審批人員應(yīng)滿足信貸產(chǎn)品申請(qǐng)人的要求,采用人工判斷的方式處理申請(qǐng)。審批人員可以要求信貸產(chǎn)品申請(qǐng)人提供進(jìn)一步的材料以輔助審批進(jìn)行。
開發(fā)信用評(píng)分模型的目標(biāo)是在分?jǐn)?shù)與人群“好壞比”之間建立起穩(wěn)定和可靠的量化關(guān)系,傳統(tǒng)評(píng)分模型和非信用數(shù)據(jù)評(píng)分模型在這一點(diǎn)上并無二致。換句話說,傳統(tǒng)模型和非信用數(shù)據(jù)模型都試圖展示自己是一個(gè)“好模型”,而模型的好壞能夠使用真實(shí)的信貸數(shù)據(jù)在統(tǒng)計(jì)意義上加以驗(yàn)證。唯一存在的問題是,哪種模型相對(duì)而言能夠被消費(fèi)者所接受。既然非信用數(shù)據(jù)評(píng)分難以改變其“不透明”的特性,則希望讓消費(fèi)者自己來控制是否使用非信用數(shù)據(jù)評(píng)分可以消弭消費(fèi)者的部分不滿心理,而不至于讓征信機(jī)構(gòu)將這種有價(jià)值的預(yù)測(cè)分析技術(shù)徹底拒之門外。
作者:李銘,北京航空航天大學(xué)畢業(yè), 獲計(jì)算機(jī)科學(xué)及工程碩士學(xué)位,美國(guó)雪城大學(xué)(Syracuse University) 獲計(jì)算機(jī)科學(xué)博士學(xué)位。曾在多家信息技術(shù)企業(yè)、大學(xué)及商業(yè)銀行工作,涉及領(lǐng)域包括計(jì)算語義學(xué)、自然語言處理及理解、海量信息處理、統(tǒng)計(jì)建模、商務(wù)智能、電訊網(wǎng)絡(luò)管理、信息安全、軟件測(cè)試、企業(yè)體系結(jié)構(gòu)和個(gè)人計(jì)算機(jī)固件等。
責(zé)任編輯:黃玉葉