郵件系統(tǒng):
用戶名: 密碼:
2024年10月23日 星期三
位置: 首頁 》圖文實錄 》第十二屆中國法學(xué)青年論壇 》專題報道 》第四分論壇
報告人郭 玉:讓數(shù)據(jù)發(fā)聲:司法領(lǐng)域大數(shù)據(jù)應(yīng)用的效用前瞻

時間:2017-08-22   來源:  責(zé)任編輯:att2014

讓數(shù)據(jù)發(fā)聲:司法領(lǐng)域大數(shù)據(jù)應(yīng)用的效用前瞻

——基于信用卡透支糾紛案件的模擬研究

郭 玉*

各位前輩、同仁:

  “大數(shù)據(jù)”早已是眼下一個特別熱門的詞匯。隨著信息技術(shù)的進步,一個大規(guī)模生產(chǎn)、分享和應(yīng)用數(shù)據(jù)的“大數(shù)據(jù)”時代早就已經(jīng)開啟,各國政府逐漸認識到大數(shù)據(jù)在推動經(jīng)濟發(fā)展、改善公共服務(wù)乃至保障國家安全方面的重大意義,紛紛展開了大數(shù)據(jù)應(yīng)用研究。文書上網(wǎng)使民間對司法數(shù)據(jù)進行“大數(shù)據(jù)式”解構(gòu)成為可能。在大數(shù)據(jù)時代,數(shù)據(jù)資源就是新的“石油”。最高院以極大的魄力要求全國各地、各級法院的法律允許公開的裁判文書上網(wǎng),實際上是將司法領(lǐng)域最寶貴的資源分享給了社會各界。中國裁判文書網(wǎng)訪問量截止到上周已經(jīng)突破了98億次。民間許多嗅覺敏銳的大數(shù)據(jù)公司早已開始了對裁判文書網(wǎng)資源進行的商業(yè)價值開發(fā)。與之相比,法院系統(tǒng)內(nèi)部也在積極調(diào)適狀態(tài),求新求變。以上海、貴州為代表,兩地的法院系統(tǒng)各自研發(fā)出了跨部門的智能輔助辦案系統(tǒng),獲得了孟建柱書記首肯,稱之“現(xiàn)代科技應(yīng)用邁出一小步,可以推動刑事司法文明前進一大步?!?7月10日在全國司法體制改革推進會上,孟建柱書記進一步提出要以習(xí)近平總書記系列重要講話精神為指南,積極主動擁抱大數(shù)據(jù)、人工智能新時代,把理念思路提升、體制機制創(chuàng)新、現(xiàn)代科技應(yīng)用和法律制度完善結(jié)合起來,努力創(chuàng)造更高水平的司法文明。將大數(shù)據(jù)思維和大數(shù)據(jù)技術(shù)應(yīng)用于司法數(shù)據(jù)研究領(lǐng)域,讓數(shù)據(jù)發(fā)聲,通過“司法數(shù)據(jù)的全面聚合”而實現(xiàn)數(shù)據(jù)價值倍增,將使司法系統(tǒng)不但在發(fā)現(xiàn)審判規(guī)律、統(tǒng)一裁判尺度、提高審判管理的智慧度、提高決策科學(xué)性以及增強審判預(yù)測能力,而且在延伸審判職能,發(fā)揮司法建議在社會管理及公共服務(wù)方面的實際功效等方面都提升到一個新高度。

  我分享的第一個問題是:“大數(shù)據(jù)”or“大規(guī)模的小數(shù)據(jù)”?

  大數(shù)據(jù)是指數(shù)據(jù)量特別大嗎?如果是,那么多大的數(shù)據(jù)體量才是大數(shù)據(jù)與小數(shù)據(jù)的分界線?用常規(guī)的研究方法,投入更多的工作量,就能夠?qū)崿F(xiàn)對大數(shù)據(jù)的研究嗎?你拿到的到底是大數(shù)據(jù)還是一個規(guī)模比較大的小數(shù)據(jù)?

  數(shù)據(jù)總量大,固然是大數(shù)據(jù)的一個顯而易見的特點,但卻不是根本的區(qū)別。龐大的數(shù)據(jù)信息一直存在,但直到近年來,這些數(shù)據(jù)才以一個整體的姿態(tài)作為研究對象。與其說大數(shù)據(jù)是一個龐大數(shù)據(jù)的集合,倒不如說是一種對龐大數(shù)據(jù)的處理思路。這種處理思路,與傳統(tǒng)的統(tǒng)計學(xué)思路是截然相反的。

  其一,拒絕取樣,請給我全部數(shù)據(jù)。傳統(tǒng)統(tǒng)計學(xué)進行的是樣本研究,而大數(shù)據(jù)思維是不做取樣研究的。在《大數(shù)據(jù)時代》中,對此有一句非常經(jīng)典的描述:“當(dāng)數(shù)據(jù)處理技術(shù)已經(jīng)發(fā)生了翻天覆地的變化時,在大數(shù)據(jù)時代進行抽樣分析就像在汽車時代騎馬一樣?!睒颖狙芯克艿闹萍s很大,其結(jié)論的可信賴度是較低的,但人類仍然長期依賴于這種研究方法,其原因是技術(shù)制約;現(xiàn)在,數(shù)據(jù)運算方法已經(jīng)不再需要人力進行摘錄、比對、分析,計算機已經(jīng)可以實現(xiàn)在最短的時間對海量數(shù)據(jù)進行分析,為什么還需要取樣分析呢?所以,在某一研究領(lǐng)域,仍然采取取樣研究的方法,運用的其實并不是大數(shù)據(jù)思維,只是一個規(guī)模比較大的小數(shù)據(jù)罷了。

  其二,不再追求精確。傳統(tǒng)的統(tǒng)計分析總是在追求精確,約精確越好。依賴于利用結(jié)構(gòu)化查詢語言,如法院辦案系統(tǒng),在這種數(shù)據(jù)庫中,每一項數(shù)據(jù)都需要在指定的表格里、以正確的格式錄入,否則無法被識別更談不上分析。如果在結(jié)構(gòu)化數(shù)據(jù)庫下想分析更多的數(shù)據(jù),就必須有海量的關(guān)聯(lián)輸入,這種人力的付出是不可能實現(xiàn)的。大數(shù)據(jù)時代對數(shù)據(jù)的完整性、精確性的要求大大降低,不再受數(shù)據(jù)錄入的是否精準的牽絆,這讓數(shù)據(jù)的多維分析成為可能。

  其三,旨在發(fā)現(xiàn)關(guān)聯(lián),而非直接命中因果。人類研究活動總是以尋找因果關(guān)系為最終落腳點。然而大數(shù)據(jù)技術(shù)卻是從關(guān)聯(lián)度入手,發(fā)現(xiàn)兩種事物之間的密切關(guān)系,然后再尋找原因。因為有了分析關(guān)聯(lián)度的工具,人們終于可以從“假設(shè)-實驗-證實”的實驗室思維中解脫出來,從“以果尋因”的思維胡同中解脫出來,發(fā)現(xiàn)一些靠人腦難以發(fā)現(xiàn)的潛在規(guī)律。這讓大數(shù)據(jù)“預(yù)測”功能得以最大限度的發(fā)揮。

  第二,結(jié)合我這篇文章來談一談我們對“大數(shù)據(jù)”可能有怎樣的運用方式。根據(jù)上面的內(nèi)容,其實可以看出,我這篇文章采用的模擬方法,即假設(shè)我擁有開源的數(shù)據(jù)及數(shù)據(jù)分析工具,可能會怎樣使用這些數(shù)據(jù),產(chǎn)生哪些分析結(jié)果,并非是真正的大數(shù)據(jù)研究方法。

  1.基本分析模型

  模型一案件數(shù)量趨勢、標的及結(jié)案分析模型。這個模型非?;A(chǔ),主要用于觀察信用卡透支前科糾紛的發(fā)案數(shù)量及執(zhí)行到位狀況。模型二單個案件透支數(shù)額比對模型,由這個模型可以看到,單張信用卡透支欠款不還的數(shù)額是持續(xù)挑戰(zhàn)新高的。模型三原告/申請執(zhí)行人分布模型,也就是分析哪間銀行、該銀行在哪個地域易發(fā)生信用卡透支欠款糾紛。上述模型對分析銀行風(fēng)控工作有著重要的參考意義。

  2.關(guān)聯(lián)度分析模型

  大數(shù)據(jù)工具可以實現(xiàn)詞頻及關(guān)聯(lián)性檢索分析,在信用卡透支糾紛中,可能從如下幾個角度分析。模型四被告/被執(zhí)行人分布研究。在人力查閱案件時,隱約感受到這樣的規(guī)律,大額透支以城市持卡人為主,10萬元以下的小額透支以鄉(xiāng)鎮(zhèn)村的持卡人為主。推測其原因,城市居民在繳納社保、工資領(lǐng)取、房貸車貸、醫(yī)療教育等諸多方面不可能與信用絕緣,不大可能為了小額的欠款使自己進入銀行征信記錄黑名單,而大額透支主要經(jīng)商失敗資金鏈斷裂導(dǎo)致。究竟是不是如此,這里沒有確定的結(jié)論,但有了大數(shù)據(jù)工具就可以進行驗證。據(jù)此就可以向銀行提供定向明確的信用卡發(fā)卡及授信的風(fēng)險控制建議。

  模型五被告/被執(zhí)行人到庭情況分析模型。這部分目前也是估算,審判階段,約有八成被告人是缺席的,而執(zhí)行階段無法聯(lián)系到被執(zhí)行的現(xiàn)象更加突出。這個模型的意義在于找到此類案件“執(zhí)行難”的真正原因,并不是法院不給力。銀行發(fā)卡授信之時對持卡人的信用考察嚴重不到位,才是銀行債權(quán)回收執(zhí)行難的最大原因。

  模型六訴訟結(jié)果分析模型。對高度類型化案件進行訴訟結(jié)果分析意義重大?,F(xiàn)在只能靠手工逐個打開判決書看判決結(jié)果及原因,案件一多就難以操作。但使用大數(shù)據(jù)技術(shù)就可以極其便捷地掌握類型化案件的預(yù)判。目前已經(jīng)有許多公司已經(jīng)實現(xiàn)了對類型化案件的預(yù)判,不但可以定向分析某個地區(qū)的法院處理方法,更可以預(yù)測具體某個法官的判決傾向。與此相比,法官自己在作出裁判的時候,如果都不了解類型化案件的一般裁判思路,其后果將是不可想象的。

  模型七法院強制執(zhí)行情況分析模型。法院進行了哪些強制執(zhí)行措施,是考察法院在執(zhí)行階段是否盡責(zé)的重要依據(jù)。某一類案件,雖然執(zhí)行到位率極底,但法院卻已采取了目前可能采取的手段,那么就不能將債權(quán)回收率差的問題認為是法院的責(zé)任。

  模型八:起訴密集度模型。研究目的有二,其一若發(fā)現(xiàn)集中立案情況嚴重,可能說明銀行在債權(quán)回收職權(quán)行使上有所懈怠,可提出針對性的司法建議;其二法院可以按照該歷年來的立案風(fēng)格作出預(yù)測,提前作出調(diào)節(jié),如在銀行熱衷集中立案的時間節(jié)點增派立案登記人手等。

  3.宏觀背景分析模型

  模型九:關(guān)聯(lián)形勢及政策研究模型。主要用于背景分析,其意義:一是原因判斷;二是收案預(yù)測。法官不是通才,要求在高強度辦案的同時,比較難以做到及時了解和掌握各行業(yè)形勢與政策的前沿動態(tài),如大數(shù)據(jù)技術(shù)能夠定期對專業(yè)類案件抓取相關(guān)的政策文件及新聞報道,生成形勢與政策分析報告,將能夠幫助法官審理案件時準確把握案件實質(zhì),同時可以幫助審判管理部門預(yù)測收案。比如,通過模型九可以看到,信用卡透支糾紛案件的井噴式增長與國家快速推廣信用卡的戰(zhàn)略息息相關(guān)。筆者抓取了央行《支付體系運行總體情況》數(shù)據(jù),可得:(1)原因判斷方面:全國信用卡發(fā)卡量、授信總額度逐年增加;有償債風(fēng)險的透支債務(wù)大幅上升;通過下面第一個圖的柱狀圖及折線圖進行比對發(fā)現(xiàn),授信總額度增長率遠超發(fā)卡量,說明在有償債風(fēng)險的透支債務(wù)大幅上升的情形之下,不但不加強風(fēng)控嚴格控制授信規(guī)模,反而對單張卡的授信額度進行了大幅提升。這就印證并解釋了模型一、模型二的現(xiàn)象,也就是為什么收案數(shù)大幅回落但立案標的減幅有限,以及為什么單案立案標的逐年趨高分布。(2)預(yù)測方面:由于法院收案會出現(xiàn)一段時間的滯后,未來幾年此類糾紛數(shù)量可能仍然會很多。

  通過上面一些模型,我們可能能夠找到案件多的原因、執(zhí)行難的原因,找到從根源上化解這類糾紛的辦法,能夠分析收案趨勢,預(yù)測審執(zhí)結(jié)果,做好輿情應(yīng)對,而且更重要的是,可以向社會管理者提出真正具有針對性強的司法建議。正如最高院研究室副主任嚴戈在《人民法院報》一篇文章中說到的那樣:“大數(shù)據(jù)時代,公共決策最重要的依據(jù)乃是數(shù)據(jù),而不是個人經(jīng)驗或長官意志?!?/span>

  以上是結(jié)合了某一類案件進行的細致而微的思考,其實大數(shù)據(jù)的應(yīng)用遠不止于此。最后再引用《大數(shù)據(jù)時代》里的一句話做結(jié)尾:“數(shù)據(jù)就像一個神奇的鉆石礦,它的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而絕大部分都隱藏在表面之下?!毕M@座鉆石礦的光芒早日在司法領(lǐng)域熠熠生輝。

  * 廣東省廣州市越秀區(qū)人民法院刑事審判庭法官。

全文
搜索

關(guān)注
微信

關(guān)注官方微信

關(guān)注
微博

關(guān)注官方微博

網(wǎng)絡(luò)
信箱