時事觀點

大數據的金融場景，風控仍面臨考驗
范秉航
2016/11/30

在大數據的應用範疇中，金融領域一直都位居重要地位，甚至可說是最早利用大數據的行業之一，其中的經典案例為美國第一資本金融公司〈Capital One〉的精準營銷。該公司利用網頁瀏覽行為的大數據分析，將客戶引導至平台，並在30秒內匹配合適的信用卡。另外，Capital One亦利用客戶的歷史交易狀況，藉由演算法在10秒內為客戶精準匹配金融產品，提高30%的銀行收益。除此之外，Capital One透過上網訊息(如IP位址)迅速定位客戶的所在地，結合人口統計數據，計算房貸的壞帳率與房價。
而在中國，金融科技的崛起，令其經歷了一場網路金融的野蠻生長時期。而當野蠻生長過後，隨之而來的是雜草叢生的金融問題，其中最為人所知的即是接連爆發的網貸案件。在眾多問題中，金融議題終究需要回歸其根本，即「信用」。目前中國市場並沒有像美國FICO的集中化信用認證系統，因此風險控管成為各家金融機構的重要工作項目，亦有許多「非」金融機構切入這個領域，提出不同的解決方案。
今年7月18日中國網路搜尋引擎龍頭百度(Baidu)宣布，將投資美國金融科技新創公司ZestFinance。藉由ZestFinance所研發的機器學習與大數據技術，結合百度所擁有的使用者數據資料，預期能透過資料分析，提供更加精準的信用評分，以做為核貸的重要依據。
ZestFinance信用評分模式與傳統評分方式大相逕庭，過去金融徵信僅使用10至15項簡單數據進行判定，ZestFinance則是利用每位用戶數萬筆的數據資料，建立超過7萬個可以判斷信貸行為的指標，並能在數秒鐘內評估貸款人的還款能力。據ZestFinance的說法，與傳統信貸相比，ZestFinance處理效率提高近90%。在風險控制方面，ZestFinance信用模型在風險鑑別的精確度提高了40%。
雖然大數據分析在金融領域受到熱烈關注，但並非萬靈丹。Google利用大數據模型判斷流感趨勢(Google Flu Trends)，根據其歷史搜索數據裡的關鍵詞，預測美國流感傳播，但其效果卻差強人意。失敗原因有二，首先是搜索關鍵詞的人無法區分流感與普通感冒的差別，因此該模型進行了過度關聯。其次是恐慌效果，當一個州的流感發生，鄰近州的準備工作或網路相關討論會被模型誤認為流感已擴散至鄰近州。
另一個難以成功的案例，則是中小企業貸款的大數據模型。由於中小企業貸款數據比個人更為複雜，且中小企業涉及到行業中非常特殊的一些數據，如非標準化的財務報表與不同行業、不同格式的合約。在缺乏對該行業的專業知識下，很難理解或有時間將相關的數據資訊挖掘出來。另外，根本沒有一個完美的模型能夠將所有的問題予以解釋或分析。其數據的複雜程度，導致90%的時間都在做數據清理的工作，喪失大數據分析的效益。
在資料科學逐漸受到重視的當下，金融公司的大數據風控成為顯學，尤其是網路金融的相關業者。透過這些數據進行風控分析與建模，無疑是金融行業必經之路，但仍有許多障礙和困境有待突破。首先是數據來源的問題。對於一些缺乏信用數據的群體(金融科技的主要客源)而言，許多線下行為尚未數據化。因此行為線上化、數據化，進而結構化，需要一定的過程與時間。隨著智慧型手機與社群網路的普及，以及未來物聯網的應用，預期可帶來更豐富的數據訊息，輔助風控決策。
其次是欺詐行為對模型有效性的考驗。一個風控模型的產生，隨之而來的是一群欲利用模型漏洞，以騙取放貸的族群。因而導致模型剛開始有效，但面對新出現的欺詐行為，逐漸喪失辨別能力，使精準度下降。故大數據風控模型應在試誤中不斷迭代，加入更多複雜的特徵數據。最後則是風險分散，避免針對特定族群放款，以降低行業內的系統性風險。