基于混合特征提取和集成學習的個人貸款違約預測研究
發布時間:2025-07-03 03:17
隨著互聯網金融的不斷發展,許多小貸公司因風險控制能力不足,接連暴雷。借款人違約風險評估模型作為一種有效的風控手段,可以利用借款人的個人信息和社會活動數據發現用戶潛在的違約風險,在小貸企業中發揮著顯著作用。本文針對借款用戶數據類別不平衡、特征維度高的特點以及企業接入數據成本高的問題,對信貸數據進行特征選擇和均衡化處理,并在此基礎上建立了基于集成學習的借款人違約風險概率預測模型。具體研究內容和貢獻如下:(1)本文提出了一種分層的特征選擇框架。首先使用ReliefS算法,通過在特征篩選階段給與少數類樣本更多關注,選擇出對少數類樣本區分能力強的特征,提高模型在不平衡樣本集的預測效果,結合Pearson相關系數法對復雜且高維的信貸特征進行快速的特征初篩,然后對剩余特征使用精篩算法。相比于直接進行特征精篩,在保證模型效果的前提下,分層特征選擇顯著提升了篩選效率。(2)針對不同預測模型特點提出了針對性的特征精篩算法。因邏輯回歸模型效果受信貸特征影響大,本文提出了IKPLasso特征篩選算法,從多個角度評估信貸特征,避免了單一評價指標造成信貸特征多方面信息被忽...
【文章頁數】:84 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內外研究歷史與現狀
1.2.1 貸款違約預測的的研究現狀
1.2.2 非平衡分類算法的研究現狀
1.2.3 特性選擇算法的研究現狀
1.3 本文的主要貢獻與創新
1.4 本論文的結構安排
第二章 相關理論知識與關鍵性技術
2.1 不平衡分類算法
2.1.1 數據層面
2.1.2 算法層面
2.2 特征選擇
2.2.1 過濾式(Filter)算法
2.2.2 包裹式(Wrapper)算法
2.2.3 嵌入式(Embedded)算法
2.3 邏輯回歸(Logistic Regression)算法
2.3.1 邏輯回歸的預測函數
2.3.2 邏輯回歸的損失函數
2.3.3 邏輯回歸梯度下降法求解
2.4 LightGBM算法
2.4.1 GBDT算法基礎
2.4.2 XGBoost算法基礎
2.4.3 LightGBM算法基礎
2.5 深度神經網絡(DNN)算法
2.5.1 神經網絡的基本結構
2.5.2 DNN前向傳播
2.5.3 DNN反向傳播
2.6 本章小結
第三章 分層特征篩選算法
3.1 特征處理與篩選框架
3.2 特征初篩
3.2.1 改進的Relief算法(ReliefS)
3.2.2 皮爾森相關系數法
3.2.3 特征初篩算法流程
3.3 針對不同預測模型的個性化特征篩選算法
3.3.1 邏輯回歸的特征篩選算法
3.3.2 LightGBM的特征篩選算法
3.3.3 深度神經網絡的特征篩選算法
3.4 本章小結
第四章 構建信貸評估模型中的工程實現
4.1 小貸場景數據集介紹
4.2 探索性數據分析
4.3 特征處理
4.3.1 缺失值處理
4.3.2 連續特征離散化
4.3.3 WOE轉化
4.4 特征構建
4.5 本章小結
第五章 實驗結果與分析
5.1 實驗設置
5.2 分層特征篩選算法效果對比
5.2.1 實驗設計
5.2.2 實驗結果
5.3 結合特征選擇的邏輯回歸模型
5.3.1 實驗設計
5.3.2 實驗結果
5.4 結合特征選擇的LightGBM模型
5.4.1 實驗設計
5.4.2 實驗結果
5.5 結合特征選擇的DNN模型
5.5.1 實驗設計
5.5.2 實驗結果
5.6 模型融合與比較
5.7 RP+LightGBM-RRFE通用數據集的結果與分析
5.7.1 數據描述與處理
5.7.2 實驗設計
5.7.3 實驗結果
5.8 本章小結
第六章 總結與展望
6.1 本文總結
6.2 展望
致謝
參考文獻
本文編號:4055681
【文章頁數】:84 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究工作的背景與意義
1.2 國內外研究歷史與現狀
1.2.1 貸款違約預測的的研究現狀
1.2.2 非平衡分類算法的研究現狀
1.2.3 特性選擇算法的研究現狀
1.3 本文的主要貢獻與創新
1.4 本論文的結構安排
第二章 相關理論知識與關鍵性技術
2.1 不平衡分類算法
2.1.1 數據層面
2.1.2 算法層面
2.2 特征選擇
2.2.1 過濾式(Filter)算法
2.2.2 包裹式(Wrapper)算法
2.2.3 嵌入式(Embedded)算法
2.3 邏輯回歸(Logistic Regression)算法
2.3.1 邏輯回歸的預測函數
2.3.2 邏輯回歸的損失函數
2.3.3 邏輯回歸梯度下降法求解
2.4 LightGBM算法
2.4.1 GBDT算法基礎
2.4.2 XGBoost算法基礎
2.4.3 LightGBM算法基礎
2.5 深度神經網絡(DNN)算法
2.5.1 神經網絡的基本結構
2.5.2 DNN前向傳播
2.5.3 DNN反向傳播
2.6 本章小結
第三章 分層特征篩選算法
3.1 特征處理與篩選框架
3.2 特征初篩
3.2.1 改進的Relief算法(ReliefS)
3.2.2 皮爾森相關系數法
3.2.3 特征初篩算法流程
3.3 針對不同預測模型的個性化特征篩選算法
3.3.1 邏輯回歸的特征篩選算法
3.3.2 LightGBM的特征篩選算法
3.3.3 深度神經網絡的特征篩選算法
3.4 本章小結
第四章 構建信貸評估模型中的工程實現
4.1 小貸場景數據集介紹
4.2 探索性數據分析
4.3 特征處理
4.3.1 缺失值處理
4.3.2 連續特征離散化
4.3.3 WOE轉化
4.4 特征構建
4.5 本章小結
第五章 實驗結果與分析
5.1 實驗設置
5.2 分層特征篩選算法效果對比
5.2.1 實驗設計
5.2.2 實驗結果
5.3 結合特征選擇的邏輯回歸模型
5.3.1 實驗設計
5.3.2 實驗結果
5.4 結合特征選擇的LightGBM模型
5.4.1 實驗設計
5.4.2 實驗結果
5.5 結合特征選擇的DNN模型
5.5.1 實驗設計
5.5.2 實驗結果
5.6 模型融合與比較
5.7 RP+LightGBM-RRFE通用數據集的結果與分析
5.7.1 數據描述與處理
5.7.2 實驗設計
5.7.3 實驗結果
5.8 本章小結
第六章 總結與展望
6.1 本文總結
6.2 展望
致謝
參考文獻
本文編號:4055681
本文鏈接:http://www.malleg.cn/guanlilunwen/huobilw/4055681.html
上一篇:金融危機對中國膠合板產業的影響研究
下一篇:沒有了
下一篇:沒有了

