728x90 Reviews3 [Reviews][Thesis] Lending Club 데이터 불균형에 관한 논문 리뷰 미국의 P2P 대출 기업인 Lending Club 데이터셋으로부터 지급 불능 여부를 예측하고자 할 때, 완전히 지급된(Fully Paid)의 건수는 80% 정도를 차지한다. 반면에, 120일 이상 경과하여 지급불능의 상태로 여겨지는 (Default)의 건수는 20%를 차지한다. 이때, 예측하는 데이터가 불균형하여 제대로 학습이 되지 않고 예측력이 떨어지는 현상이 발생하게 된다. 아래의 논문을 리뷰하며 데이터 불균형을 해소할 수 있는 방법을 학습하고자 한다. 리뷰 논문 NAMVAR, Anahita, et al. Credit risk prediction in an imbalanced social lending environment. arXiv preprint arXiv:1805.00801, 2018. Abs.. 2022. 2. 28. [Reviews][Finance] Identifying excessive credit growth and leverage 논문 리뷰 서론 논문의 목적 논문은 글로벌 경제 위기와 같은 위기가 신용의 증가를 만들고 이러한 신용 증가는 금융 안정에 대한 시스템적 위험을 만든다는 문제의식에서 시작된다. 이때, 신용 증가는 우리가 흔히 아는 신용 창출(금융 기관들이 대출의 형태도 돈을 공급하여 신용이 늘어나는 형태)로 해석하면 될 것 같다. 이러한 위기상황을 대비하기 위해서 논문에서는 조기경보 모델(Early warning model)을 만들어서, 1) 초과 적인 부채가 발생하는 기간을 식별하고, 2) 보장된 정책 조치들이 가능하도록 하는 것을 목표로 두고 있다. 논문의 방향 1) 금융 위기의 원인으로서 신용 증가와 레버리지의 역할을 조사한다. → 신용 증가는 은행의 위기 같은 금융 위기에 좋은 예측 변수가 된다. 2) 조기 경보 지표에 대한.. 2021. 8. 29. [Reviews][Finance] Infusing domain knowledge in AI-based black box models for better explainability with application in bankruptcy prediction 논문 리뷰 "Black box" 모델로 일컫는 Artificial Neural Networks, Support Vector Machine, Ensemble Approaches와 같은 모델들은 비선형 함수로 복잡도가 높아서 성능이 좋지만, 알고리즘의 설계자 조차도 그 모델이 어떻게 설계되었는지 설명(explainability) 하지 못하고 해석력(Interpretability)이 부족한 경우가 있다. 그렇기 때문에, 알고리즘을 사용하여 어떠한 결정을 내릴 때 그 알고리즘을 설명해야 하는 권리과 책임이 요구되는 추세이다. Explainability: 머신러닝이나 딥러닝 시스템의 내부 메커니즘을 인간 용어로 설명할 수 있는 정도. 무슨 일이 일어나고 있는지 설명할 수 있는 능력. Interpretability: 시스템 .. 2021. 8. 14. 이전 1 다음 반응형