21세기 디지털 시대는 빅데이터와 인터넷 금융분야에서 많은 발전을 이루었다. 새롭게 등장한 금융 비즈니스는 다양한 환경에서 접하게 되는 정보를 바탕으로 신속한 의사결정을 요구하고 있으며, 수집되는 정보는 다양한 요인들로 인해 빠르게 변화되어 예측이 어려운 자료들이 대부분이다. AI 기술 발달로 뛰어난 분석모델들이 등장하고 있지만, 모델의 단편적인 구성만으로는 정확한 예측을 하기 쉽지 않다. 예측결과에 대한 근거도 부족한 게 현실이다. 여러 관련 연구들을 고찰하면서 ...
21세기 디지털 시대는 빅데이터와 인터넷 금융분야에서 많은 발전을 이루었다. 새롭게 등장한 금융 비즈니스는 다양한 환경에서 접하게 되는 정보를 바탕으로 신속한 의사결정을 요구하고 있으며, 수집되는 정보는 다양한 요인들로 인해 빠르게 변화되어 예측이 어려운 자료들이 대부분이다. AI 기술 발달로 뛰어난 분석모델들이 등장하고 있지만, 모델의 단편적인 구성만으로는 정확한 예측을 하기 쉽지 않다. 예측결과에 대한 근거도 부족한 게 현실이다. 여러 관련 연구들을 고찰하면서 신용위험의 정확한 예측은 물론, 외부 환경적인 요소를 감안한 연구의 필요성도 높아가고 있음을 인지하게 되었다. 이에 다음과 같은 연구목적을 설정하였다. 첫째 복잡한 금융데이터를 효율적으로 처리할 수 있는 모형의 설계 및 성능의 검증이다. 둘째 금융데이터 시계열 요소를 도출하여 시계열 분석의 효율성 검증이다. 셋째 연구모형에서 설계된 분석모델들의 예측과정에 대한 해석제공이다. 본 논문에서는 P2P 대출회사 렌딩클럽 개인대출 데이터를 기반으로 채무불이행 여부를 예측하였다. 분류모델 성능향상을 위한 표준화, 전처리, 교차검증을 진행하였고, 데이터의 이미지 변환, 시계열 변환을 통해 유형별 모델학습을 진행하였다. 총 11개 분류모델의 성능을 비교하여 해석제공을 위한 유형별 기본 모델을 설정하였고, 예측결과 해석을 비교 검토하였다. 본 연구의 분석방법론이 대외적 환경과 제도적 제약을 고려한 금융 위험예측 프레임워크 기반이 되어 향후 금융, 빅데이터, AI 관련한 도움이 되길 기대한다.
21세기 디지털 시대는 빅데이터와 인터넷 금융분야에서 많은 발전을 이루었다. 새롭게 등장한 금융 비즈니스는 다양한 환경에서 접하게 되는 정보를 바탕으로 신속한 의사결정을 요구하고 있으며, 수집되는 정보는 다양한 요인들로 인해 빠르게 변화되어 예측이 어려운 자료들이 대부분이다. AI 기술 발달로 뛰어난 분석모델들이 등장하고 있지만, 모델의 단편적인 구성만으로는 정확한 예측을 하기 쉽지 않다. 예측결과에 대한 근거도 부족한 게 현실이다. 여러 관련 연구들을 고찰하면서 신용위험의 정확한 예측은 물론, 외부 환경적인 요소를 감안한 연구의 필요성도 높아가고 있음을 인지하게 되었다. 이에 다음과 같은 연구목적을 설정하였다. 첫째 복잡한 금융데이터를 효율적으로 처리할 수 있는 모형의 설계 및 성능의 검증이다. 둘째 금융데이터 시계열 요소를 도출하여 시계열 분석의 효율성 검증이다. 셋째 연구모형에서 설계된 분석모델들의 예측과정에 대한 해석제공이다. 본 논문에서는 P2P 대출회사 렌딩클럽 개인대출 데이터를 기반으로 채무불이행 여부를 예측하였다. 분류모델 성능향상을 위한 표준화, 전처리, 교차검증을 진행하였고, 데이터의 이미지 변환, 시계열 변환을 통해 유형별 모델학습을 진행하였다. 총 11개 분류모델의 성능을 비교하여 해석제공을 위한 유형별 기본 모델을 설정하였고, 예측결과 해석을 비교 검토하였다. 본 연구의 분석방법론이 대외적 환경과 제도적 제약을 고려한 금융 위험예측 프레임워크 기반이 되어 향후 금융, 빅데이터, AI 관련한 도움이 되길 기대한다.
The technologies in the fields of big data and internet finance have seen substantial advancements in the digital era of the 21st century. Emerging financial businesses demand rapid decision-making based on information encountered in various environments, with much of the collected data being diffic...
The technologies in the fields of big data and internet finance have seen substantial advancements in the digital era of the 21st century. Emerging financial businesses demand rapid decision-making based on information encountered in various environments, with much of the collected data being difficult to predict due to various factors. Despite the development of advanced analytical models through AI technology, accurate predictions are not easily achieved with the models' fragmented structures alone. The reality is that there is a lack of evidence for prediction results. As we reviewed various related studies, it became apparent that there is an increasing need not only for accurate credit risk prediction but also for studies that consider external environmental factors. With this in mind, the following research objectives were set: Firstly, to design and verify the performance of a model that can efficiently process complex financial data. Secondly, to derive the time-series elements of financial data and verify the efficiency of time-series analysis. Thirdly, to provide interpretation for the prediction process of the analytical models designed in this framework. In this paper, we predicted the default status of individual loans based on the data from the P2P lending company, LendingClub. We conducted standardization, preprocessing, and cross-validation to improve the performance of classification models. By transforming the data into images and time series, we proceeded with type-specific model training. We compared the performance of the 11 classification models, established basic models for interpretation, and reviewed and compared the interpretations of prediction results. The analytical methodology of this study serves as a financial risk prediction framework that considers external environmental and institutional constraints, and it is hoped that it will be beneficial for future endeavors in finance, big data, and AI-related fields.
The technologies in the fields of big data and internet finance have seen substantial advancements in the digital era of the 21st century. Emerging financial businesses demand rapid decision-making based on information encountered in various environments, with much of the collected data being difficult to predict due to various factors. Despite the development of advanced analytical models through AI technology, accurate predictions are not easily achieved with the models' fragmented structures alone. The reality is that there is a lack of evidence for prediction results. As we reviewed various related studies, it became apparent that there is an increasing need not only for accurate credit risk prediction but also for studies that consider external environmental factors. With this in mind, the following research objectives were set: Firstly, to design and verify the performance of a model that can efficiently process complex financial data. Secondly, to derive the time-series elements of financial data and verify the efficiency of time-series analysis. Thirdly, to provide interpretation for the prediction process of the analytical models designed in this framework. In this paper, we predicted the default status of individual loans based on the data from the P2P lending company, LendingClub. We conducted standardization, preprocessing, and cross-validation to improve the performance of classification models. By transforming the data into images and time series, we proceeded with type-specific model training. We compared the performance of the 11 classification models, established basic models for interpretation, and reviewed and compared the interpretations of prediction results. The analytical methodology of this study serves as a financial risk prediction framework that considers external environmental and institutional constraints, and it is hoped that it will be beneficial for future endeavors in finance, big data, and AI-related fields.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.