Kil-Sang Yoo
(Graduate School of IT Policy and Management, Soongsil University)
,
Jin-Hee Jang
(Graduate School of IT Policy and Management, Soongsil University)
,
Seong-Ju Kim
(Graduate School of IT Policy and Management, Soongsil University)
,
Kwang-Yong Gim
(Dept. of Business, Soongsil University)
인터넷 불법금융광고는 인터넷 카페, 블로그 등을 통해 통장매매, 신용카드·휴대폰결제현금화 및 개인신용정보매매 등 불법금융행위를 목적으로 한다. 금융감독당국의 노력에도 불구하고 불법금융행위는 줄어들지 않고 있다. 본 연구는 인터넷 불법금융광고 게시글에 파이썬 딥러닝 기반 텍스트 분류기법을 적용해 불법여부를 탐지하는 모델을 제안한다. 텍스트 분류기법으로 주로 사용되는 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit)을 활용한다. 그동안 수작업으로 심사한 불법확인 결과를 기초 데이터로 이용한다. 한국어 자연어처리와 딥러닝 모델의 하이퍼파라미터 조절을 통해 최적의 성능을 보이는 모델을 완성하였다. 본 연구는 그동안 이뤄지지 않았던 인터넷 불법금융광고 판별을 위한 딥러닝 모델을 제시하였다는데 큰 의미가 있다. 또한 딥러닝 모델에서 91.3~93.4% 수준의 정확도를 보임으로써 불법금융광고 탐지에 딥러닝 모델을 실제 적용하여 불법금융광고 근절에 기여할 수 있기를 기대해 본다.
인터넷 불법금융광고는 인터넷 카페, 블로그 등을 통해 통장매매, 신용카드·휴대폰결제현금화 및 개인신용정보매매 등 불법금융행위를 목적으로 한다. 금융감독당국의 노력에도 불구하고 불법금융행위는 줄어들지 않고 있다. 본 연구는 인터넷 불법금융광고 게시글에 파이썬 딥러닝 기반 텍스트 분류기법을 적용해 불법여부를 탐지하는 모델을 제안한다. 텍스트 분류기법으로 주로 사용되는 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit)을 활용한다. 그동안 수작업으로 심사한 불법확인 결과를 기초 데이터로 이용한다. 한국어 자연어처리와 딥러닝 모델의 하이퍼파라미터 조절을 통해 최적의 성능을 보이는 모델을 완성하였다. 본 연구는 그동안 이뤄지지 않았던 인터넷 불법금융광고 판별을 위한 딥러닝 모델을 제시하였다는데 큰 의미가 있다. 또한 딥러닝 모델에서 91.3~93.4% 수준의 정확도를 보임으로써 불법금융광고 탐지에 딥러닝 모델을 실제 적용하여 불법금융광고 근절에 기여할 수 있기를 기대해 본다.
The study proposes a model that utilizes Python-based deep learning text classification techniques to detect the legality of illegal financial advertising posts on the internet. These posts aim to promote unlawful financial activities, including the trading of bank accounts, credit card fraud, cashi...
The study proposes a model that utilizes Python-based deep learning text classification techniques to detect the legality of illegal financial advertising posts on the internet. These posts aim to promote unlawful financial activities, including the trading of bank accounts, credit card fraud, cashing out through mobile payments, and the sale of personal credit information. Despite the efforts of financial regulatory authorities, the prevalence of illegal financial activities persists. By applying this proposed model, the intention is to aid in identifying and detecting illicit content in internet-based illegal financial advertisining, thus contributing to the ongoing efforts to combat such activities. The study utilizes convolutional neural networks(CNN) and recurrent neural networks(RNN, LSTM, GRU), which are commonly used text classification techniques. The raw data for the model is based on manually confirmed regulatory judgments. By adjusting the hyperparameters of the Korean natural language processing and deep learning models, the study has achieved an optimized model with the best performance. This research holds significant meaning as it presents a deep learning model for discerning internet illegal financial advertising, which has not been previously explored. Additionally, with an accuracy range of 91.3% to 93.4% in a deep learning model, there is a hopeful anticipation for the practical application of this model in the task of detecting illicit financial advertisements, ultimately contributing to the eradication of such unlawful financial advertisements.
The study proposes a model that utilizes Python-based deep learning text classification techniques to detect the legality of illegal financial advertising posts on the internet. These posts aim to promote unlawful financial activities, including the trading of bank accounts, credit card fraud, cashing out through mobile payments, and the sale of personal credit information. Despite the efforts of financial regulatory authorities, the prevalence of illegal financial activities persists. By applying this proposed model, the intention is to aid in identifying and detecting illicit content in internet-based illegal financial advertisining, thus contributing to the ongoing efforts to combat such activities. The study utilizes convolutional neural networks(CNN) and recurrent neural networks(RNN, LSTM, GRU), which are commonly used text classification techniques. The raw data for the model is based on manually confirmed regulatory judgments. By adjusting the hyperparameters of the Korean natural language processing and deep learning models, the study has achieved an optimized model with the best performance. This research holds significant meaning as it presents a deep learning model for discerning internet illegal financial advertising, which has not been previously explored. Additionally, with an accuracy range of 91.3% to 93.4% in a deep learning model, there is a hopeful anticipation for the practical application of this model in the task of detecting illicit financial advertisements, ultimately contributing to the eradication of such unlawful financial advertisements.
본 연구는 인터넷 게시글이 불법금융광고에 해당되는지 아닌지를 판별하는 이진 분류의 문제이다. 이진 분류의 성능을 평가하는 지표는 일반적으로 Table 2와 같이 혼동행렬(Confusion Matrix)을 사용한다.
이에 본 연구에서는 딥러닝을 활용하여 인터넷 불법금융광고 의심 게시물 중 불법금융광고를 보다 빠르고 일관되게 탐지할 수 있는 모델을 제안한다. 인터넷 불법금융광고 의심 게시물인 텍스트에 딥러닝 기반 텍스트 분류 기법을 적용한다.
향후 제보된 인터넷 주소(URL) 등을 이용하여 제보를 접수함과 동시에 텍스트를 확보하는 등의 방법으로 대량의 학습 데이터를 확보하여 추가 연구를 하고자 한다. 특히 SNS 카테고리별로 딥러닝 모델을 각각 구현하는 등 성능 향상 방안과 이미지로 된 불법금융광고 탐지 영역으로 연구 범위를 추가 · 확장하고자 한다.
제안 방법
각 딥러닝 모델을 학습할 경우 적용하는 옵티마이저는 RMSprop(Root Mean Square Propagation), 아담(Adam), SGD(Stochastic Gradient Descent) 및 아다그라드(Adagrad: Adaptive Gradient) 등으로 변경하며 학습률(Learning Rate), 베타(Beta), 로우(Rho) 및 모멘텀(Momentum) 등의 값에 변화를 주면서 해당 모델들을 학습 및 테스트를 반복 수행한다. 테스트 데이터의 손실이 증가하면 과적합 징후이므로 손실이 5회 증가하면 학습을 조기 종료(Early Stopping)하도록 한다.
이는 금융감독원 직원이 불법여부를 심사하여 방심위에 조치의뢰 여부를 결정한 값으로 전문가가 분류한 결과이기에 정답으로 정의했다. 기본적인 데이터 정제를 위해 불법금융광고 내용에서 불필요한 문자를 삭제하기 위해 한글과 숫자, 공백 외의 문자를 빈값(Null) 처리하였다. ‘ㅋ’, ‘ㅎ’ 등의 의성어와 같은 특이한 문자들을 빈값 처리하는 과정도 거쳤다.
본 연구에서는 정보손실을 줄이고 데이터를 효과적으로 나타낼 수 있는 밀집벡터(Dense Vector)로 표현하는 워드 임베딩(Word Embedding)을 실시한다. 이는 데이터의 차원수를 줄이기도 하지만 단어 벡터간에 거리나 유사도를 측정할 수 있다.
입력층과 출력층 사이에 여러 은닉층을 포함한 심층신경망(DNN: Deep Neural Network)을 이용한다. 본 연구에서는 텍스트 분류를 위한 대표적인 딥러닝 모델인 1차원 CNN(Conv1D), RNN, LSTM, 양방향 LSTM(Bidirectional LSTM) 및 GRU 모델을 구현한다. 각 모델의 입력층과 출력층 사이의 은닉층(Hidden Layer)를 1개 또는 3개로 구현하여 학습과 테스트를 반복하였다.
0%)으로 총 7,118건이다. 불법이 아닌 일반금융광고는 불법금융광고보다 훨씬 많은 비중을 차지하므로 본 연구에서는 불법금융광고의 3배 수준으로 샘플링하였다.
텍스트 토큰화 및 임베딩 벡터화 등 자연어 처리를 하여 딥러닝 학습과 테스트를 위한 데이터셋을 갖춘다. 이후 CNN, RNN, LSTM 및 GRU 딥러닝 모델을 구현하여 학습과 테스트를 반복적으로 수행한다. 패딩 길이, 임베딩 사이즈, 활성화 함수 및 옵티마이저 등 딥러닝 모델의 하이퍼파라미터를 조절하면서 평가하여 최고의 성능을 보이는 딥러닝 모델을 완성한다.
금융감독원이 방심위에 조치의뢰한 인터넷 게시글 1,780건을 인터넷 불법금융광고로 레이블링하고, 금융감독원이 불법여부 확인 결과 인터넷 불법금융광고가 아닌 것으로 분류한 게시글 중 일부인 5,338건을 인터넷 불법금융광고가 아닌 것으로 레이블링하여 총 7,118건을 기초 데이터로 활용하였다. 입력 데이터가 텍스트이므로 한국어 자연어 처리 및 딥러닝 모델을 기반으로 인터넷 불법금융광고 여부를 판별한다. 텍스트 분류의 대표적인 딥로닝 모델인 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit) 기법을 적용한다.
최고의 정확도를 보인 1차원 CNN 모델에 테스트 데이터를 적용하여 성능 평가지표를 확인한다. Table 6은 학습된 1차원 CNN 모델에 테스트 데이터 2,136건을 적용한 결과인 혼동행렬이다.
텍스트 분류의 대표적인 딥로닝 모델인 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit) 기법을 적용한다. 해당 딥러닝 모델들을 파이썬으로 구현하고, 하이퍼파라미터를 조절하면서 학습과 테스트를 반복하여 모델별 성능분석을 실시하고, 성능이 우수한 최적의 딥러닝 모델을 제시한다.
대상 데이터
2019년부터 2022년까지 약 4년간 인터넷 불법금융광고 관련 키워드로 웹 스크래핑하여 수집한 데이터 중 불법여부 확인을 거친 심사결과를 기초 데이터로 사용한다. 기초 데이터로 불법금융광고 내용과 심사의견 등을 추출한다.
인터넷 불법금융광고 의심 게시물인 텍스트에 딥러닝 기반 텍스트 분류 기법을 적용한다. 금융감독원이 방심위에 조치의뢰한 인터넷 게시글 1,780건을 인터넷 불법금융광고로 레이블링하고, 금융감독원이 불법여부 확인 결과 인터넷 불법금융광고가 아닌 것으로 분류한 게시글 중 일부인 5,338건을 인터넷 불법금융광고가 아닌 것으로 레이블링하여 총 7,118건을 기초 데이터로 활용하였다. 입력 데이터가 텍스트이므로 한국어 자연어 처리 및 딥러닝 모델을 기반으로 인터넷 불법금융광고 여부를 판별한다.
‘ㅋ’, ‘ㅎ’ 등의 의성어와 같은 특이한 문자들을 빈값 처리하는 과정도 거쳤다. 기초 데이터셋은 인터넷 불법금융광고가 1,780건(25.0%), 불법이 아닌 일반금융광고가 5,338건(75.0%)으로 총 7,118건이다. 불법이 아닌 일반금융광고는 불법금융광고보다 훨씬 많은 비중을 차지하므로 본 연구에서는 불법금융광고의 3배 수준으로 샘플링하였다.
본 연구의 실험 환경은 Table 4와 같다. 실험 컴퓨팅 엔진은 구글 코랩(Colab)을 이용하였다. 하이퍼파라미터 튜닝 등 딥러닝 모델의 성능 확인 작업은 구글 코랩 프로플러스(Colab Pro+) 환경에서 하였다.
학습데이터는 불법금융광고 1,246건과 일반 금융광고 3,736건으로 총 4,982건을 사용한다. 테스트데이터는 나머지 불법금융광고 534건과 일반금융광고 1,602건으로 총 2,136건을 사용한다.
학습데이터와 테스트데이터를 생성한 후 랜덤하게 순서를 재배치했다. 학습데이터는 불법금융광고 1,246건과 일반 금융광고 3,736건으로 총 4,982건을 사용한다. 테스트데이터는 나머지 불법금융광고 534건과 일반금융광고 1,602건으로 총 2,136건을 사용한다.
4와 같이 인터넷 불법금융광고 감시시스템을 통해 수집한 인터넷 불법금융광고 의심 게시글을 활용한다. 해당 게시글 중 금융감독원 직원의 불법여부 확인을 거쳐 불법금융광고 여부를 판별한 정보를 기초 데이터로 이용한다. 제보로 입수된 데이터는 대부분 텍스트를 포함한 이미지이기 때문에 이번 연구에서는 활용하지 않았다.
이론/모형
하이퍼파라미터 튜닝 등 딥러닝 모델의 성능 확인 작업은 구글 코랩 프로플러스(Colab Pro+) 환경에서 하였다. 모델 구현 등 실험을 위해 사용한 프로그램 언어는 파이썬이며, 딥러닝 라이브러리는 텐서플로우(Tensorflow), 코앤엘파이(KoNLPy) 및 케라스(Karas) 등을 사용하였다.
의미가 유사한 단어는 벡터공간에 가깝게 반대의 경우는 멀게 배치하는 방식이다. 본 연구에서는 한국어 텍스트를 정수 인코딩을 하였기에 케라스(Keras)에서 제공하는 기본 도구인 Embedding() 함수를 사용하였다. 임베딩 벡터의 차원수는 256로 설정하였다.
이에 본 연구에서는 딥러닝을 활용하여 인터넷 불법금융광고 의심 게시물 중 불법금융광고를 보다 빠르고 일관되게 탐지할 수 있는 모델을 제안한다. 인터넷 불법금융광고 의심 게시물인 텍스트에 딥러닝 기반 텍스트 분류 기법을 적용한다. 금융감독원이 방심위에 조치의뢰한 인터넷 게시글 1,780건을 인터넷 불법금융광고로 레이블링하고, 금융감독원이 불법여부 확인 결과 인터넷 불법금융광고가 아닌 것으로 분류한 게시글 중 일부인 5,338건을 인터넷 불법금융광고가 아닌 것으로 레이블링하여 총 7,118건을 기초 데이터로 활용하였다.
입력 데이터가 텍스트이므로 한국어 자연어 처리 및 딥러닝 모델을 기반으로 인터넷 불법금융광고 여부를 판별한다. 텍스트 분류의 대표적인 딥로닝 모델인 합성곱 신경망(CNN: Convolutional Neural Network), 순환 신경망(RNN: Recurrent Neural Network), 장단기 메모리(LSTM: Long-Short Term Memory) 및 게이트 순환 유닛(GRU: Gated Recurrent Unit) 기법을 적용한다. 해당 딥러닝 모델들을 파이썬으로 구현하고, 하이퍼파라미터를 조절하면서 학습과 테스트를 반복하여 모델별 성능분석을 실시하고, 성능이 우수한 최적의 딥러닝 모델을 제시한다.
성능/효과
한편 제보 건은 인터넷 게시글이 대부분 이미지 또는 인터넷 주소(URL)로 수집되어 본 연구에 활용하지 못한 한계가 있었다. 기초 데이터가 많지 않았음에도 본 연구는 금융감독 분야에 최신 기술을 적용하는 섭테크의 일환으로 인터넷 불법금융광고 탐지 업무에 딥러닝을 실무적 적용 가능성을 확인하는 성과를 거두었다.
본 연구는 그동안 연구되지 않았던 인터넷 게시물에 대한 불법금융광고 여부를 판별하는 딥러닝 모델을 제시하였다는 점에서 큰 의미가 있다. 또한 1차원 CNN 딥러닝 모델의 하이퍼파라미터 조절을 통해 최고 0.9340의 정확도를 보임을 검증하였다. 특히 본 연구에서 구현하였던 1차원 CNN, RNN, LSTM, 양방향 LSTM 및 GRU의 모든 딥러닝 모델에서 0.
본 연구의 딥러닝 모델로 1차원 CNN, RNN, LSTM, 양방향 LSTM 및 GRU 모델을 구현한 후 하이퍼파라미터를 변경하면서 학습과 테스트를 반복한 결과 Table 5와 같이 1차원 CNN과 양방향 LSTM 모델에서 우수한 정확도를 보였다. 각 모델에 대해서는 5회 이상 반복 실행하여 최고 및 최저 정확도를 확인하였다.
인터넷 게시글 등 한국어 텍스트 분류에 관한 선행 연구를 살펴본 결과 텍스트를 토큰화화여 머신러닝과 인공 신경망 기법으로 분석하였으며, CNN 및 LSTM 등 딥러닝 모델의 성능이 우수함을 확인하였다. 특히 보이스피싱, 불법 채권추심 및 금융상품 불완전판매 등 금융감독 분야에 섭테크를 적용한 연구에서는 인공신경망 기법을 적용하고 있었다.
8681)를 확인한다. 테스트 데이터 2,136건 중 불법금융광고 464건과 일반금융광고 1,531건을 제대로 분류하여 93.40% 수준의 정확도를 보였다. 불법금융광고로 예측한 535건 중 464건을 정확히 예측하여 86.
각 모델에 대해서는 5회 이상 반복 실행하여 최고 및 최저 정확도를 확인하였다. 테스트 데이터에 대한 성능 평가결과 1차원 CNN 모델이 0.9237 ~ 0.9340로 가장 좋은 정확도를 보였다. 다음으로는 양방향 LSTM 모델이 0.
9340의 정확도를 보임을 검증하였다. 특히 본 연구에서 구현하였던 1차원 CNN, RNN, LSTM, 양방향 LSTM 및 GRU의 모든 딥러닝 모델에서 0.9134 ~ 0.9340의 정확도를 보임을 확인하였다. 이는 해당 딥러닝 모델을 실제 적용할 수 있음을 보여준다.
후속연구
한편 제보 건은 인터넷 게시글이 대부분 이미지 또는 인터넷 주소(URL)로 수집되어 본 연구에 활용하지 못한 한계가 있었다. 기초 데이터가 많지 않았음에도 본 연구는 금융감독 분야에 최신 기술을 적용하는 섭테크의 일환으로 인터넷 불법금융광고 탐지 업무에 딥러닝을 실무적 적용 가능성을 확인하는 성과를 거두었다.
향후 제보된 인터넷 주소(URL) 등을 이용하여 제보를 접수함과 동시에 텍스트를 확보하는 등의 방법으로 대량의 학습 데이터를 확보하여 추가 연구를 하고자 한다. 특히 SNS 카테고리별로 딥러닝 모델을 각각 구현하는 등 성능 향상 방안과 이미지로 된 불법금융광고 탐지 영역으로 연구 범위를 추가 · 확장하고자 한다.
참고문헌 (23)
Korean National Police Agency, "Monthly Status Report on Voice Phishing Case," Public Data Portal [Online], Availability: https://www.data.go.kr/data/15099013/fileData.do?
H. J. Kim, "An Implementation of Natural Language Processing and Deep Learning in Phone Scam Investigation," Journal of Korean Criminological Association, Vol. 16, No. 1, pp. 123-141, 2022. DOI: 10.29095/JKCA.16.1.6?
Korea Ministry of Government Legislation, "The Types and Regulations of Illegal Financial Advertising," The Easy Legal Information Service [Online], Availability: https://easylaw.go.kr/CSP/CnpClsMain.laf?csmSeq901&ccfNo1&cciNo1&cnpClsNo1?
Financial Supervisory Service, "The Crackdown, Collection, and Actions taken against Illegal Financial Advertisements in 2021," Press Releases [Online], Availability: https://www.fss.or.kr/fss/bbs/B0000188/view.do?nttId56214&menuNo200218&cl1Cd&sdate&edate&searchCnd1&searchWrd%EB%B6%88%EB%B2%95%EA%B8%88%EC%9C%B5%EA%B4%91%EA%B3%A0&pageIndex1?
Korean National Police Agency, "Analysis Report on Cybercrime Trends in 2020," Notifications/News [Online], Availability: https://www.police.go.kr/user/bbs/BD_selectBbs.do?q_bbsCode1001&q_bbscttSn20210610100256713?
Financial Supervisory Service, "Voice Phishing Incidents and Key Characteristics in 2022," Press Releases [Online], Availability: https://www.fss.or.kr/fss/bbs/B0000188/view.do?nttId127319&menuNo200218?
Financial Supervisory Service, "Insurance Fraud Detection Status and Future Plans in 2022," Press Releases [Online], Availability: https://www.fss.or.kr/fss/bbs/B0000188/view.do?nttId58396&menuNo200218&cl1Cd&sdate&edate&searchCnd1&searchWrd%EB%B3%B4%ED%97%98%EC%82%AC%EA%B8%B0&pageIndex1?
The UK's Action Fraud, "Fraud Crime Trends" & "Cyber Crime Trends," Fraud and Cyber Crime Statistics [Online], Availability: https://www.actionfraud.police.uk/fraud-stats?
The USA's Internet Crime Complaint Center(IC3), "Internet Crime Report 2022", IC3's Annual Report [Online], Availability: https://www.ic3.gov/Home/AnnualReports?
K. S. Lee, J. H. Lee, and H. M. Cho, "Keyword Combination based Classification for Illegal Gambling Websites," Korea Computer Congress 2021, pp. 1194-1196, 2021.?
C. W. Song, and H. C. Ahn, "Development of an Intelligent Illegal Gambling Site Detection Model Based on Tag2Vec," Journal of Intelligence and Information Systems, Vol. 28, No. 4, pp. 211-227. 2022. DOI: 10.13088/jiis.2022.28.4.211?
J. A. Kim, and G. B. Lee, "An Effective Method for Blocking Illegal Sports Gambling Ads on Social Media," Journal of the Korea Society of Computer and Information, Vol. 24, No. 12, pp. 201-207, 2019. DOI: 10.9708/jksci.2019.24.12.201?
J. U. Hong, S. H. Kim, J. W. Park, and J. H. Choi, "A Malicious Comments Detection Technique on the Internet using Sentiment Analysis and SVM," Journal of the Korea Institute of Information and Communication Engineering, Vol. 20, No. 2, pp. 260-267. 2016. DOI: 10.6109/jkiice.2016.20.2.260?
J. H. Park, S. Y. Cho, J. H. Lee, H. T. Lim, and Y. G. Cheong, "Detection of Illicit Drug Selling Post on an Online Community Using Phoneme Separation and Machine Learning Algorithm," Korea Computer Congress 2020, pp. 368-370, 2020.?
S. Y. Shin, K. S. Shin, and H. C. Lee, "Text Classification Using LSTM-CNN," Journal of Information and Communication Convergence Engineering, Vol. 23, No. 2, pp. 692-694. 2019.?
Y. Chen, T. Juan, and H. K. Jung, "Text Classification on Social Network Platforms Based on Deep Learning Models," Journal of Information and Communication Convergence Engineering, Vol. 21, No. 1, pp. 9-16, 2023. DOI: 10.56977/jicce.2023.21.1.9?
H. Y. Park, and K. J. Kim, "Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Model," Journal of Intelligence and Information Systems, Vol. 25, No. 4, pp. 141-154, 2019. DOI: 10.13088/jiis.2019.25.4.141?
Y. Kim, "Convolutional Neural Network for Sentence Classification," Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 1746-1751, 2014. DOI: 10.3115/v1/D14-1181?
H. J. Park, M. C. Song, and K. S. Shin, "Sentiment Analysis of Korean Reviews Using CNN - Focusing on Morpheme Embedding," Journal of Intelligence and Information Systems, Vol. 24, No. 2, pp. 59-83, 2018. DOI: 10.13088/jiis.2018.24.2.059?
Y. K. Huh, "Legal Implications of Financial Supervision with Artificial Intelligence," The Korean Journal of Securities Law, Vol. 23, No. 1, pp. 221-250, 2022. DOI: 10.17785/kjsl.2022.23.1.221?
T. H. Kim, J. I. Lim, "A Classification Model for Illegal Debt Collection Using Rule and Machine Learning Based Methods," Journal of the Korea Society of Computer and Information, Vol. 26, No. 4, pp. 93-103. 2021. DOI: 10.9708/jksci.2021.26.04.0?
J. H. Kim, and J. I. Won, "Discrimination Model On Misselling of Financial Products Using Deep Learning," KIISE Transactions on Computing Practices, Vol. 25, No. 6, pp. 294-302, 2019. DOI: 10.5626/KTCP.2019.25.6.294?
X. H. LU, and J. Jin, "A Study on the Lists of Common Korean Stopwords for Text Mining," Korean Language Research Circle, Vol. 63, No. 13, pp. 1-15, 2022. DOI: 10.16876/klrc2022..63.13
※ AI-Helper는 부적절한 답변을 할 수 있습니다.