불균형 클래스에서 AutoML 기반 분류 모델의 성능 향상을 위한 데이터 처리
Data Processing of AutoML-based Classification Models for Improving Performance in Unbalanced Classes

융합정보논문지 = Journal of Convergence for Information Technology, v.11 no.6, 2021년, pp.49 - 54  

이동준 (경기대학교 AI컴퓨터공학부) ,  강지수 (경기대학교 컴퓨터과학과) ,  정경용 (경기대학교 AI컴퓨터공학부)

AI-Helper 아이콘AI-Helper

최근 스마트 헬스케어 기술의 발전에 따라 일상적인 질환에 대한 관심이 증가하고 있다. 이에 따라 헬스케어 데이터를 통해 예측 모델로 질병을 분석하거나 예측하는 연구들이 증가하고 있다. 그러나 헬스케어 데이터에는 양성 데이터와 음성 데이터의 불균형이 존재한다. 이는 특정 질환을 가진 환자에 비하여 상대적으로 환자가 아닌 사람이 많아 데이터 수집에 어려움이 있어 발생하는 현상이다. 데이터 불균형은 질병 예측 및 탐지 시 진행하는 모델의 성능에 영향을 끼치기 때문에 이를 제거할 필요가 있다. 따라서 본 연구에서는 오버샘플링과 결측값 대치를 통해서 데이터 불균형을 해소한다. AutoML을 기반으로 여러 모델의 성능을 파악하고 모델 중 상위 3개의 모델을 앙상블한다.

Abstract AI-Helper 아이콘AI-Helper

With the recent development of smart healthcare technology, interest in daily diseases is increasing. However, healthcare data has an imbalance between positive and negative data. This is caused by the difficulty of collecting data because there are relatively many people who are not patients compar...


