$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

가중치 세분화 기반의 로지스틱 회귀분석 모델
Fine-Grain Weighted Logistic Regression Model 원문보기

Journal of the Institute of Electronics and Information Engineers = 전자공학회논문지, v.53 no.9 = no.466, 2016년, pp.77 - 81  

이창환 (동국대학교 정보통신학과)

초록
AI-Helper 아이콘AI-Helper

로지스틱 회귀분석은 오랫동안 다양한 분야에서 예측을 위한 기술 혹은 변수 간의 관계를 설명하기 위하여 사용되어 왔다. 로지스틱 회귀분석에서 각 속성은 목적 값에 대한 중요도를 가지는데 본 연구에서는 이를 세분화하여 각 속성의 값에 따라서 중요도를 부여하는 새로운 방법을 제시한다. 점진적 하강법을 이용하여 알고리즘의 성능을 최대화하는 각 속성값 가중치의 값을 계산하였다. 제안된 방법은 다양한 데이터를 이용하여 실험하였고 본 연구의 속성값 기반 로지스틱 회귀분석 방법은 기존의 로지스틱 회귀분석보다 우수한 학습 능력을 보임을 알 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

Logistic regression (LR) has been widely used for predicting the relationships among variables in various fields. We propose a new logistic regression model with a fine-grained weighting method, called value weighted logistic regression, by assigning different weights to each feature value. A gradie...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문은 각각의 특징 값에 적응 가중치를 할당하는 값어치 가중 로지스틱 회귀 (value weighted logistic regression -- VWLR) 모델을 제안했다. 최적의 파라미터를 얻기 위해 기울기 상승 방법을 이용했다.
  • 본 논문은 로지스틱 회귀의 세분화된 가중치 방법인 속성값 기반 로지스틱 회귀 (value weighted logistic regression : VWLR) 모델을 제안한다. 이 논문에서는 각 속성의 값에 각각 다른 가중치를 부여하는 로지스틱 회귀 방법의 새로운 패러다임을 제공한다.

가설 설정

  • 파라미터 수의 증가는 VWLR이 각 값들을 효과적으로 대표할 수 있도록 한다. 반면 큰 가중치를 가질 가능성도 증가한다. 이러한 이유 때문에 특히 데이터가 아주 다차원이고 훈련 데이터가 드문 경우에 VWLR에서 훈련 데이터의 오버 피팅 문제가 종종 발생할 수 있다.
  • 또한 입력변수들의 관측값들의 조합에 기반하여 출력변수의 기대값이 보여지는 선형 회귀와 달리 이진 로지스틱 회귀는 주어진 관측값들에 따른 출력 클래스의 사후 확률 (즉, true'의 확률)을 모델링한다. 이와 같이 로지스틱 회귀는 입력과 출력 사이의 관계가 입력의 선형 조합을 이용하는 로지스틱 방정식의 형태로 추정 된다고 가정한다. 이때 입력의 각 속성은 각자의 가중치와 결합된다.
  • 이러한 지역 로지스틱 회귀 모델은 주로 K 최근접 방법 (K-nearest-neighbor)을 사용하는데 이는 오직 이웃한 데이터 포인트만을 선택하고 나머지를 무시한다. 지역적 가중 로지스틱 회귀법은 각 인스턴스에 가중치를 부여하는 것을 제외하고 글로벌 로지스틱 회귀와 매우 유사하다. 특정 도메인에 거리에 대한 다양한 지표들이 제안될 것이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
로지스틱 회귀분석 방법의 단점은? 로지스틱 회귀분석은 통계학습에서 오랫동안 사용되어온 분류학습 방법이다. 하지만 로지스틱 회귀분석 방법은 선형 학습 방법으로써 실제 문제가 비선형인 경우에 좋은 성능을 보이기 힘든 단점이 있다. 이와 같은 로지스틱 회귀분석의 단점을 해결하기 위하여 다수의 방법이 제안되고 있다.
로지스틱 회귀분석은 어디에 사용되어 왔는가? 로지스틱 회귀분석은 오랫동안 다양한 분야에서 예측을 위한 기술 혹은 변수 간의 관계를 설명하기 위하여 사용되어 왔다. 로지스틱 회귀분석에서 각 속성은 목적 값에 대한 중요도를 가지는데 본 연구에서는 이를 세분화하여 각 속성의 값에 따라서 중요도를 부여하는 새로운 방법을 제시한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (10)

  1. Atkeson, Christopher G., Andrew W. Moore, and Stefan Schaal. "Locally weighted learning for control." Lazy learning. Springer Netherlands, 1997. 75-113. 

  2. Cleveland, William S., and Susan J. Devlin. "Locally weighted regression: an approach to regression analysis by local fitting." Journal of the American Statistical Association 83.403 (1988): 596-610. 

  3. Goeman, Jelle, Rosa Meijer, and Nimisha Chaturvedi. "L1 and L2 penalized regression models." (2014). 

  4. Hosmer D W, Lemesbow S. Goodness of fit tests for the multiple logistic regression model. Communications in Statistics-Theory and Methods, 1980, 9(10): 1043-1069. 

  5. Hosmer Jr, David W., and Stanley Lemeshow. Applied logistic regression. John Wiley & Sons, 2004. 

  6. Kurgan, Lukasz, and Krzysztof J. Cios. "CAIM discretization algorithm." Knowledge and Data Engineering, IEEE Transactions on Knowledge and Data Engineering, 145-153. (2004): 

  7. Menard, Scott. Applied logistic regression analysis. Vol. 106. Sage, 2002. 

  8. Zhang, Lijun, et al. "Efficient Online Learning for Large-Scale Sparse Kernel Logistic Regression." AAAI. 2012. 

  9. Zhu, Ji, and Trevor Hastie. "Kernel logistic regression and the import vector machine." Journal of Computational and Graphical Statistics (2005). 

  10. https://archive.ics.uci.edu/ml/datasets.html 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로