[논문]거리척도와 앙상블 기법을 활용한 지가 추정

이창로; 박기호

doi:10.22640/lxsiri.2016.46.2.43

거리척도와 앙상블 기법을 활용한 지가 추정
Estimating Farmland Prices Using Distance Metrics and an Ensemble Technique 원문보기

지적과 국토정보 = Journal of cadastre & land informatix, v.46 no.2, 2016년, pp.43 - 55

이창로 (서울대학교 국토문제연구소) , 박기호 (서울대학교 지리학과, 국토문제연구소)

초록
AI-Helper

본 연구는 사례 기반 학습(instance-based learning)의 논리를 활용하여 지가를 추정하였다. 다양한 사례 기반 학습 기법 중 k-최근린법을 이용하였으며, k-최근린법 적용시 유사성을 측정하는 거리척도는 유클리디안 거리를 비롯해 문헌에 비교적 자주 등장하는 10개의 거리척도를 사용하였다. 본 연구에서는 k-최근린법에 의한 10 종류의 예측값 중 가장 우수한 성능을 보이는 1개의 예측값을 최종 가격으로 선택하는 대신, 이들 예측값들을 병합하는 앙상블(ensemble) 기법의 논리를 적용하여 최종 예측값을 결정하였다. 앙상블 기법 중 일종의 잔차 적합 모형인 경사 부스팅 앨고리듬을 적용하여 최종 가격을 정하였다. 본 연구에서는 이러한 사례 기반 학습과 앙상블 기법의 이점을 실증적으로 제시하기 위해 전라남도 해남군 소재 농지를 사례로 하여 가격을 추정하였으며, k-최근린법에 의한 10 종류의 예측값보다 앙상블 기법에 의한 가격이 보다 정확한 것을 확인할 수 있었다.

Abstract ▼ AI-Helper

This study estimated land prices using instance-based learning. A k-nearest neighbor method was utilized among various instance-based learning methods, and the 10 distance metrics including Euclidean distance were calculated in k-nearest neighbor estimation. One distance metric prediction which shows the best predictive performance would be normally chosen as final estimate out of 10 distance metric predictions. In contrast to this practice, an ensemble technique which combines multiple predictions to obtain better performance was applied in this study. We applied the gradient boosting algorithm, a sort of residual-fitting model to our data in ensemble combining. Sales price data of farm lands in Haenam-gun, Jeolla Province were used to demonstrate advantages of instance-based learning as well as an ensemble technique. The result showed that the ensemble prediction was more accurate than previous 10 distance metric predictions.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 연구에서는 거리척도를 활용한 사례 기반 학습과 앙상블 기법에 대해 살펴보고, 이러한 기법들이 지가 추정시 갖는 타당성과 우수성에 대해 실증 사례를 통해 설명하고자 한다.
앙상블 기법 중 자주 사용되는 경사 부스팅 앨고리듬을 적용하여 최종 가격을 결정하였고, 그 결과 기존 10개의 예측값들보다 추정의 정확도가 높아진 것을 확인할 수 있었다. 본 연구에서는 기존 10개 예측값들 사이의 유사성이 비교적 낮아서, 즉 일정 수준 다양성을 가지고 있었기에 이러한 예측 정확도의 개선이 가능했던 것으로 풀이하였다.
본 연구에서는 지가 추정시 폭넓게 활용되는 사례 기반 학습의 활용에 초점을 맞춘다. 사례 기반 학습은 훈련 데이터와 예측 대상과의 유사성(similarity)을 어떻게 정의할지가 관건인데, 보통 거리척도(distance metric)를 활용하여 거리값이 작게 나오면 유사한 것으로, 크게 산출되면 유사성이 떨어지는 것으로 판단한다.

제안 방법

즉 사례 기반 학습 중 k-최근린법을 이용하여 전라남도 해남군의 농지 가격을 추정하였다. k-최근린법은 추정하고자 하는 대상과 다른 관찰치들 사이의 유사성, 즉 거리를 어떻게 계산할지가 관건인데 본 연구에서는 문헌에 비교적 자주 등장하는 10개 척도를 사용하여 거리를 계산하였다. 10개 거리척도를 이용하여 추정한 10 종류의 농지 가격 예측값 사이에 현격한 정확도 차이는 발견할 수 없었다.
농지 간 유사성, 즉 거리를 측정하기 위한 항목은 실거래가 신고자료로부터 확인할 수 있는 항목으로 국한하였는데, 다음과 같은 7개 항목을 이용하여 농지간 거리를 계산하였다.
다양한 거리척도를 활용하여 추정된 10개의 예측값들 상호 간의 정확성 비교와 이러한 값들을 토대로 산출된 부스팅 앙상블값의 예측 성능은 다음과 같은 2가지 지표를 사용하여 비교하였다.
다음으로 본 연구에서는 7개 토지특성 항목을 기준으로 거리척도를 계산하였는데, 각 항목별 가중치를 별도로 부여하지 않았으므로 7개 항목에 대해 동일한 비중을 주어 거리 계산을 한 셈이다. 그러나 용도지역이나 도로접면은 감정평가 실무에서 특히 중요시하는 항목으로 이러한 항목에 높은 가중치를 두어 거리척도를 계산할 수 있을 것이다.
사례 기반 학습의 경우 먼저 훈련 데이터(training data)를 가능한 한 풍부하게 수집한다. 다음으로 수집한 데이터 중 예측하고자 하는 대상과 유사한 속성을 가진 데이터를 선별한 후, 이렇게 선별된 유사 데이터의 값을 기초로 대상의 목표값(target value)을 예측한다.
감정평가 분야에서 전문가가 가장 빈번하게 활용하는 거래사례비교법은 그 논리가 k-최근린법과 동일하며 따라서 향후 k-최근린법의 적극적 응용이 필요하다. 두 번째로 k-최근린법을 적용하여 대상을 분류하거나 예측하는 경우 거리척도는 통상 유클리디안 거리를 활용하는데 그쳤으나 본 연구에서는 유사성을 측정하는 다양한 거리척도를 소개하는 동시에 실제 지가 예측에 사용하였다는 점에서 타 연구와 차별성을 갖는다. 마지막으로 산출된 여러 개 예측값들 중 비교적 성능이 우수하다고 판단되는 1개 예측값을 선택하는 것이 아니라, 이들 예측값들을 적정하게 병합하는, 앙상블 기법의 논리를 사용하여 최종 예측값을 결정하였으며, 그 결과 예측의 정확도가 추가적으로 개선될 수 있음을 보였다는 점이다.
서론에서 언급한 바와 같이 이러한 거리척도는 무수히 많고, 또 연구자마다 연구 맥락에 맞게 적당한 척도를 개발하여 적용하기도 한다. 따라서 본 연구에서는 발표된 모든 거리척도를 검토하기보다는 문헌에서 비교적 자주 언급되는 10개의 대표적인 거리척도를 활용하고자 한다(Legendre and Legendre 2012). 본 연구에서 활용한 거리척도의 공식과 특징은 Table 1과 같다.
이와 같이 계산된 거리값을 토대로 k-최근린법을 적용하여 유보한 검증 데이터 2,188건의 지가를 예측하였다4). 또한 마지막으로 10개의 거리척도에 의해 계산된 예측값들을 경사 부스팅 앨고리듬에 투입하여 앙상블 예측값을 산출하였다. Figure 2는 검증 데이터를 대상으로 한 추정한 11개 예측값들의 분포 현황을 보여준다.
또한 본 연구에서는 도로접면, 이용상황 등 토지의 물리적 특성을 주된 설명변수로 사용하였다. 즉 물리적 거리를 계산하여 지가를 예측하였으나, 지가 형성에는 이러한 물리적 요인뿐 아니라 주민의 소득 수준, 범죄율, 학군 등 사회경제적 요인도 영향을 주기 마련이다.
또한 용도지역의 경우 통상 주거지역 > 공업지역 > 녹지지역 > 관리지역 > 농림지역 > 자연 환경보전지역 순으로 지가수준이 형성되는 바, 용도지역 항목을 일종의 서열척도(ordinal metric)로 보아 표와 같이 변환하였다.
이와 같은 앙상블 개념을 실행할 수 있는 앨고리듬은 다양한데, 일반적으로 접하게 되는 앨고리듬이 배깅(bagging)과 부스팅(boosting)이다. 배깅은 데이터로부터 일부 데이터를 복원 추출하여, 즉 부트스트랩(bootstrap)을 통해 여러 개(예를 들어 100개)의 부분 데이터 집합(subset data)을 만들어 내고, 이러한 부분 데이터 집합에 모형을 100번 적합하여 예측값을 각각 계산한다. 마지막으로 이러한 예측값을 평균하여 최종 예측치를 정하게 된다.
본 연구는 농지 가격을 추정하기 위하여 가치평가 전문가인 감정평가사들의 감정평가 절차와 유사한 사례 기반 학습의 논리를 활용하였다. 즉 사례 기반 학습 중 k-최근린법을 이용하여 전라남도 해남군의 농지 가격을 추정하였다.
이와 같은 거리척도는 데이터의 특징, 연구 맥락, 연구자의 경험과 판단 등에 따라 매우 다양하게 만들어 낼 수 있다. 본 연구에서는 동일 필지에 대해 다양한 거리척도를 활용하여 복수의 지가를 예측한 후, 이러한 예측값들을 적정하게 결합하는 앙상블 기법(ensemble technique)을 활용하여 최종 지가를 결정한다. 개인보다는 다수의 지성이 더 큰 힘을 발휘하듯, 단일 예측값이 아닌 여러 예측값들을 산출한 후 이를 결합하여 최종값을 결정하는 앙상블 기법은 발표 즉시 많은 관심을 받으며 다양한 분야에서 분석의 대상이 되어 왔다(Banfield 2007; Wang 2008).
근소하나마 RMSE 기준으로 Jaccard 거리척도에 의한 예측값이, MAPE 기준으로 Gower 거리척도에 의한 예측값이 비교적 정확하게 지가를 추정한 것으로 분석되었다. 본 연구에서는 이러한 다양한 예측값 사이의 성능 비교에 머물지 않고 이들 예측값들을 병합하는 앙상블 기법의 논리를 적용하여 최종 농지 가격을 결정하였다. 앙상블 기법 중 자주 사용되는 경사 부스팅 앨고리듬을 적용하여 최종 가격을 결정하였고, 그 결과 기존 10개의 예측값들보다 추정의 정확도가 높아진 것을 확인할 수 있었다.
본 연구에서는 Table 3의 7개 항목을 사용하여 Table 1에 제시된 10개의 거리 척도를 계산하였다. 이와 같이 계산된 거리값을 토대로 k-최근린법을 적용하여 유보한 검증 데이터 2,188건의 지가를 예측하였다4). 또한 마지막으로 10개의 거리척도에 의해 계산된 예측값들을 경사 부스팅 앨고리듬에 투입하여 앙상블 예측값을 산출하였다.

대상 데이터

먼저 평가 대상 토지가 소재한 지역의 전체 거래사례를 수집한다. 다음으로 수집한 거래사례 중 평가 대상 토지와 유사한 속성(용도지역, 접면도로, 면적 등)을 가진 거래사례를 선별한다(통상 1개에서 5개 정도를 선별). 마지막으로 선별된 거래사례의 매매가격을 기초로 평가 대상 토지의 가격을 결정한다¹⁾.
Table 2를 보면 해남군의 전형적인 농지는 농림지역에 속하는 면적 약 2,200㎡ 내외의 토지임을 알 수 있고, 거래가격은 약 23,000원/㎡ 수준으로 형성되었음을 알 수 있다. 본 분석에서는 전체 신고자료 4,375건을 임의분할(random split)하여 첫 50%는 모형 구축을 위한 훈련 데이터(train data)로 사용하였고(2,187건), 나머지 50%는 구축된 모형의 예측 성능을 검토하기 위한 검증 데이터(test data)로 유보하였다(2,188건). Figure 1은 훈련 데이터와 검증 데이터로 임의분할된(50:50) 자료의 공간적 분포를 보여주고 있다.
본 연구에서 사용한 데이터는 2011년부터 2013년까지 3년간 신고된 전라남도 해남군의 토지(농지) 실거래가 신고자료 4,375건이다³⁾. Table 2는 해남군 농지 실거래가 자료의 기초 통계량을 보여준다.

이론/모형

Table 1에서 제시된 거리척도를 활용하여 예측하고자 하는 대상과의 거리값을 계산하였다면 거리값이 가까운 사례들을 선별한 후, 아래의 k-최근린법(k-nearest neighbor method)을 이용하여 대상의 목표값을 예측한다.
2014). 본 연구도 이와 같은 선행연구의 예를 따라 지가, 보다 구체적으로는 농지의 가격을 예측하기 위해 k-최근린법을 활용하였다.
부스팅 앨고리듬 역시 세부 실행방법에는 여러 가지가 있는데(Gradient Boosting, AdaBoost, XGBoost, Gentle Boost 등), 이들 세부 실행방법 간에 근본적인 차이는 없으며 적용 과정상에 약간의 상이점만 있을 뿐이다. 본 연구에서 적용한 부스팅 앨고리듬은 Friedman(2001)의 경사 부스팅(Gradient Boosting)을 따랐다. 경사 부스팅의 실행 논리에 대한 개념적 설명은 다음과 같다²⁾.
반면 부스팅은 좀더 효과적인 예측값 병합과정을 거치는데, 직전 과정에서 산출된 잔차, 즉 오차를 계속해서 줄여나가는 방향으로 예측값 수정을 한다. 본 연구에서는 이러한 특징을 고려하여 부스팅 앨고리듬을 적용하였다.
본 연구는 농지 가격을 추정하기 위하여 가치평가 전문가인 감정평가사들의 감정평가 절차와 유사한 사례 기반 학습의 논리를 활용하였다. 즉 사례 기반 학습 중 k-최근린법을 이용하여 전라남도 해남군의 농지 가격을 추정하였다. k-최근린법은 추정하고자 하는 대상과 다른 관찰치들 사이의 유사성, 즉 거리를 어떻게 계산할지가 관건인데 본 연구에서는 문헌에 비교적 자주 등장하는 10개 척도를 사용하여 거리를 계산하였다.

성능/효과

k-최근린법은 추정하고자 하는 대상과 다른 관찰치들 사이의 유사성, 즉 거리를 어떻게 계산할지가 관건인데 본 연구에서는 문헌에 비교적 자주 등장하는 10개 척도를 사용하여 거리를 계산하였다. 10개 거리척도를 이용하여 추정한 10 종류의 농지 가격 예측값 사이에 현격한 정확도 차이는 발견할 수 없었다. 근소하나마 RMSE 기준으로 Jaccard 거리척도에 의한 예측값이, MAPE 기준으로 Gower 거리척도에 의한 예측값이 비교적 정확하게 지가를 추정한 것으로 분석되었다.
검증 데이터를 대상으로 한 10개 거리척도 및 앙상블에 의한 예측 정확도는 Table 4 및 Table 5와 같다. 거리척도에 의한 10 예측값 사이에 큰 격차는 없는 것으로 보이며, 다만 RMSE 기준으로 Jaccard 예측값이, MAPE 기준으로 Gower 예측값이 근소하나마 가장 우수한 성능을 보이는 것으로 나타 났다. 그러나 최종적으로 경사 부스팅을 적용한 앙상블 예측값이 RMSE 및 MAPE 지표 모두에서 기존 10개의 거리척도보다 예측 성능이 우수한 것으로 산출 되었다.
거리척도에 의한 10 예측값 사이에 큰 격차는 없는 것으로 보이며, 다만 RMSE 기준으로 Jaccard 예측값이, MAPE 기준으로 Gower 예측값이 근소하나마 가장 우수한 성능을 보이는 것으로 나타 났다. 그러나 최종적으로 경사 부스팅을 적용한 앙상블 예측값이 RMSE 및 MAPE 지표 모두에서 기존 10개의 거리척도보다 예측 성능이 우수한 것으로 산출 되었다.
10개 거리척도를 이용하여 추정한 10 종류의 농지 가격 예측값 사이에 현격한 정확도 차이는 발견할 수 없었다. 근소하나마 RMSE 기준으로 Jaccard 거리척도에 의한 예측값이, MAPE 기준으로 Gower 거리척도에 의한 예측값이 비교적 정확하게 지가를 추정한 것으로 분석되었다. 본 연구에서는 이러한 다양한 예측값 사이의 성능 비교에 머물지 않고 이들 예측값들을 병합하는 앙상블 기법의 논리를 적용하여 최종 농지 가격을 결정하였다.
또한 용도지역의 경우 통상 주거지역 > 공업지역 > 녹지지역 > 관리지역 > 농림지역 > 자연 환경보전지역 순으로 지가수준이 형성되는 바, 용도지역 항목을 일종의 서열척도(ordinal metric)로 보아 표와 같이 변환하였다. 마지막으로 도로접면 항목은 농지에 접한 도로의 폭이 12m ~ 25m 정도인 경우 중로, 8m ~ 12m인 경우 소로, 8m 미만이면서 자동차 통행이 가능한 경우 세로가, 8m 미만이면서 자동차 통행이 불가능한 경우 세로불, 그리고 접한 도로가 없는 경우 맹지로 분류되어 있었다. 이러한 다항범주 변수를 거리척도 계산에 투입하기 위하여 역시 용도지역 항목과 유사하게 서열척도로 취급하여 표와 같이 변환하였다.
두 번째로 k-최근린법을 적용하여 대상을 분류하거나 예측하는 경우 거리척도는 통상 유클리디안 거리를 활용하는데 그쳤으나 본 연구에서는 유사성을 측정하는 다양한 거리척도를 소개하는 동시에 실제 지가 예측에 사용하였다는 점에서 타 연구와 차별성을 갖는다. 마지막으로 산출된 여러 개 예측값들 중 비교적 성능이 우수하다고 판단되는 1개 예측값을 선택하는 것이 아니라, 이들 예측값들을 적정하게 병합하는, 앙상블 기법의 논리를 사용하여 최종 예측값을 결정하였으며, 그 결과 예측의 정확도가 추가적으로 개선될 수 있음을 보였다는 점이다.
본 연구에서는 이러한 다양한 예측값 사이의 성능 비교에 머물지 않고 이들 예측값들을 병합하는 앙상블 기법의 논리를 적용하여 최종 농지 가격을 결정하였다. 앙상블 기법 중 자주 사용되는 경사 부스팅 앨고리듬을 적용하여 최종 가격을 결정하였고, 그 결과 기존 10개의 예측값들보다 추정의 정확도가 높아진 것을 확인할 수 있었다. 본 연구에서는 기존 10개 예측값들 사이의 유사성이 비교적 낮아서, 즉 일정 수준 다양성을 가지고 있었기에 이러한 예측 정확도의 개선이 가능했던 것으로 풀이하였다.

후속연구

그러나 본 연구는 보완되거나 발전시킬 여지가 많다. 먼저 앙상블 기법은 예측값들 사이의 유사성이 낮을 때 예측의 정확도가 높아질 수 있다.
그러나 시산가격 조정에 있어 감정 평가 실무상 명확한 기준이 없어 평균가격으로 최종 가격을 정하는 것이 일반적이다. 따라서 복수의 지가를 최적의 상태로 결합하는 앙상블 기법은 시산가격 조정 과정을 보다 효율화함으로써 지가의 정확성을 높일 수 있을 것으로 기대된다.
특히 농지의 경우라면 농산물 집하 및 운반의 편의성, 인접 대도시까지의 접근성, 주변 지역 성숙에 따른 해당 지역 개발(도시화) 압력 등이 보다 중요한 지가 형성 요인으로 작용할 수 있다. 따라서 이러한 사회 경제적 측면의 거리를 측정하여 유사성 계산에 반영한다면 지가 정확도의 추가 개선이 가능할 것으로 보인다.
마지막으로 본 연구는 사례 기반 학습에 초점을 맞추었으나 모형 기반 학습을 병행하여 두 종류의 학습에서 나온 결과물을 모두 고려하여 최종 예측치를 결정할 수도 있을 것이다.
본 연구가 농지 가격 예측을 포함한 사회 여러 분야에 사례 기반 학습 및 앙상블 기법에 대한 관심을 제고하는데 단초가 되기를 기대한다.
먼저 앙상블 기법은 예측값들 사이의 유사성이 낮을 때 예측의 정확도가 높아질 수 있다. 즉 앙상블 기법을 사용한다고 하여 항상 정확도가 높아지는 것은 아니므로 데이터가 어떠한 특징을 가질 때 예측 정확도가 크게 개선될 수 있는지, 반대로 그러한 개선효과가 거의 없는지 등을 향후 과제로 살펴볼 필요가 있다.

질의응답

핵심어	질문	논문에서 추출한 답변
	앙상블 개념을 실행할 수 있는 일반적인 알고리즘은?	이와 같은 앙상블 개념을 실행할 수 있는 앨고리듬은 다양한데, 일반적으로 접하게 되는 앨고리듬이 배깅(bagging)과 부스팅(boosting)이다. 배깅은 데이터로부터 일부 데이터를 복원 추출하여, 즉 부트스트랩(bootstrap)을 통해 여러 개(예를 들어 100개)의 부분 데이터 집합(subset data)을 만들어 내고, 이러한 부분 데이터 집합에 모형을 100번 적합하여 예측값을 각각 계산한다.
	배깅 알고리즘의 원리는?	이와 같은 앙상블 개념을 실행할 수 있는 앨고리듬은 다양한데, 일반적으로 접하게 되는 앨고리듬이 배깅(bagging)과 부스팅(boosting)이다. 배깅은 데이터로부터 일부 데이터를 복원 추출하여, 즉 부트스트랩(bootstrap)을 통해 여러 개(예를 들어 100개)의 부분 데이터 집합(subset data)을 만들어 내고, 이러한 부분 데이터 집합에 모형을 100번 적합하여 예측값을 각각 계산한다. 마지막으로 이러한 예측값을 평균하여 최종 예측치를 정하게 된다.
	부스팅 알고리즘의 원리는?	반면 부스팅은 부트스트랩에 기초한 여러 개의 부분 데이터 집합을 생성하지 않는다. 대신 최초의 원데이터를 계속하여 수정하면서 모형을 업데이트한다. 즉 최초의 모형을 구성한 후, 종속변수 Y가 아닌 잔차를 업데이트하는 방식으로 모형을 수정하게 된다. 배깅의 경우 선형회귀모형 등 전통적 모형보다 예측 성능이 뛰어남을 보여 준 사례도 존재하지만(Fanelli et al.

참고문헌 (23)

김명현, 이세호, 신동훈. 2015. K-Nearest Neighbors (K-NN) 알고리즘을 통한 KOSPI200 선물지수 예측효과 연구. 대한경영학회지. 28(10):2613-2633. Kim MH, Lee SH, Shin DH. 2015. Predictability Test of K-Nearest Neighbors Algorithm: Application to the KOSPI 200 Futures. Korea Business Management Journal. 28(10):2613-2633.
김희종, 김형도. 2014. 그라디언트 부스팅과 균형 분류 를 이용한 채무 불이행 예측. 한국정보기술학회 논문지. 12(1):155-164. Kim HJ, Kim HD. 2014. Predicting Loan Defaults with Gradient Boosting and Balanced Classification. Journal of Advanced Information Technology and Convergence. 12(1):155-164.
이석준, 김선옥. 2007. 협업필터링에서 고객의 평가치 를 이용한 선호도 예측의 사전평가에 관한 연구. Asia Pacific Journal of Information Systems. 17(4):187-206. Lee SJ, Kim SO. 2007. Pre-evaluation for Prediction Accuracy by Using the Customer's Ratings in Collaborative Filtering. Asia Pacific Journal of Information Systems. 17(4):187-206.
장희순, 방경식. 2014. 부동산 용어사전. 부연사. Jang HS, Bang KS. 2014. Real Estate Dictionary. Buyeonsa.
Aha DW, Kibler D, Albert MK. 1991. Instancebased Learning Algorithms. Machine Learning. 6(1):37-66.

상세보기
Alfaro E, Garcia N, Gamez M, Elizondo D. 2008. Bankruptcy Forecasting: An Empirical Comparison of AdaBoost and Neural Networks. Decision Support Systems. 45(1):110-122.

상세보기
Banfield RE. 2007. A Comparison of Decision Tree Ensemble Creation Techniques, IEEE Transactions on Pattern Analysis and Machine Intelligence. 29(1):173-180.

상세보기
Chopra S, Hadsell R, LeCun Y. 2005. Learning a Similarity Metric Discriminatively, with Application to Face Verification. In: Computer Vision and Pattern Recognition. Proceedings of a Conference Held by IEEE Computer Society; 2005 Jun 20; San Diego (CA); 2005. Vol. 1. p. 539-546.
Fanelli G , D antone M , G all J , F ossati A, G ool L . 2013. Random Forests for Real Time 3D Face Analysis. International Journal of Computer Vision. 101(3):437-458.

상세보기
Friedman JH. 2001. Greedy Function Approximation: a Gradient Boosting Machine. Annals of Statistics. 29(5): 1189-1232.

상세보기
Gama J, Camacho R, Brazdil P, Jorge A, Torgo L. 2005. Machine Learning: ECML 2005. Proceedings of a symposium held at the 16th European Conference on Machine Learning; 2005 Oct 3-7; Porto, Portugal; 2005. p. 601-608.
Kuhn M, Johnson K. 2013. Applied Predictive Modeling. New York: Springer, p. 389-400.
Legendre P, LF Legendre. 2012. Numerical Ecology. London: Elsevier, p. 296-298.
Lemmens A, Croux C. 2006. Bagging and Boosting Classification Trees to Predict Churn. Journal of Marketing Research. 43(2):276-286.

상세보기
Li P, Wu Q, Burges CJ. 2007. Mcrank: Learning to Rank Using Multiple Classification and Gradient Boosting. In: Proceedings of a symposium held at the 21st Annual Conference on Neural Information Processing Systems; 2007 Dec 3-5; Vancouver (BC); 2007. p. 897-904.
Liao Y, Vemuri VR. 2002. Use of K-Nearest Neighbor Classifier for Intrusion Detection. Computers & Security. 21(5):439-448.

상세보기
Park B, Bae JK. 2015. Using Machine Learning Algorithms for Housing Price Prediction: The Case of Fairfax County, Virginia Housing Data. Expert Systems with Applications. 42(6):2928-2934.

상세보기
Quinlan JR. 1993. Combining Instance-based and Model-based Learning. In: Proceedings of a symposium held at the 10th International Conference on Machine Learning; 1993 Jun 27-29; Amherst (MA); 1993. p. 236-243.
Rasyidi MA, Kim J, Ryu KR. 2014. Short-Term Prediction of Vehicle Speed on Main City Roads Using the K-Nearest Neighbor Algorithm. Journal of Intelligence and Information Systems. 20(1):121-131.

원문보기 상세보기
Schapire RE. 1999. Theoretical Views of Boosting. In: Proceedings of a symposium held at the 4th European Conference, Euro COLT on Computational Learning Theory; 1999 Mar 29-31; Nordkirchen, Germany; 1999. p. 1-10.
Shen H, Chou KC. 2005. Using Optimized Evidence-Theoretic K-Nearest Neighbor Classifier and Pseudo-amino Acid Composition to Predict Membrane Protein Types. Biochemical and Biophysical Research Communications. 334(1):288-292.

상세보기
Wang YQ. 2008. Building Credit Scoring Systems Based on Support-based Support Vector Machine Ensemble. In: Proceedings of a symposium held at the 4th International Conference on Natural Computation; 2008 Oct 18-20; Jinan, China; 2008. p. 323-326.
Weinberger KQ, Blitzer J, Saul LK. 2009. Distance Metric Learning for Large Margin Nearest Neighbor Classification. Journal of Machine Learning Research. 10: 207-244.

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증