[논문]공간 패널 회귀모형을 이용한 양파 생산량 추정

최성천; 백장선

doi:10.5351/kjas.2016.29.5.873

공간 패널 회귀모형을 이용한 양파 생산량 추정
Onion yield estimation using spatial panel regression model 원문보기

응용통계연구 = The Korean journal of applied statistics, v.29 no.5, 2016년, pp.873 - 885

초록
AI-Helper

노지에서 재배되는 양파 생산량은 기후환경에 의하여 영향을 받으며, 특정 지역에서 많이 생산되는 지역적인 특성을 가지고 있다. 따라서 생산량 예측시 기상과 지역을 동시에 고려하는 접근이 필요하다. 본 논문에서는 공간 패널 회귀모형을 이용하여 기상변화에 따른 생산량을 추정하였다. 양파 주산지 13곳에 대한 2006년부터 2015년까지의 기상 패널자료를 사용하여, 공간시차를 반영한 공간자기회귀(spatial autoregressive)모형을 사용하였다. 공간가중치 행렬은 임계치 설정방법과 최근거리 설정방법으로 나누어 분석하여, 최근 3곳까지 거리 설정방법을 사용한 모형이 최종 모형으로 선택되었으며, 자기상관성이 유의함을 보였다. 하우스만 검정을 통해 채택된 확률효과모형으로 분석한 결과 누적일조시간(1월), 평균상대습도(4월), 평균최저기온(6월), 누적강수량(11월) 등이 양파 생산량 예측에 유의한 변수로 나타났다.

Abstract ▼ AI-Helper

Onions are grown in a few specific regions of Korea that depend on the climate and the regional characteristic of the production area. Therefore, when onion yields are to be estimated, it is reasonable to use a statistical model in which both the climate and the region are considered simultaneously. In this paper, using a spatial panel regression model, we predicted onion yields with the different weather conditions of the regions. We used the spatial auto regressive (SAR) model that reflects the spatial lag, and panel data of several climate variables for 13 main onion production areas from 2006 to 2015. The spatial weight matrix was considered for the model by the threshold value method and the nearest neighbor method, respectively. Autocorrelation was detected to be significant for the best fitted model using the nearest neighbor method. The random effects model was chosen by the Hausman test, and the significant climate variables of the model were the cumulative duration time of sunshine (January), the average relative humidity (April), the average minimum temperature (June), and the cumulative precipitation (November).

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

생산량을 배제한 채 가격의 패턴만 고려했던 타 연구와 달리, 기상자료와 생육특성을 고려한 생산량 변수가 포함되어 양파도매가격 예측력이 향상됨을 나타냈다. 여기서는 2006년부터 2015년까지 13곳의 양파 주산지의 단수(10a당 생산량(kg))자료를 활용해 패널회귀모형을 구축하여 기상변화에 따른 생산량 추정을 하고자 한다. 이와 더불어 주산지의 위치가 대부분 전남, 경남, 경북 등 남부지방에 집중되어 있어 지역간 상관성이 존재할 것이라 예상되어 공간계량모형을 고려한 분석을 시도하였다.

가설 설정

행렬의 원소인 w_ij는 지역 i와 지역 j 간의 상호의존성의 크기를 나타내며, 모든 지역이 인접성(근접성) 정도에 따라 동일한 가중치를 가진다고 가정한다. 또한 시간에 걸쳐 변하지 않는다고 가정하며 모든 행원소의 합은 1이 되도록 표준화 시킨다.
패널 개체들이 모집단에서 무작위로 추출된 표본의 개념이라면 오차항 μi는 확률분포를 따른다고 가정할 수 있다.
W_N를 N × N 행렬로서 지역간의 상관성을 나타내는 공간가중치행렬이라고 하자. 행렬의 원소인 w_ij는 지역 i와 지역 j 간의 상호의존성의 크기를 나타내며, 모든 지역이 인접성(근접성) 정도에 따라 동일한 가중치를 가진다고 가정한다. 또한 시간에 걸쳐 변하지 않는다고 가정하며 모든 행원소의 합은 1이 되도록 표준화 시킨다.

제안 방법

21). 공간가중치행렬(WN)의 원소(wij)를 결정하는 방법은 한곳에 밀집되어 있지 않고 전남, 경남, 경북, 제주로 떨어져 있어 인접여부의 방법(w_ij = 1 or w_ij = 0)은 사용하지 않고, 지역간 거리를 활용하여 생성 하였다. 지역간의 공간적인 자기상관성을 나타내는 기준은 임계치 설정방법과 최근거리 설정방법으로 구분하였다.
8). 공간데이터분석을 수행하는 GeoDa프로그램(http://geodacenter.asu.edu)을 활용하여 가중치행렬을 생성하였으며 행을 기준으로 표준화 시켜 행원소의 합이 1이 되도록 변경하였다.
하우스만 검정을 통해 확률효과모형을 선택하였으며, 공간가중치 행렬의 선택방법에 따라 공간 자기상관 회귀계수가 유의한 것으로 나타났다. 누적일조시간(1월), 평균상대습도(4월), 평균최저기온(6월), 누적강수량(11월)이 양파 생산량에 유의하였으며, 각각의 직접효과와 간접효과도 추정하였다.
모형의 적합성은 아카이케 정보 기준(Akaike information criterion; AIC), 베이지안 정보 기준(Bayesi- an information criterion; BIC)값을 활용하여 모형간의 적합도를 비교하고 전체 설명력을 확인하였다. 이때 N^∗은 관측치의 수, k^∗는 추정된 모수의 수, likelihood는 최대우도를 의미한다.
간접효과는 총효과에서 직접효과와의 차이가 된다. 본 논문에서는 Rpackage(splm) (Millo와 Piras, 2012)를 활용하여 직접효과와 간접효과의 추정치를 계산하였다. 모수에 대한 추정은 최우추정방법을 이용하며 로그우도는 아래와 같다.
노지에서 재배되는 양파의 생산량은 기후환경에 영향을 많이 받으며, 특정 지방에서 많이 생산되는 지역적인 특성을 가지고 있다. 본 논문에서는 공간적인 자기상관을 고려한 공간패널모형을 이용하여 기상변화에 따른 생산량 예측을 하였다. 하우스만 검정을 통해 확률효과모형을 선택하였으며, 공간가중치 행렬의 선택방법에 따라 공간 자기상관 회귀계수가 유의한 것으로 나타났다.
설명변수 선택은 생산량과 84개의 기상데이터를 활용하여 다중회귀분석 단계선택 방법을 통해 유의한 변수만을 선택하였다 (유의수준: 진입 0.05, 제거 0.1). 다중회귀분석-단계선택 방법을 통하여 1월 누적일조시간, 4월 평균상대습도, 6월 평균최저기온, 6월 평균기온, 8월 평균최저기온, 11월 누적강수량이 선택되었다.
01%를 점유하고 있다. 설명변수로는 농촌진흥청 (RDA, 2013)의 자료를 참조하여 양파 생육에 영향을 미치는 주요 기상변수로서 온도, 강수량, 습도, 햇빛 등을 고려 하였다. 기상자료는 기상청에서 제공하는 2006년부터 2015년까지 월별 기상자료를 사용하였다 (Table 3.
여기서 1월부터 12월까지의 평균기온, 평균최저기온, 평균최고기온, 누적강수량, 평균상대습도, 누적일조시간, 평균지면온도에 대하여 기상자료를 구축하였고 총 84개의 월별 설명변수를 사용하였다. 양파의 수확시기인 7월을 기준으로 양파의 연간 단위당 생산량이 변화하기 때문에, 해당연도의 양파 생산량에 미치는 기상자료를 전년도 7월부터 해당년도 6월까지로 설정하여 설명변수 값으로 사용하였다.
2). 여기서 1월부터 12월까지의 평균기온, 평균최저기온, 평균최고기온, 누적강수량, 평균상대습도, 누적일조시간, 평균지면온도에 대하여 기상자료를 구축하였고 총 84개의 월별 설명변수를 사용하였다. 양파의 수확시기인 7월을 기준으로 양파의 연간 단위당 생산량이 변화하기 때문에, 해당연도의 양파 생산량에 미치는 기상자료를 전년도 7월부터 해당년도 6월까지로 설정하여 설명변수 값으로 사용하였다.
여기서는 2006년부터 2015년까지 13곳의 양파 주산지의 단수(10a당 생산량(kg))자료를 활용해 패널회귀모형을 구축하여 기상변화에 따른 생산량 추정을 하고자 한다. 이와 더불어 주산지의 위치가 대부분 전남, 경남, 경북 등 남부지방에 집중되어 있어 지역간 상관성이 존재할 것이라 예상되어 공간계량모형을 고려한 분석을 시도하였다. 본 논문은 제 2장에서는 공간패널모형에 대해 설명하고, 제 3장에서는 분석에 사용된 자료를 설명한다.
만약 지역간 거리가 임계치보다 가까운 경우 행렬의 원소값은 지역간 거리의 역수(w_ij = dist(지역i,지역j) ⁻¹)를 사용하며, 지역간 거리가 임계치보다 멀리 떨어진 경우는 원소의 값을 0으로(w_ij = 0)사용한다. 지역간 자기상관성이 최소한 1곳 이상 존재하도록 설정하기 위하여 제주와 해남간의 거리인 141,900m를 최소임계치로 설정하는 방법과, 모든 지역이 서로 자기상관성이 존재하기 위해 424,037m를 최대임계치로 설정하는 방법을 사용하였다 (Table 3.4, Table 3.5). 최근거리 설정방법은 특정지역을 기준으로 가장 가까운 m번째 까지 지역은 서로 자기 상관성이 존재한다고 판단하는 방법으로 예를 들면 제주를 기준으로 m = 3인 경우 제주와 가장 가까운 고흥, 무안, 해남의 지역만 제주와 공간적인 자기 상관성을 가지게 된다.
공간가중치행렬(WN)의 원소(wij)를 결정하는 방법은 한곳에 밀집되어 있지 않고 전남, 경남, 경북, 제주로 떨어져 있어 인접여부의 방법(w_ij = 1 or w_ij = 0)은 사용하지 않고, 지역간 거리를 활용하여 생성 하였다. 지역간의 공간적인 자기상관성을 나타내는 기준은 임계치 설정방법과 최근거리 설정방법으로 구분하였다.
모형 추정시 회귀계수가 유의하지 않은 변수가 발생할 경우 해당되는 변수는 제외시킨후 다시 추정하는 과정을 반복하여 6월 평균기온, 8월 평균최저기온이 제외되었으며, 최종 유의한 설명변수는 전년도 11월 누적강수량, 당해년도 1월 누적일조시간, 당해년도 4월 평균상대습도, 당해년도 6월 평균최저기온이 선택되었다. 하우스만 검정결과 모든 모형에서 귀무가설을 채택하게 되어 확률효과모형으로 추정하였다. 공간적인 자기상관성을 나타내는 ρ의 경우 m = 3, m = 4의 방법에서 유의수준 0.
하우스만 검정을 통해 오차항 μi를 확률변수로 간주하는 확률효과모형인지, 추정해야할 모수로 간주하는 고정효과모형인지를 선택한 후, 각각의 모형에서 확률효과 또는 그룹효과의 유의성을 검정한다.

대상 데이터

공간패널모형에서 반응변수로 사용한 자료는 2006년부터 2015년 까지 통계청에서 제공하는 13개 시군의 10a당 양파 생산량이다 (Table 3.1). 해당 시군은 전국 양파 주요 산지이며, 전국대비 양파 수확면적 비율은 (2010년 농림어업총조사 기준, 통계청) 무안군 19.
설명변수로는 농촌진흥청 (RDA, 2013)의 자료를 참조하여 양파 생육에 영향을 미치는 주요 기상변수로서 온도, 강수량, 습도, 햇빛 등을 고려 하였다. 기상자료는 기상청에서 제공하는 2006년부터 2015년까지 월별 기상자료를 사용하였다 (Table 3.2). 여기서 1월부터 12월까지의 평균기온, 평균최저기온, 평균최고기온, 누적강수량, 평균상대습도, 누적일조시간, 평균지면온도에 대하여 기상자료를 구축하였고 총 84개의 월별 설명변수를 사용하였다.

데이터처리

)의 증가(감소)를 보장할 수 없다. 대안으로서 반응변수와 예측값의 상관계수 제곱값인 corr²(#)을 적합도 검정의 측도로 사용하였다.

성능/효과

1). 다중회귀분석-단계선택 방법을 통하여 1월 누적일조시간, 4월 평균상대습도, 6월 평균최저기온, 6월 평균기온, 8월 평균최저기온, 11월 누적강수량이 선택되었다. 사용된 월별 기상자료의 기초통계량 값이 Table 3.
1에 나타나 있다. 모든 지역에서 연도별 추정값의 추이가 실제 생산량과 일치함을 알 수 있으며 따라서 제안된 공간패널회귀모형이 잘 적합됨을 확인할 수 있다.
2와 같다. 모형 추정시 회귀계수가 유의하지 않은 변수가 발생할 경우 해당되는 변수는 제외시킨후 다시 추정하는 과정을 반복하여 6월 평균기온, 8월 평균최저기온이 제외되었으며, 최종 유의한 설명변수는 전년도 11월 누적강수량, 당해년도 1월 누적일조시간, 당해년도 4월 평균상대습도, 당해년도 6월 평균최저기온이 선택되었다. 하우스만 검정결과 모든 모형에서 귀무가설을 채택하게 되어 확률효과모형으로 추정하였다.
Nam과 Choe (2015)는 자기회귀시차(autoregressive and distributed lags) 모형으로 재배면적과 단수를 예측하고, 양파 출하시기 도매가격을 전망하였다. 생산량을 배제한 채 가격의 패턴만 고려했던 타 연구와 달리, 기상자료와 생육특성을 고려한 생산량 변수가 포함되어 양파도매가격 예측력이 향상됨을 나타냈다. 여기서는 2006년부터 2015년까지 13곳의 양파 주산지의 단수(10a당 생산량(kg))자료를 활용해 패널회귀모형을 구축하여 기상변화에 따른 생산량 추정을 하고자 한다.
본 논문에서는 공간적인 자기상관을 고려한 공간패널모형을 이용하여 기상변화에 따른 생산량 예측을 하였다. 하우스만 검정을 통해 확률효과모형을 선택하였으며, 공간가중치 행렬의 선택방법에 따라 공간 자기상관 회귀계수가 유의한 것으로 나타났다. 누적일조시간(1월), 평균상대습도(4월), 평균최저기온(6월), 누적강수량(11월)이 양파 생산량에 유의하였으며, 각각의 직접효과와 간접효과도 추정하였다.
확률효과 모수인 ϕ = σ2μ/σ2ε는 모든 모형에서 유의수준 0.1하에 유의한 결과가 나왔다.

후속연구

본 논문에서는 양파 주산지만을 고려하였으며, 기상자료의 부족으로 기상대체시군을 활용하는 한계가 있었다. 향후 확장된 공간모형을 활용하거나 다른 방법의 공간가중치 행렬을 사용할 경우 예측력이 높아질 가능성이 있어 추후 더 많은 지역 자료를 사용한 연구가 필요하다.
본 논문에서는 양파 주산지만을 고려하였으며, 기상자료의 부족으로 기상대체시군을 활용하는 한계가 있었다. 향후 확장된 공간모형을 활용하거나 다른 방법의 공간가중치 행렬을 사용할 경우 예측력이 높아질 가능성이 있어 추후 더 많은 지역 자료를 사용한 연구가 필요하다.

질의응답

핵심어	질문	논문에서 추출한 답변
	시계열 자료란?	어떠한 특성이나 성질이 시간의 순서대로 나열되어 있는 자료를 시계열 자료(time series data)라고 하며, 반대로 특정 시점에 여러 개체의 현상이나 특성을 모아 놓은 것을 횡단면 자료(cross sectional data)라고 한다. 패널자료(panel data)는 시계열자료와 횡단면자료를 하나로 합쳐놓은 자료이다.
	가중치 행렬을 구하는 방법에는 어떤 것이 있는가?	가중치 행렬을 구하는 방법은 크게 인접성(contiguity)을 기준으로 구축하는 방법과, 거리(distance)를 기준으로 구축하는 방법이 있다. 인접성을 고려하는 경우 인접하는 기준을 어떻게 세우느냐에 따라 방법이 달라지고, Rook, Queen, Bishop 방법 등이 있다.
	패널 모형 적용을 위해 어떤 가정이 성립해야 하는가?	패널 모형에는 다음과 같은 기본가정이 성립해야 한다. (가정 1) 모든 i 및 t에 대하여, E(εit) = 0, (가정 2) 모든 i 및 t에 대하여, var(εit) = σ2, (가정 3) 모든 i ̸= j 및 t ̸= s에 대하여, cov(εit, εjs) = 0, (가정 4) 모든 i 및 t에 대하여, cov(xit, εit) = 0. 만약 이러한 가정 중에서 개체 간의 상관성이 존재하여 cov(εit, εjs) = 0을 만족하지 못하게 되면, 공간적인 자기상관이 존재한다고 할 수 있으며, 자기상관을 고려한 모형을 사용해야 한다.

참고문헌 (10)

Baltagi, B. H. (2005). Econometric Analysis of Panel Data (3th ed.), John Wiley & Sons, New York.
Greene, W. H. (2012). Econometric Analysis (7th ed.), Pearson.
Kim, Y. J. (2013). Abnormal climate's effect on crop yield and its volatility: a case study of onions (Thesis paper), Seoul National University.
Lee, H. Y. and Noh, S. C. (2013). Advanced Statistical Analytics, MOONWOOSA.
LeSage, J. and Pace, R. K. (2009). Introduction to Spatial Econometrics, CRC Press Taylor & Francis Group.
Millo, G. and Piras, G. (2012). splm: Spatial panel data models in R, Journal of Statistical Software, 47, 1-38.
Min, I. S. and Choi, P. S. (2012). STATA Panel Data Analysis, The Korean Association of STATA.
Nam, K. H. and Choe, Y. C. (2015). A study on onion wholesale price forecasting model, Journal of Agricultural Extension & Community Development, 22, 423-434.

원문보기 상세보기
Rural Development Administration (RDA) (2013). Agricultural Technology Guide: Onion (e-book), http://www.rda.go.kr
Verbeek, M. (2000). A Guide to Modern Econometrics, Wiley, Chichester.

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증