반복측정자료 분석을 위한 혼합모형의 적용성 검토: 강원지역 굴참나무 임분을 대상으로 Applicability Evaluation of a Mixed Model for the Analysis of Repeated Inventory Data : A Case Study on Quercus variabilis Stands in Gangwon Region원문보기
본 연구의 목적은 임의효과(random effect)를 포함하는 혼합모형(mixed model)을 이용하여 흉고직경과 수고의 변화량을 평가하는데 있다. 강원도 굴참나무 임분을 대상으로 흉고직경과 수고를 조사하고 3년 후 동일 임분을 재조사하였다. 혼합모형에서 굴참나무의 흉고직경-수고 관계는 고정효과(fixed effect)이고 초기측정과 반복측정의 흉고직경과 수고 차이를 임의효과로 설정하였다. 임의효과에 따른 모형의 적합도를 검정하기 위하여 아카이케의 정보기준(akaike information criterion, AIC)을 참고하고 반복 측정에 따른 분산-공분산 행렬과 오차항을 산정하였다. 추정된 공분산은 -0.0291이고 오차항은 0.1007을 나타내었다. 분산-공분산 행렬을 이용한 임의효과가 포함된 모형의 AIC(=-215.5)는 고정효과를 고려한 모형의 AIC(=-154.4)에 비해 낮은 수치를 나타내었다. 이러한 결과는 범주형 자료의 임의효과가 모형 개발에 반영되는 결과인 것으로 조사되었다. 그러므로, 본 연구에서 적용된 혼합모형은 반복 측정 자료를 이용한 모형 개발에 활용이 가능한 것으로 판단된다.
본 연구의 목적은 임의효과(random effect)를 포함하는 혼합모형(mixed model)을 이용하여 흉고직경과 수고의 변화량을 평가하는데 있다. 강원도 굴참나무 임분을 대상으로 흉고직경과 수고를 조사하고 3년 후 동일 임분을 재조사하였다. 혼합모형에서 굴참나무의 흉고직경-수고 관계는 고정효과(fixed effect)이고 초기측정과 반복측정의 흉고직경과 수고 차이를 임의효과로 설정하였다. 임의효과에 따른 모형의 적합도를 검정하기 위하여 아카이케의 정보기준(akaike information criterion, AIC)을 참고하고 반복 측정에 따른 분산-공분산 행렬과 오차항을 산정하였다. 추정된 공분산은 -0.0291이고 오차항은 0.1007을 나타내었다. 분산-공분산 행렬을 이용한 임의효과가 포함된 모형의 AIC(=-215.5)는 고정효과를 고려한 모형의 AIC(=-154.4)에 비해 낮은 수치를 나타내었다. 이러한 결과는 범주형 자료의 임의효과가 모형 개발에 반영되는 결과인 것으로 조사되었다. 그러므로, 본 연구에서 적용된 혼합모형은 반복 측정 자료를 이용한 모형 개발에 활용이 가능한 것으로 판단된다.
The purpose of this study was to evaluate mixed model of dbh-height relation containing random effect. Data were obtained from a survey site for Quercus variabilis in Gangwon region and remeasured the same site after three years. The mixed model were used to fixed effect in the dbh-height relation f...
The purpose of this study was to evaluate mixed model of dbh-height relation containing random effect. Data were obtained from a survey site for Quercus variabilis in Gangwon region and remeasured the same site after three years. The mixed model were used to fixed effect in the dbh-height relation for Quercus variabilis, with random effect representing correlation of survey period were obtained. To verify the evaluation of the model for random effect, the akaike information criterion (abbreviated as, AIC) was used to calculate the variance-covariance matrix, and residual of repeated data. The estimated variance-covariance matrix, and residual were -0.0291, 0.1007, respectively. The model with random effect (AIC = -215.5) has low AIC value, comparison with model with fixed effect (AIC = -154.4). It is for this reason that random effect associated with categorical data is used in the data fitting process, the model can be calibrated to fit repeated site by obtaining measurements. Therefore, the results of this study could be useful method for developing model using repeated measurement.
The purpose of this study was to evaluate mixed model of dbh-height relation containing random effect. Data were obtained from a survey site for Quercus variabilis in Gangwon region and remeasured the same site after three years. The mixed model were used to fixed effect in the dbh-height relation for Quercus variabilis, with random effect representing correlation of survey period were obtained. To verify the evaluation of the model for random effect, the akaike information criterion (abbreviated as, AIC) was used to calculate the variance-covariance matrix, and residual of repeated data. The estimated variance-covariance matrix, and residual were -0.0291, 0.1007, respectively. The model with random effect (AIC = -215.5) has low AIC value, comparison with model with fixed effect (AIC = -154.4). It is for this reason that random effect associated with categorical data is used in the data fitting process, the model can be calibrated to fit repeated site by obtaining measurements. Therefore, the results of this study could be useful method for developing model using repeated measurement.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
기존의 연구는 주로 지역간 차이를 고려하여 혼합모형의 적용성을 검토하였고 최근 다양한 시점에서 수집된 자료의 차이를 고려하는 모형의 개발이 필요한 실정이다. 그러므로, 본 연구의 목적은 초기측정과 반복측정에 따른 흉고 직경과 수고의 변화량을 파악하고 분산-공분산행렬을 제시하여 혼합모형을 이용한 정도 높은 흉고직경-수고 모형 개발에 있다.
본 연구는 우리나라의 대표적인 참나무류인 굴참나무를 대상으로 반복측정에 따른 흉고직경과 수고의 모형식을 개발하고 생장량을 비교하였다. 조사대상지는 강원도 내 3개 양양, 홍천, 횡성지역이고 조사 시기는 2010년, 2013년 동일시험지를 대상으로 조사하였다.
제안 방법
Figure 3. The relation of height versus DBH for Quercus variabilis in Gangwon region with mixed model of random effect for repeated measurement.
고정효과를 고려한 모형과 임의효과를 포함하는 혼합 모형을 비교하고 적합성 여부를 판단하기 위하여 각 모형의 우도(likelihood)를 계산하고 AIC(akaike information criterion)를 제시하여 모형의 적합성을 나타내었다(식 4). AIC에 있는 2 × p는 모수의 수에 대한 오차항이며 일반적으로 수가 증가할수록 임의 효과에서 발생하는 오차는 상쇄되므로 AIC는 서로 조화되는 상태에서 최적의 모형을 결정한다(Mcculloch et al.
혼합모형은 AIC를 이용하여 고정효과를 고려한 모형과 비교하고 적합도를 검증하였다. 고정효과의 모수는 강원지방에 분포하는 굴참나무 표본에 기초하여 흉고 직경과 수고 모형을 추정하고 임의효과를 적용하여 모형의 조절(calibration) 가능성을 평가하였다. 흉고직경과 수고의 관계를 고정효과로 분류하고 반복 측정에 따른 차이를 임의효과로 나타내어 분산-공분산 행렬을 분석하였을 때, 임의효과에 대한 분산은 0.
조사대상지는 강원도 내 3개 양양, 홍천, 횡성지역이고 조사 시기는 2010년, 2013년 동일시험지를 대상으로 조사하였다. 반복측정 후의 흉고직경과 수고를 조사하고 두 집단 간 경향을 파악하여 고정효과와 임의효과를 고려하는 혼합모형을 사용하였다. 혼합모형은 AIC를 이용하여 고정효과를 고려한 모형과 비교하고 적합도를 검증하였다.
반복측정에 따른 흉고직경과 수고 차이를 고려하여 분산-공분산 행렬을 추정하였다(Table 3). 임의효과에 대한 공변량과 오차항을 추정하여 2010년 측정된 흉고직경의 분산은 0.
(2005)은 범주형 자료에서 발생하는 자료간 차이를 임의효과를 이용하여 모형에 적용하는 방안을 제시하였다. 본 연구는 반복측정에 따른 차이를 고려하는 혼합모형을 이용하여 흉고직경과 수고의 관계식을 제시하였다. 본 연구의 결과에서 임의효과를 고려한 혼합모형은 반복측정에 따른 변화량 파악에 용이하고 그것의 효과를 분석하는데 활용이 가능한 것으로 조사되었다.
본 연구는 강원도에 분포하는 굴참나무 임분을 대상으로 홍천 1개소, 양양 2개소, 횡성 1개소를 조사하였다 (Figure 1). 조사구는 0.02 ha, 0.03 ha의 원형조사구이고 조사구에 분포하는 입목의 흉고직경과 수고를 조사하였다. 조사목은 임분 상황을 고려하여 고사목, 정단부 피해목은 제외하였다.
반복측정 후의 흉고직경과 수고를 조사하고 두 집단 간 경향을 파악하여 고정효과와 임의효과를 고려하는 혼합모형을 사용하였다. 혼합모형은 AIC를 이용하여 고정효과를 고려한 모형과 비교하고 적합도를 검증하였다. 고정효과의 모수는 강원지방에 분포하는 굴참나무 표본에 기초하여 흉고 직경과 수고 모형을 추정하고 임의효과를 적용하여 모형의 조절(calibration) 가능성을 평가하였다.
대상 데이터
본 연구는 강원도에 분포하는 굴참나무 임분을 대상으로 홍천 1개소, 양양 2개소, 횡성 1개소를 조사하였다 (Figure 1). 조사구는 0.
조사목은 임분 상황을 고려하여 고사목, 정단부 피해목은 제외하였다. 조사는 2010년 측정되었고 3년 후 동일 임분을 대상으로 재측정하였다. 조사대상지에 분포하는 굴참나무의 지위지수는 16~18 범위(기준임령, 30년)로 지위지 수표에서 제시하는 굴참나무의 지위지수 범위(12~18)중 높은 수치를 나타내고 흉고직경과 수고 생장은 증가추세에 있는 것으로 판단되어 반복측정의 간격은 3년으로 정하였다(Korea Forest Service, 2012).
본 연구는 우리나라의 대표적인 참나무류인 굴참나무를 대상으로 반복측정에 따른 흉고직경과 수고의 모형식을 개발하고 생장량을 비교하였다. 조사대상지는 강원도 내 3개 양양, 홍천, 횡성지역이고 조사 시기는 2010년, 2013년 동일시험지를 대상으로 조사하였다. 반복측정 후의 흉고직경과 수고를 조사하고 두 집단 간 경향을 파악하여 고정효과와 임의효과를 고려하는 혼합모형을 사용하였다.
데이터처리
흉고직경과 수고의 관계를 나타내기 위하여 상대생장식을 이용하고 로그변환하여 식 2의 형태로 나타내었다. 동일 입목의 반복측정에 따른 변화 행렬과 오차항을 추정하기 위하여 SAS의 MIXED procedure를 이용하고 RANDOM 구문을 사용하여 고정효과의 신뢰구간과 임의효과에 대한 분산과 공분산을 산정하였다(Kim, 1999; SAS, 2004).
이론/모형
본 연구는 조사시기에 따른 흉고직경과 수고의 차이를 산정하고 모형에 적용하기 위하여 혼합모형을 사용하였다. 혼합모형은 고정효과와 임의효과를 포함하는 선형모형(linear model)의 종류이다(Searle, 1982; Sharma and Parton, 2007; Mcculloh et al.
성능/효과
4)에 비하여 낮은 결과를 나타내었다. AIC의 결과는 다수의 모형에서 최적의 모형을 선택하는 기준으로 본 연구에서 제시된 혼합모형은 기존의 고정효과만 고려한 모형에 비해 높은 정도를 나타내는 것으로 조사되었다. 반복측정의 관측치와 혼합모형을 이용하여 제시된 흉고직경과 수고의 결과는 Figure 3과 같다.
5233이고 흉고직경에 따라 변하는 상대생장계수이다. 고정효과의 모수에 대한 표준오차는 추정된 값의 0.07% 이하를 나타내고 p-값은 통계적으로 유의한 수치를 나타내어 강원지역 굴참나무의 흉고직경과 수고 모형개발을 위한 모수 사용은 적합한 것으로 판단된다(Table 2).
4)에 비하여 낮은 결과를 나타내었다. 본 연구에서 제시된 조사시기별 임의효과를 고려한 강원도 굴참나무의 흉고직경과 수고 모형은 exp[0.9459 + 0.5642ln(DBH)]이고, AIC를 비교한 결과, 고정효과를 고려한 모형에 비해 높은 적합도를 나타내었다. 이러한 결과는 연속적인 측정 자료에 포함되어 있는 자료의 편향성을 혼합모형 내 임의효과를 이용하여 범주형 자료의 특징을 모형에 반영한 결과로 판단된다.
본 연구는 반복측정에 따른 차이를 고려하는 혼합모형을 이용하여 흉고직경과 수고의 관계식을 제시하였다. 본 연구의 결과에서 임의효과를 고려한 혼합모형은 반복측정에 따른 변화량 파악에 용이하고 그것의 효과를 분석하는데 활용이 가능한 것으로 조사되었다. 그러므로, 다양한 시점 혹은 지역에서 수집된 자료를 이용하여 모형을 개발하는 경우, 집단 간 관계를 파악하고 효과를 분석하여 모형의 개발과정에 적용하는 과정이 필요한 것으로 판단된다.
0291으로 2010년 자료에 비해 2013년의 변화 추세가 적은 것으로 조사되었다. 분석된 결과에서 임분의 흉고직경과 수고의 변화량은 줄고 균일도가 높아지는 경향을 나타내었다. 이러한 결과는 시간의 경과에 따라 흉고직경과 수고의 공분산은 음의 값(−)을 나타낸다는 Lappi(1997)의 연구 결과와 유사한 것으로 판단된다.
여기서, 조절(calibration)은 기존의 고정효과를 고려한 모형에 집단간 발생하는 임의효과를 적용하여 모수가 변화한다는 의미이다. 임의효과를 적용한 결과에서 모형의 절편은 감소하고 기울기는 증가하는 것으로 조사되었다. Figure 2에서 고정효과와 임의효과를 포함한 혼합모형과 고정효과만 포함하는 모형의 잔차도를 비교하였을 때, 임의효과를 고려한 흉고직경과 수고의 관계식이 고정효과를 고려한 모형에 비해 0에 근접한 형태를 나타내었다.
후속연구
이러한 결과는 본 연구에서 수집된 자료의 조사시기별 간격이 기존의 연구에 비해 짧고 적은 조사 횟수 때문으로 판단된다. 그러므로 집단 간 생장이 유의한 차이를 나타내는 간격과 적정 조사 횟수에 대한 연구가 필요한 것으로 사료된다.
이러한 차이는 본 연구에서 수집된 강원지방 굴참나무의 자료는 천연림자료가 일부 포함되고 조사간격이 짧으며, 반복조사횟수가 적기 때문이다. 그러므로, 흉고직경과 수고의 장기적인 변화경향을 파악하기 위하여 지속적인 자료의 수집과 관찰이 필요한 것으로 판단된다.
이러한 결과는 연속적인 측정 자료에 포함되어 있는 자료의 편향성을 혼합모형 내 임의효과를 이용하여 범주형 자료의 특징을 모형에 반영한 결과로 판단된다. 본 연구의 결과는 강원지방에 분포하는 굴참나무의 반복측정에 따른 흉고직경과 수고 생장의 변화량 파악을 통하여 정도 높은 모형의 개발과 범주형 자료 분석을 위한 혼합 모형의 적용성 판단에 활용이 가능하다.
질의응답
핵심어
질문
논문에서 추출한 답변
고정효과는 무엇인가?
, 2009). 고정효과는 특정 수준의 모집단을 대상으로 설명하고자 하는 요인(factor)이고 임의효과는 연구 대상이 모집단으로부터 일정한 확률로 선정된 표본임을 가정하는 효과를 나타낸다(Searle, 1982; Mcculloh et al., 2008).
모형의 개발연구에는 어떤 사료를 사용하는가?
모형의 개발연구는 대상이 되는 모집단 특성을 파악하기 위해 다양한 시점에서 수집된 연속적인 자료(continuous data)가 사용된다. 그러나 수집된 자료는 특정 범주 (category)에 따라 특성이 존재하고 특정 시점에서 자료가 편중되는 경우, 자료의 가중치가 전체적인 모형의 왜곡을 나타내는 경우가 발생한다(Searle, 1982).
모형 개발과정에 발생하는 문제점을 해결하기 위해 범주간 특성을 파악하고 분산-공분산 행렬을 작성하여 모형에 적용해야하는 이유는?
모형의 개발연구는 대상이 되는 모집단 특성을 파악하기 위해 다양한 시점에서 수집된 연속적인 자료(continuous data)가 사용된다. 그러나 수집된 자료는 특정 범주 (category)에 따라 특성이 존재하고 특정 시점에서 자료가 편중되는 경우, 자료의 가중치가 전체적인 모형의 왜곡을 나타내는 경우가 발생한다(Searle, 1982). 그러므로 범주간 특성을 파악하고 분산-공분산 행렬(variance-covariance matrix)을 작성하여 모형에 적용함으로써 모형 개발과정에 발생하는 문제점을 해결해야 한다(Lappi and Bailey, 1988; Lappi, 1997; Trincado et al.
참고문헌 (20)
Adame, P., Rio, M.D., and Canellas, I. 2008. A mixed nonlinear height-diameter model for pyrenean oak (Quercus pyrenaica Willd.). Forest Ecology and Management 256: 88-98.
Budhathoki, C.B., Lynch, T.B., and Guldin, J.M. 2008. A Mixed-effects model for the dbh-height relationship of shortleaf pine (Pinus echinata Mill.). Southern Journal of Applied Forestry 32(1): 5-11.
Lappi, J. and Bailey, R.L. 1988. A height prediction model with random stand and tree parameter: An alternative to traditional site index methods. Forest Science 34(4): 907-927.
Lee, Y.J., Coble, D.W., Pyo, J.K., Kim, S.H., Lee, W.K., and Choi, J.K. 2009. A Mixed-effects height-diameter model for pinus thunbergii trees in Gangwon province, Korea. Journal of Korean Forest Society 98(2): 178-182.
Liang, J. and Picard, N. 2013. Matrix model of forest dynamics: An overview and outlook. Forest Science 59(3): 359-378.
Liu, X.Q., Rong, J.Y., and Liu, X.Y. 2008. Best linear unbiased prediction for linear combinations in general mixed linear models. Journal of Multivariate Analysis 99: 1503-1517.
Lynch, T.B., Holly, A.G., and Stevenson, D.J. 2005. A random-parameter height-dbh model for Cherrybark oak. Southern Journal of Applied Forestry 29(1): 22-26.
SAS Institute, Incorporation. 2004. SAS/STAT 9.1 User's Guide. SAS Institute, Incorporation. Cary. North Carolina.
Searle, S.R. 1982. Matrix algebra useful for statistics. John Wiley and Sons, Incorporation. pp. 200-201.
Sharma, M. and Parton, J. 2007. Height-diameter equations for boreal tree species in Ontario using a mixed-effects modeling approach. Forest Ecology and Management 249: 187-198.
Trincado, G. and Burkhart, H.E. 2006. A generalized approach for modeling and localizing stem profile curves. Forest Science 52: 670-682.
Trincado, G., Vanderschaaf, C.L. and Burkhart, H.E. 2007. Regional mixed-effects height-diameter models for loblolly pine (Pinus taeda L.) plantations. European Journal of Forest Research 126: 253-262.
Vanderschaaf, C. 2008. Stand level height-diameter mixed effects models: parameters fitted using Loblolly pine but calibrated for sweetgum. Proceeding of the 16th Central Hardwoods Forest Conference. pp. 386-393.
Vargas-larreta, B., Castedo-dorado, F., Alvarez-gonzalez, J.G., Barrio-anta, M. and Cruz-cobos, F. 2009. A generalized height-diameter model with random coefficients for unevenaged stands in El Salto, Durango(Mexico). Forestry 82(4): 445-462.
Zhang, Y. and Borders, B.E. 2004. Using a system mixed-effects modeling method to estimates tree compartment biomass for intensively managed loblolly pines-an allometric approach. Forest Ecology and Management 194: 145-157.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.