The objective of this study is to evaluate and analyze Osu stream watershed water environment system. The data were collected from January 2009 to December 2011 including water temperature, pH, DO, EC, BOD, COD, TOC, SS, T-N, T-P and discharge. The data were used for principle component analysis and...
The objective of this study is to evaluate and analyze Osu stream watershed water environment system. The data were collected from January 2009 to December 2011 including water temperature, pH, DO, EC, BOD, COD, TOC, SS, T-N, T-P and discharge. The data were used for principle component analysis and factor analysis. The results are as followes. The primary factors obtained from both the principal component analysis and the factor analysis were BOD, COD, TOC, SS and T-P. Once principal component analysis and factor analysis have been performed with the collected data and then the results will be applied to both simple regression model and multiple regression model. The regression model was developed into case 1 using concentrations of water quality parameters and case 2 using delivery loads. The value of the coefficient of determination on case 1 fell between 0.629 and 0.866; this was lower than case 2 value which fell between 0.946 and 0.998. Therefore, case 2 model would be a reliable choice.The coefficient of determination between the estimated figure using data which was developed to the regression model in 2012 and the actual measurement value was over 0.6, overall. It can be safely deduced that the correlation value between the two findings was high. The same model can be applied to get TOC concentrations in future.
The objective of this study is to evaluate and analyze Osu stream watershed water environment system. The data were collected from January 2009 to December 2011 including water temperature, pH, DO, EC, BOD, COD, TOC, SS, T-N, T-P and discharge. The data were used for principle component analysis and factor analysis. The results are as followes. The primary factors obtained from both the principal component analysis and the factor analysis were BOD, COD, TOC, SS and T-P. Once principal component analysis and factor analysis have been performed with the collected data and then the results will be applied to both simple regression model and multiple regression model. The regression model was developed into case 1 using concentrations of water quality parameters and case 2 using delivery loads. The value of the coefficient of determination on case 1 fell between 0.629 and 0.866; this was lower than case 2 value which fell between 0.946 and 0.998. Therefore, case 2 model would be a reliable choice.The coefficient of determination between the estimated figure using data which was developed to the regression model in 2012 and the actual measurement value was over 0.6, overall. It can be safely deduced that the correlation value between the two findings was high. The same model can be applied to get TOC concentrations in future.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이에 본 연구에서는 주성분 및 요인분석의 결과로부터 추출된 수질 인자를 회귀모형의 독립변수로 하였으며, 종속변수는 TOC로 하여 TOC의 농도 추정을 위한 단회귀모형과 중회귀모형을 개발하였다. 또한 회귀 모형은 Case 1(수질농도)과 Case 2(유달부하량)로 구분하여 개발한 후 적용성을 평가하였으며, 향후 오수천 유역의 수질관리정책 수립을 위한 기초자료를 제공하는데 목적이 있다.
제안 방법
본 연구는 오수천 유역에서 실측된 자료를 활용하여 주성분 및 요인분석을 실시하였으며, 추출된 인자 들을 통해 회귀모형을 개발하고 적용성 평가를 수행하여 다음과 같은 결론을 도출하였다. 주성분 및 요인분석에서 전체 기여율의 50%이상을 설명해주는 제 1요인은 BOD, COD, TOC, SS, T-P로 분류되었 으며, 제 1요인의 수질농도만을 대상으로 개발된 Case 1(Model 1, 2, 3)에 대한 회귀모형의 결정계수는 0.
또한, 중회귀모형의 경우 상수항과 BOD, COD, SS, T-P와 같은 독립변수를 가지게 되며, TOC의 농도는 종속변수이다. 본 연구에서는 수질농도만을 대상으로 개발된 Case 1과 수질 농도에 유량을 곱하여 산정된 유달부하량(Delivery Load)으로 개발된 Case 2로 구분하였으며, 그 결과는 Figure 3, 4와 Table 5에 나타내었다. 개발된 모든 모형들의 F-value에 대한 p-value가 0.
요인분석은 다변량 분석법 중 하나로 여러 변수간의 상관행렬로부터 공통요인을 도출하여 서로 상관이 있는 경우 변수간의 상관성을 설명하고 변수를 적은 수로 축소시켜 요인을 추출하는 방법이다. 본 연구에서는 오수천 유역의 10개의 수질인자와 유량을 대상으로 주성분분석을 통하여 요인을 추출한 후 요인별 점수를 산정하는 요인분석을 실시하였다. 요인분석을 통해 분류된 제 1요인에 해당하는 인자들은 상관성이 높은 공통 인자들로서 회귀모형을 구축하기 위한 변수로 사용하였다.
회귀분석에는 단회귀분석(Simple Regression Analysis)과 중 회 귀 분 석 (Multiple Regression Analysis) 이 있으며, 설명변수가 하나인 경우가 단회귀분석이고 두 개 이상인 경우는 중회귀분석이다. 본 연구에서의 단회귀모형은 BOD와 COD를 독립변수로 식 (1)과 (2)의 방법으로 개발하였으며, 중회귀모형은 식 (3)과 같다.
수질 및 유량 조사는 4년(2009-2012)간 평균 8일 간격으로 실시하였으며, 대상유역 말단 지점에서 유량을 측정하고 동시에 수질시료를 채취하였다. 수질시료의 채취와 분석은 수질오염공정시험기준(환경부, 2008)에 준하여 실시하였으며, WT(Water Temperature), DO(Disolved Oxygen), pH, EC (Electric Conductivity)는 YSI 650 MDS를 이용하여 현장에서 직접 측정하였다.
이렇게 얻어진 요인들을 회귀분석에 이용한다면 보다 효율적으로 TOC 농도를 추정할 것으로 판단된다. 이에 본 연구에서는 주성분 및 요인분석의 결과로부터 추출된 수질 인자를 회귀모형의 독립변수로 하였으며, 종속변수는 TOC로 하여 TOC의 농도 추정을 위한 단회귀모형과 중회귀모형을 개발하였다. 또한 회귀 모형은 Case 1(수질농도)과 Case 2(유달부하량)로 구분하여 개발한 후 적용성을 평가하였으며, 향후 오수천 유역의 수질관리정책 수립을 위한 기초자료를 제공하는데 목적이 있다.
한편 전체 기여율의 50%이상을 설명해주는 제 1요인은 BOD, COD, TOC, SS, T-P로 분류되었으며, 제 2요인과 3요인은 각각 유량, pH, EC와 WT, DO로 분류하였다. 이중 제 1요인의 항목을 대상으로 회귀모형에 적용하였다.
회귀모형의 독립변수로 사용하기 위하여 대상지점에 대한 주성분분석을 실시하였고 추출된 요인으로 부터 상관성이 높은 변수들로 분류하여 Table 3, 4에 나타내었다. 주성분 수를 결정하기 위해 요인을 설명하는 분산의 크기를 나타내는 고유치 (Eigenvalue)를 기준으로 통상 고유치가 1이상인 값을 기준으로 결정하였다. 고유치는 요인을 설명하는 분산의 크기를 나타내며 고유치가 1보다 크다는 것은 하나의 요인이 변수 1개 이상을 설명해 주며, 1보다 작다는 것은 변수 1개의 분산도를 설명할 수 없다는 것으로 해석할 수 있다.
622%로서 전체 수질변동에 대하여 설명하고 있다. 한편 전체 기여율의 50%이상을 설명해주는 제 1요인은 BOD, COD, TOC, SS, T-P로 분류되었으며, 제 2요인과 3요인은 각각 유량, pH, EC와 WT, DO로 분류하였다. 이중 제 1요인의 항목을 대상으로 회귀모형에 적용하였다.
회귀모형은 3년(2009-2011)간 실측된 자료를 이용하여 개발되었다. 개발된 단회귀모형과 중회귀모형의 적합성 평가를 위하여 2012년의 실측자료를 활용하여 TOC농도를 추정하였으며, 실측치와 추정치에 대한 분석 결과는 Figure 5와 Table 6에 나타내었다.
대상 데이터
섬진강 유역의 주요하천은 국가하천 3개소(섬진강, 요천, 보성강)를 포함하며, 지방하천은 2개소(오수천, 추령천)이다. 본 연구의 대상 유역은 오수천 유역 중 발원지부터 섬진강본류 합류점 전까지 전 구간 및 유역으로 유역면적은 371.1 km2이며, 측정 지점은 오수천 유역의 말단 지점이다 (국립환경과학원, 2012).
데이터처리
3년(2009-2011)간 모니터링을 통해 측정된 자료로써 주성분분석(Principal Component Analysis) 과 요인분석(Factor Analysis), 그리고 회귀분석 (Regression Analysis)을 통 계 분석 프로그램인 SPSS(ver. 18.0)로 실시하였으며, 2012년의 측정 자료는 회귀모형의 적용성 평가에 활용하였다. 주성분 분석은 해석하고자 하는 변수 간의 상관성을 갖는 여러 종류의 데이터를 큰 손실 없이 요약하여 2 혹은 3차원의 데이터로 축약하는 방법이며, 관측대상이 어떠한 위치에 있는지 시각적으로 파악할 수 있다.
회귀모형은 3년(2009-2011)간 실측된 자료를 이용하여 개발되었다. 개발된 단회귀모형과 중회귀모형의 적합성 평가를 위하여 2012년의 실측자료를 활용하여 TOC농도를 추정하였으며, 실측치와 추정치에 대한 분석 결과는 Figure 5와 Table 6에 나타내었다. 회귀모형에 의해 산정된 추정치와 실측치의 결정계수는 Case 1의 Model 1은 0.
개발된 회귀모형을 이용하여 2012년의 측정 자료를 대상으로 TOC를 추정하였으며, 추정된 값과 실측값의 평가는 대응표본 T검정을 통해 검정하였다. 여기서 T검정에 대한 유의확률(양쪽)이 p<0.
이처럼 결측 자료의 보완에 활용될 수 있는 농도 추정을 위한 연구는 앞으로도 지속되어야 할 것이며, 미래의 수질관리를 위한 중요한 분석기법이 될 것으로 판단된다. 그러나 앞서 언급해온 연구들은 회귀 분석을 수행하기 위해서 모집단의 변수들을 추출함에 있어서 대부분 Pearson 상관분석을 수행하였다. 이러한 방법은 두 변수 사이의 선형적 집중성 만을 측정하게 되어 비선형의 연관성을 반영하지 못하며, 특이점에 따라서 분석결과가 크게 달라질 수 있다.
한편, 대응표본 T검정을 통해 TOC의 측정치와 추정치 간의 차이를 신뢰구간 95%에서 해석해보면 Case 1(Model 1, 2, 3)의 경우 양쪽 유의확률이 p0.05로서 두 값의 차이가 유의하지 않는 것으로 해석하였다.
회귀모형의 독립변수로 사용하기 위하여 대상지점에 대한 주성분분석을 실시하였고 추출된 요인으로 부터 상관성이 높은 변수들로 분류하여 Table 3, 4에 나타내었다. 주성분 수를 결정하기 위해 요인을 설명하는 분산의 크기를 나타내는 고유치 (Eigenvalue)를 기준으로 통상 고유치가 1이상인 값을 기준으로 결정하였다.
이론/모형
고유치는 요인을 설명하는 분산의 크기를 나타내며 고유치가 1보다 크다는 것은 하나의 요인이 변수 1개 이상을 설명해 주며, 1보다 작다는 것은 변수 1개의 분산도를 설명할 수 없다는 것으로 해석할 수 있다. 또한 변수들의 요인 부하량이 어느 한 요인에 높게 나타나도록 하기 위한 방법인 Varimax 회전방법을 적용하였다. 연구 지점에서 3개의 요인이 추출되었으며, 제 1요인의 고유치와 기여율은 5.
수질시료의 채취와 분석은 수질오염공정시험기준(환경부, 2008)에 준하여 실시하였으며, WT(Water Temperature), DO(Disolved Oxygen), pH, EC (Electric Conductivity)는 YSI 650 MDS를 이용하여 현장에서 직접 측정하였다. 또한 하천유량은 수문 관측 매뉴얼(건설교통부, 2004)에 준하여 유속-면적법(Velocity-Area Method)으로 측정하였다.
수질 및 유량 조사는 4년(2009-2012)간 평균 8일 간격으로 실시하였으며, 대상유역 말단 지점에서 유량을 측정하고 동시에 수질시료를 채취하였다. 수질시료의 채취와 분석은 수질오염공정시험기준(환경부, 2008)에 준하여 실시하였으며, WT(Water Temperature), DO(Disolved Oxygen), pH, EC (Electric Conductivity)는 YSI 650 MDS를 이용하여 현장에서 직접 측정하였다. 또한 하천유량은 수문 관측 매뉴얼(건설교통부, 2004)에 준하여 유속-면적법(Velocity-Area Method)으로 측정하였다.
성능/효과
9 mg/L로서 3년 평균 농도와 비교해 볼 때 BOD와 COD는 높았으며, TOC는 낮게 조사되었지만 큰 차이는 없는 것으로 나타났다. 또한 T-N과 SS는 농도 범위는 각각 0.5-2.8 mg/L, 평균 1.9 mg/L와 1.0-278.8 mg/L, 13.4 mg/L로서 다소 높게 조사되었으며, T-P의 경우 0.042-0.273 mg/L의 농도 범위에서 평균 0.048 mg/L로 다소 낮게 조사되었다. 실측된 3년(2009-2011)간의 자료와 2012년의 자료는 다소 차이는 있지만 큰 차이는 보이지 않았으며, 본 연구지점에 대한 BOD의 하천 생활환경기준은 Ib등급(좋음)이며, COD와 T-P의 경우 II등급(약간 좋음)에 해당한다.
998보다 낮게 나타나 Case 2의 모형이 신뢰성이 더 높은 것으로 판단할 수 있다. 또한 개발된 모든 모형의 F-value에 대한 p-value가 0.000으로 나타나 종속변수 TOC를 설명하는데 유의한 것으로 판단하였다. 개발된 회귀모형을 2012년 자료에 적용하여 산정된 추정치와 실측치에 대한 결정계수는 Case 1의 Model 1을 제외하고 전반적으로 0.
048 mg/L로 다소 낮게 조사되었다. 실측된 3년(2009-2011)간의 자료와 2012년의 자료는 다소 차이는 있지만 큰 차이는 보이지 않았으며, 본 연구지점에 대한 BOD의 하천 생활환경기준은 Ib등급(좋음)이며, COD와 T-P의 경우 II등급(약간 좋음)에 해당한다.
또한 변수들의 요인 부하량이 어느 한 요인에 높게 나타나도록 하기 위한 방법인 Varimax 회전방법을 적용하였다. 연구 지점에서 3개의 요인이 추출되었으며, 제 1요인의 고유치와 기여율은 5.504, 50.037%, 제 2요인과 3요인은 각각 1.628, 14.800%와 1.186, 10.785%이고 누적기여율은 75.622%로서 전체 수질변동에 대하여 설명하고 있다. 한편 전체 기여율의 50%이상을 설명해주는 제 1요인은 BOD, COD, TOC, SS, T-P로 분류되었으며, 제 2요인과 3요인은 각각 유량, pH, EC와 WT, DO로 분류하였다.
본 연구는 오수천 유역에서 실측된 자료를 활용하여 주성분 및 요인분석을 실시하였으며, 추출된 인자 들을 통해 회귀모형을 개발하고 적용성 평가를 수행하여 다음과 같은 결론을 도출하였다. 주성분 및 요인분석에서 전체 기여율의 50%이상을 설명해주는 제 1요인은 BOD, COD, TOC, SS, T-P로 분류되었 으며, 제 1요인의 수질농도만을 대상으로 개발된 Case 1(Model 1, 2, 3)에 대한 회귀모형의 결정계수는 0.629-0.866으로 유달부하량을 대상으로 개발된 Case 2(Model 1, 2, 3)의 0.946-0.998보다 낮게 나타나 Case 2의 모형이 신뢰성이 더 높은 것으로 판단할 수 있다. 또한 개발된 모든 모형의 F-value에 대한 p-value가 0.
실측치와 추정치에 대한 모형의 적합성 평가에서 단순히 결정계수로 모형을 평가한다면 Case 1과 Case 2의 회귀모형은 TOC 농도를 추정함에 있어 적용이 가능할 것으로 판단되었다. 하지만, 대응표본 T검정을 이용한 검정 결과에서 Case 1 보다는 Case 2의 회귀모형을 이용하여 TOC 농도(유달부하량)를 추정하는 것이 더욱 신뢰성이 높을 것으로 판단하였다.
한편, 대응표본 T검정을 통해 TOC의 측정치와 추정치 간의 차이를 신뢰 구간 95%에서 검정을 하였으며, 그 결과 Case 1(Model 1, 2, 3)의 경우 양쪽 유의확률이 p0.05로서 두 값의 차이가 유의하지 않는 것으로 볼 수 있다.
후속연구
향후, Case 1(Model 2, 3)과 Case 2(Model 1, 2, 3)의 회귀모형은 TOC농도를 추정함에 있어 적용이 가능할 것으로 판단되며, 그중 유달부하량을 이용하여 개발된 Case 2의 회귀모형을 적용한다면 좀 더 신뢰도 높은 값을 추정할 수 있을 것으로 판단된다. 그러나 본 연구결과는 오수천 유역에서만 나타나는 특성에 주의할 필요가 있으며, 다른 유역에 적용하기 위해서는 TOC와 상관성이 없는 인자들과 더불어 실험분석에 영향을 미치는 인자들의 관계에 대해서도 추가적인 연구가 필요할 것으로 사료된다.
이러한 방법 중에 주성분 분석은 요인분석을 수행하기 전에 몇 개의 인자들을 추출하기 위해서 여러 가지 방법이 사용되지만 그 중에 보편적으로 많이 사용하는 분석법이며, 요인분석은 수많은 변수들 중에 상관관계를 이용하여 여러 변수들로 측정된 자료를 보다 적은 수로 줄여 정보를 요약하고 변수들을 적절히 조합함으로써 묶여지지 않은 중요도가 낮은 변수를 제거할 수 있다. 이렇게 얻어진 요인들을 회귀분석에 이용한다면 보다 효율적으로 TOC 농도를 추정할 것으로 판단된다. 이에 본 연구에서는 주성분 및 요인분석의 결과로부터 추출된 수질 인자를 회귀모형의 독립변수로 하였으며, 종속변수는 TOC로 하여 TOC의 농도 추정을 위한 단회귀모형과 중회귀모형을 개발하였다.
실제로 하천에 수질 특성을 파악하기 위해서는 많은 자료가 필요하고 이에 많은 예산과 인원이 투입되어야 할 것이며, 그럼에도 불구하고 측정이 불가능한 경우도 생길 것이다. 이처럼 결측 자료의 보완에 활용될 수 있는 농도 추정을 위한 연구는 앞으로도 지속되어야 할 것이며, 미래의 수질관리를 위한 중요한 분석기법이 될 것으로 판단된다. 그러나 앞서 언급해온 연구들은 회귀 분석을 수행하기 위해서 모집단의 변수들을 추출함에 있어서 대부분 Pearson 상관분석을 수행하였다.
향후, Case 1(Model 2, 3)과 Case 2(Model 1, 2, 3)의 회귀모형은 TOC농도를 추정함에 있어 적용이 가능할 것으로 판단되며, 그중 유달부하량을 이용하여 개발된 Case 2의 회귀모형을 적용한다면 좀 더 신뢰도 높은 값을 추정할 수 있을 것으로 판단된다. 그러나 본 연구결과는 오수천 유역에서만 나타나는 특성에 주의할 필요가 있으며, 다른 유역에 적용하기 위해서는 TOC와 상관성이 없는 인자들과 더불어 실험분석에 영향을 미치는 인자들의 관계에 대해서도 추가적인 연구가 필요할 것으로 사료된다.
질의응답
핵심어
질문
논문에서 추출한 답변
BOD란?
최근 생분해성 유기물을 나타내는 관리지표인 BOD(Biochemical Oxygen Demand)와 생분해성 유기물질을 포함한 난분해성 유기물질을 나타낼 수 있는 관리지표인 COD(Chemical Oxygen Demand) 및 TOC(Total Organic Carbon)의 상관성에 관한 많은 연구가 수행되고 있다(김범철 등, 2007; 박혜영 등, 2006; 변주태 등, 2008; 서희정 등, 2010). 또한 수질관리를 위해 국내의 경우 최근 들어 BOD 와 COD가 반영하지 못하는 오염원의 총량이나 유기물의 특성이 반영된 TOC를 수질오염지표로 적용하기 위해 큰 관심을 기울이고 있다(박윤경 등, 2012).
수질오염지표로서 TOC에 대한 관심이 커지고 있는 이유는?
또한 수질관리를 위해 국내의 경우 최근 들어 BOD 와 COD가 반영하지 못하는 오염원의 총량이나 유기물의 특성이 반영된 TOC를 수질오염지표로 적용하기 위해 큰 관심을 기울이고 있다(박윤경 등, 2012). TOC의 경우 BOD와 COD에 비교해 볼 때 분석시간이 짧고, 분석오차를 줄일 수 있기에 관심이 커지고 있다(최동호 등, 2012). 한편, BOD와 COD를 이용하여 TOC 농도를 추정하기 위한 회귀모형의 개발과 평가에 대한 연구들이 있으며(민상윤 등, 2012; 한상훈 등, 2012; 정재운 등, 2013), 유량-부하량 관계식을 이용하여 부하량 산정을 위한 연구가 많이 수행되고 있다(박지형 등, 2011; 박진환 등, 2012; 정상만 등, 2000; 최한규 등, 2002).
생분해성 유기물질을 포함한 난분해성 유기물질을 나타낼 수 있는 관리지표에는 어떤 것들이 있는가?
최근 생분해성 유기물을 나타내는 관리지표인 BOD(Biochemical Oxygen Demand)와 생분해성 유기물질을 포함한 난분해성 유기물질을 나타낼 수 있는 관리지표인 COD(Chemical Oxygen Demand) 및 TOC(Total Organic Carbon)의 상관성에 관한 많은 연구가 수행되고 있다(김범철 등, 2007; 박혜영 등, 2006; 변주태 등, 2008; 서희정 등, 2010). 또한 수질관리를 위해 국내의 경우 최근 들어 BOD 와 COD가 반영하지 못하는 오염원의 총량이나 유기물의 특성이 반영된 TOC를 수질오염지표로 적용하기 위해 큰 관심을 기울이고 있다(박윤경 등, 2012).
참고문헌 (22)
건설교통부, 2004, 수문관측매뉴얼.
국립환경과학원, 2012, 영산강.섬진강수계 유량측정망 운영사업 최종보고서.
김범철, 정성민, 장창원, 김재구, 2007, 호수와 하천에서 유기물 오염도의 지표로서 BOD, COD와 TOC의 비교 및 분해율 산정, 대한환경공학회지, 29(6), 640-643.
김영주, 2003, 주성분분석에 의한 도시호수의 수질평가에 관한 연구, 환경관리학회지, 9(2), 197-203.
김요용, 이시진, 2011, 다변량 통계 분석기법을 이용한 한강수계 지천의 수질 평가, 대한환경공학회지, 33(7), 501-510.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.