본 연구는 국립환경과학원의 물환경정보시스템에서 제공한 자료를 사용하였다. 자료는 낙동강 본류 (낙본, nb)의 수질측정소 A지역에서 측정소 N지역까지 2003년 1월부터 2013년 8월까지 측정한 월별 수질데이터를 이용하였다. 생물학적 산소요구량 BOD (biological oxygen demand)의 통계학적 수질분석은 월별, 연도별, 지역별로 R 프로그래밍을 이용하여 구체화 하였다. 낙본지역 측정소들의 BOD에 대하여 탐색적 자료분석 (exploratory data analysis) 방법과 비모수 회귀분석방법 중 하나인 Lowess (locally weighted scatter plot smoother) 경향분석법을 이용하여 장기수질경향과 지역별 수질분포의 현황을 분석하였다. 그리고 특이점 (outlier)이 가장 많이 발생하는 시기와 낙본 측정지역들을 분석하였다. 그 결과 낙본하류지역인 부산광역시 강서구 명지동 측정소 nbM의 BOD 수질환경 보다 낙본중류지역인 대구광역시 달성군 구지면의 측정소 nbG와 경상남도 창원시의 측정소 nbI 지역의 수질오염이 보다 심각한 문제점들이 있는 것으로 나타난다.
본 연구는 국립환경과학원의 물환경정보시스템에서 제공한 자료를 사용하였다. 자료는 낙동강 본류 (낙본, nb)의 수질측정소 A지역에서 측정소 N지역까지 2003년 1월부터 2013년 8월까지 측정한 월별 수질데이터를 이용하였다. 생물학적 산소요구량 BOD (biological oxygen demand)의 통계학적 수질분석은 월별, 연도별, 지역별로 R 프로그래밍을 이용하여 구체화 하였다. 낙본지역 측정소들의 BOD에 대하여 탐색적 자료분석 (exploratory data analysis) 방법과 비모수 회귀분석방법 중 하나인 Lowess (locally weighted scatter plot smoother) 경향분석법을 이용하여 장기수질경향과 지역별 수질분포의 현황을 분석하였다. 그리고 특이점 (outlier)이 가장 많이 발생하는 시기와 낙본 측정지역들을 분석하였다. 그 결과 낙본하류지역인 부산광역시 강서구 명지동 측정소 nbM의 BOD 수질환경 보다 낙본중류지역인 대구광역시 달성군 구지면의 측정소 nbG와 경상남도 창원시의 측정소 nbI 지역의 수질오염이 보다 심각한 문제점들이 있는 것으로 나타난다.
This paper is based on water information system of NIE, National Institute of Environmental Research. We used monthly data of water quality from January, 2013 to August, 2013 starting from measuring point A (nbA) to measuring point N (nbN) located along the Nakdong river main stream. Statistical wat...
This paper is based on water information system of NIE, National Institute of Environmental Research. We used monthly data of water quality from January, 2013 to August, 2013 starting from measuring point A (nbA) to measuring point N (nbN) located along the Nakdong river main stream. Statistical water quality analysis of BOD (biological oxygen demand) is specified by R programming depending on month, year, and points. Based on BOD measured from Nakdong river's measuring points, we used exploratory data analysis and locally weighted scatter plot smoother (Lowess) trend analysis, which is a method of non-parametic regression analysis, to analyze long-term water tendency and water quality distribution depending on points. Also, we analyzed the period and the measuring point of which the outliers are abundant. As a result, compared to BOD measured in nbM located in Busan along the downstream, BOD measured in nbG located in Daegu and nbI located in Changwon along the midstream showed higher rate of water pollution at a severe level.
This paper is based on water information system of NIE, National Institute of Environmental Research. We used monthly data of water quality from January, 2013 to August, 2013 starting from measuring point A (nbA) to measuring point N (nbN) located along the Nakdong river main stream. Statistical water quality analysis of BOD (biological oxygen demand) is specified by R programming depending on month, year, and points. Based on BOD measured from Nakdong river's measuring points, we used exploratory data analysis and locally weighted scatter plot smoother (Lowess) trend analysis, which is a method of non-parametic regression analysis, to analyze long-term water tendency and water quality distribution depending on points. Also, we analyzed the period and the measuring point of which the outliers are abundant. As a result, compared to BOD measured in nbM located in Busan along the downstream, BOD measured in nbG located in Daegu and nbI located in Changwon along the midstream showed higher rate of water pollution at a severe level.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이명박 정부의 4대강 사업 시행결과에 대하여 많은 논란 중 하나는 수질 환경문제일 것이다. 본 연구의 목적은 4대강 사업 중 가장 많은 논란을 일으키고 있는 낙동강 본류의 수질에 대하여 수질측정 변수 중 하나인 BOD의 경향을 통계적으로 분석하는데 있다.
Kim 등 (2007)은 금호강 수질오염에 대한 모형을 연구하였고, Kang 등 (2011) 낙동강의 유량과 유속의 모형을 연구하였다. 이 연구에서 월별로 연도별로 각 낙본측정소에 대하여 BOD에 대한 수질의 상태의 분석과 어떤 낙본측정소 지역이 심각한 수질오염을 가지고 있는가를 분석한다.
가설 설정
3) 가중값 함수는 수직띠의 양쪽 경계에서 0의 값을 가진다.
제안 방법
, max) 표현된다. Table 3.2는 다섯 수치 요약에서 평균 (mean)과 표준편차 (sd), 그리고 사분위수 산포 (spr(H))를 포함하여 지역별 BOD를 분석하였다. 가장 하류 낙본지역인 낙동강 하구언지역은 본류가 두 줄기로 나누어지는데 하나는 부산광역시 강서구 명지동의 nbM지역과 또 다른 하나는 부산광역시 강서구 녹산동의 nbN 지역이다.
본 연구는 낙동강 본류 (낙본)의 최상류 지역에서부터 최남단의 하류지역까지의 14개 낙본 수질 측정소에서 측정되어진 수질측정 자료를 분석하였다. 수질측정 변수 중 하나인 생물학적 산소요구량, BOD(biological oxygen demand)에 대하여 월별, 연도별, 지역별 통계적 분석과 특이점 (outlier)을 연구하였다. 생물학적 산소요구량 (biological oxygen demand), BOD는 어떤 물속의 미생물이 산소가 존재하는 상태에서 유기물을 분해 안정시키는데 요구되는 산소량이다.
수질 분석에서 총질소를 분석하는 이유는 질소와 인은 수질 부영양화 현상에 지대한 영향을 미치는데 물속에서 질소나 인이 다량 유입되면 그것을 먹고사는 플랑크톤이 급속히 증가하여 적조현상이 발생하고, 용존산소가 부족하여 수질오염의 원인이 되기 때문이다. 이러한 이유로 낙본 지역의 생물학적 산소요구량 BOD에 대하여 특이점 (outlier)들의 경향을 시기와 지역별로 분석 조사한다. 다른 수질측정 변수들에 대한 분석방법도 동일한 방법으로 할 수 있다.
대상 데이터
본 연구는 낙동강 본류 (낙본)의 최상류 지역에서부터 최남단의 하류지역까지의 14개 낙본 수질 측정소에서 측정되어진 수질측정 자료를 분석하였다. 수질측정 변수 중 하나인 생물학적 산소요구량, BOD(biological oxygen demand)에 대하여 월별, 연도별, 지역별 통계적 분석과 특이점 (outlier)을 연구하였다.
본 연구에 필요한 데이터는 국립환경과학원의 물환경정보시스템 (water information system)의 홈페이지 (water.nier.go.kr)에 있는 ‘측정자료조회’의 ‘수질 (총량측정망)’에서 구하였다.
kr)에 있는 ‘측정자료조회’의 ‘수질 (총량측정망)’에서 구하였다. 이 데이터들은 수질측정소 낙본측정소 A지역에 낙본측정소 N지역까지 14개의 측정소에서 2003년 1월부터 2013년 8월까지 측정한 월별 수질데이터이다.
데이터처리
이 수질 데이터의 분석도구로 R 프로그래밍을 사용하였다. BOD 데이터를 월별, 연도별, 지역별로 탐색적 자료분석 EDA (exploratory data analysis) 방법과 비모수적 회귀분석방법인 Lowess (locally weighted scatter plot smoother) 경향분석법을 적용하여 장기수질경향과 수질분포를 분석한다.
이론/모형
이 수질 데이터의 분석도구로 R 프로그래밍을 사용하였다. BOD 데이터를 월별, 연도별, 지역별로 탐색적 자료분석 EDA (exploratory data analysis) 방법과 비모수적 회귀분석방법인 Lowess (locally weighted scatter plot smoother) 경향분석법을 적용하여 장기수질경향과 수질분포를 분석한다. 수질변화의 측정에서 특이점 (outlier)의 발생은 매우 중요하게 다루어 진다.
성능/효과
1) 낙동강 본류 (낙본)의 중류지역인 nbG, nbH, nbI 지역의 BOD의 평균수치들은 하류지역인 nbJ, nbK, nbL, nbM 지역의 평균들보다 높게 나타난다. 특히 중류의 도시지역인 대구 달성군 nbG지역과 경남 창원시 nbI 지역이 경남 양산의 물금 nbK, 부산 북구 금곡동 nbL, 부산 강서구 명지동 nbM지역보다 높은 것은 더 깊이 연구해 볼 가치가 있다.
2) 가중값 함수는 x = xi에 대하여 대칭이며 중앙에서 멀어질수록 매끄러운 형태로 감소한다. 즉 w0 ≤ w1 ≤ · · · ≤ wk로 실제 존재하지 않는 관측점에는 가중치를 주지 않는다.
2) 낙동강 본류의 가장 상류에 있는 경북 봉화군 석포면 nbA측정소가 nbB, nbC, nbD 지역의 BOD 수치의 평균보다 높게 나타날 뿐 아니라 다른 모든 통계수치들에서도 높게 나타나고 있다. 상식적으로 nbA 지역이 가장 낮은 BOD 수치를 가질 것으로 예측되었지만, 상류지역에서 가장 높은 BOD 평균 수치를 나타낸다.
3) 위의 1)과 2)의 결과를 두고 볼 때, BOD의 수치는 측정소의 순위에 따른 지리적 위치도 영향을 받겠지만 그 보다는 주변의 수질오염에 영향을 미치는 인프라에 더 큰 영향을 받는다는 것을 알 수 있다. 또한 강은 상류에서 하류로 흘러가면서 어느 정도 자체 정화 능력이 있다는 사실을 보여주고 있다.
BOD의 특이점은 8월 > 10월 > 7월 > 6월 > 5월 > 9월 > 11월 > 12월 > 4월 > 1월 > 2월 > 3월의 순으로 가장 많이 나타난 달인 8월은 가장 적게 나타난 달인 3월 보다는 2.8배 이상의 특이점이 발생하는 것으로 분석된다.
가장 최대값들을 많이 보이는 지역은 낙본중류지역인 nbG의 대구광역시 달성군 구지면 지역과 낙본중류지역인 nbI인 경상남도 창원시 의창구 북면 지역이 BOD 수치가 높이 나타남을 보인다. 낙본상류 지역은 낙동강 제일 상류지역 측정소 nbA의 경우, 8월에 가장 낮은 BOD 수치를 나타내지만, 9월부터 점차 nbA의 BOD 수치가 증가하기 시작하여 2월에 이르러서는 nbA보다 하류지역들인 nbB, nbC, nbD 지역의 BOD 수치들보다 높은 수치를 나타낸다.
본 연구에서의 분석방법으로 ‘공분산 함수에 기초한 공간모형’을 기법을 고려하여 선형모형의 시계열적 방법을 시도하짐지만, 거리가 가까운 유역에서는 적용이 잘되지만 낙동강본류의 전역을 고려할 때에 이모형이 잘 적용되지 못했다.
이는 강우량과 상관성이 있어 보인다. 비가 적게 오는 계절일수록 BOD의 평균 수치가 올라가고, 비가 많이 오는 계절일수록 상대적으로 BOD 수치가 낮아지는 경향을 보인다. 흥미로운 사실은 산포의 측도인 사분위수 범위 (spr(H))와 표준편차 (sd)의 순위 역시 평균과 중앙값들의 순위들과 매우 비슷한 경향을 띄고 있다.
가장 하류 낙본지역인 낙동강 하구언지역은 본류가 두 줄기로 나누어지는데 하나는 부산광역시 강서구 명지동의 nbM지역과 또 다른 하나는 부산광역시 강서구 녹산동의 nbN 지역이다. 이들 두 낙동강 하구언지역의 수질오염을 비교하면 nbN 지역의 측정치들은 nbM 낙본측정 지역뿐만 아니라 다른 어떤 낙본측정지역의 측정치들보다 매우 심하게 수질오염을 나타내며, 큰 산포를 보인다. Table 3.
72%로 가장 적게 나온 것은 흥미 있는 현상이다. 특이점 비율이 가장 높게 나온 낙본하류지역의 가장 끝자리인 nbM은 4.71%으로 가장 높게 나타나고, nbC 4.17%, nbG 3.94%, nbH 3.69%, nbA 3.54%, nbF 2.99%, nbJ 3.19% 낙본중류지역과 낙본하류지역에서 산발적으로 높게 나타나고 있다. nbM과 nbC 지역이 특이점이 가장 많이 발생하고 있고, 이에 따른 대책이 필요해 보인다.
후속연구
이런 이유로 본 연구에서는 nbN 측정지역과 다른 지역들 간의 통계적인 비교를 제외한다. 그러나 nbN 지역이 왜 다른 지역들보다 심한 수질오염의 측정치를 나타내는지는 기회가 된다면 다음 연구에서 분석하고자 한다. 낙동강 본류인 nbN과는 다른 줄기지만, 동일한 위치에 있는 nbM 지역을 볼 때, 단순히 낙동강 최하류지역에 있다는 이유만으로 수질이 나쁘다는 결론을 내릴 수 없기 때문이다.
질의응답
핵심어
질문
논문에서 추출한 답변
BOD 데이터 분석 방법은?
이 수질 데이터의 분석도구로 R 프로그래밍을 사용하였다. BOD 데이터를 월별, 연도별, 지역별로 탐색적 자료분석 EDA (exploratory data analysis) 방법과 비모수적 회귀분석방법인 Lowess (locally weighted scatter plot smoother) 경향분석법을 적용하여 장기수질경향과 수질분포를 분석한다. 수질변화의 측정에서 특이점 (outlier)의 발생은 매우 중요하게 다루어 진다.
생물학적 산소요구량이란?
수질측정 변수 중 하나인 생물학적 산소요구량, BOD(biological oxygen demand)에 대하여 월별, 연도별, 지역별 통계적 분석과 특이점 (outlier)을 연구하였다. 생물학적 산소요구량 (biological oxygen demand), BOD는 어떤 물속의 미생물이 산소가 존재하는 상태에서 유기물을 분해 안정시키는데 요구되는 산소량이다. 산소를 필요로 하는 박테리아가 일정 시간 내 (보통 20도씨에서 5일간)에 물속의 유기물을 산화 분해시켜 정화하는데 소비되는 산소의 양을 ppm으로 나타낸 것이다.
BOD는 무엇을 ppm으로 나타낸 것인가?
생물학적 산소요구량 (biological oxygen demand), BOD는 어떤 물속의 미생물이 산소가 존재하는 상태에서 유기물을 분해 안정시키는데 요구되는 산소량이다. 산소를 필요로 하는 박테리아가 일정 시간 내 (보통 20도씨에서 5일간)에 물속의 유기물을 산화 분해시켜 정화하는데 소비되는 산소의 양을 ppm으로 나타낸 것이다. 음료수는 2ppm이하가 적당하고 농업용수는 5ppm이 좋다.
참고문헌 (9)
Cleveland, W. S. (1979). Robust locally weighted regression and smoothing scatterplots. Journal of American Statistician Assocociation, 74, 829-836.
Cleveland, W. S. (1993). Visualizing data, Hobart Press, New York.
Cleveland, W. S. and Devlin, S. J. (1988). Locally weighted regression: An approach to regression analysis by local fitting. Journal of American Statistician Assocociation, 83, 596-610.
Lee, H. S. and Lee, S. U. (2006). A study on the long-term trend analyses of water qualities in Nakdong river. Proceedings of the Autumn Conference of Korean Society of Environmental Engineers, 1144-1149.
Kang, H., Jang, J. H., Ahn, J. H. and Kim, I. J. (2011). Numerical estimations of Nakdong river flows through linking of watershed and river flow models. Journal of Korea Water Resource Association, 44, 577-590.
Kim, J. H. and Park, S. S. (2004). Long-term trend analysis of water qualities in Nakdong river based on non-parametric statistical methods. Journal of Korean Society Water Quality, 20, 63-71.
Kim, J. T., Lee, B. J. and Kim, J. Y. (2007). Trend analysis of distribution of stream qualities in Gumho river. Journal of the Korean Data & Information Science Society, 18, 713-719.
Huh, J. (2012). Bandwidth selection for discontinuity point estimation in density. Journal of the Korean Data & Information Science Society, 23, 79-87.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.