본 논문은 대학 취업정보시스템에서 데이터베이스 시스템이 얼마나 잘 운용되지 않는지 살펴보고자 하였다. 왜냐하면 현업에서는 데이터 디자인 기본 원칙에 미달하는 점들이 보이고 있기 때문이다. 다행히도 우리의 연구를 위해 대학취업지원 데이터베이스를 선택할 수 있었다. 본 연구에서는 현행 시스템으로써 대학 취업프로그램 이수시스템을 선택하였고 데이터 모델링에 있어서 기본 원칙을 엄격하게 따르는 새로운 대학취업지원 데이터베이스라는 이름으로 개발해 보았다. 기존의 대학취업지원 데이터베이스가 새로운 대학취업지원 데이터베이스에서 발견할 수 있는 표준 균형성으로부터 얼마나 기준에서 벗어나 있는지 비교해 볼 수 있었다. 데이터 비만도 관점에서 볼 때 기존의 대학취업지원 데이터베이스가 얼마나 많은 불필요한 데이터를 내포하고 있는지 계산해 보았다. 새로운 대학취업지원 데이터베이스는 불필요한 데이터를 전혀 포함하지 않았다. 즉, 데이터 모델을 형성하기 위해 필요한 데이터들만으로 구성되어 있다는 것을 의미한다. 그러나 기존의 대학취업지원 데이터베이스 시스템의 비만도는 50%가 넘었다. 그러므로 본 논문에서 제안한 새로운 대학취업지원 데이터베이스 시스템의 데이터 비만도가 19%로 나타나 기존의 시스템의 비만도가 37%나 높다는 것은 매우 중요한 차이인 것이다.
본 논문은 대학 취업정보시스템에서 데이터베이스 시스템이 얼마나 잘 운용되지 않는지 살펴보고자 하였다. 왜냐하면 현업에서는 데이터 디자인 기본 원칙에 미달하는 점들이 보이고 있기 때문이다. 다행히도 우리의 연구를 위해 대학취업지원 데이터베이스를 선택할 수 있었다. 본 연구에서는 현행 시스템으로써 대학 취업프로그램 이수시스템을 선택하였고 데이터 모델링에 있어서 기본 원칙을 엄격하게 따르는 새로운 대학취업지원 데이터베이스라는 이름으로 개발해 보았다. 기존의 대학취업지원 데이터베이스가 새로운 대학취업지원 데이터베이스에서 발견할 수 있는 표준 균형성으로부터 얼마나 기준에서 벗어나 있는지 비교해 볼 수 있었다. 데이터 비만도 관점에서 볼 때 기존의 대학취업지원 데이터베이스가 얼마나 많은 불필요한 데이터를 내포하고 있는지 계산해 보았다. 새로운 대학취업지원 데이터베이스는 불필요한 데이터를 전혀 포함하지 않았다. 즉, 데이터 모델을 형성하기 위해 필요한 데이터들만으로 구성되어 있다는 것을 의미한다. 그러나 기존의 대학취업지원 데이터베이스 시스템의 비만도는 50%가 넘었다. 그러므로 본 논문에서 제안한 새로운 대학취업지원 데이터베이스 시스템의 데이터 비만도가 19%로 나타나 기존의 시스템의 비만도가 37%나 높다는 것은 매우 중요한 차이인 것이다.
In this essay, we hoped to see how the operational university job database systems perform badly, since there are a lot of signs that they fall short of data design fundamentals. Fortunately, we are able to choose a university employment support database(UESD) application as a candidate for our stud...
In this essay, we hoped to see how the operational university job database systems perform badly, since there are a lot of signs that they fall short of data design fundamentals. Fortunately, we are able to choose a university employment support database(UESD) application as a candidate for our study. We have taken UESD system as it is and we have developed an enhanced version of the UESD system, which strictly followed the basic fundamentals in data modeling and named it as NewUESD system. Then, we have conducted a comparison to see how much UESD system is deviated from the standard balancedness found in NewUESD. From the perspective of data obesity, we computed how much UESD contains unnecessary data. The NewUESD contained no unnecessary data at all, which implies that it has only data that is necessary to form a data model. But the data obesity of UESD system is found to be more than 50%. Therefore, it is significantly higher, 37% higher in this case, than the obesity judged to be normal, which is 19% in NewUESD system.
In this essay, we hoped to see how the operational university job database systems perform badly, since there are a lot of signs that they fall short of data design fundamentals. Fortunately, we are able to choose a university employment support database(UESD) application as a candidate for our study. We have taken UESD system as it is and we have developed an enhanced version of the UESD system, which strictly followed the basic fundamentals in data modeling and named it as NewUESD system. Then, we have conducted a comparison to see how much UESD system is deviated from the standard balancedness found in NewUESD. From the perspective of data obesity, we computed how much UESD contains unnecessary data. The NewUESD contained no unnecessary data at all, which implies that it has only data that is necessary to form a data model. But the data obesity of UESD system is found to be more than 50%. Therefore, it is significantly higher, 37% higher in this case, than the obesity judged to be normal, which is 19% in NewUESD system.
현업에서 운영 업무 전체를 구성하는 크고 작은 업무들은 하나의 유기체처럼 연결돼 있다. 어느 한 데이터에서 출발하여 다른 목표 데이터로 향하여 목표지점에 도달하기까지의 경로를 Data Path라고 부른다면, 업무 세부 절차 관련 데이터 경로가 모여 단위 업무 데이터 지도를 형성하게 된다. 하지만 데이터 지도가 잘못돼 목표지점을 표시도 못한 채 나타난다면 업무의 운영은 혼선을 빚을 수밖에 없을 것이다.
데이터 비만도로 측정 가능한 것은 무엇인가?
기본에서 보면 오늘날 기업이 보유하고 있는 데이터 지도들은 같은 지명이 지도 전체에 수시로 편의에 따라 중복 등장하는 모습을 지니고 있어서 도저히 지도라고 부를 수조차 없는 형태로 되어 있다. 데이터가 쓸데없이 중복되어 있게끔 나타난 모양의 심각성 수준을 데이터 비만도로 측정할 수 있다.
쓸데없는 데이터 중복에 대해 어떤 평가가 있는가?
쓸데없는 데이터 중복은 쓸데없는 업무 절차 중복과 의미가 같다. 하나의 업무로 포장돼 단위 업무로 관행적으로 용납 되어 있어서 그렇지 만약 업무 리엔지니어링을 실시한다면 반드시 제거해야 할 비만 요소들인 것이다. 이렇게 보면 업무 간 세부 절차상의 중복은 데이터 지도라는 현미경 프리즘을 통해서만 가시화될 수 있는 것이지 그렇지 않고는 절대로 면화되기 불가능하다.
참고문헌 (13)
Richard Y. Wang, Henry B. Kon, and Stuart E. Madnick, "Data quality requirements analysis and modeling", Proceedings. IEEE Ninth International Conference on Data Engineering, pp. 670 - 677. April 1993.
C. B. Cinzia Cappiello, and C. Francalanci, "A. Maurino, Methodologies for data quality assessment and improvement", ACM Computing Surveys, Vol. 41, No. 3, pp. 52-55, 2009.
C. W. Fisher, and B. R. Kingma, "Criticality of data quality as exemplified in two disasters", Information Systems, Vol. 39, pp.109-116. 2010.
"[DB]Elements of a good data model", http:// blog.daum.net/fmddn/1787002.
D. Katz, M. Bommaroti, and J. Zelner, "The data deluge, The Economist", March 2010.
Min-Kyu Lee, "Data Performance Case Study through Removing of Data Duplicate Relationships", Soongsil University, 2010.
T. Shanker, and M. Richtel, "Data overload can be deadly", The New York Times, Jan 16, 2011.
I. Davies, P. Green, M. Rosemann, M. Indulska, and S. Galo, "How do practitioners use conceptual modeling in practice?", Data and Knowledge Engineering, Vol 58, pp. 358-380, 2006.
"Practical Projects Application of Data Model Normalization / De-normalization", http://blog. naver.com/jooyong3/40035951092.
Hye-Kyung Rhee, Hee-Wan Kim, "A Study on the Data Modeling decreasing the Data Obesity", The Society of Digital Policy & Management, The Journal of Digital Policy & Management The Society of Digital Policy & Management, Vol. 11, No. 11, pp.359-366, Nov 2013.
Kook-Hee Lee, "A Study on the Database Quality Assessment", Korea Database Agency, Dec, 1995.
James Martin, "Information Engineering", Vol. 1, Vol.2, Vol.3, Prentice-Hall, 1989.
Peter Chen, "The Entity Relationship Model -Toward a Unified View of Data", ACM, Vol.1, No.1, 1976.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.