$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

소프트웨어 공수 예측의 정확성에 대한 이상치 제거의 영향 분석
Analyzing Influence of Outlier Elimination on Accuracy of Software Effort Estimation 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.35 no.10, 2008년, pp.589 - 599  

서영석 (KAIST 전산학과) ,  윤경아 (KAIST 전산학과) ,  배두환 (KAIST 전산학과)

초록
AI-Helper 아이콘AI-Helper

정확한 소프트웨어 공수 예측은 소프트웨어 관련 여러 커뮤니티들에서 예전부터 항상 이슈가 되어 왔다. 소프트웨어 공수 예측의 정확도를 향상시키기 위해 지금까지 많은 연구들에서는 데이타 품질이 공수 예측에 중요한 요소들 중 하나임에도 불구하고 이것에 대한 고려 없이 공수 예측 기법들에만 초점을 맞추어 왔다. 본 연구에서는 소프웨어어 공수 예측 기법과 이상치 제거 기법들 사이의 영향 관계를 공수 예측 정확도의 관점에서 실험적으로 살펴본다. 두 개의 프로젝트 데이타들(ISBSG와 국내의 한 금융 조직으로부터 수집된 데이타)에 대해 일반적으로 많이 사용되는 세 가지 공수 예측 기법(최소제곱법, 신경망 네트워크, 그리고 베이지안 네트워크)과 두 가지 이상치 제거 기법(최소절사제곱법과 K-means 클러스터링)을 적용시켜 결과들을 서로 비교해 보고 이상치 제거 기법을 적용하지 않은 결과와도 비교해 본다.

Abstract AI-Helper 아이콘AI-Helper

Accurate software effort estimation has always been a challenge for the software industrial and academic software engineering communities. Many studies have focused on effort estimation methods to improve the estimation accuracy of software effort. Although data quality is one of important factors f...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 최소제곱법과 최소절사제곱법의 조합에 대해서 이 모든 이상치값들에 대한 MRE값의 평균값과 중앙값을 계산해 본 결과 최소제곱법과 이상치 제거하지 않은 데이타와의 조합에 대한 값들보다 더 좋지 못한 결과를 보여준다는 것을 표 7에서 확인해볼 수 있다. 결국 본 연구에서는 실험군에서 얻은 공수 예측 정확도들을 평균한 값을 이용하기 때문에 전체적으로는 이상치를 제거하지 않고 만든 공수 예측 모델과 비슷한 공수 예측 정확도를 나타낸다.
  • 이상치들이 많이 존재하는 데이타를 이용해 공수 예측 모델을 만든다면 앞으로 수행할 프로젝트에 대한 정확한 공수 예측은 어려울 것이다. 그러므로 본 연구에서는 두 가지 프로젝트 데이타에 대해 이상치 제거 기법들을 적용한 후 공수 예측 모델들의 예측 정확도를 알아보았고, 다른 이상치 제거 기법과 공수 예측기법들이 다른 결과를 보여주는 이유에 대해서도 살펴보았다. 실험을 수행해 본 결과 이상치 제거 기법을 이용해 이상치를 제거한 후 만든 공수 예측 모델들이 그렇지 않은 모델들보다 더 정확한 공수 예측 결과를 보여주었고 다른 분포를 가지는 두 가지 프로젝트 데이타에 대해 얻어진 공수 예측 결과의 차이도 확인할 수 있었다.
  • 따라서 본 연구에서는 기존 연구의 (1), (2), (3)파 같은 부족한 점들을 보완하여 통계기반의 기법을 포함한 여러 이상치 제거 기법들이 공수 예측 기법들의 정확성에 미치는 영향을 보다 샨뢰성 있는 공수 예측 평가 기준들과 데이타 특성을 고려해 분석해 보고자 한다.
  • 따라서, 본 연구에서는 소프트웨어 공수 예측 기법과 데이타 품질을 저해하는 이상치를 제거하는 기법들 사이의 영향 관계에 대해 공수 예측의 정확도 관점에서 살펴보고자 한다. 실제 업체에서 수집된 2개의 데이타셋을 대상으로 최소절사제곱법과 K-means 클러스터링 기법에 의해 각각 이상치를 제거하고, 이 데이타셋과 원본 데이타셋을 바탕으로 일반적으로 공수 예측 기법으로 많이 사용되는 최소제곱법, 신경망 네트워크, 베이지안 네트워크를 이용하여 공수 예측을 하고 이상치 제거 전후의 공수 예측 정확도를 비교하였다.

가설 설정

  • 따라서 통계기반 이외의 다른 이상치 제거기법에 대한 효과에 대한 연구도 필요하다. (2) 공수 예측 정확도의 평가가 미흡하다. 일반적으로 예측모델의 성능을 평가하기 위한 다양한 평가기준들이 존재하는데, Chae의 연구에서는 MMRE(Mean Magnitude of Relative Error)만을 사용하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (21)

  1. C. van Koten and A.R. Gray, "Bayesian Statistical Effort Prediction Models for Data-centred 4GL software development," Information and Software Technology, Vol.48, No.11, pp. 1056-1067, 2006 

  2. A. Gray and S. MacDonell, "Application of Fuzzy Logic to Software Metric Models for Development Effort Estimation," Annual Meeting of the North American Fuzzy Information Processing Society, pp. 394-399, 1997 

  3. M. Jorgensen, "Experience With the Accuracy of Software Maintenance Task Effort Prediction Models," IEEE Transactions on Software Engineering, Vol.21, No.8, pp. 674-681, 1995 

  4. E. Mendes, C. Lokan, R. Harrison, and C. Triggs, "A Replicated Comparison of Cross-company and Within-company Effort Estimation Models using the ISBSG Database," 11th IEEE International Software Metrics Symposium, 2005 

  5. P.C. Pendharkar, G.H. Subramanian, and J.A. Rodger, "A Probabilistic Model for Predicting Software Development Effort," IEEE Transactions on Software Engineering, Vol.31, No.7, pp. 615-624, 2005 

  6. V.K.Y. Chan and W.E. Wong, "Outlier Elimination in Construction of Software Metric Models," Proceedings of the 22nd ACM Symposium on Applied Computing, pp. 1484-1488, 2007 

  7. A.R. Gray and S.G. MacDonell, "A Comparison of Techniques for Developing Predictive Models of Software Metrics," Information and Software Technology, Vol.39, No.6, pp. 425-437, 1997 

  8. J. Heaton, Introduction to Neural Networks with Java, Chesterfield, MO : Heaton Research, Inc, 2005 

  9. S. Chulani, B. Boehm, and B. Steece, "Bayesian Analysis of Empirical Software Engineering Cost Models," IEEE Transactions on Software Engineering, Vol.25, No.4, pp. 573-583, 1999 

  10. P.J. Rousseeuw, "Multivariate Estimation with High Breakdown Point," Mathematical Statistics and Applications, pp. 283-297, 1985 

  11. P.J. Rousseeuw and A.M. Leroy, Robust Regression and Outlier Detection, NY : John Wiley & Sons, Inc, 1987 

  12. A.K. Jain, M.N. Murty, and P.J. Flynn, "Data Clustering: A Review," ACM Computing Surveys, Vol.31, No.3, pp. 264-323, 1999 

  13. S. Lamrous and M. Taileb, "Divisive Hierarchical K-means," International Conference on Intelligent Agents, Web Technologies and Internet Commerce, 2006 

  14. International Software Benchmarking Standards Group, http://www.isbsg.org, 2005 

  15. P.J. Rousseeuw, "Least Median Squares Regression," Journal of American Statistical Association, Vol.79, No.388, pp. 871-880, 1984 

  16. Q. Song and M. Shepperd, "A new imputation method for small software project data sets," Journal of Systems and Software, Vol.80, No.1, pp. 51-62, 2007 

  17. M.Mendes and A.Pala, "Type I Error Rate and Power of Three Normality Tests," Pakistan Journal of Information and Technology, Vol.2, No.2, pp. 135-139, 2003 

  18. P.J. Rousseeuw and K. van Driessen, "Computing LTS Regression for Large Data Sets," Data Mining and Knowledge Discovery, Vol.12, No.1, pp. 29-45, 2006 

  19. B. Kitchenham, S.G. MacDonell, L. Pickard, and M.J. Shepperd, "Assessing Prediction Systems," The Information Science Discussion Paper Series, University of Otago, 1999 

  20. T. Foss, E. Stensrud, B. Kitchenham, and I. Myrtveit, "A Simulation Study of the Model Evaluation Criterion MMRE," IEEE Transactions on Software Engineering, Vol.29, No.11, pp. 985-995, 2003 

  21. S.D. Conte, H.E. Dunsmore, and V.Y. Shen, Software Engineering Metrics and Models. Benjamin/ Cummings Publishing Company, 1986 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로