[국내논문] 유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안
Semantic Process Retrieval with Similarity Algorithms 원문보기

경영정보학연구 = The journal of MIS research, v.18 no.1, 2008년, pp.79 - 96  

이홍주 (가톨릭대학교 경영학부)

One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in...


문제 정의

  • 본 연구의 목적은 실제 비즈니스 프로세스 구조에 바탕을 두어 시맨틱 프로세스를 표현하고, 효과적인 프로세스 검색을 위해 정확한 매칭방안의 결과를 확장하여 유사한 프로세스를 검색하는 유사도 기반의 검색 알고리즘을 제시하는 것이다. 이를 위해 MIT 프로세스 핸드북(Process Handbook) 프로젝트에서 구축해 놓은 기업들의 프로세스 데이터를 OWL로 표현하였으며, 표현된 비즈니스 프로세스 데이터를 SPARQL과 연계하여 검색하기 위한 유사도 알고리즘을 제시하고 이들의 검색성과를 비교한다.
  • 제 Ⅳ장에서는 제 Ⅲ장에서 제시한 기법의 검색 성과를 알아보기 위해 수행한 실험과 실험데이터를 소개하며, 각 방안들의 검색성과를 비교한다. 결론으로 제Ⅴ장에서 실험 성과에 대해 토의하며 실험의 한계와 향후 연구방향에 대해 논의한다.
  • 본 연구에서는 실제 기업 비즈니스 프로세스 데이터를 활용하여 실제의 의미가 포함된 시맨틱 프로세스 데이터를 생성하며, 이를 검색 실험에 활용하기 위한 실험 데이터 생성방안을 제시한다. 또한 생성된 비즈니스 프로세스 데이터의 속성에 기반을 둔 유사도 알고리즘을 고안하여 시맨틱 프로세스 검색 방안을 제시하고 이들간의 검색성과를 비교하였다.
  • 본 연구에서는 MIT 프로세스 핸드북에 표현되어 있는 실제 비즈니스 프로세스와 이들의 구조에 바탕을 두어 시맨틱 프로세스를 표현하였다. 시맨틱 웹으로 표현된 자원을 검색하기 위한 SPARQL의 검색 결과를 확장하기 위하여 프로세스 간의 유사도에 기반을 둔 검색방안들을 제시하였으며, 다양한 유사도 척도에 기반을 둔 검색 결과 확장방안의 성과를 비교하였다.

가설 설정

  • 연구의 한계로는 하나의 데이터 집합을 대상으로 유사도 알고리즘의 성과를 비교하였기 때문에 연구성과를 일반화하기에는 어려움이 따르며, 다른 분야의 데이터 집합을 활용하여 유사도 알고리즘의 성과를 비교하여야 할 필요가 있다. 또한 생성된 실험 데이터를 가지고 성과를 비교하는 검색실험의 기본 가정은 다른 프로세스들보다 목표프로세스의 돌연변이들이 목표프로세스와 가장 유사하리라는 것이다. 하지만 프로세스에 따라서는 다른 프로세스들이 더욱 유사할 수 있으며, 돌연변이 정도에 따라서 돌연변이 프로세스보다 목표 프로세스에 더욱 유사한 프로세스가 존재할 수 있다.
김학래와 김홍기가 정의한 시맨틱 웹이란? 데이터와 서비스가 의미를 포함하게 되어 조직간 응용프로그램의 연계와 자동화를 활성화할 수 있을 것이라는 시맨틱 웹의 목표를 이루기 위해 학계와 산업계에서 많은 노력과 연구들이 이루어져 왔다. 김학래와 김홍기(2003)은 시맨틱 웹을 “컴퓨터가 정보의 의미를 이해하고 처리할 수 있는 웹”으로 정의하고 있으며, 웹 자원에 대한 메타정보를 기계가 읽고 처리함으로써 웹에 있는 방대한 정보와 지식을 연결하고 활용할 수 있게 되는 것을 뜻한다[Davies et al., 2003; 김학래와 김홍기, 2003].
질의언어에는 무엇이 있는가? 시맨틱 웹 자원의 검색을 위해서는 정확한 매칭기법에 기반을 둔 RQL, RDQL, SPARQL 등과 같은 질의언어들이 제시되어 왔다[Haase et al., 2004].
정확한 매칭기법에 기반을 둔 질의언어는 무엇을 파악하는데 중점을 두고 있는가? , 2004]. 이들은 RDF기반으로 표현된 시맨틱 웹 자원이 그래프로 표현될 수 있다는 것을 활용하여, 질의어가 포함된 그래프 구조를 파악하는 데에 중점을 두고 있다. 정확한 매칭 기법에 기반을 두고 있기 때문에 정확한 검색결과를 가져올 수는 있으나, 유사한 자원을 파악하거나 관련 정보를 활용하여 검색성과를 높이는 것은 어려웠다.
참고문헌 (31)

  1. 김학래, 김홍기, "시맨틱 웹 기반의 e-비즈니스 상호운용성," 한국경영정보학회 춘계학술대회, 2002, pp. 311-319 

  2. 김학래, 김홍기, "유비쿼터스 서비스를 위한 시맨틱 웹 기술," 한국경영정보학회 추계학술대회, 2003, pp. 31-35 

  3. 김형도, 김종우, "UML기반의 기업간 비즈니스 프로세스 명세 모델링," Journal of Information Technology Applications & Management, Vol. 13, No. 4, 2006, pp. 71-88 

  4. Baeza-Yates, R. and Ribeiro-Neto, B., Modern Information Retrieval, ACM Press, New York, 1999 

  5. Bernstein, A., Kaufmann, E., Buerki, C., and Klein, M., "Object Simialrity in Ontologies: A Foundation for Business Intelligence Systems and High-Performance Retrieval," Proceedings of Twenty-Fifth International Conference on Information Systems, 2004, pp. 741-756 

  6. Bernstein, A., Kaufmann, E., Kiefer, C., and Burki, C., SimPack: A Generic Java Library for Similarity Measures in Ontologies, Technical Report, Department of Informatics, University of Zurich, 2005 

  7. Bernstein, A. and Kiefer, C., "Imprecise RDQL: Towards Generic Retrieval in Ontologies Using Similarity Joins," Proceedings of SAC'06, Dijon, France, 2006, ACM, pp. 1684-1689 

  8. Bernstein, A. and Klein, M., "Towards High-Precision Service Retrieval," Proceedings of the 1st International Semantic Web Conference on The Semantic Web (ISWC'02), London, UK, 2002, Springer-Verlag, pp. 84-101 

  9. Bianchini, D., Antonellis, V.D., Pernici, B., and Plebani, P., "Ontology-based methodology for e-service discovery," Information Systems, Vol. 31, 2006, pp. 361-380 

  10. Davies, J., Fensel, D. and Harmelen, F.V., ed., Towards the Semantic Web: ontologydriven knowledge management, West Sussex, England: John Wiley and Sons Ltd, 2003 

  11. Ehrig, M., Koschmider, A. and Oberweis, A., "Measuring Similarity between Semantic Business Process Models," Proceedings of the 4th Asia-Pacific Conference on Conceptual Modelling (APCCM'07), Ballarat, Victoria, Australia, 2007, pp. 71-80 

  12. Haase, P., Broekstra, J., Eberhart, A. and Volz, R., "A Comparison of RDF Query Languages," Proceedings of ISWC, 2004, pp. 502-517 

  13. Hau, J., Lee, W., and Darlington, J., "A Semantic Similarity Measure for Semantic Web Services," Proceedings of WWW2005, Chiba, Japan, 2005 

  14. Hollenstein, S., XQuery Similarity Joins, University of Zurich, 2005 

  15. Kiefer, C., Bernstein, A., and Stocker, M., "The Fundamentals of iSPARQL-A Virtual Triple Approach For Similarity-Based Semantic Web Tasks," Proceedings of Proceedings of the 6th International Semantic Web Conference (ISWC), 2007 

  16. Klein, M. and Dellarocas, C., "Designing Robust Business Processes," in Thomas W. Malone, Kevin Crowston, and Gerorge A. Herman, ed., Organizing Business Knowledge: The MIT Process Handbook, MIT Press, Cambridge, Massachusetts, USA, 2003, pp. 423-439 

  17. Klein, M. and Petti, C., "A Handbook-Based Methodology for Redesigning Business Processes," Knowledge and Process Management, Vol. 13, No. 2, 2006, pp. 108-119 

  18. Klusch, M., Fries, B., Khalid, M. and Sycara, K., "OWLS-MX: Hybrid OWL-S Service Matchmaking," Proceedings of AAAI '05, 2005 

  19. Klusch, M., Fries, B. and Sycara, K., "Automated Semantic Web Service Discovery with OWLS-MX," Proceedings of AAMAS 2006, Hakodate, Hokkaido, Japan, 2006 

  20. Levenshtein, V.I., "Binary Codes Capable of Correcting Deletions, Insertions and Reversals," Soviet Physics Doklady, Vol. 10, 1966, pp. 707-710 

  21. Lin, D., "An Information-Theoretic Definition of Similarity," Proceedings of the Fifth International Conference on Machine Learning (ICML '98), Madison, WI, 1998 

  22. Malone, T.W., Crowston, K. and Herman, G., ed., Orgznizing Business Knoweldge: The MIT Process Handbook, Cambridge, Massachusetts, USA: MIT Press, 2003 

  23. Malone, T.W., Crowston, K., Lee, J. and Pentlad, B., "Tools for inventing organizations: Toward a handbook of organizational processes," Management Science, Vol. 45, No. 3, 1999, pp. 425-443 

  24. McCool, R., "Rethinking the Semantic Web, Part 1," IEEE INTERNET COMPUTING, Vol. 9, No. 6, 2005, pp. 86-88 

  25. Ouzzani, M. and Bouguettaya, A., "Efficient Access to Web Services," IEEE Internet Computing, Vol. 8, No. 2, 2004, pp. 34-44 

  26. Resnik, P., "Semantic Similarity in a Taxonomy: An Information-Based Measure and its Application to Problems of Ambiguity in Natural Language," Journal of Artificial Intelligence Research, Vol. 11, 1999, pp. 95-130 

  27. Sager, T., Bernstein, A., Pinzger, M. and Kiefer, C., "Detecting Similar Java Classes Using Tree Algorithms," Proceedings of the 2006 International Workshop on Mining Software Repositories(MSR'06), Shanghai, China, 2006 

  28. Taivalsaari, A., "On the notion of inheritance," ACM Computing Surveys, Vol. 28, No. 3, 1996, pp. 438-479 

  29. Valiente, G., Algorithms on Trees and Graphs, Springer-Verlag, Berlin, 2002 

  30. Van der Aalst, W.M.P. and Basten, T., Inheritance of Workflows: An approach to tackling problems related to change, Technical report, Eindhoven University of Technology, 1999 

  31. Wang, Y. and Stroulia, E., "Semantic Structure Matching for Assessing Web-Service Similarity," Proceedings of 1st International Conference on Service Oriented Computing, Trento, Italy, 2003, pp. 194-207 

