의미간의 유사도 연구의 패러다임 변화의 필요성-인지 의미론적 관점에서의 고찰 The Need for Paradigm Shift in Semantic Similarity and Semantic Relatedness : From Cognitive Semantics Perspective원문보기
개념간의 의미적 유사도 및 관계도(Semantic Similarity/Relatedness)를 구하는 연구는 고전적인 연구에서는 데이터 베이스 통합이나 시스템 통합, 그리고 현대의 연구에 있어서는 태그 및 키워드 추출, 연관 단어 추천 등에 걸쳐 다양한 분야에서 활용되어 온 연구이다. 그 연구는 역사가 오래되었을 뿐만 아니라, 경영정보와 컴퓨터 공학, 계산 언어학에 걸쳐 여러 분야에서도 많은 관심을 가져왔던 연구 분야라고 할 수 있다. 그러나, 지금까지의 개념간의 관계도 계산 방식은 미리 만들어진 사전이나 참조할 수 있는 다른 시맨틱 네트워크(Semantic Network)를 이용하여 계산하는 방법이 주를 이루었다. 이러한 접근 방법의 경우, 개념간의 의미적 관계가 변화에 대한 가능성을 고려하지 않는 것이 일반적이다. 하지만, 정보 기술의 발달과 빠른 사회변화는 개념간의 의미관계 등에 변화를 가져오고 있는 것이 현실이다. 사회적으로 일어나는 사건이나, 문화적 변화 등이 개념간의 의미관계를 변화시키는 것을 물론이며, 이러한 변화가 정보 통신 기술의 도움으로 빠르게 공유되고 있다. 이렇게 개념간의 의미 관계가 시간이나 맥락에 따라 빠르게 변화할 수 있는 가능성이 있음에도 불구하고, 기존의 개념간 의미적 유사도 및 관계도에 대한 연구들은 이러한 '의미관계의 변화'에 대한 새로운 문제에 대해 해답을 제시하지 못한 것이 사실이다. 따라서, 본 연구에서는 개념간의 유사도 연구에 있어 지금까지 있어왔던 '정적인 의미간 관계도 패러다임'에서 '동적인 의미간 관계도 패러다임'으로의 전환의 필요성과 그 당위성을 인지 의미론적(Cognitive Semantics)의 관점에서 역설하고자 한다. 인간이 인지하는 개념간의 의미관계가 변화할 수 있는 이론적 근거를 인지 의미론에서 찾아봄으로써, 패러다임 변화의 방향을 구체적으로 제시하였다. 또한 이러한 패러다임의 변화에 맞추어 개념간의 의미적 유사도 및 관계도에 대한 연구가 어떠한 방향으로 나아가야 할지 구체적인 연구 방향을 제시함으로써 관련 연구자들에게 새로운 연구의 가이드라인을 제시하였다.
개념간의 의미적 유사도 및 관계도(Semantic Similarity/Relatedness)를 구하는 연구는 고전적인 연구에서는 데이터 베이스 통합이나 시스템 통합, 그리고 현대의 연구에 있어서는 태그 및 키워드 추출, 연관 단어 추천 등에 걸쳐 다양한 분야에서 활용되어 온 연구이다. 그 연구는 역사가 오래되었을 뿐만 아니라, 경영정보와 컴퓨터 공학, 계산 언어학에 걸쳐 여러 분야에서도 많은 관심을 가져왔던 연구 분야라고 할 수 있다. 그러나, 지금까지의 개념간의 관계도 계산 방식은 미리 만들어진 사전이나 참조할 수 있는 다른 시맨틱 네트워크(Semantic Network)를 이용하여 계산하는 방법이 주를 이루었다. 이러한 접근 방법의 경우, 개념간의 의미적 관계가 변화에 대한 가능성을 고려하지 않는 것이 일반적이다. 하지만, 정보 기술의 발달과 빠른 사회변화는 개념간의 의미관계 등에 변화를 가져오고 있는 것이 현실이다. 사회적으로 일어나는 사건이나, 문화적 변화 등이 개념간의 의미관계를 변화시키는 것을 물론이며, 이러한 변화가 정보 통신 기술의 도움으로 빠르게 공유되고 있다. 이렇게 개념간의 의미 관계가 시간이나 맥락에 따라 빠르게 변화할 수 있는 가능성이 있음에도 불구하고, 기존의 개념간 의미적 유사도 및 관계도에 대한 연구들은 이러한 '의미관계의 변화'에 대한 새로운 문제에 대해 해답을 제시하지 못한 것이 사실이다. 따라서, 본 연구에서는 개념간의 유사도 연구에 있어 지금까지 있어왔던 '정적인 의미간 관계도 패러다임'에서 '동적인 의미간 관계도 패러다임'으로의 전환의 필요성과 그 당위성을 인지 의미론적(Cognitive Semantics)의 관점에서 역설하고자 한다. 인간이 인지하는 개념간의 의미관계가 변화할 수 있는 이론적 근거를 인지 의미론에서 찾아봄으로써, 패러다임 변화의 방향을 구체적으로 제시하였다. 또한 이러한 패러다임의 변화에 맞추어 개념간의 의미적 유사도 및 관계도에 대한 연구가 어떠한 방향으로 나아가야 할지 구체적인 연구 방향을 제시함으로써 관련 연구자들에게 새로운 연구의 가이드라인을 제시하였다.
Semantic similarity/relatedness measure between two concepts plays an important role in research on system integration and database integration. Moreover, current research on keyword recommendation or tag clustering strongly depends on this kind of semantic measure. For this reason, many researchers...
Semantic similarity/relatedness measure between two concepts plays an important role in research on system integration and database integration. Moreover, current research on keyword recommendation or tag clustering strongly depends on this kind of semantic measure. For this reason, many researchers in various fields including computer science and computational linguistics have tried to improve methods to calculating semantic similarity/relatedness measure. This study of similarity between concepts is meant to discover how a computational process can model the action of a human to determine the relationship between two concepts. Most research on calculating semantic similarity usually uses ready-made reference knowledge such as semantic network and dictionary to measure concept similarity. The topological method is used to calculated relatedness or similarity between concepts based on various forms of a semantic network including a hierarchical taxonomy. This approach assumes that the semantic network reflects the human knowledge well. The nodes in a network represent concepts, and way to measure the conceptual similarity between two nodes are also regarded as ways to determine the conceptual similarity of two words(i.e,. two nodes in a network). Topological method can be categorized as node-based or edge-based, which are also called the information content approach and the conceptual distance approach, respectively. The node-based approach is used to calculate similarity between concepts based on how much information the two concepts share in terms of a semantic network or taxonomy while edge-based approach estimates the distance between the nodes that correspond to the concepts being compared. Both of two approaches have assumed that the semantic network is static. That means topological approach has not considered the change of semantic relation between concepts in semantic network. However, as information communication technologies make advantage in sharing knowledge among people, semantic relation between concepts in semantic network may change. To explain the change in semantic relation, we adopt the cognitive semantics. The basic assumption of cognitive semantics is that humans judge the semantic relation based on their cognition and understanding of concepts. This cognition and understanding is called 'World Knowledge.' World knowledge can be categorized as personal knowledge and cultural knowledge. Personal knowledge means the knowledge from personal experience. Everyone can have different Personal Knowledge of same concept. Cultural Knowledge is the knowledge shared by people who are living in the same culture or using the same language. People in the same culture have common understanding of specific concepts. Cultural knowledge can be the starting point of discussion about the change of semantic relation. If the culture shared by people changes for some reasons, the human's cultural knowledge may also change. Today's society and culture are changing at a past face, and the change of cultural knowledge is not negligible issues in the research on semantic relationship between concepts. In this paper, we propose the future directions of research on semantic similarity. In other words, we discuss that how the research on semantic similarity can reflect the change of semantic relation caused by the change of cultural knowledge. We suggest three direction of future research on semantic similarity. First, the research should include the versioning and update methodology for semantic network. Second, semantic network which is dynamically generated can be used for the calculation of semantic similarity between concepts. If the researcher can develop the methodology to extract the semantic network from given knowledge base in real time, this approach can solve many problems related to the change of semantic relation. Third, the statistical approach based on corpus analysis can be an alternative for the method using semantic
Semantic similarity/relatedness measure between two concepts plays an important role in research on system integration and database integration. Moreover, current research on keyword recommendation or tag clustering strongly depends on this kind of semantic measure. For this reason, many researchers in various fields including computer science and computational linguistics have tried to improve methods to calculating semantic similarity/relatedness measure. This study of similarity between concepts is meant to discover how a computational process can model the action of a human to determine the relationship between two concepts. Most research on calculating semantic similarity usually uses ready-made reference knowledge such as semantic network and dictionary to measure concept similarity. The topological method is used to calculated relatedness or similarity between concepts based on various forms of a semantic network including a hierarchical taxonomy. This approach assumes that the semantic network reflects the human knowledge well. The nodes in a network represent concepts, and way to measure the conceptual similarity between two nodes are also regarded as ways to determine the conceptual similarity of two words(i.e,. two nodes in a network). Topological method can be categorized as node-based or edge-based, which are also called the information content approach and the conceptual distance approach, respectively. The node-based approach is used to calculate similarity between concepts based on how much information the two concepts share in terms of a semantic network or taxonomy while edge-based approach estimates the distance between the nodes that correspond to the concepts being compared. Both of two approaches have assumed that the semantic network is static. That means topological approach has not considered the change of semantic relation between concepts in semantic network. However, as information communication technologies make advantage in sharing knowledge among people, semantic relation between concepts in semantic network may change. To explain the change in semantic relation, we adopt the cognitive semantics. The basic assumption of cognitive semantics is that humans judge the semantic relation based on their cognition and understanding of concepts. This cognition and understanding is called 'World Knowledge.' World knowledge can be categorized as personal knowledge and cultural knowledge. Personal knowledge means the knowledge from personal experience. Everyone can have different Personal Knowledge of same concept. Cultural Knowledge is the knowledge shared by people who are living in the same culture or using the same language. People in the same culture have common understanding of specific concepts. Cultural knowledge can be the starting point of discussion about the change of semantic relation. If the culture shared by people changes for some reasons, the human's cultural knowledge may also change. Today's society and culture are changing at a past face, and the change of cultural knowledge is not negligible issues in the research on semantic relationship between concepts. In this paper, we propose the future directions of research on semantic similarity. In other words, we discuss that how the research on semantic similarity can reflect the change of semantic relation caused by the change of cultural knowledge. We suggest three direction of future research on semantic similarity. First, the research should include the versioning and update methodology for semantic network. Second, semantic network which is dynamically generated can be used for the calculation of semantic similarity between concepts. If the researcher can develop the methodology to extract the semantic network from given knowledge base in real time, this approach can solve many problems related to the change of semantic relation. Third, the statistical approach based on corpus analysis can be an alternative for the method using semantic
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 논문에서는 이러한 기존의 의미간 유사도에 대한 연구가 동적인 의미간 유사도 패러다임으로 전환하기 위해서 나아가야 할 연구 방향을 제시해 보고자 한다. 여기서 제시하는 동적인 의미간 유사도 패러다임이란, 의미간의 유사도나 관계가 시간이나 문맥적 변화에 의해 변화될 수 있다는 전제를 염두에 둔 연구 방향으로서, 의미간 유사도의 역동성을 감안한 연구 방식을 의미한다.
따라서, 본 연구에서는 ‘정적인 의미간 관계도 패러다임’에서 벗어나 ‘동적인 의미간 관계도 패러다임’으로의 연구 패러다임 전환의 필요성을 역설해 보고자 한다.
따라서, 본 연구에서는 ‘정적인 의미간 관계도 패러다임’에서 벗어나 ‘동적인 의미간 관계도 패러다임’으로의 연구 패러다임 전환의 필요성을 역설해 보고자 한다. 이러한 패러다임 전환의 당위성을 살펴보기 위해 인지 의미론(Cognitive Semantics)적 관점에서 인간의 개념에 대한 인지 과정을 자세히 살펴보고자 한다.
가설 설정
인지 의미론에서는 ‘인지’라고 하는 일반적인 사고 영역을 통해 의미를 판단한다고 가정한다.
이론/모형
Rada는 이러한 접근 방식을 검색 시스템인 Medline의 정보를 이용해 만든 위계적 네트워크(Hierarchy Network)인 MeSH(Medical Subject Headings)에 적용하였다(Rada et al., 1989; Rada and Bicknell, 1989). 그들의 주된 가정은 시맨틱 네트워크 상에서 두 개념간의 거리는 그 두 개념의 유사도를 상징한다는 엣지 기반 접근 방식의 대전제를 따르고 있다.
후속연구
이러한 일반적인 지식은 사회의 변화에 따라 새롭게 생길 뿐 아니라 기존의 지식 및 구조 또한 쉽게 변한다. 더욱이 고전적인 시스템 통합 방법론에서 필요로 하는 의미간의 유사도 측정 또한 빠르게 진화하고 변화하는 비즈니스 환경을 고려할 때 결코 시맨틱 네트워크의 역동성과 의미간의 유사도를 구하는 연구를 분리해서 생각되어서는 안된다.
개념간의 유사도를 구하는 연구에 있어서도 이와 같이 코퍼스를 수집하고 이를 통계적으로 분석해 관계도를 계산해 내는 방식이 매우 유용할 수 있다. 앞서 논의했던 시맨틱 네트워크를 이용하는 경우보다는 훨씬 더 융통성 있는 방법론을 개발할 수 있을 뿐만 아니라, 동적으로 변화하는 의미간의 관계들을 확인하는 가장 확실한 방법이 될 수 있을 것이다. 특히 대부분의 사람들이 웹을 사용하고 또 이를 통해 정보를 습득하고 지식을 쌓아가고 있는 현실을 감안할 때, 코퍼스는 인간의 인지구조를 모사하기에 더 없이 좋은 원천이 될 수 있을 것이다.
본 연구에서 주장하고자 하는 ‘동적인 개념간의 유사도 패러다임’의 기본 전제는 서론에서 밝힌 바와 같이 세상의 변화와 그 변화에 대한 정보 및 지식을 인지하고 있는 인간의 인지구조를 보다 정확하게 즉시적으로 반영할 수 있는 개념간의 유사도 계산 방식이 필요하다는 것이다. 이러한 패러다임에 맞는 연구 방향으로 앞 장에서는 세 가지 가능한 연구 방향을 제안하였으며, 이 세 가지 연구 방향 이 외에도 보다 많은 연구들이 앞으로 진행될 것으로 믿는다.
인간의 두뇌에 있는 인지 구조는 환경의 영향에 의해 빠른 속도로 변화하고 있고, 정보 통신 기술의 발달은 다양한 사건이나 문화적 변화를 통해 이루어지는 새로운 지식들을 보다 빠르게 많은 사람들이 공유할 수 있게 하였다. 이런 일련의 과정으로 벌어지고 있는 인간의 인지 범위의 역동적 확장은 개념간의 유사도를 도출하는 연구에도 반영될 수 있어야 보다 정확하게 다양한 분야에 적용될 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
인간의 개념에 대한 인지는 무엇으로 구축되는가?
인간의 개념에 대한 인지는 인간이 가지고 있는 경험과 지식 등으로 구축된다. 인간은 경험과 지식을 기반으로 개념의 내포 및 외연 영역을 사고하며, 이 영역의 포함관계 등을 기반으로 두 개념의 의미 연관을 추리한다.
세상에 대한 이해를 돕는 세계 지식은 어떻게 구성되는가?
세상에 대한 이해를 돕는 세계 지식은 앞서 언급한 바와 같이 문화적 지식과 개인적 지식으로 구성된다. 이 문화적 지식과 개인적 지식으로 세상을 인지하는 방식을 다음과 같이 예를 들어볼 수 있다.
엣지 기반의 접근 방식이란 어떠한 방식을 의미하는가?
엣지 기반의 접근 방식은 시맨틱 네트워크를 이용하는 방식 중에 가장 직관적이고 자연스러운 접근 방식이라고 할 수 있다. 이 접근 방식은 두 개념을 상징하는 시맨틱 네트워크상의 노드간의 거리를 측정하여 개념간의 유사도를 측정하는 방식이다.
참고문헌 (14)
Cho, I. D. and N. K. Kim, "Recommending core and connecting keywords of research area using social network and data mining techniques", Journal of Intelligence and Information Systems, Vol.17, No.1(2011), 127-138.
Couto, F. M., M. J. Silva, and P. M. Coutinho, "Measuring semantic similarity between Gene Ontology terms", Data and Knowledge Engineering, Vol.61, No.1(2007), 137-152.
Holland, D. and N. Quinn, (Eds.), Cultural models in language and thought, Cambridge : Cambridge University Press, 1987.
Kim, H. W., M. Sohn, and H. J. Lee, "Dyanamic decision making using social context based on Ontology", Journal of Intelligence and Information Systems, Vol.17, No.3(2011), 43-62.
Lin, D., "An information-theoretic definition of similarity", in Proceedings of the 15th international conference on Machine Learning, Vol.1, 296-304.
Lobner, Sebastian, 2002, Understanding Semantics. London : Arnold.
Ogden, C. K. and I. A. Richards, The meaning of meaning : A study of the influence of language upon thought and of the science of symbolism, 8th ed. Reprint New York : Harcourt Brace Jovanovich, 1923.
Park, J. S., N. W. Kim, M. J. Choi, Z. Jin, and Y. S. Choi, "Semantic search : A survey", Journal of Intelligence and Information Systems, Vol.17, No.14(2011), 19-36.
Resnik, P., "Using information content to evaluate semantic similarity in a taxonomy", Proceedings of the 14th international joint conference on Artificial intelligence, August Vol.20, No.25(1995), 448-453, Montreal, Quebec, Canada.
Rada, R. and E. Bicknell, "Ranking documents with a thesaurus", Journal of the American Society for Information Science, Vol.40, No. 5(1989), 304-310.
Rada, R., H. Mill, E. Bicknell, and M. Blettner, "Development and application of a metric on semantic nets", IEEE Transactions on Syst. Man Cybern. Vol.19, No.1(1989), 17-30.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.