본 논문에서는 검색(Retrieval)을 위한 문서의 확률모델을 제시하였다. 제시된 모델은 문서의 생성과정을 고려하였다. 문서는 단어들의 열(Sequence)이며 이 단어들은 정보원(Information Source)에 의해 선택된 후 문서상에 출력된다고 정의하였다. 본 논문에서 제시한 문서 모델링에서는 2개의 정보원을 고려하였다. 본 논문에서는 문서의 생성에 관여하는 정보원을 사용자의 정보 요구와 관련된 정보를 통해 표현하였다. 각각의 정보원은 사전에서 단어를 선택하여 이를 문서상에 출력하며 이 과정을 통해 문서가 생성된다. 각각의 정보원은 사용자의 정보 요구를 미리 알고 있으며 사용자의 정보 요구를 질의로 표현함에 있어서 포함될 수 있는 단어들과 포함되지 않는 단어들을 사전으로부터 각각 선택한 다음 문서상에 출력된다. 또한 모델에 의해 제시된 가중치 부여 공식을 실제 검색 환경에서 사용할 수 있도록 하였다. 이는 사용자의 Relevance Reedback 정보를 이용한 확률추정을 통하여 이루어졌다. 본 논문은 문서의 생성과정에 관여하는 정보원을 고려함으로써 향후 여러가지 방면의 정보검색 분야에서 응용이 가능하게 하였다. 이는 문서의 생성에 관여하는 정보원의 정의 및 포함 정보를 변화함으로써 가능하다. 즉, 제시된 모델에서 정보원을 어떠한 정보를 이용하여 표현하느냐에 따라 정보원의 성격이 달라지게 되며 이는 문서 ...
본 논문에서는 검색(Retrieval)을 위한 문서의 확률모델을 제시하였다. 제시된 모델은 문서의 생성과정을 고려하였다. 문서는 단어들의 열(Sequence)이며 이 단어들은 정보원(Information Source)에 의해 선택된 후 문서상에 출력된다고 정의하였다. 본 논문에서 제시한 문서 모델링에서는 2개의 정보원을 고려하였다. 본 논문에서는 문서의 생성에 관여하는 정보원을 사용자의 정보 요구와 관련된 정보를 통해 표현하였다. 각각의 정보원은 사전에서 단어를 선택하여 이를 문서상에 출력하며 이 과정을 통해 문서가 생성된다. 각각의 정보원은 사용자의 정보 요구를 미리 알고 있으며 사용자의 정보 요구를 질의로 표현함에 있어서 포함될 수 있는 단어들과 포함되지 않는 단어들을 사전으로부터 각각 선택한 다음 문서상에 출력된다. 또한 모델에 의해 제시된 가중치 부여 공식을 실제 검색 환경에서 사용할 수 있도록 하였다. 이는 사용자의 Relevance Reedback 정보를 이용한 확률추정을 통하여 이루어졌다. 본 논문은 문서의 생성과정에 관여하는 정보원을 고려함으로써 향후 여러가지 방면의 정보검색 분야에서 응용이 가능하게 하였다. 이는 문서의 생성에 관여하는 정보원의 정의 및 포함 정보를 변화함으로써 가능하다. 즉, 제시된 모델에서 정보원을 어떠한 정보를 이용하여 표현하느냐에 따라 정보원의 성격이 달라지게 되며 이는 문서 분류(Classification), 분산 검색(Distributed IR)등의 사례에 적용이 가능하다는 것을 의미한다. 본 논문은 문서를 모델링함에 있어서 문서 생성에 실제로 관련된 정보를 이용함으로써 기존의 확률모델보다 보다 현실적이고 자연스러운 문서 모델링을 제시하였다.
본 논문에서는 검색(Retrieval)을 위한 문서의 확률모델을 제시하였다. 제시된 모델은 문서의 생성과정을 고려하였다. 문서는 단어들의 열(Sequence)이며 이 단어들은 정보원(Information Source)에 의해 선택된 후 문서상에 출력된다고 정의하였다. 본 논문에서 제시한 문서 모델링에서는 2개의 정보원을 고려하였다. 본 논문에서는 문서의 생성에 관여하는 정보원을 사용자의 정보 요구와 관련된 정보를 통해 표현하였다. 각각의 정보원은 사전에서 단어를 선택하여 이를 문서상에 출력하며 이 과정을 통해 문서가 생성된다. 각각의 정보원은 사용자의 정보 요구를 미리 알고 있으며 사용자의 정보 요구를 질의로 표현함에 있어서 포함될 수 있는 단어들과 포함되지 않는 단어들을 사전으로부터 각각 선택한 다음 문서상에 출력된다. 또한 모델에 의해 제시된 가중치 부여 공식을 실제 검색 환경에서 사용할 수 있도록 하였다. 이는 사용자의 Relevance Reedback 정보를 이용한 확률추정을 통하여 이루어졌다. 본 논문은 문서의 생성과정에 관여하는 정보원을 고려함으로써 향후 여러가지 방면의 정보검색 분야에서 응용이 가능하게 하였다. 이는 문서의 생성에 관여하는 정보원의 정의 및 포함 정보를 변화함으로써 가능하다. 즉, 제시된 모델에서 정보원을 어떠한 정보를 이용하여 표현하느냐에 따라 정보원의 성격이 달라지게 되며 이는 문서 분류(Classification), 분산 검색(Distributed IR)등의 사례에 적용이 가능하다는 것을 의미한다. 본 논문은 문서를 모델링함에 있어서 문서 생성에 실제로 관련된 정보를 이용함으로써 기존의 확률모델보다 보다 현실적이고 자연스러운 문서 모델링을 제시하였다.
In this paper, a document modeling and retrieving method is suggested. With regard to document modeling, the process of document generation was considered. There's 2 information sources involved with the process of document generation. In this modeling, an assumption was made that 2 information sour...
In this paper, a document modeling and retrieving method is suggested. With regard to document modeling, the process of document generation was considered. There's 2 information sources involved with the process of document generation. In this modeling, an assumption was made that 2 information sources know about the user's information need in advance. Each information source's behaviour is to select a term from a dictionary and write it in a document. The identity of two information sources are made by the fact that one information source always select a term that might be used to approximate the user's information need by his/her own queries. On the contrary, the other always select a term that might not be used to approximate the user's information need by his/her own queries. To compute the probability of relevance given a document, the ratio of probability of being selected by 2 information sources was considered. To get practical weighting function, a parameter estimation was done. In this work, the relevance feedback information was used to estimate the parameters. According to the information needed to incorporate the information sources involved with the process of document generation, more complex and sophisticated document modeling is possible. This work provides a springboard from which we can jump to the place where more practical and sophisticated document modeling techniques are possible.
In this paper, a document modeling and retrieving method is suggested. With regard to document modeling, the process of document generation was considered. There's 2 information sources involved with the process of document generation. In this modeling, an assumption was made that 2 information sources know about the user's information need in advance. Each information source's behaviour is to select a term from a dictionary and write it in a document. The identity of two information sources are made by the fact that one information source always select a term that might be used to approximate the user's information need by his/her own queries. On the contrary, the other always select a term that might not be used to approximate the user's information need by his/her own queries. To compute the probability of relevance given a document, the ratio of probability of being selected by 2 information sources was considered. To get practical weighting function, a parameter estimation was done. In this work, the relevance feedback information was used to estimate the parameters. According to the information needed to incorporate the information sources involved with the process of document generation, more complex and sophisticated document modeling is possible. This work provides a springboard from which we can jump to the place where more practical and sophisticated document modeling techniques are possible.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.