최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.3 no.12, 2014년, pp.531 - 536
이상훈 (조지아주립대학교 대학원 컴퓨터학과) , 문승진 (수원대학교 컴퓨터학과)
With the very large quantity of information available on the Internet, techniques for dealing with the abundance of documents have become increasingly necessary but the problem of processing information in the documents is still technically challenging and remains under study. Automatic document sum...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
가장 많이 알려진 자동문서 요약의 평가 방법은 무엇인가? | 둘째, 제안된 문서 요약 시스템은 컴퓨터 평가방법을 사용한다. 현재 가장 많이 알려진 자동문서 요약의 평가 방법은 Recall-Oriented Understudy for Gisting Evaluation (ROUGE)[5] 방법으로 특정한 사람들이 요약한 문서(Gold Model)와 컴퓨터가 요약한 문서(System Model)를 비교해서 Precision과 Recall을 0과 1 사이의 값으로 정한 후 1에 가까울수록 좋은 요약문이라고 결정하는 방법이다. 하지만 기존의 방법은 개인의 평가방법에 의존했기 때문에 요약에 참여하는 개인의 관심 분야나 전공분야가 다를 때 결과 역시 변하는 문제를 가지고 있다. | |
퍼지 이론이 말하는 불확실성 문제는 무엇인가? | 일반적으로 문서를 요약하는 기술은 요약하고자 하는 용어나 문장을 선택할 때 문장의 길이, 용어 빈도수, 문장의 위치 등 여러 가지 특징들을 고려해야 하는데, 이러한 특징들을 함께 사용할 때 최종 문장의 중요도를 어떻게 반영해야 하는지가 애매모호한 문제로 제기되어 왔다. 퍼지 이론은 이러한 불확실성의 문제를 모델링하는 데 장점을 가지고 있다. | |
전처리 단계는 어떻게 구성되는가? | 전처리 단계는 문장 영역 구분(Sentence Boundary Detection), 불필요한 단어 제거(Stop-word Removing), 제거된 단어의 어근 추출(Stemming)의 세 부분으로 구성된다. 본 논문에서는 문장 영역을 구분하기 위해서 발견법(Heuristic)을 사용하지 않고 문장 영역을 구분하는 지도 학습 시스템(Supervised Learning System)을 이용하였다. |
R. Witte and S. Bergler, "Fuzzy coreference resolution for Summarization," In Proceedings of International Symposium on Reference Resolution and Its Applications to Question Answering and Summarization (ARQAS). Venice, Italy: Universit Ca Foscari, pp.43-50, 2003.
L. Suanmali, N. Salim, and M. S. Binwahlan, "Fuzzy Logic Based Method for Improving Text Summarization," International Journal of Computer Science and Information Security (IJCSIS), Vol.2, No.1, pp.65-70, 2009.
G. Ravindra, N. Balakrishnan, and K.R. Ramakrishnan, "Automatic Evaluation of Extract Summaries Using Fuzzy F-score Measure," In Proceedings of 5th International Conference on Knowledge Based Computer Systems, pp. 487-497, 2004.
D. M. Blei, A. Y. Ng, and M. I. Jordan, "Latent Dirichlet Allocation," Journal of Machine Learning Research, Vol.3, pp.993-1022, 2003.
C.Y. Lin, "ROUGE: A Package for Automatic Evaluation of Summaries", In Proceedings of Workshop on Text Summarization of ACL, Spain, 2004.
D. Gillick, "Sentence Boundary Detection and the Problem with the U.S," The Association for Computational Linguistics, pp.241-244, 2009.
J. C. Reynar and A. Ratnaparkhi, "A Maximum Entropy Approach to Identifying Sentence Boundaries," In Proceedings of 5th Conference on Applied Natural Language Processing, pp.16-19, 1997.
M. F. Porter, "An Algorithm for Suffix Stripping," Program, Vol.14, No.3, pp.130-137, 1980.
D. Newman, Topic modeling tool, Available in: .
K. McKeown, R. Barzilay, J. Chen, D. K. Elson, D. K. Evans, J. Klavans, A. Nenkova, B. Schiffman, and S. Sigelman, "Columbia's Newsblaster: New Features and Future Directions," HLT-NAACL, pp.15-16, 2003.
G. Salton and C. Buckley, "Term-weighting Approaches in Automatic Text Retrieval," Information Processing and Management, Vol.24, pp.513-523, 1988. Reprinted in: Sparck Jones K. and Willet P. (eds.), Readings in Information Retrieval, Morgan Kaufmann, pp.323-328, 1997.
I. Dhillon, S. Mallela, and R. Kumar, "Enhanced word clustering for hierarchical classification," In Proceedings of 8th ACM Intl. Conf. on Knowledge Discovery and Data Mining, 2002.
P. Jaccard, "Etude comparative de la distribution florale dans une portion des Alpes et des Jura," Bulletin de la Socit Vaudoise des Sciences Naturelles, Vol.37, pp.547-579, 1901.
L. A. Zadeh, "Fuzzy Sets," Information and Control 8, Vol. 8, No.3, pp.338-353, 1965.
A. Louis and A. Nenkova, "Summary Evaluation without Human Models," Text Analysis Conference, 2008.
D. R. Timothy, T. Allison, S. Blair-goldensohn, J. Blitzer, A. Celebi, S. Dimitrov, E. Drabek, A. Hakim, W. Lam, D. Liu, J. Otterbacher, H. Qi, H. Saggion, S. Teufel, A. Winkel, and Z. Zhang, "MEAD a platform for multidocument multilingual text summarization," In Proceedings of International Conference on Language Resources and Evaluation, pp.1-4, 2004.
S. Kullback and R. A. Leibler, "On Information and Sufficiency," Annals of Mathematical Statistics, Vol.22, No.1, pp.79-86, 1951.
T. M. Cover and J. A. Thomas, Elements of Information Theory, Wiley, New York, NY, 1991.
L. A. Zadeh, "The Concept of a Linguistic Variable and Its Application to Approximate Reasoning," Information Sciences, Vol.8, pp.199-249, 1975.
R. L. Summerscales, S. Argamon, S. Bai, J. Huperff, and A. Schwartzff, "Automatic Summarization of Results from Clinical Trials," BIBM, pp.372-377, 2011.
S. Kiritchenko, B. Bruijn, S. Carini, J. Martin, and I. Sim, "Exact: automatic extraction of clinical trial characteristics from journal publications," BMC Med Inform Decis Mak, Vol.10, No.1, pp.56-17, 2010.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.