$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

그래프 분할을 이용한 문장 클러스터링 기반 문서요약
Document Summarization Based on Sentence Clustering Using Graph Division 원문보기

정보처리학회논문지. The KIPS transactions. Part B. Part B, v.13B no.2 = no.105, 2006년, pp.149 - 154  

이일주 (동원대학 모바일컨텐츠과) ,  김민구 (아주대학교 정보 및 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

문서요약은 여러 개의 하위 주제로 구성되어 있는 문서에 대해 문서의 복잡도를 줄이면서 하위 주제를 모두 포함하는 요약문을 생성하는 것이 목적이다. 본 논문은 그래프 분할을 이용하여 하위 주제별로 중요 문장을 추출하는 요약시스템을 제안한다. 문장별 공기정보에 의한 단어의 연관성 분석을 통해 선정된 대표어를 이용하여 문서를 그래프로 표현한다. 그래프는 연결정보에 의해 하위 주제를 의미하는 부분 그래프로 분할되며 부분 그래프는 긴밀한 관계를 갖는 문장들이 클러스터링된 형태이다. 부분 그래프별로 중요 문장을 추출하면 하위 주제별 핵심 내용들로만 요약문을 구성하게 되어 요약 성능이 향상된다.

Abstract AI-Helper 아이콘AI-Helper

The main purpose of document summarization is to reduce the complexity of documents that are consisted of sub-themes. Also it is to create summarization which includes the sub-themes. This paper proposes a summarization system which could extract any salient sentences in accordance with sub-themes b...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 기존의 문장 클러스터링에 의한 요약방법이 가지고 있는 문제점을 줄이고 문서의 개념을 요약문에 최대한 반영하고자 한다. 이를 위해 그래프 분할 기법에 의한 하위 주제별 문장 클러스터링을 수행한 후 중요 문장을 추출하는 문서요약을 제안한다.
  • 공기정보란 두 단어가 동일문서, 문장, 구 등에 같이 발생하는 현상을 말하며 더 자주 발생 할수록 두 단어가 밀접한 관계를 가지고 있다는 전제에 기반하고 있다[12]. 논문에서는 단어의 공기정보를 기반으로 단어의 연관성 분석을 통해 문서의 대표어를 추출한다.
  • 즉, 주제와 무관한 단어들의 중복만으로도 문장간의 유사도 값이 높아지게 된다. 본 논문에서는 문장 클러스터링 개념은 이용하되, 문장의 유사도 계산에 의한 방법 대신 그래프 분할이라는 개념을 이용하여 클러스터링을 수행한 후 중요 문장을 주줄하고자 한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (19)

  1. Inderjeet Mani, Automatic Summarization, John Benjarnins Publishing Co., 2001 

  2. Mary McKenna, Elizabeth D.Liddy, 'Evaluation of Automatic Text Summarization Across Multiple Documents,' MAl Symposium, 1998 

  3. H.P.Edmundson, 'New Methods in Automatic Extracting,' Journal of the ACM, 16(2), 1969 

  4. Marti A Hearst, 'Multi-paragraph segmentation of expository text,' In Proceedings of the 32nd Annual Meeting of the ACL, June, 1994 

  5. Salton.G., Singhal.A., Mitra.M., and Buckly.C., 'Automatic text structuring and summarization,' Information Processing and Management, Vol.33, No.2, 1997 

  6. 류동원, 이종혁, '단어공기정보를 이용한 자동화 문서요약' 한국정보과학회학술논문발표지 27권 1호, pp.345-347, 2000 

  7. 류제, '단어의 공기 관계 그래프를 이용한 문서의 핵심 문장 ?추출에 관한 연구' 호서대학교 벤처전문대학원 석사학위논문, 2000 

  8. 정영미, 최상희, '문장 클러스터링에 기반한 자동요약 모형' 한국정보관리학회지, 제18권 3호, pp.159-178, 2001 

  9. 박성배, 장병탁, 'Co-Trained Support Vector Machines을 이용한 문서분류' 한국정보과학회 봄 학술발표 논문집 (B), 제29권 1호, pp. 259-261, 2002 

  10. Julian Kupiec, Jan Pedersen, and Francine Chen, 'A Trainable Document Summarizer,' In Proceedings of ACM-SIGIR'95, pp.68-73,1995 

  11. Barzilay, Regina and Michael Elhadad, 'Lexical Chains for Text Summarization', Master's thesis, Ben-Gurion University, 1997 

  12. C.J.van Rijsbergen., 'A Theoritical Basis for the Use of Co-occurrence Data in Information Retrieval,' Journal of Documentation.Vol.33:106-119,1977 

  13. 김재훈, 김준홍, '도합유사도를 이용한 한국어 문서요약 시스템' 한국 인지과학회 논문지 제12권 제1.2호, pp.35-42, 2001 

  14. Skorochodko,E.F., 'Adaptive method of automatic abstracting and indexing,' Information Processing 71: Processing of the IFIP Congress 71, ed. by Freiman, pp.1179-1182, NorthHolland Publishing Company, 1972 

  15. 김철언, 그래프론과 알고리듬, POSTEC PRESS, 1997 

  16. Sparck Jones, K., 'Automatic summarizing.factors and directions,' Advances in Automatic Text Summarization, pp.1-12, The MIT Press. 1999 

  17. Morris. A.H., Kasper and G.M, Adams. D.A., 'The effects and limitations of automated text condensing on reading comprehension performance,' Information systems Research, 3(1), pp.17-35, 1992 

  18. http://www.itl.nistgov/iaui/894.02/Irelated_projects/tipster_sumnac 

  19. http://www.isi.edu/-cyl/ROUGE/ 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로