$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

단어 간 의미적 연관성을 고려한 어휘 체인 기반의 개선된 자동 문서요약 방법
An Improved Automatic Text Summarization Based on Lexical Chaining Using Semantical Word Relatedness 원문보기

스마트미디어저널 = Smart media journal, v.6 no.1, 2017년, pp.22 - 29  

차준석 (조선대학교 소프트웨어융합공학과, 조선대학교 컴퓨터공학과) ,  김정인 (조선대학교 소프트웨어융합공학과, 조선대학교 컴퓨터공학과) ,  김판구 (조선대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

최근 스마트 디바이스의 급속한 발달과 보급으로 인하여 인터넷 웹상에서 등장하는 문서의 데이터는 하루가 다르게 증가 하고 있다. 이러한 정보의 증가로 인터넷 웹상에서는 대량의 문서가 증가하여 사용자가 해당 문서의 데이터를 이해하는데, 어려움을 겪고 있다. 그렇기 때문에 자동 문서 요약 분야에서 문서를 효율적으로 요악하기 위해 다양한 연구가 진행 되고 있다. 효율적으로 문서를 요약하기 위해 본 논문에서는 텍스트랭크 알고리즘을 이용한다. 텍스트랭크 알고리즘은 문장 또는 키워드를 그래프로 표현하며, 단어와 문장 간의 의미적 연관성을 파악하기 위해 그래프의 정점과 간선을 이용하여 문장의 중요도를 파악한다. 문장의 상위 키워드를 추출 하고 상위 키워드를 기반으로 중요 문장 추출 과정을 거친다. 중요 문장 추출 과정을 거치기 위해 단어 그룹화 과정을 거친다. 단어그룹화는 특정 가중치 척도를 이용하여 가중치 점수가 높은 문장을 선별하여 선별된 문장들을 기반으로 중요 문장을 중요 문장을 추출하여, 문서를 요약을 하게 된다. 이를 통해 기존에 연구 되었던 문서요약 방법보다 향상된 성능을 보였으며, 더욱 효율적으로 문서를 요약할 수 있음을 증명하였다.

Abstract AI-Helper 아이콘AI-Helper

Due to the rapid advancement and distribution of smart devices of late, document data on the Internet is on the sharp increase. The increment of information on the Web including a massive amount of documents makes it increasingly difficult for users to understand corresponding data. In order to effi...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 추출 요약 기법을 기반으로 자동 문서요약을 하기 위한 문서요약 시스템을 제안하고자 한다.
  • 본 논문에서는 효율적으로 문서 요약을 하기 위해 문서에 존재하는 대표 키워드를 추출하며, 추출된 대표 키워드를 상위 키워드와 하위 키워드로 나누는 방법을 제안하였다. 이 방법은 문서에 존재하는 문장과 키워드 간의 연관단어를 파악하여 기존에 연구되었던 문서 요약 방법보다 문서에 존재하는 핵심 주제를 추출하기 위해 제안한 방법이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
생성 요약 기법이란 무엇인가? 생성 요약 기법은 문서 내 존재하는 중요 키워드와 문장을 파악하여 자연어 처리 기법을 이용한 문장조합기법, 재구축기법등을 이용하여 문서요약을 하는 연구이다. 또한 생성요약 기법은 문서에 존재하는 단어의 위치, 문장의 위치 같이 대상 문서에서 형태적으로 나타나는 정보를 이용하여 문서요약을 진행한다.
추출 요약 기법의 한계점은 무엇인가? 추출 요약 기법은 현재 다양한 연구를 통해 문장이 가지는 단어의 빈도수 및 가중치를 통해 문장과 단어 간의 관계를 분석하여 중요 문장을 추출하는 방식으로 이루어지고 있다. 하지만 자동으로 분석된 문장의 가중치가 기존 문서의 의미전달이 제대로 이루어지지 않는 경우 올바른 문장 요약이 이루어지지 않는다. 상대적으로 기존 생성 요약 기법보다는 구현이 쉽다는 장점 때문에 현대 추출 요약 기법을 이용한 문서 요약은 활발히 진행되고 있으며, 추출 요약 기법을 이용한 연구 중 PLSA(Probavilistic Latent Semantic Analysis) 알고리즘을 이용한 문서 요약 기법이 있다.
문서요약의 기본 목적은 무엇인가? 문서를 요약하기 위해서는 문서의 특징을 반영한 방법이 필요하다. 문서요약의 기본 목적은 원문을 읽지 않고서도 원문의 주제를 파악할 수 있도록 문서의 핵심 주제를 간략하게 압축 정리하는 것에 있다. 문서요약은 원문의 주제를 서술적으로 표현해야 하므로 복잡한 언어처리와 주제 분석 같은 고차원적인 문서 분석 기술을 필요로 한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Ohm Sornil, Kornnika Gree-ut, "An Automatic T ext Summarization Approach using Content-Base d and Graph-Based Characteristics", In Proceedi ngs of IEEE Conference on Cybernetics and Inte lligent Systems, pp. 1-6, 2006. 

  2. 이창범, 김민수, 이기호, 이귀상, 박혁로, "주성분 분석을 이용한 문서 주제어 추출", 정보과학회논문지 : 소프트웨어 및 응용, pp. 747-754, 2002. 

  3. D.D. Lewis, S.K. Jones, "Natural language proces sing for information retrieval," Communications o f the ACM, Vol. 39, No.1, pp. 92-101, 1996. 

  4. E.D. Liddy, S.H. Myaeng, "DR-LINK's: linguistic-comceptual approach to document and detection, " The First Text REtreival Conference, pp. 113-129, 1993, 

  5. Mihalcea, Rada, Paul Tarau. "TextRank: Bringing order into texts." Association for Computational Linguistics, 2004. 

  6. J. Kupiec, J. Pedersen, and F. Chen, "A Trainabl e Document Summarizer." Proceedings of 18th A CM-SIGIR Conference, pp.68-73, 1995. 

  7. Chanback Jeong, Taehwan Kim, Hochul Jeon, Joongmin Choi Department of Computer Science & Engineering Hangyang University, A News Recommendation System based on Document Clustering Using WordNet, 2008. 

  8. I. Mani, Automatic Summarization, John Benjami ns Publishing Company, pp.114-125, 2001. 

  9. Henning, Leonhard, "Topic-based Multi-Documen t Summarization with Probabilistic Latent Seman tic Analysis", Proceedings of the International Co nference RANLP'09, 2009 

  10. Xiaojun Wan, Jianwu Yang, "Multi-Document S ummarization Using Cluster-based Link Analysis ",Proceedings of the International Conference(SIG IR'08), 2008. 

  11. K.S. Thakkar, R. V. Dharaskar, and M. B. Ch andak, "Graph-based algorithms for text summar ization",In 2010 3rd International Conference on Emerging Trends in Engineering and Technology, pp. 516-519, 2010. 

  12. 조형락, 김성진, 이동호. "의미기반 텍스트 랭크 알고리즘을 이용한 다중문서 요약. 한국정보과학회 2015년도 동계학술발표회 논문집: 756-758 2015. 

  13. S. Harabagiu, L. Finley "Topic Themes for Mult i Document Summarization," In proceeding of A CM SIGIR, pp. 202-209, 2005. 

  14. C.Y.Lin, E.H.Hovy, "Automatic evaluation of su mmaries using n-gram co-occurrence statistics", In Proceedings of Human Language Technology Conference (HLT-NAACL 2003), Edmonton, Can ada, May, 2004. 

  15. P. McNamee, J. Mayfield, "Character N-Gram T okenization for European Language Text Retriev al",Information Retrieval, Vol 7, No. 1-2, pp. 73-97, 2004. 

  16. J. Heu, Y. Joo, D. Lee, Multi-Document Summarization Technique using Semantic Analysis bet ween Tags, 2012. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로