최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회, 2016 Oct. 07, 2016년, pp.62 - 66
송광호 (인하대학교, 정보통신공학과) , 민지홍 (인하대학교, 정보통신공학과) , 김유성 (인하대학교, 정보통신공학과)
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
문서에서 키워드를 추출해내는 방법은 무엇이 있는가? | 문서에서 키워드를 추출해내는 방법에는 기본적으로 문서에 나타난 단어들의 빈도를 이용하는 빈도기반 접근법과 그에 더해 문서들이 가진 언어학적 요소들을 가미하는 특징기반 접근법 그리고, 최근 연구되기 시작한 기계학습기반 접근법 등이 있다[7]. 그 중 빈도기반 접근법은 1958년 Luhn[8]이 처음 제안한 후 지금까지도 가장 많이 연구되는 방법이다. | |
키워드 추출의 어려운 점은? | 키워드 추출은 대체로 여러 문서들의 집합에서 나온 대량의 단어들 중에서 각 문서들을 구별하는데 핵심적 역할을 하는 단어를 추려내는 방법으로 이루어진다. 그러나 [5]에 따르면 문서 집합에서 추출된 단어들 중 실제 각각의 문서를 구별하는 핵심적인 역할을 할 수 있는 단어 즉, 각 문서가 가진 고유성을 잘 기술할 수 있는 단어들은 약 10% 정도로 매우 적은 수이기 때문에 각각의 문서들이 가진 의미를 잘 표현할 수 있는 단어들을 각 문서마다 걸러내는데에 많은 어려움이 따른다. 따라서 최근에는 문서 군집이 아닌 단일 문서를 대상으로 그 문서만의 키워드를 추출해 내는 연구들이 활발히 진행되고 있다. | |
키워드 추출이란? | 이렇게 선별된 속성들은 이후의 처리 단계에서 중요한 영향을 미치기 때문에 이를 정확하고 효율적으로 선별해내는 것은 매우 중요하다. 특히 단어(Word)는 텍스트 마이닝 연구에서 가장 널리 쓰이는 주요 속성으로써 주제를 대표할 수 있는 적은 수의 대표 단어(Representative Term)를 주어진 텍스트로부터 자동추출해내는 키워드 추출(Keyword Extraction)[1] 연구들이 활발히 진행되고 있다[2][3][4]. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.