최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기韓國軍事科學技術學會誌 = Journal of the KIMST, v.21 no.1, 2018년, pp.86 - 93
김현중 (연세대학교 산업공학과) , 김우주 (연세대학교 산업공학과)
Since media articles, which have a great influence on public opinion, are transmitted to the public through various media, it is very difficult to analyze them manually. There are many discussions on methods that can collect, process, and analyze documents in the academia, but this is mostly done in...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
LexRank 알고리즘의 문장 추출 과정은 어떻게 되는가? | LexRank 알고리즘은 중심성이 높은 문장들을 추출 하는 방식으로 문서를 요약한다. 먼저 각 문장 단어별 TF-IDF 점수를 합산하여 문장의 중요 정도를 계산 후 코사인 유사도를 측정하여 각 문장간 유사도를 확인 한다. 계산된 코사인 유사도 값에 임계(Threshold)를 설정하여 각 문장을 노드로 표현한 그래프를 만들고 총 노드 수와 인접 노드 수, 연결된 차수(Degree)를 Google 검색 엔진에서 페이지의 상대적 우선 순위 결 정에 사용되는 PageRank로 계산하여 중요 문장을 최종 추출한다[16]. | |
텍스트마이닝이란? | 텍스트마이닝은 다양한 문서들 사이에서 유의미한 정보를 추출하고 패턴을 파악하는 방법으로 문서 내 이벤트 등 특정한 정보 추출(Information Extraction)부터 사용자의 관심사항에 따라 해당 내용의 문서를 지속 제공해주는 토픽 추적(Topic Tracking), 주어진 문서들을 지정된 그룹에 할당해주는 분류(Classification), 유사 문서들끼리 그룹화 해주는 군집(Clustering), 긴 내용의 문서에서 핵심 내용을 추출ㆍ정리하여 제공하 는 요약(Summarization) 등이 있다[8]. | |
LDA의 특징은? | 토픽 모델링은 문서들 사이에서 구성된 키워드간의 관계를 통해 문서의 주제를 찾아내는 기법이다. LDA는 토픽 모델링 알고리즘 중 하나로 각 문서는 여러 토픽들로 구성되어 있고 서로 다른 확률로 분포되어 있다는 가정 하에 결합확률분포와 조건부분포를 계산하여 토픽 별로 관련 키워드를 추출한다[9]. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.