최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회, 2016 Oct. 07, 2016년, pp.67 - 71
김도우 (서강대학교, 정보통신대학원) , 구명완 (서강대학교, 정보통신대학원)
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
문서 분류의 자동화를 위하여 기존에는 어떤 방법을 이용했는가? | 문서 분류의 자동화를 위하여 기존에는 단순히 문서에 나타나는 단어의 빈도를 이용하여 분류 범주를 지정하는 통계적인 분류방법을 이용하거나[1], 분류에 필요한 주요 단어들을 추출하고 추출된 단어들을 기반으로 K-NN, 의사결정 트리, 베이지언 네트워크, 인공신경망 등의 데이터 마이닝 알고리즘을 이용한 연구가 진행되었다[2]. 최근에는 딥러닝 알고리즘인 컨볼루션 신경망(Convolutional neural network, CNN)이 자연어 처리에 효과적이라는 것이 알려지면서, 문서에 포함된 단어들을 각각 vector로 표현하는 방법인 word2vec[5]과 CNN을 이용한 문서 분류 방법[3]이 제안되었고, 실제로 놀라운 결과를 보여주었다[3]. | |
딥러닝 알고리즘인 컨볼루션 신경망이 무엇에 효과적인가? | 문서 분류의 자동화를 위하여 기존에는 단순히 문서에 나타나는 단어의 빈도를 이용하여 분류 범주를 지정하는 통계적인 분류방법을 이용하거나[1], 분류에 필요한 주요 단어들을 추출하고 추출된 단어들을 기반으로 K-NN, 의사결정 트리, 베이지언 네트워크, 인공신경망 등의 데이터 마이닝 알고리즘을 이용한 연구가 진행되었다[2]. 최근에는 딥러닝 알고리즘인 컨볼루션 신경망(Convolutional neural network, CNN)이 자연어 처리에 효과적이라는 것이 알려지면서, 문서에 포함된 단어들을 각각 vector로 표현하는 방법인 word2vec[5]과 CNN을 이용한 문서 분류 방법[3]이 제안되었고, 실제로 놀라운 결과를 보여주었다[3]. 그러나, CNN을 이용한 문서 분류 방법에서 문서 자체를 vector로 표현하는 방법인 doc2vec[6]의 활용은 고려되지 않았다. | |
문서 분류의 자동화에 대한 필요성이 증대되고 있는 이유는? | 이에 따라 국내외 언론사들은 인터넷 기사 서비스를 위한 별도의 체계를 구성·운영하여 정규 뉴스보도 외에도 사용자들이 시간과 장소에 구애받지 않고 신속하게 뉴스 서비스를 이용할 수 있도록 지원하고 있다. 대부분의 언론사에서는 기사를 인터넷에 게시하기 전에 분류 전문가를 통해 기사를 분류하고 검증하는 단계를 거친다. 그러나 이러한 수작업 처리 방법은 정보시스템의 급속한 발달로 인해 처리해야 할 정보와 문서의 양이 점점 방대해지고 복잡해지는 현대 시대에 빠르게 전달해야 하는 뉴스의 속도를 저하시킬 뿐만 아니라 인력 자원의 투입으로 인한 많은 비용을 소비하고 있다. 따라서 문서 분류의 자동화에 대한 필요성은 더욱 증대되고 있다[1]. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.