최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기韓國情報技術學會論文誌 = Journal of Korean institute of information technology, v.9 no.9, 2011년, pp.163 - 177
주지훈 , 윤영미
본 논문에서는 시간의 흐름에 따라 변하는 온라인상에서의 뉴스의 흐름을 분석한다. 대량의 뉴스 미디어 및 블로그 게시물 안의 인용 구문들을 추적하여, 인용 횟수를 기록한 데이터를 밈(Meme) 데이터라고 한다. 이들 밈 데이터를 전 처리 한 후 K-means, X-means, EM 군집 알고리즘을 적용하여, 인용 횟수의 시간에 따른 변화 패턴을 식별하고 비교한다. 또한 이렇게 분석된 클러스터를 이용하여, 시간 변화에 따른 밈의 예측 모델을 제시한다. 인용 횟수가 가장 높은 피크 점 이전의 데이터를 트레이닝 데이터로 활용하여, Naive Bayes, SMO, Random Forest 알고리즘을 적용하여 피크 점 이후의 밈의 패턴이 속할 클러스터를 예측하는 분류자를 생성한다. 해당 클러스터의 정보를 바탕으로 피크 점 이후의 밈의 패턴을 예측 한다. 본 논문에서는 LOOCV를 활용한 Precision, Recall, F_measure, Accuracy를 통하여 이 예측시스템을 검증한다. K-means로 군집 분석을 수행한 결과를 트레이닝 데이터로 활용하고, SMO 알고리즘으로 분류 분석을 수행하였을 때, 95.3%의 정확도를 나타낸다. 본 논문에서 구축한 모델은, 피크 점 이전의 독립 밈 데이터가 주어지면 피크 점 이후의 패턴 예측에 활용 될 수 있다.
We made an analysis on the pattern of on-line news which change as time flows. The record for the number of mentions in a series of time for short units of text that propagate and diffuse over the web from mainstream media to blogs is referred as “meme” data. The flow of changes in the number of quo...
※ AI-Helper는 부적절한 답변을 할 수 있습니다.