최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기지능정보연구 = Journal of intelligence and information systems, v.23 no.3, 2017년, pp.69 - 94
Recently, increase of demand for big data analysis has been driving the vigorous development of related technologies and tools. In addition, development of IT and increased penetration rate of smart devices are producing a large amount of data. According to this phenomenon, data analysis technology ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
토픽 모델링이란? | 토픽 모델링은 각 문서를 임의의 주제들로 구성된 집합으로 간주하고, 각 문서를 구성하는 주제와 각 주제에 해당하는 용어의 중요도를 확률 적으로 제시하는 기법으로 정의할 수 있다(Kim et al., 2017; Steyvers and Griffiths, 2007). | |
비정형 데이터의 분석에는 특히 어떠한 것이 급증하고 있는가? | 이러한 현상과 함께 비정형 데이터의 분석 기술이 대중화됨에 따라 다양한 비정형 데이터의 수집, 분석, 그리고 활용에 대한 관심이 증가하고 있다. 특히 의사소통의 매체로 가장 널리 사용되는 텍스트 데이터에 대한 분석 시도가 급증하고 있으며, 소셜 네트워크 서비스(Social Network Service, SNS)로 대표되는 웹 플랫폼의 활성화와 바이럴 마케팅(Viral Marketing) 등 웹을 이용한 신종 기법의 등장에 따라 텍스트 데이 터의 양은 기하급수적 증가 추세를 보이고 있다.따라서 텍스트의 분석을 통해 유용한 정보를 도출하고 이를 산업 각 분야에 활용하기 위한 노력이 매우 활발하게 이루어지고 있으며, 이와 더불어 텍스트 분석을 위한 이론 및 기법을 총칭하는 텍스트 마이닝(Text Mining)에 대한 관심 역시 고조되고 있다. | |
빅데이터 분석을 최신 기술 동향에서는 어떤 용어로 표현하는가? | 기존의 빅데이터 분석은 대부분 전문적 지식을 갖춘 소수의 사람들에 의해 수행되어 각 수요자에게 전파되었다. 하지만 최근 컴퓨터 프로그래밍 교육의 활성화와 다양한 상용 프로그램의 개발은 분석에 대한 진입장벽을 점차 낮추고 있으며, 최신 기술 동향에서는 빅데이터 분석을 시민 데이터 과학(Citizen Data Science) 및 자가 서비스 전달을 수반한 고급 분석(Advanced Analytics with Self-Service Delivery)과 같은 새로운 용어로 표현하고 있다(Gartner, 2015). 이에 따라 향후 빅데이터 분석은 전문가 중심의 수행에 머물지 않고 사용자의 자가 분석에 의한 맞춤형 분석 서비스 형태로 제공되며, 수요자의 필요에 의해 특정 분석 결과만을 선별 및 통합하는 방향으로 진화할 것으로 예상된다. |
AlSumait, L., D. Barbara and C. Domeniconi, "On-Line LDA: Adaptive Topic Models for Mining Text Streams with Applications to Topic Detection and Tracking," 2008 Eighth IEEE International Conference on Data Mining, (2008), 1-12.
Blei, D. M. and J. D. Lafferty, "Dynamic Topic Models," Proceedings of the 23rd International Conference on Machine Learning, (2006), 113-120.
Deerwester, S., S. T. Dumais, G. W. Furnas, T. K. Landauer and R. Harshman, "Indexing by Latent Semantic Analysis," Journal of the American Society for Information Science, Vol.41, No.6 (1990), 391-407.
Forman, G. and B. Zhang, "Distributed Data Clustering can be Efficient and Exact," ACM SIGKDD Explorations Newsletter, Vol.2, No.2 (2000), 34-38.
Gartner, Gartner's 2015 Hype Cycle for Emerging Technologies Identifies the Computing Innovations that Organizations Should Monitor, Gartner, 2015. Available at http://www.gartner.com/newsroom/id/3114217 (Accessed 19 June, 2017).
Han, J., J. Pei and M. Kamber, Data Mining: Concepts and Techniques, Elsevier, Amsterdam, 2011.
Hotho, A., A. Nurnberger and G. Paass, "A Brief Survey of Text Mining," Ldv Forum, Vol. 20, No. 1 (2005), 1-37.
IDC, Big Data and Business Analytics Revenues forecast to reach $150.8 Billion this Year, Led by Banking and Manufacturing Investments, IDC, 2017. Available at http://www.idc.com/getdoc.jsp?containerIdprUS42371417 (Accessed 19 June, 2017).
Koll, M. B., "WEIRD: An Approach to Concept-Based Information Retrieval," ACM SIGIR Forum, Vol.13, No.4 (1979), 32-50.
Lee, D., H. Choi and N. Kim, "A Method for Evaluating News Value based on Supply and Demand of Information using Text Analysis," Journal of Intelligence and Information Systems, Vol.22, No.4 (2016), 45-67.
Liang, Z. and P. Chen, "Delta-Density based Clustering with a Divide-and-Conquer Strategy: 3DC Clustering," Pattern Recognition Letters, Vol.73, (2016), 52-59.
Livermore, M. A., A. Riddell and D. Rockmore, "Agenda Formation and the US Supreme Court: A Topic Model Approach," Arizona Law Review, (2016), Forthcoming.
McCallum, A., K. Nigam and L. H. Ungar, "Efficient Clustering of High-Dimensional Data Sets with Application to Reference Matching," Proceedings of the Sixth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, (2000), 169-178.
Mei, Q. and C. X. Zhai, "Discovering Evolutionary Theme Patterns from Text: An Exploration of Temporal Text Mining," Proceedings of the Eleventh ACM SIGKDD International Conference on Knowledge Discovery in Data Mining, (2005), 198-207.
Mooney, R. J. and R. Bunescu, "Mining Knowledge from Text using Information Extraction," ACM SIGKDD Explorations, Vol.7, No.1 (2006), 3-10.
Salton, G., The SMART Retrieval System-Experiments in Automatic Document Processing, Prentice-Hall, New Jersey, 1971.
Salton, G., A. Wong and C. S. Yang, "A Vector Space Model for Automatic Indexing," Communications of the ACM, Vol.18, No.11 (1975), 613-620.
Sebastiani, F., "Classification of Text, Automatic," The Encyclopedia of Language and Linguistics, Vol.14, (2006), 457-462.
Song, Y., J. Du and L. Hou, "A Topic Detection Approach Based on Multi-Level Clustering," Proceeding of the 31st Chines Control Conference, (2012), 3834-3838.
Steyvers, M. and T. Griffiths, Probabilistic Topic Models : Handbook of Latent Semantic Analysis, Psychology Press, Oxfordshire, 2007.
Wang, J., H. Deng and J. Han, "Torpedo : Topic Periodicity Discovery from Text Data," Next-Generation Analyst III, (2015), 94990A- 94990A-10.
Wang, L., P. Chen and L. Huang, "An Efficient Clustering Algorithm for Large-Scale Topical Web Pages," Proceedings of the 18th ACM Conference on Information and Knowledge Management, (2009), 1851-1854.
Witten, I. H., Text Mining, Practical Handbook of Internet Computing, CRC Press, Florida, 2004.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.