

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

뉴스데이터의 LDA 토픽 분석을 통한 장수군 농촌지역 활성화 사업의 특징 - 관광·생활 키워드를 중심으로 -
Features of the Rural Revitalization Projects in Jang-su County Using LDA Topic Analysis of News Data - Focused on Keyword of Tourism and Livelihood - 원문보기

농촌계획 : 韓國農村計劃學會誌, v.24 no.4, 2018년, pp.69 - 80  

김용진 (서울대학교 협동과정 조경학) ,  손용훈 (서울대학교 환경대학원)

Abstract AI-Helper 아이콘AI-Helper

In this study, we typified the project for revitalizing the rural area through text analysis using news data, and analyzed the main direction and characteristics of the project. In order to examine the factors emphasized among the issues related to the revitalization of rural areas, we used news dat...


AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 일반적으로 연구에서 활용하는 TF-IDF의 경우 단어 분석에 유용하나, 새로운 개념이나 고유명사를 분석함에 있어서 중요도가 과소·과대평가될 수 있다(Lim & Park, 2015). 따라서 본 연구에서는 이러한 한계를 보완하기 위해 TF를 중심으로 토픽모델링을 시행하였다. LDA 분석에는 정확성이 높고 분석의 속도가 개선된 붕괴된 깁스 표집(Collapsed Gibbs Sampling)을 이용한 몬테카를로 마르코프 체인(MCMC)기법(Griffiths &Steyvers, 2004)을 이용하였다.
  • 본 연구는 토픽분석을 통해서 지역에 수행되고 있는 사업을 유형화하고, 유형이 지닌 의미를 파악할 수 있었다. 특히 지역에서 중점적으로 추진하고 있는 사업의 방향성을 살펴볼 수 있다는데 토픽모델링 분석기법의 장점이 나타났다.
  • 뉴스데이터에 나타난 주요 사업과 평가는 정부기관·지방자치단체·사업수행기관 등에서 수행한 평가와 비교할 때 전문성 혹은 객관성이 부족할 수 있지만, 현실 사회를 반영한다는 면에서 큰 의미가 있다. 본 연구에서는 기존의 혼재되어 있던 농촌사업을 유형화하여 개별사업단위 평가와 달리 지역 전체를 대상으로 포괄적 측면에서 농촌지역 활성화 사업을 분석하는 방안을 찾는데 의의가 있다.
  • 본 연구의 목적은 뉴스데이터를 활용한 텍스트분석을 통해서 농촌지역 활성화를 위한 사업을 유형화하고, 그 특징을 해석하는 것이다. 뉴스데이터에 나타난 주요 사업과 평가는 정부기관·지방자치단체·사업수행기관 등에서 수행한 평가와 비교할 때 전문성 혹은 객관성이 부족할 수 있지만, 현실 사회를 반영한다는 면에서 큰 의미가 있다.
  • 분석에 있어서는 텍스트마이닝 기법을 활용하였으며, ‘관광’과 ‘생활’ 키워드에 나타난 주요 사업들에 대해 토픽모델링을 실시하였다. 이를 토대로 본 연구에서는 농촌지역 활성화를 목적으로 수행되는 사업을 토픽별로 유형화하고 토픽에 나타난 사업의 특징을 살펴보았다.
  • 농촌에서 이루어지는 지역 활성화사업은 관광·생활·문화·소득·인구 등 다양한 분야의 사업들이 있다. 이중 본 연구에서는 농촌지역 활성화를 목적으로 시행되고 있는 주요 사업의 특징을 살펴보기 위해 [Table 5] 와 같이 앞서 도출한 농촌지역 활성화에 관한 11개 유형에 포함되는 각각의 사업 수를 정리하였다.

가설 설정

  • 따라서 문서 간에 나타난 단어 사이의 토픽이 잠정적으로 내재한다는 가정 하에 토픽모델링을 사용하였다(Blei, Ng & Jordan, 2003; Steyvers & Griffiths, 2007;Blei, 2011; Wiedemann, 2013; Kim & Baek, 2016).
본문요약 정보가 도움이 되었나요?


핵심어 질문 논문에서 추출한 답변
토픽모델링은 어떤 기술이며, 어떤 장점이 있는가? 토픽모델링은 텍스트마이닝, 네트워크 분석 등 여러 분야에서 널리 사용되어온 머신러닝 기술로 거대한 정보에 내포된 구조, 의미, 패턴을 파악하는 장점이 있다(Blei, Ng & Jordan, 2003; Blei, 2012).
정부에서 시행해온 농촌지역 활성화 관련 사업 4단계는? 정부에서 시행해온 농촌지역 활성화 관련 사업은 시기적으로 마을단위 종합개발(1958~1979) - 농업위주 농촌개발(1980~1990) - 부처별 분산적 농촌개발(1991~2002)- 균형발전을 위한 통합적 농촌개발(2003~현재)의 4단계로 구분할 수 있다(MAFRA, 2016). 이러한 사업들은 농촌의 거점지역인 중심지, 농업활동이 주로 이루어지는 배후농촌지역, 산촌·낙도지역 등 낙후지역을 대상으로 실시되었으며, 2000년을 기준으로 전·후 사업의 특성을 구분할 수 있다(Kim & Son, 2017).
복지서비스 유형에서 분류된 토픽에서는 무엇을 독려하고 있는가? 이 유형에서는 복지사업에 대한 참여를 독려하기 위한 홍보(T12, L10, L11, L15, L17) 및 평가(T10)가 포함되었다. 이 토픽들에 분포한 사업들을 살펴보면 지역 거주민을 중심으로 한 직접적 혜택을 제공(의료비 지원, 수영장 무료개방 등)하는 사업의 참여를 독려하고 있었다.
질의응답 정보가 도움이 되었나요?

참고문헌 (59)

  1. Ahn, S., & Jung, W.(2014). An Analysis of Influence Factors on the Satisfaction of Rural Village Development Projects, The Korean Association for Local Government Studies, 2, 1-34. 

  2. Asuncion, A., Welling, M., Smyth, P., & Teh, Y. W. (2009). On smoothing and inference for topic models. In Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence, AUAI Press. 27-34. 

  3. Barranco, J. & Wisler, D.(1999). Validity and systematicity of newspaper data in event analysis. Eur Sociol Rev, 15(3), 301-322. 

  4. Battisti, F. D., Ferrara, A., & Salini, S.(2015). A decade of research in statistics: a topic model approach. Scientometrics, 103, 413-433. 

  5. Binkley, D., Heinz, D., Lawrie, D., & Overfelt, J.(2014). Understanding LDA in source code analysis. In Proceedings of the 22nd Int'l Conf. on Program Comprehension, ACM. 26-36. 

  6. Blei, D., & Jordan, M.(2003). Modeling annotated data. In Proceedings of the 26th annual international ACM SIGIR conference on Research and development in information retrieval, ACM. 127-134. 

  7. Blei, D.(2011). Introduction to probabilistic topic models. Communications of the ACM, 77-84. 

  8. Blei, D. M.(2012). Probabilistic topic models. Communications of the ACM, 55(4), 77-84. 

  9. Brauer, R. & Dymitrow, M.(2014). Quality of life in rural areas: A topic for the Rural Development policy?. Bulletin of Geography. Socio-economic Series, 25, 25-54. 

  10. Chandra, Y., Jiang, L. C., & Wang, C.(2016). Mining social entrepreneurship strategies using topic modeling. PLoS ONE, 11(3), 1-28. 

  11. Daniel, B.(2015). Big data and analytics in higher education: opportunities and challenges. British Journal of Educational Technology, 46(5), 904-920. 

  12. Ding, W., & Chen, C. (2014). Dynamic topic detection and tracking: A comparison of HDP, C-word, and cocitation methods. Journal of the Association for Information Science and Technology, 65(10), 2084-2097. 

  13. Earl, J., Martin, A., McCarthy, J. D., Soule, S. A.(2004). The use of newspaper data in the study of collective action. Annu Rev Sociol, 30, 65-80. 

  14. Friedman, J. H.(1997). On Bias, Variance, 0/1-Loss, and the Curse of Dimensionality, Data Mining and Knowledge Discovery, 1, 55-77. 

  15. Friedmann, J.(2001). Regional Development and Planning: The Story of a Collaboration, International Regional Science Review, 24(3), 386-395. 

  16. Gan, Q., Zhu, M., Li, M., Liang, T., Cao, Y., & Zhou, B.(2014). Document visualization: an overview of current research. Wiley Interdisciplinary Reviews: Computational Statistics, 6(1), 19-36. 

  17. Geman, S., Bienenstock, E., & Doursat, R.(1992). Neural Networks and the Bias/Variance Dilemma, Neural Computation, 4, 1-58. 

  18. Grant, S., Cordy, J. R., & Skillicorn, D. B. (2013). Using heuristics to estimate an appropriate number of latent topics in source code analysis. Science of Computer Programming, 78(9), 1663-1678. 

  19. Greene, D. & Cross, J. P.(2015). Unveiling the Political Agenda of the European Parliament Plenary: A Topical Analysis. Proceedings of the ACM Web Science Conference, ACM, 2. 

  20. Griffiths, T. L., & Steyvers, M.(2004). Finding scientific topics. Proceedings of the National academy of Sciences, 101(1), 5228-5235. 

  21. Guo, L., Vargo, C. J., Pan, Z., Ding, W., & Ishwar, P. (2016). Big social data analytics in journalism and mass communication: comparing dictionary-based text analysis and unsupervised topic modeling. Journalism & Mass Communication Quarterly, 93(2), 332-359. 

  22. Han, J., & Kamber, M.(2011). Data Mining: Concepts and Techniques, 3rd ed, Morgan Kaufmann Publishers. 

  23. Hannigan, T.(2015). Close encounters of the conceptual kind: disambiguating social structure from text. Big Data & Society, 2(2), 1-6. 

  24. Hastie, T., Tibshirani, R., & Friedman, J. H.(2008). The Elements of Statistical Learning: Data Mining, Inference, and prediction, 2nd ed, New York: Springer. 

  25. Hu, Y., & Li, W.(2011). Document sentiment classification by exploring description model of topical terms. Computer Speech and Language, 25, 386-403. 

  26. Huang, X., Wan, X. & Xiao, J.(2014). Comparative news summarization using concept-based optimization, Knowledge and information systems, 31(3). 391-716. 

  27. Jacobi, C., van Atteveldt, W., & Welbers, K.(2016). Quantitative analysis of large amounts of journalistic texts using topic modeling. Digital Journalism, 4(1), 89-106. 

  28. Jockers, M. L.(2014). Text analysis with R for students of literature. Switzerland: Springer International Publishing. 

  29. Jung, C., & Ahn, J.(2015). A Study on the Recognition of the Residential Environments Connected to Local Central Cities - Focusing on Gyeongnam Area of the West, Residential Environment Institute of Korea, 13(2), 41-52. 

  30. Karl, A., Wisnowski, J., & Rushing, W. H.(2015). A practical guide to text mining with topic extraction. Wiley Interdisciplinary Reviews: Computational Statistics, 7(5), 326-340. 

  31. Kelly, J., & Swindell, D.(2002). Service Quality Variation Across Urban Space: First Steps Toward a Model of Citizen Satisfaction, Journal of Urban Affairs, 24(3), 271-288. 

  32. Kim, E., Ahn, Y., & Lee, M.(2012). An Improvement of Evaluation Indicator System Geared towards Comprehensive Rearrangement Projects in Seats of Township and Town Offices: Based on the Existing Evaluation Indicator System of Small Town Promotion Projects, Korean Institute of Rural Architectures, 14(1), 45-56. 

  33. Kim, J., & Gim, U.(2013). Review and Proposal of Central place Improvement Project in Basic Settlement Area-Centered on Comprehensive Improvement Project of the Seat of Eup(Dong)Myon, JKRDA, 25(4), 133-152. 

  34. Kim, J., & Baek, S.(2016). Analysis of Issues on the College and University Structural Reform Evaluation Using Text Big Data Analytics, Asian Journal of Education, 17(3), 409-436. 

  35. Kim, Y., & Son, Y.(2017). The Residents' Perceptions on the Revitalization Project of Rural Centers Utilizing IPA: The Case of Janggye-myeon of Jangsu-gun, KSRP, 23(3), 133-145. 

  36. Ko, Y.(2009). Typical Development Models for Revitalization of Rural Market Towns, Department of Bio Systems & Rural Engineering, Chonnam National University. 

  37. Lee, S.(2011). An Comparative Analysis on the Regional Economic Effect of the Small Town Revitalization Project, Korean Association for Local Government Studies, 13(1), 31-54. 

  38. Lim, C., Choi, S., & Sim, H.(2009). An Analysis on Spatial Characteristics in the Center Villages of Hub-Myun Site. KSRP, 15(3), 35-46. 

  39. Lim, H., & Park, S.(2015). A Tentative Approach for Regional Futures Strategy with Big Data: Through the Analysis using the Data of SNS and Newspaper. Journal of the Korean Cadastre Information Association, 17(1), 75-90. 

  40. Lucas, C., Nielsen, R. A., Roberts, M. E., Stewart, B. M., Storer, A., & Tingley, D.(2015). Computer-assisted text analysis for comparative politics. Political Analysis, 23(2), 254-277. 

  41. MAFRA(2016). A New Approach to Rural Development. 

  42. MAFRA(2017). A Plan to Develop General Farming and Fishing Villages in 2019. 

  43. Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburghh, C., & Byers, A. H.(2011). Big data: the next frontier for innovation, competition and productivity. McKinsey Global Institute Report. 

  44. Matthies, B., & Corners, A.(2015). Computer-aided text analysis of corporate disclosures-demonstration and evaluation of two approaches. The International Journal of Digital Accounting Research, 15, 69-98. 

  45. Moreno, A., & Redondo, T.(2015). Text analytics: the convergence of big data and artificial intelligence. International Journal of Interactive Multimedia and Artificial Intelligence, 3(6), 57-64. 

  46. Newman, M. E. J.(2004). Fast algorithm for detecting community structure in networks, Phys. Rev. E 69 066133. 

  47. Niedomysl, T. & Amcoff, J.(2011). Is there hidden potential for rural population growth in sweden?, Rural Sociology, 76(2), 257-279. 

  48. Oliver. P. E. & Myer, D. T.(1999). How events enter the public sphere: conflict, location, and sponsorship in local newspaper coverage of public events. Am J Sociol, 105(1), 38-87. 

  49. Park, K., & Lee, H.(2009). Residents' Participation and Satisfaction of the Altered Environment in the Development of Rural Agricultural Area, Korean Institute of Rural Architectures, 11(1), 57-66. 

  50. Park, S., & Kim, Y.(2014). A Study on the Revitalization of the Seat of Myeon for Rural Sustainability: Focusing on the Resident's Perceptions of Seat of Myeon in Jeollanam-do, Architectural Institute of Korea, 16(5), 45-53. 

  51. Paul, M. & Dredze, M.(2012). Factorial LDA: Sparse multi-dimensional text models. Advances in Neural Information Processing Systems, 2582-2590. 

  52. Ready, J., White, M. D. & Fisher, C.(2006). Shock value: a comparative analysis of news reports and official police records on TASER deployments. Policing An Int J Police Strateg Manag. 32(1), 148-170. 

  53. Shumueli, G., Patel, N. R., & Bruce, P. C.(2010). Data Mining for Business Intelligence: Concepts, Techniques, and Applications in Microsoft Office Excel with XLMiner, 2nd ed. New York: Wiley & Sons. 

  54. Shmueli, G., & Koppius, O.(2011). Predictive Analytics in Information Systems Research, MIS Quarterly, 35(3), 553-572. 

  55. Song, M., & Sung, J.(2004). A Study on the Evaluation and Model of participatory Community Development project in Korea, Korea Rural Economic Institute. 

  56. Steyvers, M., & Griffths, T.(2007). Probabilistic topic models. In Landauer, T. K., McNamara, D. S., Dennis, S. & Kintsch, W.(Eds.), Latent Semantic Analysis: A Road to Meaning. (427-448). Mahwah, NJ, US: Lawrence Erbaum Associates Publishers. 

  57. Visvaldis, V., Ainhoa, G. & Ralfs, P.(2013). Selecting indicators for sustainable development of small towns: the case of Valmiera municipality, Procedia Computer Science, 26, 21-32. 

  58. Wiedemann, G.(2013). Opening up to big data: computer-assisted analysis of textual data in social science. Forum Qualitative Social Research, 14(2), Art. 13. 

  59. Zhang, X.-P., Zhou, X.-Z., Huang, H.-K., Feng, Q., Chen, S.-B. & Liu, B.-Y.(2011). Topic model for chinese medicine diagnosis and prescription regularities analysis: case on diabetes. Chinese journal of integrative medicine, 17, 307-313. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트
