$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

텍스트 마이닝 기법을 활용한 동남권 신공항 신문기사 분석
Analysis of News Regarding New Southeastern Airport Using Text Mining Techniques 원문보기

스마트미디어저널 = Smart media journal, v.6 no.1, 2017년, pp.47 - 53  

한무명초 (계명대학교 경영정보학과) ,  김양석 (계명대학교 경영정보학과) ,  이충권 (계명대학교 경영정보학과)

초록
AI-Helper 아이콘AI-Helper

사회적 이슈는 정책의 방향을 결정하는 중요한 요인이며, 신문은 사회적 이슈를 반영하는 중요한 채널이다. 신문기사의 텍스트를 분석하는 것은 사회적 이슈를 이해하는 데 기여할 수 있지만, 대규모의 비정형 데이터인 뉴스를 수작업으로 분석하는 것은 매우 어렵다. 따라서 본 연구는 텍스트 분석기법과 연관분석 기법을 활용해 비정형 신문기사 내용을 정형화하여 사회적 이슈의 이해관계자들 간 관점 차이를 시스템적으로 분석하는 것을 목적으로 한다. 본 연구 수행을 위해 각 지역을 대표하는 신문사(조선일보, 중앙일보, 동아일보, 매일신문, 부산일보)를 선정한 후 기사 115건과 댓글 6,772건을 2주간 수집하여 분석하였다. 연구 결과 전국 일간지들은 해당 지역과 정치적인 관계에 초점을 맞춘 반면에, 지역 일간지들은 속해 있는 지자체를 대변하는 논조로 기사가 작성된 측면이 강하게 나타났다.

Abstract AI-Helper 아이콘AI-Helper

Social issues are important factors that decide government policy and newspapers are critical channels that reflect them. Analysing news articles can contribute to understanding social issues, but it is very difficult to analyse the unstructured large volumes of news data manually. Therefore, this s...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구는 각 신문사의 논조와 독자들의 의견을 객관적인 데이터로 보여주기 위해 빈도분석, 연관분석, 시각화를 사용했다는 점에서 학문적 기여를 하였다. 그러나 본 연구는 단어 수준의 분석만을 수행하였다는 한계가 있다.
  • 본 연구는 비정형 데이터인 신문기사 내용을 정형화해 서로 다른 이해당사자들의 관심 표현의 차이를 세 가지 유형(전국일간지, 대구 지방지, 부산 지방지)의 신문사별 기사 내용과 독자들의 댓글을 바탕으로 분석하였다. 이를 위해 신공항 부지선정 결과와 관련해 전국 일간지인 조선일보, 중앙일보, 동아일보와 이해당사 지역 일간지인 매일신문과 부산일보의 기사와 댓글의 콘텐츠 분석과 연관분석을 하고, 분석 결과의 시각화를 제시하였다.
  • 사회적 이슈에 대해 이해관계자들은 서로 다른 입장을 가질 수 있으며, 소통 채널에 따라 다른 표현을 사용할 수 있다. 이 문제에 대한 실증적 분석을 위해 본 연구에서는 신공항 선정과 관련된 뉴스와 댓글을 분석하였다. 이를 위해 각 지역을 대표하는 언론사를 선정한 후 뉴스와 댓글을 수집하여 다음과 같은 연구를 수행하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
TF-IDF의 사용목적은 무엇인가? TF-IDF는 TF와 IDF를 곱한 값으로 문서 그룹이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한가를 나타내기 위해 사용한다. 이를 이용하여 검색 엔진에서 검색 결과의 순위를 결정하거나, 문서에서 핵심어를 추출하거나, 문서들 사이의 비슷한 정도를 측정하기 위해 사용한다[11,12,13].
텍스트 마이닝을 위한 분석 방법에는 무엇이 있는가? 텍스트 마이닝은 분석 목적에 따라 벡터, 행렬, 계층 등의 다양한 형태로 표현될 수 있지만, 일반적으로 벡터공간모델을 사용한다[8,9]. 텍스트 마이닝을 위한 분석 방법에는 감성 분석(Sentiment Analysis), 정보 추출(Information Extraction), 네트워크 분석(Network Analysis), 텍스트 분류(Classification), 텍스트 군집화(Clustering) 등이 있다[10].
텍스트 마이닝이란 무엇인가? 텍스트 마이닝은 자연어 처리 기술을 기반으로 직접적인 연관을 보여주지 않는 비정형 텍스트에서 숨겨진 관계 또는 패턴을 도출하여 의미 있고 활용 가치가 높은 정보 또는 지식을 창출하는 기법이다[6,7]. 텍스트 마이닝은 분석 목적에 따라 벡터, 행렬, 계층 등의 다양한 형태로 표현될 수 있지만, 일반적으로 벡터공간모델을 사용한다[8,9].
질의응답 정보가 도움이 되었나요?

참고문헌 (21)

  1. I.H. Witten, "Text Mining, Practical Handbook of Internet Computing, " CRC Press. 2004. 

  2. M.A. Hearst, "Untangling Text Data Mining", Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics. 1999. 

  3. R.J. Mooney and R. Bunescu, "Mining Knowledge from Text using Information Extraction," ACM SIGKDD Exploration Newletter, vol. 7, no. 1, pp. 3-10, Jun. 2005. 

  4. F. Sebastiani, "Machine Learning in Automated Text Categorization," ACM Computing Surveys, vol. 34, no. 1, pp. 1-47, 2002. 

  5. F. Sebastiani, "Classification of Text, Automatic," The Encyclopedia of Language and Linguistics, vol. 14, pp. 457-462, 2006. 

  6. P. Judita, M. Stevenson, and R. Gaizauskas, "Exploring relation types for literature-based discovery," Journal of the American Medical Informatics Association, ocv002, pp. 987-992, May. 2015. 

  7. F. Ronen and I. Dagan, "Knowledge Discovery in Textual Databases (KDT)," Proceedings of the First International Conference on Knowledge Discovery and Data Mining, vol. 95, pp. 112-117, 1995. 

  8. S. Gerard, A. Wong, and C.S. Yang, "A Vector Space Model for Automatic Indexing, " Communications of the ACM, vol. 18, no. 11, pp. 613-620, Nov. 1975. 

  9. S. Anna, P. Andritsos, and N. Nicoloyannis, "Overview and Semantic Issues of Text Mining," ACM SigMod Record, vol. 36, No.3, pp. 23-34, Sep. 2007. 

  10. W. Fan, L. Wallace, S. Rich, & Z. Zhang, Tapping the power of text mining. Communications of the ACM, vol. 49, no. 9, pp. 76-82, 2006. 

  11. https://ko.wikipedia.org/wiki/TF-IDF 2016. 9. 19. 검색 

  12. H. Jiawei, J. Pei, and M. Kamber, "Data mining: Concepts and Techniques," 3rd Edition, Morgan Kaufmann Publishers, 2011. 

  13. J.H. Park and S. Min, "A Study on The Research Trends in Library & Information Science in Korea Using Topic Modeling," Journal of the Korean Society for information Management, vol. 30, no. 1, pp. 7-32, 2013. 

  14. R. Paul and Kroeger, "Analyzing Grammar: An Introduction," Cambridge University Press, 2005. 

  15. 서강수, "데이터 분석 전문가 가이드", 한국데이터베이스진흥원, 2014. 

  16. 노형남, "워드 클라우드에 의한 환대 경영 전략," 관광연구, 제29권, 제4호, pp. 335-354, 2014. 

  17. T. Hammond, T. Hannay, B. Lund, and J. Scott, Social bookmarking tools (I), A general review. D-Lib Magazine, vol. 11, no. 4, 2005. 

  18. P. Abhinn, "Study and Analysis of K-Means Clustering Algorithm Using Rapidminer," International Journal of Engineering Research and Applications, vol. 1, no. 4, pp. 60-64, Dec. 2014. 

  19. A. Kumar, P. Thakur, K. Gupta, and A. Pal, "Text mining approach to analyse the relation between obesity and breast cancer data, " International Letters of Natural Sciences, vol. 44, no. 1, pp. 1-9, 2015. 

  20. 강대국, 박용태, "리뷰 기반의 모바일 서비스 고객 요구사항 특성 분석," 한국경영과학회 추계학술대회, 방위사업청 무기체계 시험평가 세미나 논문집, pp. 945-951, 2012. 

  21. 정기선, "지역감정과 지역갈등인식의 변화 1988년과 2003년 비교," 한국사회학, 제39권, 제2호, pp. 69-99, 2005. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로