$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 토픽 모델링을 이용한 트위터 데이터의 공간 분포 패턴 분석
Spatial Distribution Patterns of Twitter Data with Topic Modeling 원문보기

한국지역지리학회지 = Journal of the Korean Association of Regional Geographers, v.23 no.2, 2017년, pp.376 - 387  

우현지 (한국교원대학교 지리교육과) ,  김영훈 (한국교원대학교 지리교육과)

초록
AI-Helper 아이콘AI-Helper

본 연구는 트위터를 대상으로 트윗 공간 데이터에서 지리적 의미를 탐색하기 위한 방법을 모색하였다. 트윗 공간 데이터의 구축 과정 및 지리적 분석의 프레임워크를 정립하고 지리적 연구 방법론을 제안하였다. 이를 위해 본 연구는 제주도의 GPS 좌표 참조 트윗(geotweet)을 대상으로 트윗의 내용적 특성과 트윗 발생 위치의 공간 분포 특성을 확인하였다. 제주도 좌표 참조 트윗에서는 지명 또는 장소명이 많이 출현하였는데, 이는 자신의 위치를 알리고자하는 의도로 파악하였다. 트윗의 공간 분포는 제주공항을 중심으로 한 일부 관광지 주변으로 핫스팟이 확인되었고, 이는 제주도 유동인구 핫스팟과 유사한 패턴을 보였다. 주제 중심의 트윗 분석을 위해 본 연구에서는 토픽 모델링 알고리즘을 이용하여 분석하였다. 분석 결과, 주제의 지리적 위치와 트윗의 내용은 서로 관련이 있음을 알 수 있었다. 마지막으로 본 연구는 토픽 모델링 분석을 통해 방대한 트윗 데이터의 내용에 상응하는 지역 분포 특성을 직관적으로 확인하는데 유용하게 활용될 수 있다는 것을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

This paper attempts to analyze the geographical characters of Twitter data and presents analysis potentials for social network analysis in geography. First, this paper suggests a methodology for a topic modeling-based approach in order to identify the geographical characteristics of tweets, includin...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구는 소셜빅데이터2) 중 하나인 트위터를 대상으로 공간 정보 데이터 구축 및 지리적 분석의 프레임워크를 정립하고 트윗 공간 데이터의 지리적 연구 방법론을 제안하는 것을 목적으로 하였다. 트윗 데이터는 사용자들의 일상, 의견, 감정, 상황 등이 기록된 텍스트적 정보와 그것이 발생한 위치적 정보가 실시간으로 수집되는 공간 데이터이다.
  • 트윗 데이터는 사용자들의 일상, 의견, 감정, 상황 등이 기록된 텍스트적 정보와 그것이 발생한 위치적 정보가 실시간으로 수집되는 공간 데이터이다. 이러한 트윗의 내용적 특성과 트위터 사용자들의 지리적 위치와의 관련성을 확인하고 온라인 공간에서의 지역 특성을 발견하려는 방법을 연구한다.
  • 본 연구는 트윗 데이터의 위치 정보에 상응하는 트위터 사용자들의 언어적 특성을 주목하였다. 이는 유사한 내용적 정보를 공유하는 사용자의 집합은 그들의 지리적 특성을 반영하는 성향과 관련이 깊다.
  • 본 연구는 대중들의 생각의 속도가 실시간으로 반영되는 소셜빅데이터인 트위터를 대상으로, 그것의 발생하는 위치에 근거하여 내용적 특성에 따른 지역특성을 파악하고자 하였다. 이를 위해 트윗 공간데이터의 지리적 분석 방법론의 프레임워크를 정립하고, 트윗 데이터의 토픽 모델링을 통해 트윗의 주제에 따른 공간 분포를 확인하였다.

가설 설정

  • 이 장에서는 제주도에서 발생된 GPS 좌표가 참조된 트윗(geotweet)을 대상으로 트윗 데이터의 공간 분포 패턴을 분석하였다. 분석에 앞서 트윗을 작성하려는 의도에 따라 위치 정보의 참조 유형이 달라질 것으로 가정하고, 관광객이 많은 제주도는 그들의 정확한 좌표를 참조하여 방문 장소와 관광 행태를 드러내는 트윗을 작성할 것으로 예상하였다. 시기적으로 국회위원 총선과 봄꽃의 개화 시점인 2016년 4월 1일에서 4월 8일까지의 제주도 좌표 참조 트윗 954건을 대상으로 키워드의 출현 빈도를 분석하여 어떤 내용이 주로 언급되었는지 분석하였다.
  • 앞 장에서 제주도의 좌표 참조 트윗은 주로 관광객이 작성하여 지명 및 장소에 대한 내용의 비율이 높다는 것을 확인하였다. 즉, 제주도 트윗에서 추출되는 주제의 내용은 관광 목적, 관광지 특성, 여행자의 행태를 반영할 것으로 가정하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
트위터의 사용자 관련 정보로 어떤 것들을 포함하는가? 이러한 짧은 트윗 텍스트 이면에는 더 많은 메타데이터가 존재한다. 트윗 관련 정보로서 트윗 고유 ID, 트윗 생성 일자, 텍스트, 작성 위치 등이 있고, 사용자 관련 정보로서 사용자 공유 ID, 팔로워 수 등을 포함한다. 사용자의 필요에 따라 위치정보의 참조 여부를 결정할 수 있는데, 모바일의 GPS에서 부여되는 좌표를 참조하는 경우 지리학 연구에서 유용하게 활용될 수 있다(박재희, 2013).
LDA 알고리즘은 잠재적 변수인 주제를 어떻게 학습하는가? , 2003). 이 알고리즘은 문서에서 주제를 추론해내는 확률 분포 모델로서, 하나의 텍스트 내의 단어들의 사용 빈도를 확률적으로 분석하여 잠재적 변수인 주제를 학습한다. LDA는 문서가 가질 수 있는 주제들의 확률 분포와 각 주제에 대한 단어들의 확률 분포를 추론한다(조태민・이지형, 2015).
트윗 데이터란 무엇인가? 본 연구는 소셜빅데이터2) 중 하나인 트위터를 대상으로 공간 정보 데이터 구축 및 지리적 분석의 프레임워크를 정립하고 트윗 공간 데이터의 지리적 연구 방법론을 제안하는 것을 목적으로 하였다. 트윗 데이터는 사용자들의 일상, 의견, 감정, 상황 등이 기록된 텍스트적 정보와 그것이 발생한 위치적 정보가 실시간으로 수집되는 공간 데이터이다. 이러한 트윗의 내용적 특성과 트위터 사용자들의 지리적 위치와의 관련성을 확인하고 온라인 공간에서의 지역 특성을 발견하려는 방법을 연구한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (25)

  1. 강애띠, 2016, 트윗에서 추출한 스트레스 감성과 토픽의 공간적 특성 연구, 이화여자대학교 박사학위논문. 

  2. 강애띠.강영옥, 2015, 타임라인데이터를 이용한 트위터 사용자의 거주 지역 유추방법, 한국공간정보학회지, 23(2), 69-81. 

  3. 구자용, 2015, 공간정보 빅 데이터의 지도화와 공간적 분포 특성에 관한 연구 -서울시 지역의 트윗 데이터를 사례로, 국토지리학회지, 49(3), 349-360. 

  4. 김자연, 2016, Multi-depth LDA 모델을 이용한 마이크로블로그에서의 토픽분석, 고려대학교 석사학위논문. 

  5. 김진만, 2015, 소셜네트워크서비스에서 추출된 감정의 핫스팟 분석: 한국어 트위터와 하둡에코시스템을 중심으로, 상명대학교 박사학위논문. 

  6. 박유경, 2014, 공공기관 소셜미디어의 메타데이터 표준요소 분석, 경북대학교 석사학위논문. 

  7. 박자현.송민, 2013, 토픽모델링을 활용한 국내 문헌정보학 연구동향 분석, 정보관리학회지, 30(1), 7-32. 

  8. 박재희, 2013, SNS데이터의 도시정책지표로서의 활용 가능성 연구: 트윗 데이터의 주거환경 만족에 대한 공간적 특성, 이화여자대학교 석사학위논문. 

  9. 배정환.손지은.송민, 2013, 텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석, 지능정보연구, 19(3), 141-156. 

  10. 신정엽, 2014, 정보 격차의 맥락에서 트윗 데이터의 이론적 고찰과 실증적 공간 탐색: 미국 킹 카운티를 사례로, 한국지도학회지, 14(2), 89-106. 

  11. 오효정.윤보현.최남현.유철중.김용, 2014, 소셜 빅데이터 내용 분석 기반 사용자 그룹별 선호지역 및 이동패턴 시각화, 한국정보기술학회지, 12(12), 195-203. 

  12. 원진영.김대곤, 2014, 텍스트마이닝을 활용한 사회위험 이슈 도출, 한국위기관리논집, 10(7), 33-52. 

  13. 이병혁.이기현.윤지영, 2005, IT와 공간구조의 재구성, 정보통신정책연구원. 

  14. 전철욱(편역), 2016, Building Machine Learning Systems with Python 한국어판(개정판), 에이콘, 서울(Coelho, L. P. and Richert, W., 2013,Building Machine Learning Systems withPython, Packt Publishing, Ltd., Birmingham,UK) 

  15. 조태민.이지형, 2015, LDA모델을 이용한 잠재 키워드 추출, 한국지능시스템학회 논문집, 25(2), 180-185. 

  16. 진설아.허고은.정유경.송민, 2013, 트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구, 정보관리학회지, 30(1), 285-302. 

  17. 최선화.배병걸, 2013, 소셜 빅데이터 재난관리 운영방안 및 이슈 탐지기법 연구, 국립재난안전연구원. 

  18. 하수욱.남광우.류근호, 2012, 마이크로 블로그기반의 공간 지식 추출 기법연구, 한국공간정보학회지, 20(2), 129-136. 

  19. 홍일영, 2015, 국내 지오트윗의 공간분포, 한국지도학회지, 15(2), 93-101. 

  20. Blei, D. M., Ng, A. Y., and Jordan, M. I., 2003, Latent Dirichlet Allocation, Journal of Machine Learning Research, 3, 993-1022. 

  21. Hong, L., and Davison, B. D., 2010, Empirical study of topic modeling in twitter, Proceedings of the First Workshop on Social Media Analytics(SOMA), 80-88. 

  22. Li, L., Goodchild, M. F., and Xu, B., 2013, Spatial, temporal, and socioeconomic patterns in the use of Twitter and Flickr, Cartography and Geographic Information Science, 40(2), 61-77. 

  23. Sui, D., and Goodchild, M., 2011, The convertgence of GIS and social media: challenges for GIScience, International Journal of Geographical Information Science, 29(1), 1737-1748. 

  24. Yin, Z., Cao, L., Han, J., Zhai, C., and Huang, T., 2011, Geographical topic discovery and comparison, Proceedings of the 20th International Conference on World Wide Web, 247-256. 

  25. Zhao, W. X., Jiang, J., Weng, J., He, J., Lim, E. P., Yan, H., and Li, X., 2011, Comparing twitter and traditional media using topic models, European Conference on Information Retrieval, Springer Berlin Heidelberg, 338-349. 

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로