본 연구의 목적은 2004년부터 2017년까지의 해변과 해수욕장을 키워드로 하는 지역신문기사를 이용하여 계절별 현안을 분석하는 것이다. 분석을 위해 오픈소스 프로그램을 기반으로 한 토픽모델링과 시계열회귀분석을 수행하였다. 토픽모델링 분석 결과 계절별 토픽은 봄 35개, 여름 47개, 가을 36개, 겨울 35개가 도출되었다. 모든 계절에서 공통적으로 도출된 주제는 해수욕장, 축제 행사, 사건사고 및 환경문제, 관광지, 개발 분양, 행정 정책, 날씨로 나타났다. 시계열회귀분석 결과 봄에는 35개의 토픽 중 5개의 상승 토픽과 2개의 하락 토픽이 도출되었다. 여름에는 47개의 토픽 중 6개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 가을에는 36개의 토픽 중 4개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 겨울에는 35개의 토픽 중 3개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 그리고 각 계절별로 상승 토픽과 하락 토픽에 해당하지 않는 토픽은 중립 토픽으로 구분하였다. 본 연구를 통해 해변과 같이 계절별로 용도가 다른 경우에 지역현안에 대한 분석을 위해 계절별 토픽모델링을 진행한다면 더욱 유용한 결과를 도출하고 이에 따른 세부적인 진단이 가능하다고 판단된다.
본 연구의 목적은 2004년부터 2017년까지의 해변과 해수욕장을 키워드로 하는 지역신문기사를 이용하여 계절별 현안을 분석하는 것이다. 분석을 위해 오픈소스 프로그램을 기반으로 한 토픽모델링과 시계열회귀분석을 수행하였다. 토픽모델링 분석 결과 계절별 토픽은 봄 35개, 여름 47개, 가을 36개, 겨울 35개가 도출되었다. 모든 계절에서 공통적으로 도출된 주제는 해수욕장, 축제 행사, 사건사고 및 환경문제, 관광지, 개발 분양, 행정 정책, 날씨로 나타났다. 시계열회귀분석 결과 봄에는 35개의 토픽 중 5개의 상승 토픽과 2개의 하락 토픽이 도출되었다. 여름에는 47개의 토픽 중 6개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 가을에는 36개의 토픽 중 4개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 겨울에는 35개의 토픽 중 3개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 그리고 각 계절별로 상승 토픽과 하락 토픽에 해당하지 않는 토픽은 중립 토픽으로 구분하였다. 본 연구를 통해 해변과 같이 계절별로 용도가 다른 경우에 지역현안에 대한 분석을 위해 계절별 토픽모델링을 진행한다면 더욱 유용한 결과를 도출하고 이에 따른 세부적인 진단이 가능하다고 판단된다.
The purpose of this study is to analyze the seasonal issues using the local newspaper articles with the keyword beach from 2004 to 2017. Topic modeling and Time series regression analysis based on open source programs were performed for analysis. Topic modeling results showed 35 topics in spring, 47...
The purpose of this study is to analyze the seasonal issues using the local newspaper articles with the keyword beach from 2004 to 2017. Topic modeling and Time series regression analysis based on open source programs were performed for analysis. Topic modeling results showed 35 topics in spring, 47 topics in summer, 36 topics in autumn and 35 topics in winter. The common themes were 'beaches', 'festivals and events', 'accident and environmental issues', 'tourism', 'development and sale', 'administration and policy' and 'weather'. Time series regression analysis showed in the spring, 5 Hot-Topics and 2 Cold-Topic were found out of the 35 topics. In the summer, 6 Hot-Topics and 3 Cold-Topic were found out of the 47 topics. In the autumn, 4 Hot-Topics and 3 Cold-Topic were found out of the 36 topics. In the winter, 3 Hot-Topics and 3 Cold-Topic were found out of the 35 topics. And for each season, topics that do not fall into the Hot-Topic and Cold-Topic are classified as Neutral-Topic. In this study if seasonal uses are different such as beaches are deemed that seasonal topic modeling for analysis of regional issues will yield more useful results and enable detailed diagnosis.
The purpose of this study is to analyze the seasonal issues using the local newspaper articles with the keyword beach from 2004 to 2017. Topic modeling and Time series regression analysis based on open source programs were performed for analysis. Topic modeling results showed 35 topics in spring, 47 topics in summer, 36 topics in autumn and 35 topics in winter. The common themes were 'beaches', 'festivals and events', 'accident and environmental issues', 'tourism', 'development and sale', 'administration and policy' and 'weather'. Time series regression analysis showed in the spring, 5 Hot-Topics and 2 Cold-Topic were found out of the 35 topics. In the summer, 6 Hot-Topics and 3 Cold-Topic were found out of the 47 topics. In the autumn, 4 Hot-Topics and 3 Cold-Topic were found out of the 36 topics. In the winter, 3 Hot-Topics and 3 Cold-Topic were found out of the 35 topics. And for each season, topics that do not fall into the Hot-Topic and Cold-Topic are classified as Neutral-Topic. In this study if seasonal uses are different such as beaches are deemed that seasonal topic modeling for analysis of regional issues will yield more useful results and enable detailed diagnosis.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
동 연구들은 연구동향, IT, 관광, 생태환경 등 다양한 영역에서 토픽모델링을 활용한 정보의 추출이 가능한 것을 보여준다. 본 연구에서는 이들이 제시하는 토픽모델링을 활용하여 강원도에 소재한 해변과 관련하여 지역 현안을 파악하고자 한다.
본 연구에서는 텍스트마이닝 방법 가운데 하나인토픽모델링으로 지역신문에 적용하여 강원도 지역 해변에 대해 계절별로 부각되고 있는 현안을 분석하고 이를 통해 텍스트마이닝을 통한 해변 관련 계절별 현안분석 가능성을 평가하고자 한다.
제안 방법
마지막으로 겨울에는 35개의 토픽 중 3개의 상승 토픽과 3개의 하락 토픽을 도출하였다. 각 계절별로 상승 토픽과 하락 토픽에 해당하지 않는 토픽은 중립 토픽으로 구분하였다.
둘째, 분석을 위한 전처리 작업으로는 각 언론사별 기사를 하나의 데이터로 통합한 뒤 서로 중복되는 기사를 제거하였다. 그리고 기사 작성 월을 기준으로 계절을 구분하였다. 셋째, 토픽모델링은 웹크롤링과 전처리를 통해 구축한 지역신문 기사 중 본문 내용만 추출하여 단어정제를 진행하였고 토픽모델링을 진행하였다.
첫째, 지역신문 기사 수집을 위한 웹크롤링 작업은 오픈소스 프로그램인 R을 통하여 진행하였다. 둘째, 분석을 위한 전처리 작업으로는 각 언론사별 기사를 하나의 데이터로 통합한 뒤 서로 중복되는 기사를 제거하였다. 그리고 기사 작성 월을 기준으로 계절을 구분하였다.
그리고 수집된 기사 중 본문을 추출하고 작성 월을 기준으로 3~5월은 봄, 6~8월은 여름, 9~11월은 가을, 12~2월은 겨울로 나누어 계절을 구분하고 계절별 토픽모델링과 시계열회귀분석을 진행하였다. 둘째, 토픽모델링을 통해 봄 35개, 여름 47개, 가을 36개, 겨울 35개의 계절별 토픽을 도출하였다. 계절별공통적으로 도출된 주제는 해수욕장, 축제·행사, 사건사고 및 환경문제, 관광지, 개발·분양, 행정·정책,날씨로 나타났다.
본 연구는 ‘해변’과 ‘해수욕장’을 키워드로 검색한 17,931건의 강원도 지역신문 기사를 대상으로 토픽모델링과 시계열회귀분석을 통해 강원도 지역의 해변과 관련한 지역현안을 계절별로 파악하였다.
본 연구에서는 2004년부터 2017년까지 총 14년간의 강원도민일보와 강원일보의 기사 17,931건을 대상으로 토픽모델링과 시계열회귀분석 방법을 활용하여 해변과 관련한 계절별 지역현안을 분석하였다.
Ponweiser(2012)는 harmonic mean을 이용한 토픽 수 선정 기법을 최적의 토픽 수 결정 기법 중 하나라고 제언하였다. 본 연구에서는 비교적 단순하고 효율적인 계산방식을 적용한 harmonic mean 값이 최대가 되는지점을 각 계절별 토픽 수로 선정하였다.1) 봄에 해당하는 토픽 수는 35, 여름에 해당하는 토픽 수는 42, 가을에 해당하는 토픽 수는 36, 겨울에 해당하는 토픽 수는 34로 선정하였다.
본 연구는 ‘해변’과 ‘해수욕장’을 키워드로 검색한 17,931건의 강원도 지역신문 기사를 대상으로 토픽모델링과 시계열회귀분석을 통해 강원도 지역의 해변과 관련한 지역현안을 계절별로 파악하였다. 분석은 웹크롤링, 전처리, 토픽모델링, 시계열회귀분석 단계로 수행하였다. 첫째, 지역신문 기사 수집을 위한 웹크롤링 작업은 오픈소스 프로그램인 R을 통하여 진행하였다.
그리고 기사 작성 월을 기준으로 계절을 구분하였다. 셋째, 토픽모델링은 웹크롤링과 전처리를 통해 구축한 지역신문 기사 중 본문 내용만 추출하여 단어정제를 진행하였고 토픽모델링을 진행하였다. 넷째, 토픽모델링의 결과를 활용하여 연도별 시계열회귀분석을 진행하였다.
연도에 따른 토픽모델링 결과의 변화 추세를 파악하기 위하여 오픈소스 프로그램인 R을 활용하여 시계열회귀분석을 진행하였다. 진행에 앞서 연도 변수는 회귀계수 추정 값의 변동을 줄여 모형의 예측 오류를 개선하기 위해 정규화를 사용하여 값을 재구성하였다. 시계열회귀분석 결과를 통해 각 계절별 토픽의 14년간 연도별 추세를 파악할 수 있었다.
분석은 웹크롤링, 전처리, 토픽모델링, 시계열회귀분석 단계로 수행하였다. 첫째, 지역신문 기사 수집을 위한 웹크롤링 작업은 오픈소스 프로그램인 R을 통하여 진행하였다. 둘째, 분석을 위한 전처리 작업으로는 각 언론사별 기사를 하나의 데이터로 통합한 뒤 서로 중복되는 기사를 제거하였다.
(2018)은 생태-환경-빈곤과 관련한 연구의 부족을 지적하며 1981년부터 2017년까지의 생태, 환경 및 빈곤을 키워드로 하는 4,335개의 간행물을 수집하였다. 토픽모델링을 통해 생물 다양성(Species diversity)과 경제와 환경개발(Economic and environmental development), 건강위험(Health risk),도시빈곤(Urban poverty) 등 9개의 주요토픽을 도출하였다. 이를 통해 향후 관련 연구의 의사결정에 대한 이론적 기초를 제공할 수 있다고 밝혔다.
2014년 ‘해수욕장의 이용 및 관리에 관한 법률’이 제정·시행되면서 최근에는 해수욕장의 표기가 다시 증가하고 있는 추세다. 해수욕장의 명칭 변경과 법률 제정 등의 이유로 시기별로 단어사용이 달라짐에 따라 본 연구에서는 포괄적인 분석을 위해 키워드를 해변과 해수욕장으로 나누어 분석에 이용하였다. <그림 1>은 해변과 해수욕장으로 검색된 연도별 기사 추세를 나타낸다.
대상 데이터
지역신문을 이용하여 해변과 관련한 계절별 현안분석을 수행하기 위해 강원도의 지역신문인 강원도민일보와 강원일보를 대상으로 2004년부터 2017년까지의 기사 중 해수욕장과 해변을 키워드로 하는 기사를 분석대상으로 선정한다.
연구를 통해 도출된 결과는 다음과 같다. 첫째, 오픈소스 프로그램인 R을 활용하여 해수욕장과 해변을 키워드로 하는 17,931건의 기사를 웹크롤링으로 수집하였다. 그리고 수집된 기사 중 본문을 추출하고 작성 월을 기준으로 3~5월은 봄, 6~8월은 여름, 9~11월은 가을, 12~2월은 겨울로 나누어 계절을 구분하고 계절별 토픽모델링과 시계열회귀분석을 진행하였다.
데이터처리
첫째, 오픈소스 프로그램인 R을 활용하여 해수욕장과 해변을 키워드로 하는 17,931건의 기사를 웹크롤링으로 수집하였다. 그리고 수집된 기사 중 본문을 추출하고 작성 월을 기준으로 3~5월은 봄, 6~8월은 여름, 9~11월은 가을, 12~2월은 겨울로 나누어 계절을 구분하고 계절별 토픽모델링과 시계열회귀분석을 진행하였다. 둘째, 토픽모델링을 통해 봄 35개, 여름 47개, 가을 36개, 겨울 35개의 계절별 토픽을 도출하였다.
또한 시계열회귀분석의 유의확률 값이 통계적으로 유의미하며 회귀계수 값이 양수로 나타나는 증가추세의 토픽을 Hot-Topic으로 하고 음수로 나타나는 감소추세의 토픽을 Cold-Topic으로 구분하였다. 그리고 유의확률값이 통계적으로 유의미하지 않고 증감추세가 무의미한 중립토픽을 Neutral-Topic으로 구분하였다.
셋째, 토픽모델링은 웹크롤링과 전처리를 통해 구축한 지역신문 기사 중 본문 내용만 추출하여 단어정제를 진행하였고 토픽모델링을 진행하였다. 넷째, 토픽모델링의 결과를 활용하여 연도별 시계열회귀분석을 진행하였다. 분석과정의 흐름은 <그림 3>과 같다.
시계열회귀분석 결과를 통해 각 계절별 토픽의 14년간 연도별 추세를 파악할 수 있었다. 또한 시계열회귀분석의 유의확률 값이 통계적으로 유의미하며 회귀계수 값이 양수로 나타나는 증가추세의 토픽을 Hot-Topic으로 하고 음수로 나타나는 감소추세의 토픽을 Cold-Topic으로 구분하였다. 그리고 유의확률값이 통계적으로 유의미하지 않고 증감추세가 무의미한 중립토픽을 Neutral-Topic으로 구분하였다.
연도에 따른 토픽모델링 결과의 변화 추세를 파악하기 위하여 오픈소스 프로그램인 R을 활용하여 시계열회귀분석을 진행하였다. 진행에 앞서 연도 변수는 회귀계수 추정 값의 변동을 줄여 모형의 예측 오류를 개선하기 위해 정규화를 사용하여 값을 재구성하였다.
이론/모형
본 연구에서 오픈소스 프로그램인 R을 활용하여 Blei et al.(2003)에 의해 소개된 잠재디리클레할당(Latent Dirichlet Allocation, LDA)모델을 통해 계절별로 구분하여 분석을 수행하였다. 토픽모델링을 위한 R 패키지는 ‘lubridate’, ‘tm’, ‘topicmodels’을 활용하였다.
성능/효과
계절별공통적으로 도출된 주제는 해수욕장, 축제·행사, 사건사고 및 환경문제, 관광지, 개발·분양, 행정·정책,날씨로 나타났다.
계절별로 봄에는 사건사고 및 환경문제와 관광지에 대한 토픽이 다수 도출되었으며 여름에는 해수욕장과 축제·행사에 대한 토픽이 다수 도출되었다.
계절별로 토픽의 수와 토픽의 주제는 다소 차이가 있으나 공통적으로 해수욕장, 축제·행사, 사건사고 및 환경문제, 관광지, 개발·분양, 행정·정책, 날씨로 나타났다.
그리고 가을에는 관광지와 개발·분양에 대한 토픽이 다수 도출되었고 겨울에는 축제·행사와 행정·정책에 대한 토픽이 다수 도출되었다.
박상언(2016)은 방송 미디어와 소셜 미디어간의 연관성을 알아보기 위하여 인기 드라마 5개와 이를 대상으로 작성된 네이버 블로그를 수집하여 토픽모델링 분석을 통한 콘텐츠 분석을 수행하였다. 분석 결과 10개의 토픽을 도출하였고 이 토픽들은 시청률과의 상관관계가 있으며 시청률이 높고 낮음에 따라 다뤄지는 토픽의 차이가 존재함을 밝혔다.
김창식 등(2017)은 국내에 출판된 정보시스템분야 저널의 연구동향을 조사하기 위하여 2002년부터 2016년까지의 관련 논문 초록 1,245편을 대상으로 토픽모델링과 시계열회귀분석을 수행하였다. 분석 결과 도출된 20개의 토픽 중에서 고객충성도, 소통혁신 등 4개의 상승토픽과 시스템구축 등 2개의 하락토픽을 도출하였다.
윤혜진 등(2017)은 지역관광에 관한 논문의 초록에 대해 토픽모델링과 시계열회귀분석을 활용하여 지역관광 분야의 토픽을 추출하고 토픽의 연도별 추세분석을 수행하였다. 분석 결과 도출된 토픽은 20개이며 모두 상승추세를 보이는 상승토픽에 해당된다고 밝혔다.
분석 결과 봄에는 해수욕장-운영(T32), 축제·행사-구성방안(T15), 관광지-강릉(T03), 개발·분양-해양관광개발(T18), 날씨-기온(T27), 대회-아이스하키(T12), 축구(T33)가 통계적으로 유의미한 결과를 나타냈으며 여름에는 해수욕장-범죄(T03), 민원(T31), 쓰레기문제(T37), 축제·행사-삼척(T33),사건사고 및 환경문제-물놀이사고(T10), 재난사고(T19), 개발·분양-양양(T04), 행정·정책-정책도모(T32), 피서-숙박·편의시설(T14)이 통계적으로 유의미한 결과를 나타냈다.
박자현 등(2013)은 문헌정보학 주요 4개 학술지(정보관리학회지, 한국문헌정보학회지, 한국도서관·정보학회지, 한국비블리아학회지)의 발표 논문 초록을 수집하고 토픽모델링 분석을 수행하여 국내 문헌정보학 분야의 연구동향을 규명했다. 분석 결과 정보관리학회지는 정보학 관련 연구주제가 도서관 관련 연구주제보다 많이 출현하였고 한국문헌정보학회지등 3개의 학회지는 이와 반대되는 결과를 보였다고 밝혔다.
우현지 등(2017)은 제주도를 대상으로 Open API를 이용해 제주도의 GPS 좌표 참조 트윗을 대상으로 토픽모델링을 활용해 트위터 데이터의 지리적 분석을 통한 공간분포 패턴을 분석하였다. 분석 결과 지리적 위치와 트윗 내용은 관련이 있으며 토픽모델링 분석은 지역 분포 특성의 직관적 확인에 있어 유용하게 활용될 수 있음을 보여주었다.
김태경 등(2015)은 토픽모델링을 이용하여 인터넷과 모바일 환경에서 금융과 IT가 융합된 핀테크(Fintech) 세부 기술에 대해 Hot topic과 Cold topic을 이용하여 유망기술과 쇠퇴기술을 도출하였다. 분석 결과 추출한 20개의 토픽 중에서 모바일결제, 인증/보안 등 5개의 Hot topic과 주택담보대출, 신용카드결제 등 5개의 Cold topic을 도출하였다.
(2018)은 프랑스에서의 맹수(늑대)의 출현과 이로 인해 벌어지는 지역 거주민과 맹수의 충돌에 대한 1994-2014년 사이 지역신문과 전국신문의 보도내용을 구조적 토픽모델링(Structural Topic Modeling)을 통해 분석하였다. 분석 결과는 맹수와 직접적으로 접촉하는 지역의 신문은 이 문제에 대해 인간중심적 입장의 보도를 한 반면 전국단위 신문은 맹수 측면을 고려한 보도에 치중한 것을 보여주었다.
(2011)은 1829-2008년 사이 미국 텍사스 주에 발간된 지역신문의 기사에 대해 토픽모델링을 적용하여 지역신문이 지역의 역사에 대해 가치 있는 정보를 줄 수 있는지 분석하였다. 분석 결과는 토픽모델링이 자동적으로 추출해낸 토픽들이 지역의 역사를 드러내는데 적절하나 역사가의 추가적 해석 없이는 추출된 토픽들의 상대적 가치를 해석하기 어렵다는 점을 보여주었다.
계절별공통적으로 도출된 주제는 해수욕장, 축제·행사, 사건사고 및 환경문제, 관광지, 개발·분양, 행정·정책,날씨로 나타났다. 셋째, 시계열회귀분석 결과 봄에는 35개의 토픽 중 5개의 상승 토픽과 2개의 하락 토픽을 도출하였다. 여름에는 47개의 토픽 중 6개의 상승 토픽과 3개의 하락 토픽을 도출하였다.
진행에 앞서 연도 변수는 회귀계수 추정 값의 변동을 줄여 모형의 예측 오류를 개선하기 위해 정규화를 사용하여 값을 재구성하였다. 시계열회귀분석 결과를 통해 각 계절별 토픽의 14년간 연도별 추세를 파악할 수 있었다. 또한 시계열회귀분석의 유의확률 값이 통계적으로 유의미하며 회귀계수 값이 양수로 나타나는 증가추세의 토픽을 Hot-Topic으로 하고 음수로 나타나는 감소추세의 토픽을 Cold-Topic으로 구분하였다.
후속연구
계절별로 세분화하여 진행한 토픽모델링과 시계열 회귀분석 결과는 해변과 같이 사계절 용도가 다른 경우에 지역현안을 분석하는데 있어 더욱 유용한 결과를 도출하고 이에 따른 세부적인 진단이 가능하다고 판단된다. 각 지역의 자치단체에서는 계절별로 도출된 Cold-Topic과 Neutral-Topic보다는 Hot-Topic에 대한 대응 및 개선방안을 강구한다면 지역 현안을 보다 원활하게 해결할 수 있을 것으로 판단된다. 또한 설문조사와 의견수렴 등의 질적 현안분석 방법에 비해 웹크롤링을 이용한 토픽모델링 분석 방법은 경제적·시간적 절약을 기대할 수 있고 좀 더 객관적인 결과를 도출할 수 있다고 판단된다.
본 연구에서는 지역신문기사 자료를 활용하여 계절별 토픽모델링과 시계열회귀분석을 진행하였는데 강원도민일보와 강원일보 2개의 언론사를 활용한 점은 분석 자료의 다양성이 부족하다는 한계점을 가진다. 또한 본 연구에서 활용된 잠재디리클레할당(LDA)은 토픽 수 선정에 따라 분석 결과가 크게 달라진다는 한계가 있다.
또한 설문조사와 의견수렴 등의 질적 현안분석 방법에 비해 웹크롤링을 이용한 토픽모델링 분석 방법은 경제적·시간적 절약을 기대할 수 있고 좀 더 객관적인 결과를 도출할 수 있다고 판단된다.
향후 연구 진행시 중앙지 혹은 강원도지역의 여타 지역 언론기사, 타 지역의 언론기사와 같은 보다 다양한 지역신문기사 자료를 활용하고 데이터에 따라 적절한 토픽 수가 선정되는 디리클레 프로세스(Dirichlet Process) 혹은 계층적 디리클레 프로세스(Hierarchical Dirichlet Process)를 토픽모델링에 적용한다면 더욱 다양하고 의미 있는 결과를 얻을 수 있을 것으로 판단된다. 또한 토픽모델링 분석 이후 지역 간의 연계 및 주제 간의 연계 등이 가능한 사회연결망분석(Social Network Analysis, SNA)을 활용한다면 좀 더 다양한 분석 결과의 시각적 표현이 가능할 것으로 판단된다.
본 연구에서는 지역신문기사 자료를 활용하여 계절별 토픽모델링과 시계열회귀분석을 진행하였는데 강원도민일보와 강원일보 2개의 언론사를 활용한 점은 분석 자료의 다양성이 부족하다는 한계점을 가진다. 또한 본 연구에서 활용된 잠재디리클레할당(LDA)은 토픽 수 선정에 따라 분석 결과가 크게 달라진다는 한계가 있다.
향후 연구 진행시 중앙지 혹은 강원도지역의 여타 지역 언론기사, 타 지역의 언론기사와 같은 보다 다양한 지역신문기사 자료를 활용하고 데이터에 따라 적절한 토픽 수가 선정되는 디리클레 프로세스(Dirichlet Process) 혹은 계층적 디리클레 프로세스(Hierarchical Dirichlet Process)를 토픽모델링에 적용한다면 더욱 다양하고 의미 있는 결과를 얻을 수 있을 것으로 판단된다. 또한 토픽모델링 분석 이후 지역 간의 연계 및 주제 간의 연계 등이 가능한 사회연결망분석(Social Network Analysis, SNA)을 활용한다면 좀 더 다양한 분석 결과의 시각적 표현이 가능할 것으로 판단된다.
질의응답
핵심어
질문
논문에서 추출한 답변
현안분석방법의 단점은?
그러나 설문조사나 의견수렴과 같은 현안분석방법은 기획하는 담당자의 가치판단과 사안의 경중에 대한 주관적 판단에 따라 그 범위가 좁혀질 수 있다는 단점이 있다. 반면 최근 문헌 빅데이터를 이용한 텍스트마이닝 방법은 분석자의 주관을 최소화하면서 방대한 문헌을 분석하여 문헌들의 내용을 효과적으로 분석할 수 있는 기술적 환경을 제공한다.
지역신문과 전국신문의 구조적 토픽모델링 분석 결과는 무엇인가?
(2018)은 프랑스에서의 맹수(늑대)의 출현과 이로 인해 벌어지는 지역 거주민과 맹수의 충돌에 대한 1994-2014년 사이 지역신문과 전국신문의 보도내용을 구조적 토픽모델링(Structural TopicModeling)을 통해 분석하였다. 분석 결과는 맹수와 직접적으로 접촉하는 지역의 신문은 이 문제에 대해 인간중심적 입장의 보도를 한 반면 전국단위 신문은 맹수 측면을 고려한 보도에 치중한 것을 보여주었다.
해변을 가진 자치단체가 해당 지역 관리를 위해 필요한 것은?
해변을 가진 자치단체가 해당지역을 효과적으로 관리하기 위해 필요한 것은 해변과 관련한 현안을 지속적으로 발굴하고 대응방안을 고안하는 것이다. 현안 발굴은 설문조사나 해변 이용자를 포함한 다양한 이해관계자의 의견수렴 등을 통해 이루어질 수 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.