SNS 등 온라인에 쏟아지는 고객의 감성분석을 활용하여 마케팅 등 다양한 분야에서 성과를 내고 있다. 고객의 제품사용 후기 데이터를 수집하여 신제품의 마케팅 전략과 제품개선 방안을 도출하고 있으며, 선거철에는 유권자들의 마음을 실시간으로 읽어서 선거 전략을 수립하고 있다. 본 연구에서는 온라인 상에서 충북관광에 관한 글들을 수집하여 텍스트 마이닝 기법을 활용하여 분석함으로써 충북관광을 위한 홍보전략과 관광진흥 정책을 수립하는 방안을 제시한다. 사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북전역의 관광지를 대상으로 한다. 분석결과 충청북도 북부지역의 관광지들이 주요 이슈 관광지로 나타났으며, 관광지별로 연관 관광지와 연관 키워드들이 분석되었다. 또한, 주요 관광지별 감성분석을 통하여 긍/부정 현황과 그 원인을 파악할 수 있도록 하였다. 특히 이들 분석에 다차원 분석 기법을 연계함으로써 관광관련 텍스트 정보를 다각도로 분석하여 전략을 수립하는데 활용할 수 있도록 하였다.
SNS 등 온라인에 쏟아지는 고객의 감성분석을 활용하여 마케팅 등 다양한 분야에서 성과를 내고 있다. 고객의 제품사용 후기 데이터를 수집하여 신제품의 마케팅 전략과 제품개선 방안을 도출하고 있으며, 선거철에는 유권자들의 마음을 실시간으로 읽어서 선거 전략을 수립하고 있다. 본 연구에서는 온라인 상에서 충북관광에 관한 글들을 수집하여 텍스트 마이닝 기법을 활용하여 분석함으로써 충북관광을 위한 홍보전략과 관광진흥 정책을 수립하는 방안을 제시한다. 사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북전역의 관광지를 대상으로 한다. 분석결과 충청북도 북부지역의 관광지들이 주요 이슈 관광지로 나타났으며, 관광지별로 연관 관광지와 연관 키워드들이 분석되었다. 또한, 주요 관광지별 감성분석을 통하여 긍/부정 현황과 그 원인을 파악할 수 있도록 하였다. 특히 이들 분석에 다차원 분석 기법을 연계함으로써 관광관련 텍스트 정보를 다각도로 분석하여 전략을 수립하는데 활용할 수 있도록 하였다.
With the development of mobile devices and Internet, information exchange has actively been made through SNS and Blogs. Blogs are widely used as a space where people share their experience after their visit to tourist attractions. We propose a method of recommending associated tourist attractions ba...
With the development of mobile devices and Internet, information exchange has actively been made through SNS and Blogs. Blogs are widely used as a space where people share their experience after their visit to tourist attractions. We propose a method of recommending associated tourist attractions based on tourists' opinions using issue analysis, association analysis, and sentimental analysis for various online reviews including news in order to help to develop tour products and policies. The result shows that north area of Chungbuk province has been selected as issue attractions, and associated attractions/keywards have been identified for given well-known attraction. Positive/negative opinion for review texts has been analyzed and user can grasp the reason for the sentiments. Multidimensional analysis technique has been integrated to derive additional sophisticated insights and various policy proposal for smart tourism.
With the development of mobile devices and Internet, information exchange has actively been made through SNS and Blogs. Blogs are widely used as a space where people share their experience after their visit to tourist attractions. We propose a method of recommending associated tourist attractions based on tourists' opinions using issue analysis, association analysis, and sentimental analysis for various online reviews including news in order to help to develop tour products and policies. The result shows that north area of Chungbuk province has been selected as issue attractions, and associated attractions/keywards have been identified for given well-known attraction. Positive/negative opinion for review texts has been analyzed and user can grasp the reason for the sentiments. Multidimensional analysis technique has been integrated to derive additional sophisticated insights and various policy proposal for smart tourism.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
마지막으로 관광 빅데이터를 저장하고 관리할 수 있는 확장성 있는 방안을 제시하고, 적절한 범위의 데이터를 수집, 저장, 분석하는 프로토타입 시스템을 구축한다. 그리고, 분석결과가 도청 및 산하기관의 관광관련 부서의 주요 업무와 연계되어 시너지 효과를 창출할 수 있도록 하기 위함이다. 특히, 가시화를 통하여 분석결과가 의미하는 바를 직관적으로 표출할 수 있도록 한다.
다음으로 관광 키워드들 사이의 연관분석을 통하여 패키지 관광 등을 기획하는데 근거자료를 제시하도록 한다. 어떤 관광지들이 함께 언급되는지? 어떤 관광지와 어떤 키워드 (예, 식당이나 인접 관광지 등)가 연관성이 높은지를 파악하여 패키지로 묶는 관광 상품을 개발하는데 유용할 것이다.
본 논문에서는 온라인상에서 충북관광에 관한 글들을 수집하여 텍스트 마이닝 기법을 활용하여 분석함으로써 충북관광을 위한 홍보 전략과 관광 진흥 정책을 수립하는 방안을 제시한다. 사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북 전역의 관광지를 대상으로 한다.
본 연구에서는 연관성 분석을 다차원 분석과 결합하여 더욱 세분화된 분석결과를 도출하도록 한다. Figure 4.
본 논문에서는 충청북도 전체 관광지를 대상으로 관련 데이터를 온라인, 오프라인 상에서 수집하고 이슈분석, 연관분석, 감성분석을 수행하였다. 특히, 지역별 (시군별, 관광지별), 계절별 (혹은 월별), 주제별로 다차원 분석과 연계하여 분석함으로써 더욱 세밀한 인사이트를 도출하고자 하였다. 이슈분석 결과 북부지역의 관광지에 대한 관심이 대부분이었으며, 중부, 남부 순서로 관심도가 높았다.
제안 방법
다음으로 비정형 데이터는 자체 웹 크롤러를 구축하여 수집하였다.
또한, 수집된 온라인 글을 대상으로 온라인상에서 관광객의 선호 및 불만사항을 분석하여 충북 관광자원의 서비스 개선 방안 제시한다. 충북도내에는 350여개의 관광지가 있으며, 관광지별로, 계절별로 긍/부정으로 구분하여 제시함으로써 개선을 유도한다.
마지막으로 관광 빅데이터를 저장하고 관리할 수 있는 확장성 있는 방안을 제시하고, 적절한 범위의 데이터를 수집, 저장, 분석하는 프로토타입 시스템을 구축한다. 그리고, 분석결과가 도청 및 산하기관의 관광관련 부서의 주요 업무와 연계되어 시너지 효과를 창출할 수 있도록 하기 위함이다.
본 논문의 주요 연구내용은 다음과 같다. 먼저 온라인상의 이슈 분석을 통해 충북의 각 지역별 특화된 관광자원 개발 정책 방향 제시한다. 이슈 분석을 위해 데이터 웨어하우스 구축을 통한 다차원 분석을 수행하고, 전체/지역/테마/채널별로 상위 빈도를 차지하는 관광명소와 이슈를 분석해 낸다.
본 논문에서는 충청북도 관광 데이터를 다양한 온라인 소스 (뉴스, 블로그)로부터 추출하여 관광 이슈 분석, 연관 분석, 감성 분석을 수행하였다. 이슈분석 결과 충북 관광명소는 북부권 위주의 관광명소가 온라인상에서 이슈화 되고 있음을 알 수 있었으며, 남부권의 경우 언급 빈도가 현저히 떨어져 홍보의 필요성이 제기되고 있다.
본 논문에서는 충청북도 전체 관광지를 대상으로 관련 데이터를 온라인, 오프라인 상에서 수집하고 이슈분석, 연관분석, 감성분석을 수행하였다. 특히, 지역별 (시군별, 관광지별), 계절별 (혹은 월별), 주제별로 다차원 분석과 연계하여 분석함으로써 더욱 세밀한 인사이트를 도출하고자 하였다.
1은 본 연구의 전체 프로세스를 보여준다. 본 연구는 자체 웹 크롤러를 이용하여 비정형 데이터 (뉴스, 블로그)를 수집하고, 이를 공공 데이터와 통합하여 충북 관광의 이슈, 연관 키워드, 감성분석을 수행한다. 분석결과의 시각화를 통하여 직관적인 의사결정을 지원하도록 한다.
이는 남부 및 중부지역 관광지를 이슈화할 필요가 높음을 의미한다. 연관분석 결과 관광지간에 연관성과 관광지-관광키워드 (예: 숙식) 사이의 연관성을 분석하여 관광 패키지화가 가능한 근거자료를 제시하였다. 또한, 이슈분석과 연관분석에 여러 차원을 연계하여 다차원 분석을 수행한 결과 계절별로, 지역별로 어떤 이슈가 있는지, 어떤 연관관계가 있는지 확인할 수 있었고, 이를 바탕으로 더욱 세밀한 관광정책 수립이 가능하게 된다.
먼저 온라인상의 이슈 분석을 통해 충북의 각 지역별 특화된 관광자원 개발 정책 방향 제시한다. 이슈 분석을 위해 데이터 웨어하우스 구축을 통한 다차원 분석을 수행하고, 전체/지역/테마/채널별로 상위 빈도를 차지하는 관광명소와 이슈를 분석해 낸다. 충북 관광자원에 대한 도·내외 사람들의 온라인상의 관심사를 분석하여 이슈관광 명소를 계절별로, 지역별로 도출해낸다.
충북 관광자원에 대한 도·내외 사람들의 온라인상의 관심사를 분석하여 이슈관광 명소를 계절별로, 지역별로 도출해낸다.
5와 같다. 충북관광과 관련된 블로그, 뉴스 데이터를 수집하여 데이터베이스로 구축하고, 연관분석과 이슈 및 긍/부정 분석을 수행한 후, 그 결과를 시각화 라이브러리인 d3.js를 이용하여 php 서버에서 구현하였다. 클라이언트 어플리케이션은 구글 맵을 이용하여 구현하였으며, 분석결과는 PC 뿐 아니라 스마트폰에서도 볼 수 있도록 하였다.
js를 이용하여 php 서버에서 구현하였다. 클라이언트 어플리케이션은 구글 맵을 이용하여 구현하였으며, 분석결과는 PC 뿐 아니라 스마트폰에서도 볼 수 있도록 하였다.
대상 데이터
본 논문에서는 충청북도 주요 관광지에 대한 긍/부정 의견을 온라인에서 수집하여 분석하였다. Figure 4.
블로그 및 뉴스에서 충북 관광명소 (381개)를 대상으로, 언급 빈도를 분석한 결과는 다음 Table 4.1과 같이 나타났다. 빈도 분석 결과, 뉴스 또는 블로그에서 언급이 많은 관광명소는 충주호 (Chungjuho Lake), 제천 의림지 (Jecheon Uirimji), 제천 청풍호(Jecheon Cheongpung Lake) 순이며, 10개의 상위 관광명소 중에 자연 및 휴양 관광자원이 절반 이상을 차지하는 것으로 보아, 충북관광에서 자연 관광명소에 관한 언급이 많다는 것을 알 수 있다.
본 논문에서는 온라인상에서 충북관광에 관한 글들을 수집하여 텍스트 마이닝 기법을 활용하여 분석함으로써 충북관광을 위한 홍보 전략과 관광 진흥 정책을 수립하는 방안을 제시한다. 사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북 전역의 관광지를 대상으로 한다. 특히 다차원 분석 기법을 연계함으로써 관광관련 텍스트 정보를 다각도로 분석하여 전략을 수립하는데 활용할 수 있도록 한다.
성능/효과
1과 같이 나타났다. 빈도 분석 결과, 뉴스 또는 블로그에서 언급이 많은 관광명소는 충주호 (Chungjuho Lake), 제천 의림지 (Jecheon Uirimji), 제천 청풍호(Jecheon Cheongpung Lake) 순이며, 10개의 상위 관광명소 중에 자연 및 휴양 관광자원이 절반 이상을 차지하는 것으로 보아, 충북관광에서 자연 관광명소에 관한 언급이 많다는 것을 알 수 있다.
이슈분석 결과 충북 관광명소는 북부권 위주의 관광명소가 온라인상에서 이슈화 되고 있음을 알 수 있었으며, 남부권의 경우 언급 빈도가 현저히 떨어져 홍보의 필요성이 제기되고 있다. 아울러 대청호 주변 개발 제한 구역을 청정관광구역으로 개발함으로써 수자원 보호와 관광 증진을 동시에 해결할 필요가 있음을 알 수 있었다. 북부권의 경우 충북의 대표 관광명소인 충주호를 중심으로 인접 관광명소를 연계 육성하고, 남부권의 경우 온라인 홍보 등을 통하여 자연경관 등 대표관광명소를 홍보하는 것이 필요한 것으로 나타났다.
연관 키워드 및 연관 관광명소를 분석한 결과 제천·단양은 당일 코스로 여러 관광명소들을 방문하는 것으로 나타났으며, 충주는 1박 2일 코스로 충주호 주변의 캠핑장을 이용하며 충주호, 유람선 등 충주권역 내에서만 관광을 하는 것으로 나타났다 (Figure 4.3).
특히, 지역별 (시군별, 관광지별), 계절별 (혹은 월별), 주제별로 다차원 분석과 연계하여 분석함으로써 더욱 세밀한 인사이트를 도출하고자 하였다. 이슈분석 결과 북부지역의 관광지에 대한 관심이 대부분이었으며, 중부, 남부 순서로 관심도가 높았다. 이는 남부 및 중부지역 관광지를 이슈화할 필요가 높음을 의미한다.
본 논문에서는 충청북도 관광 데이터를 다양한 온라인 소스 (뉴스, 블로그)로부터 추출하여 관광 이슈 분석, 연관 분석, 감성 분석을 수행하였다. 이슈분석 결과 충북 관광명소는 북부권 위주의 관광명소가 온라인상에서 이슈화 되고 있음을 알 수 있었으며, 남부권의 경우 언급 빈도가 현저히 떨어져 홍보의 필요성이 제기되고 있다. 아울러 대청호 주변 개발 제한 구역을 청정관광구역으로 개발함으로써 수자원 보호와 관광 증진을 동시에 해결할 필요가 있음을 알 수 있었다.
왼쪽부분의 그래프는“관광교통 및 정보”측면에서 시간의 흐름에 따른 긍/부정 의견의 추이를 나타내고, 그 다음은 “관광시설 및 안내시설” 측면에서 긍/부정의 추이를 보여주고 있다. 전체적으로 충주호는 오른쪽 부분에서 자연경관 및 관광명소 측면에서 만족도가 매우 높은 관광지임을 나타나고 있다.
후속연구
향후에 교통 데이터(버스 혹은 택시) 분석을 추가하여 주요 관광지 버스배차 간격 개선과 노선조정 등에 활용할 수 있을 것이다. 또한 충북 관광명소의 경우 각 관광명소의 특색을 나타내는 기념품이 없는 상황이므로 충북의 관광 수입을 증가시키기 위한 충북 관광명소 만의 특색 있는 기념품 개발 등 대안이 제시되어야 할 것이다.
연관분석 결과 관광지간에 연관성과 관광지-관광키워드 (예: 숙식) 사이의 연관성을 분석하여 관광 패키지화가 가능한 근거자료를 제시하였다. 또한, 이슈분석과 연관분석에 여러 차원을 연계하여 다차원 분석을 수행한 결과 계절별로, 지역별로 어떤 이슈가 있는지, 어떤 연관관계가 있는지 확인할 수 있었고, 이를 바탕으로 더욱 세밀한 관광정책 수립이 가능하게 된다.
최근 들어 정부 3.0을 계기로 공공 빅데이터 개방이 시작되었고, 빅데이터 기술도 점차 안정적으로 확산되고 있어 향후 빅데이터를 활용한 관광 활성화에 연구가 활발하게 진행될 것으로 판단된다. 개방되는 공공데이터의 질적인 차원의 문제는 여전히 해결되어야 할 과제로 지적되고 있으나 이제 수집 가능한 수많은 자료를 어떻게 의미 있는 정보로 전환할지에 대한 고민이 필요한 시점이다.
사용된 데이터는 주요 블로그, 뉴스, 관광관련 공공 데이터 등이며, 충북 전역의 관광지를 대상으로 한다. 특히 다차원 분석 기법을 연계함으로써 관광관련 텍스트 정보를 다각도로 분석하여 전략을 수립하는데 활용할 수 있도록 한다.
행정선례 답습 또는 관행에 따른 정책수립에서 탈피하여 민간 및 공공기관이 보유하고 있는 다양한 정형·비정형의 빅데이터를 분석하여 과학적인 정책 수요조사 및 관광정책을 발굴·수립할 수 있으며, 민간·공공 데이터의 융·복합 분석을 통한 효용성 및 가능성을 도출할 수 있기 때문에 이러한 추세는 앞으로 더욱 강조될 것으로 보인다.
향후 과제로는 통신사 등의 이동정보 데이터를 추가 활용하여 관광객 유입경로와 충북 내 이동경로 분석, 카드사용정보 등과 연계한 관광수익성 분석 등이 통합 분석되면 더욱 효과적이고 세밀한 관광정책 수립이 가능해 질 것이다. 가장 중요한 것은 본 연구의 결과가 일회성이 아니라 지속적으로 도출 되도록 하는 것이다.
도내 11개의 관광명소 감성분석 결과 공통적으로 나타난 불만사항은 대중교통을 이용하는 사람들이 관광명소 입구까지 가는데 시간이 오래 걸려 타 지역의 다른 관광명소를 택하는 경우가 있었으므로 관광명소의 교통 및 서비스 개선이 필요하다 (예: 자전거 등의 새로운 관광수단 도입). 향후에 교통 데이터(버스 혹은 택시) 분석을 추가하여 주요 관광지 버스배차 간격 개선과 노선조정 등에 활용할 수 있을 것이다. 또한 충북 관광명소의 경우 각 관광명소의 특색을 나타내는 기념품이 없는 상황이므로 충북의 관광 수입을 증가시키기 위한 충북 관광명소 만의 특색 있는 기념품 개발 등 대안이 제시되어야 할 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
연관분석은 어떤 형태들로 분석될 수 있는가?
연관분석은 관광 명소별 연관성 분석, 관광명소-키워드 연관성 분석, 다차원 분석과 결합한 연관분석 등 다양한 형태로 분석될 수 있다. Figure 4.
빅데이터를 활용한 관광 활성화에 연구가 활발하게 진행될 것으로 판단되는 배경은 무엇인가?
최근 들어 정부 3.0을 계기로 공공 빅데이터 개방이 시작되었고, 빅데이터 기술도 점차 안정적으로 확산되고 있어 향후 빅데이터를 활용한 관광 활성화에 연구가 활발하게 진행될 것으로 판단된다. 개방되는 공공데이터의 질적인 차원의 문제는 여전히 해결되어야 할 과제로 지적되고 있으나 이제 수집 가능한 수많은 자료를 어떻게 의미 있는 정보로 전환할지에 대한 고민이 필요한 시점이다.
빅데이터 기술이 공공기관에도 다양하게 활용되는 추세가 앞으로 더욱 강조될 것으로 보이는 이유는 무엇 때문인가?
최근 정보통신기술의 발달에 따라 빅데이터 기술이 공공기관에서도 다양하게 활용되고 있다. 행정선례 답습 또는 관행에 따른 정책수립에서 탈피하여 민간 및 공공기관이 보유하고 있는 다양한 정형·비정형의 빅데이터를 분석하여 과학적인 정책 수요조사 및 관광정책을 발굴·수립할 수 있으며, 민간·공공 데이터의 융·복합 분석을 통한 효용성 및 가능성을 도출할 수 있기 때문에 이러한 추세는 앞으로 더욱 강조될 것으로 보인다. 국민권익위원회, 한국관광공사 등에서 공공 데이터를 통합 분석하여 통찰력을 발견하는 것이 그 예이다.
참고문헌 (7)
Cho, W. S. (2014). Demand Survey of tourism administrative and policy suggestion using Big Data, Research Report, Chungbuk National University & Chungcheongbukdo, Korea.
Do, H. Y., Lee, A. J. and Lee, C. W. (2013a). The study of restaurant service quality, customer satisfaction and nationality by big-data analysis. Journal of Food Service Management Society of Korea, 16, 49-70.
Do, H. Y. and Ryu, K. S. (2013b). The effect of restaurant service quality and customer satisfaction recommendation behavior by big-data analysis. Journal of Food Service Management Society of Korea, 16, 233-255.
Kong, H. S. and Song, E. J. (2013). A study on hotel CRM(Customer Relationship Management) using big data and security. Convergence Security Journal, 13, 69-75.
Lee, Y. J. and Yoon, J. H. (2014). A study on utilizing SNS big data in the tourism studies : Based on an analysis of key words for tourism information search. International Journal of Tourism and Hospitality Research, 28, 5-14.
Lee, Y. J., Jung, H. K. and Bu, S. H. (2010). Evaluation of the publicity on eTourism information : Focused on the portal site 'N'. Journal of Tourism & Leisure Research, 22, 389-408.
Moon, J. W. (2013). The utilization of ICT and implication for development of tour service: Based on case analysis of Korea and other countries. Korea Information Society Development Institute, 25, 1-35.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.