[학위논문]관광지 만족도를 평가하는 관광지 선택속성에 관한 연구 : 텍스트 마이닝과 퍼지셋 질적비교분석의 활용 A research on the tourists’ destination selection attributes and satisfaction : Using text mining and fuzzy-set qualitative comparative analysis원문보기
2020년 국민여행조사에 따르면, 내국인은 여행할 때 자연과 풍경을 감상하는 활동의 비중이 높은 것으로 나타났다. 실제로 자연관광에 대한 국민의 관심과 수요가 높아지고 있으며, 자연관광지는 대한민국의 관광 시장에서도 중요한 부분을 차지하는 것으로 나타났다. COVID-19 상황과 더불어 개인의 심신 회복, 스트레스 완화, 웰빙과 관련있는 자연관광은 국민의 관심사이면서, 동시에 떠오르는 연구의 대상이다. 이에 본 연구는 다양한 관광지 중에서도 국내에서 잘 알려진 자연관광지 5개소를 대상으로 관광지 ...
2020년 국민여행조사에 따르면, 내국인은 여행할 때 자연과 풍경을 감상하는 활동의 비중이 높은 것으로 나타났다. 실제로 자연관광에 대한 국민의 관심과 수요가 높아지고 있으며, 자연관광지는 대한민국의 관광 시장에서도 중요한 부분을 차지하는 것으로 나타났다. COVID-19 상황과 더불어 개인의 심신 회복, 스트레스 완화, 웰빙과 관련있는 자연관광은 국민의 관심사이면서, 동시에 떠오르는 연구의 대상이다. 이에 본 연구는 다양한 관광지 중에서도 국내에서 잘 알려진 자연관광지 5개소를 대상으로 관광지 선택속성과 관광지 만족도 간의 관계를 탐구하였다. 한편, 관광에 대한 동향 파악과 관광객들의 행동 원인을 규명하는 것에 유용한 단서를 제공하는 것 중 하나는 관광지에 대한 온라인 리뷰 데이터이다. 온라인 리뷰는 관광객이 여행 정보를 획득하기 위한 새로운 정보 채널로 인식되고 있으며, 평점만으로 전부 파악하기 어려운 관광지에 대한 구체적이면서 최신의 정보를 제공한다. 따라서, 관광지에 대한 전반적인 만족도를 이해하기 위해서는 방문객의 사실적인 정보와 경험이 담겨있는 온라인 리뷰 데이터를 시의적절하게 활용하는 연구가 진행되어야 한다. 관광지 만족도를 설명하기에 앞서, 우선적으로 요구되는 사항은 관광객이 고려하는 관광지 선택속성을 이해하는 것이다. 이에 본 연구는 보편화된 설문조사 방식에서 벗어나 실시간으로 축적되는 트립어드바이저 리뷰 데이터를 연구에 활용하였다. 연구의 대상이 되는 관광지는 한국관광100선에 5회 연속 선정된 자연관광지 5개소이며, 이는 모두 대한민국을 대표하는 관광지라고 할 수 있다. 여기에는 ① 설악산 국립공원, ② 한라산 국립공원, ③ 순천만습지(순천만국가정원), ④ 남이섬, ⑤ 우도가 포함된다. 본 연구의 진행 절차를 요약하면 다음과 같다. 첫 번째, 한국관광100선에 5회 연속 선정된 자연관광지를 대상으로 텍스트 마이닝을 하여 리뷰 데이터를 수집하고, 명사만 추출하여 빈도 분석을 하였다. 이때, 빈도 높은 단어들은 관광객들이 리뷰를 작성할 때 주로 언급하는 내용이라고 할 수 있다. 빈도 분석을 통해 관광객들이 전반적인 관광지 만족도와 함께 고려하는 사항에 대하여 단어 중심으로 확인하였다. 두 번째, TF-IDF 가중치를 적용한 LDA 토픽모델링을 통해 리뷰 내용에 존재하는 주요 관광지 선택속성(토픽)을 도출하였다. 각각의 관광지마다 여섯 개의 토픽을 도출하였으며, 여기에는 자연관광지 5개소에서 공통으로 도출되는 토픽도 존재하였고, 관광지마다 독특하게 발견되는 토픽도 존재하였다. LDA 토픽모델링 기법을 사용해서 리뷰에 존재하는 핵심 토픽을 파악하는 것은 관광지 방문객들의 전반적인 인식과 이들이 리뷰에서 언급하는 내용을 단어가 아닌 토픽 단위로 이해할 수 있기에 중요하다. 세 번째, FsQCA 분석을 통해 결과변수(관광지 만족도)를 평가하는 원인조건(관광지 선택속성)의 다양한 조합을 확인하였다. 예를 들어, 5점이라는 관광지 만족도 점수가 부여된 리뷰가 10개 있다고 가정했을 때, 이 10개의 리뷰 내용이 모두 동일한 토픽으로 구성되어 있다고 단정하기는 어려울 것이다. 그 이유는 각각의 리뷰 내용을 구성하는 토픽, 그리고 해당 토픽들의 조합이 리뷰마다 다르게 나타날 수 있기 때문이다. 따라서, 동일한 결과(예:관광지 만족도 점수가 5점일 때)를 설명하는 상황에서도 서로 다른 원인조건의 조합이 발생할 수 있는 상황임을 전제해야 한다. 이에 본 연구는 퍼지셋 논리를 적용하였으며, FsQCA 분석에 대한 활용으로 보다 정교한 차원에서 관광지 선택속성과 관광지 만족도 간의 관계를 설명할 수 있었다. 우선, LDA 토픽모델링에서 얻어진 관광지 선택속성(토픽)을 원인조건으로, 관광지 만족도를 결과변수로 하여 필요조건 성립여부를 검증하였다. 다음으로는 관광지 만족도를 결정하는 다양한 원인조건의 조합을 나타내는 진리표를 도출하였다. 진리표를 토대로 관광지 만족도를 평가하는 원인조건조합의 대표 모형을 도출하였으며, 충분조건 검증에서는 표준분석을 사용하여 최적화된 결과를 제시하는 중간 해법을 토대로 결과를 해석하였다. 그 결과, 관광지 만족도를 평가하는 리뷰에서 높은 비중으로 확인되는 원인조건조합의 유형을 확인할 수 있었다. 즉, 이러한 결과는 모형 설명력과 모형 일치도가 높은 모형을 토대로 어떤 관광지 선택속성의 조합으로 인해 관광지 만족도가 평가되는지 설명할 수 있기에 유용하다. 종합하면, 리뷰 데이터는 정성 데이터에 가까우며 만족도 점수는 정량 데이터에 가깝다고 할 수 있다. 이처럼 성격이 다른 두 가지 형태의 데이터를 동시에 활용하는 본 연구의 시도는 관광지 방문객의 만족도를 설명하는 관광지 선택속성의 다양한 조합을 탐색적으로 연구하기 위한 체계적인 연구 절차를 제시하였다는 점에서 의미가 있다. 온라인 리뷰에 드러나는 관광지 선택속성을 밝히는 것뿐만 아니라, FsQCA 분석을 통해 관광지 만족도를 평가하는 관광지 선택속성의 다양한 조합을 제시함으로써 결합된 관점에서 인과관계를 설명하였다. 특히 본 연구는 LDA 토픽모델링에 대한 결과를 FsQCA 분석으로 확장할 수 있는 발전 가능성을 보여주었다.
2020년 국민여행조사에 따르면, 내국인은 여행할 때 자연과 풍경을 감상하는 활동의 비중이 높은 것으로 나타났다. 실제로 자연관광에 대한 국민의 관심과 수요가 높아지고 있으며, 자연관광지는 대한민국의 관광 시장에서도 중요한 부분을 차지하는 것으로 나타났다. COVID-19 상황과 더불어 개인의 심신 회복, 스트레스 완화, 웰빙과 관련있는 자연관광은 국민의 관심사이면서, 동시에 떠오르는 연구의 대상이다. 이에 본 연구는 다양한 관광지 중에서도 국내에서 잘 알려진 자연관광지 5개소를 대상으로 관광지 선택속성과 관광지 만족도 간의 관계를 탐구하였다. 한편, 관광에 대한 동향 파악과 관광객들의 행동 원인을 규명하는 것에 유용한 단서를 제공하는 것 중 하나는 관광지에 대한 온라인 리뷰 데이터이다. 온라인 리뷰는 관광객이 여행 정보를 획득하기 위한 새로운 정보 채널로 인식되고 있으며, 평점만으로 전부 파악하기 어려운 관광지에 대한 구체적이면서 최신의 정보를 제공한다. 따라서, 관광지에 대한 전반적인 만족도를 이해하기 위해서는 방문객의 사실적인 정보와 경험이 담겨있는 온라인 리뷰 데이터를 시의적절하게 활용하는 연구가 진행되어야 한다. 관광지 만족도를 설명하기에 앞서, 우선적으로 요구되는 사항은 관광객이 고려하는 관광지 선택속성을 이해하는 것이다. 이에 본 연구는 보편화된 설문조사 방식에서 벗어나 실시간으로 축적되는 트립어드바이저 리뷰 데이터를 연구에 활용하였다. 연구의 대상이 되는 관광지는 한국관광100선에 5회 연속 선정된 자연관광지 5개소이며, 이는 모두 대한민국을 대표하는 관광지라고 할 수 있다. 여기에는 ① 설악산 국립공원, ② 한라산 국립공원, ③ 순천만습지(순천만국가정원), ④ 남이섬, ⑤ 우도가 포함된다. 본 연구의 진행 절차를 요약하면 다음과 같다. 첫 번째, 한국관광100선에 5회 연속 선정된 자연관광지를 대상으로 텍스트 마이닝을 하여 리뷰 데이터를 수집하고, 명사만 추출하여 빈도 분석을 하였다. 이때, 빈도 높은 단어들은 관광객들이 리뷰를 작성할 때 주로 언급하는 내용이라고 할 수 있다. 빈도 분석을 통해 관광객들이 전반적인 관광지 만족도와 함께 고려하는 사항에 대하여 단어 중심으로 확인하였다. 두 번째, TF-IDF 가중치를 적용한 LDA 토픽모델링을 통해 리뷰 내용에 존재하는 주요 관광지 선택속성(토픽)을 도출하였다. 각각의 관광지마다 여섯 개의 토픽을 도출하였으며, 여기에는 자연관광지 5개소에서 공통으로 도출되는 토픽도 존재하였고, 관광지마다 독특하게 발견되는 토픽도 존재하였다. LDA 토픽모델링 기법을 사용해서 리뷰에 존재하는 핵심 토픽을 파악하는 것은 관광지 방문객들의 전반적인 인식과 이들이 리뷰에서 언급하는 내용을 단어가 아닌 토픽 단위로 이해할 수 있기에 중요하다. 세 번째, FsQCA 분석을 통해 결과변수(관광지 만족도)를 평가하는 원인조건(관광지 선택속성)의 다양한 조합을 확인하였다. 예를 들어, 5점이라는 관광지 만족도 점수가 부여된 리뷰가 10개 있다고 가정했을 때, 이 10개의 리뷰 내용이 모두 동일한 토픽으로 구성되어 있다고 단정하기는 어려울 것이다. 그 이유는 각각의 리뷰 내용을 구성하는 토픽, 그리고 해당 토픽들의 조합이 리뷰마다 다르게 나타날 수 있기 때문이다. 따라서, 동일한 결과(예:관광지 만족도 점수가 5점일 때)를 설명하는 상황에서도 서로 다른 원인조건의 조합이 발생할 수 있는 상황임을 전제해야 한다. 이에 본 연구는 퍼지셋 논리를 적용하였으며, FsQCA 분석에 대한 활용으로 보다 정교한 차원에서 관광지 선택속성과 관광지 만족도 간의 관계를 설명할 수 있었다. 우선, LDA 토픽모델링에서 얻어진 관광지 선택속성(토픽)을 원인조건으로, 관광지 만족도를 결과변수로 하여 필요조건 성립여부를 검증하였다. 다음으로는 관광지 만족도를 결정하는 다양한 원인조건의 조합을 나타내는 진리표를 도출하였다. 진리표를 토대로 관광지 만족도를 평가하는 원인조건조합의 대표 모형을 도출하였으며, 충분조건 검증에서는 표준분석을 사용하여 최적화된 결과를 제시하는 중간 해법을 토대로 결과를 해석하였다. 그 결과, 관광지 만족도를 평가하는 리뷰에서 높은 비중으로 확인되는 원인조건조합의 유형을 확인할 수 있었다. 즉, 이러한 결과는 모형 설명력과 모형 일치도가 높은 모형을 토대로 어떤 관광지 선택속성의 조합으로 인해 관광지 만족도가 평가되는지 설명할 수 있기에 유용하다. 종합하면, 리뷰 데이터는 정성 데이터에 가까우며 만족도 점수는 정량 데이터에 가깝다고 할 수 있다. 이처럼 성격이 다른 두 가지 형태의 데이터를 동시에 활용하는 본 연구의 시도는 관광지 방문객의 만족도를 설명하는 관광지 선택속성의 다양한 조합을 탐색적으로 연구하기 위한 체계적인 연구 절차를 제시하였다는 점에서 의미가 있다. 온라인 리뷰에 드러나는 관광지 선택속성을 밝히는 것뿐만 아니라, FsQCA 분석을 통해 관광지 만족도를 평가하는 관광지 선택속성의 다양한 조합을 제시함으로써 결합된 관점에서 인과관계를 설명하였다. 특히 본 연구는 LDA 토픽모델링에 대한 결과를 FsQCA 분석으로 확장할 수 있는 발전 가능성을 보여주었다.
주제어
#관광지 선택속성 관광지 만족도 온라인 리뷰 텍스트 마이닝 LDA 토픽모델링 퍼지셋 질적비교분석
학위논문 정보
저자
박지원
학위수여기관
세종대학교 대학원
학위구분
국내박사
학과
호텔관광경영학과
지도교수
이형룡
발행연도
2022
키워드
관광지 선택속성 관광지 만족도 온라인 리뷰 텍스트 마이닝 LDA 토픽모델링 퍼지셋 질적비교분석
※ AI-Helper는 부적절한 답변을 할 수 있습니다.