공유경제 기반의 고객리뷰를 이용한 토픽모델링 분석: 공유주차를 중심으로 A Study on Analysis of Topic Modeling using Customer Reviews based on Sharing Economy: Focusing on Sharing Parking원문보기
본 연구에서는 공유경제의 다양한 비즈니스 모델 중 공유주차로 범위를 제한하고, 이와 관련된 리뷰를 수집한 후 텍스트마이닝 분석을 통해 공유주차가 갖고 있는 사회적 이슈와 소비자 인식에 대해 살펴보고자 한다. 본 실험에서는 TFIDF (Term frequency inverse document frequency) 기법과 LDA (Latent dirichlet allocation) 기법을 이용하여 키워드별 토픽을 추출하여 분석한 결과 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 지자체 협약, 주차공간협소, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 본 연구는 정성적 연구, 기업 및 지역의 사례를 이용하여 기존의 탐색적 연구를 수행한 선행 연구와는 차별화된 연구로 학술적 기여도가 높다고 할 수 있다. LDA 분석을 본 연구에 활용하여 나타난 결과를 바탕으로 지역경제 활성화를 위한 공유경제 정책 수립에 응용하거나 활용할 수 있다는 실무적 기여도가 있다.
본 연구에서는 공유경제의 다양한 비즈니스 모델 중 공유주차로 범위를 제한하고, 이와 관련된 리뷰를 수집한 후 텍스트마이닝 분석을 통해 공유주차가 갖고 있는 사회적 이슈와 소비자 인식에 대해 살펴보고자 한다. 본 실험에서는 TFIDF (Term frequency inverse document frequency) 기법과 LDA (Latent dirichlet allocation) 기법을 이용하여 키워드별 토픽을 추출하여 분석한 결과 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 지자체 협약, 주차공간협소, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 본 연구는 정성적 연구, 기업 및 지역의 사례를 이용하여 기존의 탐색적 연구를 수행한 선행 연구와는 차별화된 연구로 학술적 기여도가 높다고 할 수 있다. LDA 분석을 본 연구에 활용하여 나타난 결과를 바탕으로 지역경제 활성화를 위한 공유경제 정책 수립에 응용하거나 활용할 수 있다는 실무적 기여도가 있다.
This study will examine the social issues and consumer awareness of sharing parking through the method text mining. In this experiment, the topic by keyword was extracted and analyzed using TFIDF (Term frequency inverse document frequency) and LDA (Latent dirichlet allocation) technique. As a result...
This study will examine the social issues and consumer awareness of sharing parking through the method text mining. In this experiment, the topic by keyword was extracted and analyzed using TFIDF (Term frequency inverse document frequency) and LDA (Latent dirichlet allocation) technique. As a result of categorization by topic, citizens' complaints such as local government agreements, parking space negotiations, parking culture improvement, citizen participation, etc., played an important role in implementing shared parking services. The contribution of this study highly differentiated from previous studies that conducted exploratory studies using corporate and regional cases, and can be said to have a high academic contribution. In addition, based on the results obtained by utilizing the LDA analysis in this study, there is a practical contribution that it can be applied or utilized in establishing a sharing economy policy for revitalizing the local economy.
This study will examine the social issues and consumer awareness of sharing parking through the method text mining. In this experiment, the topic by keyword was extracted and analyzed using TFIDF (Term frequency inverse document frequency) and LDA (Latent dirichlet allocation) technique. As a result of categorization by topic, citizens' complaints such as local government agreements, parking space negotiations, parking culture improvement, citizen participation, etc., played an important role in implementing shared parking services. The contribution of this study highly differentiated from previous studies that conducted exploratory studies using corporate and regional cases, and can be said to have a high academic contribution. In addition, based on the results obtained by utilizing the LDA analysis in this study, there is a practical contribution that it can be applied or utilized in establishing a sharing economy policy for revitalizing the local economy.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
첫째, 본 연구에서는 공유주차 서비스를 이용하는 고객리뷰 데이터와 지역정보 데이터를 수집한다. 고객에 대한 정보는 개인정보보호를 위해 수집이 불가피하지만 온라인상에서 고객이 직접 작성한 주관적인 의견을 내포하고 있는 리뷰는 수집이 가능하여 고객리뷰를 바탕으로 데이터마이닝 연구를 진행하고자 한다. 또한, 지역 정보 데이터는 공공기관에서 공공데이터를 통해 공개하고 있으며, 활용 가치가 매우 높기 때문에 본 연구에 필요한 데이터는 통계청을 통해 수집한다.
즉, 이 연구를 통해 공유주차에 대한 소비자들이 원하는 니즈에 대한 인식을 살펴볼 수 있었고, 공유주차와 관련된 비즈니스가 많이 시행되고 있지만, 아직까지도 몇몇 지역에 국한되어있거나 전국적으로 활성화가 되지 않고 있음을 본 연구를 통해 확인할 수 있었다. 또한, 키워드들의 분석으로 향후 공유주차서비스의 발전 방향성을 제시하는 함의를 제공하고 있다.
실제 데이터를 활용한 통계적 분석 및 데이터공학적 접근이 필요한 시점이다. 본 연구에서는 공유경제의 다양한 비즈니스 모델 중 공유주차로 범위를 제한하고, 이와 관련된 리뷰를 수집한 후 텍스트마이닝 분석을 통해 공유주차가 갖고 있는 사회적 이슈와 소비자 인식에 대해 살펴보고자 한다.
제안 방법
예를들어, 서울특별시의 경우 서울, 서울시, 서울특별시 등 다양한 키워드를 사용하므로 지역명을 지칭하는 키워드를 기준으로 유사어를 선별하여 추출하였다. 그리고 경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남 등의 키워드를 기준으로 선별하고 추출하였다.
또한, 지역 정보 데이터는 공공기관에서 공공데이터를 통해 공개하고 있으며, 활용 가치가 매우 높기 때문에 본 연구에 필요한 데이터는 통계청을 통해 수집한다. 둘째, 수집된 데이터로부터 빅데이터 분석에 기반한 실증연구를 진행하기 위해 텍스트마이닝 기법을 적용하여 연구의 질적 수준을 높이고자 한다. 텍스트마이닝 기법에서 가장 많이 사용되고 있는 TFIDF (Term frequency inverse document frequency) 기법과, 시각화 분석을 시행한다.
고객리뷰에서는 많은 지역정보를 포함하고 있었지만, 실질적으로 광고 혹은 홍보성이 강한 리뷰들이 대부분인 것을 파악할 수 있었다. 따라서 2차적으로 전처리과정이 필요하여 좀 더 세분화된 분석을 위해 추출된 문서들을 정제한 후 공유주차와 지역정보가 포함된 문장만을 추출하여 분석을 시행하였다. 추출된 문장의 수는 총 7,126개로 파악할 수 있었으며, 특정 단어들을 추출한 후 영향력을 높일 수 있는 TFIDF기법을 적용하고 시각화 분석을 시행하였다.
1 버전으로 tm, lda, LDAvis 등의 패키지를 사용하였다. 먼저 토픽모델링 기법을 적용하기 위해 혼잡도를 계산하여 K 값을 구하고, 토픽의 수를 결정한다. Blei et al.
본 실험에서는 먼저 6,000개의 고객리뷰 데이터를 개별적으로 문서화하고, 지역정보가 포함된 문서를 추출하였다. Table 2는 블로그에서 검색된 지역명을 키워드로 추출한 결과이며 워드클라우드로 시각화한 결과는 Fig.
본 실험에서는 빈도분석과 TFIDF 기법을 이용한 시각화 분석을 시행하고, LDA 토픽모델링 기법을 이용하여 키워드별 토픽을 추출하여 분석하였다. 분석결과, 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 Table 3의 정리에서 언급한 바와 같이 고객리뷰와 지역정보를 바탕으로 공유주차 서비스와 관련된 소비자들 선호 키워드들을 확인할 수 있었다.
본 연구는 공유경제 시장에서 공유주차 서비스를 이용한 고객들의 리뷰와 지역정보를 수집하여 분석를 진행하였다. 고객리뷰는 서비스를 이용한 고객들의 후기를 이용함으로써 주관적인 경험을 바탕으로 공유주차 서비스에 대한 직접적인 영향에 대해 파악할 수 있었으며, 지역정보를 포함한 리뷰에서 지역적 특성까지 고려할 수 있는 효과적인 데이터라는 것을 본 연구를 통해 알 수 있었다.
본 연구에서 분석을 위해 사용된 프로그램은 R 3.6.1 버전으로 tm, lda, LDAvis 등의 패키지를 사용하였다. 먼저 토픽모델링 기법을 적용하기 위해 혼잡도를 계산하여 K 값을 구하고, 토픽의 수를 결정한다.
본 연구에서는 데이터를 수집하기 위해 Python 3.8 버전에서 제작한 크롤러로 모듈인 셀레니엄 (Selenium)과 Python내에 html로 작성된 문서들을 파싱하기 위해 BeautifulSoup 라이브러리를 이용하여 사진 및 동영상을 제외한 텍스트 기반의 웹크롤링으로 진행하였다. 수집된 데이터는 약 18개월 (2018년 1월 부터 2019년 6월 까 지)동안 작성된 고객 리뷰이다.
예를 들어, ‘상주’ 혹은 ‘영주’라는 지역정보를 포함하고 있는 문장을 추출할 수 있지만 실질적으로 ‘노상주자창’이나 ‘공영주차장’이라는 단어가 포함되어 있는 문장이 추출되는 오류가 발생한다. 본 연구에서는 이점을 고려하여 시각화 분석을 포함한 전 처리를 시행하였다. 시각화 기법은 주로 데이터 마이닝을 분석하는데 있어 전처리 단계에 사용되며, 잘못된 수치값, 결측값 등을 찾아줌으로써 데이터 클리닝을 도와준다.
지역정보와 고객리뷰의 출현빈도를 기준으로 혼잡도를 계산하여 K 값을 산출한 후 키워드를 선정하였으며, 추출된 상위권 키워드를 바탕으로 해당 토픽을 쉽게 이해할 수 있는 특성을 가진 단어로 설정하였다 (Lee and Kil, 2019). 본 연구에서는 기존 연구방법을 활용한 혼잡도 계산시 토픽의 범위를 5개부터 50개로 실험한 결과에서 토픽의 수가 30개일 때 최적의 결과임을 확인할 수 있었다.
텍스트마이닝 기법에서 가장 많이 사용되고 있는 TFIDF (Term frequency inverse document frequency) 기법과, 시각화 분석을 시행한다. 최종적으로 토픽분석을 위한 LDA (Latent dirichlet allocation) 토픽모델링 기법을 활용하여 확률분포에 따른 키워드와 토픽들을 추출하여 분석하는 연구를 진행한다. 본 연구의 결과를 바탕으로 공유주차로부터 파생되는 경제적 효익은 정보불균형으로 인한 사회적 비용 절감 효과와 공유주차와 관련한 신규 일자리 및 정책 창출이 발생될 수 있을 것이다.
따라서 2차적으로 전처리과정이 필요하여 좀 더 세분화된 분석을 위해 추출된 문서들을 정제한 후 공유주차와 지역정보가 포함된 문장만을 추출하여 분석을 시행하였다. 추출된 문장의 수는 총 7,126개로 파악할 수 있었으며, 특정 단어들을 추출한 후 영향력을 높일 수 있는 TFIDF기법을 적용하고 시각화 분석을 시행하였다. 분석결과는 Fig.
둘째, 수집된 데이터로부터 빅데이터 분석에 기반한 실증연구를 진행하기 위해 텍스트마이닝 기법을 적용하여 연구의 질적 수준을 높이고자 한다. 텍스트마이닝 기법에서 가장 많이 사용되고 있는 TFIDF (Term frequency inverse document frequency) 기법과, 시각화 분석을 시행한다. 최종적으로 토픽분석을 위한 LDA (Latent dirichlet allocation) 토픽모델링 기법을 활용하여 확률분포에 따른 키워드와 토픽들을 추출하여 분석하는 연구를 진행한다.
대상 데이터
LDA 토픽모델링 기법을 이용하여 추출된 키워드들 중 수도권을 제외한 지역인 대전시, 대구시, 아산시 등의 키워드가 추출되었고, 응암동, 은평구, 북한산 등과 같은 소규모 단위의 지역구도 언급되었다. 즉, 일부 지역에서 공유주차관련 사업이 시행되고 있다는 것을 파악할 수 있었지만, 지역에서는 공유주차 서비스가 필요함에도 불구하고, 사업이 시행되지 않고 있는 것으로 본 실험을 통해 확인할 수 있었다.
고객에 대한 정보는 개인정보보호를 위해 수집이 불가피하지만 온라인상에서 고객이 직접 작성한 주관적인 의견을 내포하고 있는 리뷰는 수집이 가능하여 고객리뷰를 바탕으로 데이터마이닝 연구를 진행하고자 한다. 또한, 지역 정보 데이터는 공공기관에서 공공데이터를 통해 공개하고 있으며, 활용 가치가 매우 높기 때문에 본 연구에 필요한 데이터는 통계청을 통해 수집한다. 둘째, 수집된 데이터로부터 빅데이터 분석에 기반한 실증연구를 진행하기 위해 텍스트마이닝 기법을 적용하여 연구의 질적 수준을 높이고자 한다.
2와 같이 데이터 수집을 시작에서 결과분석까지 순서대로 서술한다. 본 연구에서는 데이터를 수집하기 위해 선정한 국내 포털사이트 네이버 (Naver)로 선정하였다. 2019년 포털사이트 이용 행태 조사에 따르면 우리나라 국민이 가장 많이 이용하는 포털사이트는 네이버로 전체 응답자의 94.
하지만 네이버에서는 블로그 검색시 최대 1,000개까지 제공하고 있으며, ‘공유주차’라는 키워드를 검색하여 월별로 1,000 건씩 총 18,000건에 해당하는 데이터를 수집하였다. 본 연구에서는 수집된 데이터를 분석하기 위해 총 18,000건 중 6,000건 (2019년 1월 부터 2019년 6월 까지)에 해당하는 고객리뷰를 사용하였다. 지역정보에 대한 데이터는 통계청에서 제공하는 데이터를 활용하였다.
또한 페이스북, 카카오스토리, 인스타그램, 트위터 등의 SNS 역시 소비자들이 많이 이용하고 있다. 소비자들이 주로 이용하는 SNS는 본 연구에서는 특성상 데이터 수집이 어려울뿐만 아니라 짧은글 혹은 중복글이 대부분을 차지고 있다는 단점이 있지만 블로그는 소비자들의 주관적인 의견을 내포하고 있다는 장점이 있어서 본 연구에서는 블로그를 데이터 수집대상으로 선정하였다.
8 버전에서 제작한 크롤러로 모듈인 셀레니엄 (Selenium)과 Python내에 html로 작성된 문서들을 파싱하기 위해 BeautifulSoup 라이브러리를 이용하여 사진 및 동영상을 제외한 텍스트 기반의 웹크롤링으로 진행하였다. 수집된 데이터는 약 18개월 (2018년 1월 부터 2019년 6월 까 지)동안 작성된 고객 리뷰이다. 2018년도 기준으로 검색된 블로그의 수는 63,157개이며, 2019년 1 월부터 6월까지 검색된 블로그의 수는 38,342개 로 파악할 수 있었다.
본 연구에서는 수집된 데이터를 분석하기 위해 총 18,000건 중 6,000건 (2019년 1월 부터 2019년 6월 까지)에 해당하는 고객리뷰를 사용하였다. 지역정보에 대한 데이터는 통계청에서 제공하는 데이터를 활용하였다. 대한민국은 서울특별시, 부산광역시, 세종특별자치시, 제주특별자치도 등의 특·광역시와 8개의 지역으로 나눌 수 있으며, 각 지역의 행정구역으로 소재지(시군구)별로 분류하고, 경기도의 경우 수원시, 성남시, 용인시 등 31개의 행정구역으로 분류되어 있다.
본 연구의 분석방법과 연구진행은 다음과 같다. 첫째, 본 연구에서는 공유주차 서비스를 이용하는 고객리뷰 데이터와 지역정보 데이터를 수집한다. 고객에 대한 정보는 개인정보보호를 위해 수집이 불가피하지만 온라인상에서 고객이 직접 작성한 주관적인 의견을 내포하고 있는 리뷰는 수집이 가능하여 고객리뷰를 바탕으로 데이터마이닝 연구를 진행하고자 한다.
하지만 네이버에서는 블로그 검색시 최대 1,000개까지 제공하고 있으며, ‘공유주차’라는 키워드를 검색하여 월별로 1,000 건씩 총 18,000건에 해당하는 데이터를 수집하였다.
성능/효과
본 연구는 공유경제 시장에서 공유주차 서비스를 이용한 고객들의 리뷰와 지역정보를 수집하여 분석를 진행하였다. 고객리뷰는 서비스를 이용한 고객들의 후기를 이용함으로써 주관적인 경험을 바탕으로 공유주차 서비스에 대한 직접적인 영향에 대해 파악할 수 있었으며, 지역정보를 포함한 리뷰에서 지역적 특성까지 고려할 수 있는 효과적인 데이터라는 것을 본 연구를 통해 알 수 있었다.
분석 결과 추출된 토픽을 통하여 지자체 협약, 주차공간협소, 시민의식, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 또한, 공유주차와 관련한 많은 서비스 사업이 진행되고 있지만 아직까지도 수도권과 일부지역에서만 서비스가 이루어지고 있다는 것을 본 연구의 분석을 통해 확인할 수 있었다.
마지막으로 토픽 10에서는 예정, 전통, 솔루션, 추가, 체결, 그린, 자치구, 연결, 공원, 규제 등의 키워드가 추출되었으며, “주차공간확보”라 명명하였다.
지역정보와 고객리뷰의 출현빈도를 기준으로 혼잡도를 계산하여 K 값을 산출한 후 키워드를 선정하였으며, 추출된 상위권 키워드를 바탕으로 해당 토픽을 쉽게 이해할 수 있는 특성을 가진 단어로 설정하였다 (Lee and Kil, 2019). 본 연구에서는 기존 연구방법을 활용한 혼잡도 계산시 토픽의 범위를 5개부터 50개로 실험한 결과에서 토픽의 수가 30개일 때 최적의 결과임을 확인할 수 있었다. 최종적으로 30개의 토픽별 키워드에 대한 결과에서 공유주차와 지역정보를 포함하고 있으면서 가장 관련성이 높은 상위 10개의 토픽을 선정한 결과는 Table 3과 같다.
분석 결과 추출된 토픽을 통하여 지자체 협약, 주차공간협소, 시민의식, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 또한, 공유주차와 관련한 많은 서비스 사업이 진행되고 있지만 아직까지도 수도권과 일부지역에서만 서비스가 이루어지고 있다는 것을 본 연구의 분석을 통해 확인할 수 있었다.
토픽 8과 토픽 9는 “시민참여”라 명명하였고, 추출된 키워드는 저렴, 방식, 무료, 계획, 데이터, 결제, 도입, 기업 등이 추출되었고, 지역정보로는 은평구, 북한산, 응암동 등이 나타나는 것을 확인할 수 있었다. 즉, 수도권의 일부 지역에서는 현재 공유주차 플랫폼 서비스의 활성화로 시민들의 참여도가 높아지고 있다는 것을 파악할 수 있었고, 시민들이 모바일 앱의 활용으로 주자창을 이용하고 결제까지 이루어지고 있다는 것을 파악할 수 있었으 며, 시민의 참여가 높아지고 있다는 것을 예측 할 수 있었다.
분석결과, 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 Table 3의 정리에서 언급한 바와 같이 고객리뷰와 지역정보를 바탕으로 공유주차 서비스와 관련된 소비자들 선호 키워드들을 확인할 수 있었다. 즉, 이 연구를 통해 공유주차에 대한 소비자들이 원하는 니즈에 대한 인식을 살펴볼 수 있었고, 공유주차와 관련된 비즈니스가 많이 시행되고 있지만, 아직까지도 몇몇 지역에 국한되어있거나 전국적으로 활성화가 되지 않고 있음을 본 연구를 통해 확인할 수 있었다. 또한, 키워드들의 분석으로 향후 공유주차서비스의 발전 방향성을 제시하는 함의를 제공하고 있다.
LDA 토픽모델링 기법을 이용하여 추출된 키워드들 중 수도권을 제외한 지역인 대전시, 대구시, 아산시 등의 키워드가 추출되었고, 응암동, 은평구, 북한산 등과 같은 소규모 단위의 지역구도 언급되었다. 즉, 일부 지역에서 공유주차관련 사업이 시행되고 있다는 것을 파악할 수 있었지만, 지역에서는 공유주차 서비스가 필요함에도 불구하고, 사업이 시행되지 않고 있는 것으로 본 실험을 통해 확인할 수 있었다. 통계청에서 주차와 관련한 자료에 의하면 전국적으로 많은 주차 면수를 보유하고 있지만 주차면을 효율적으로 활용할 수 있는 방안은 아직까지도 모색중에 있으며, 일부 지역에서만 공유주차 서비스가 활용 되고 있다는 것을 파악할 수 있었다.
토픽 2는 “플랫폼 서비스”라 명명하였으며, 주차 플랫폼 서비스 기업은 공유주차 서비스 이용자들에게 스마트폰의 활용으로 위치정보를 제공하고 앱을 통해 편의를 제공하고 있다는 것을 예측할 수 있었다.
토픽 3은 “주차공간협소”라 명명하였으며, 추출된 키워드에서는 주차면, 주차난, 지역, 해결, 공간, 실시간, 서울시 등 인구밀집지역 혹은 주택밀집지역과 같은 곳에서 주차공간의 부족으로 이용자들의 불편을 겪고 있다는 것을 유추할 수 있었다.
토픽 7은 “주차문화개선”이라 명명하여 지역적으로 공유주차관리 센터 구축을 통해 주차문제를 해결하고 수익을 창출시켜 지역경제 활성화를 위한 주차문화를 개선해야 한다는 것을 예측할 수 있었다.
토픽 8과 토픽 9는 “시민참여”라 명명하였고, 추출된 키워드는 저렴, 방식, 무료, 계획, 데이터, 결제, 도입, 기업 등이 추출되었고, 지역정보로는 은평구, 북한산, 응암동 등이 나타나는 것을 확인할 수 있었다.
후속연구
또한, 향후 본 연구를 바탕으로 공유경제의 활성화라는 측면에서 유휴자원의 효율적인 이용과 공유경제의 더 나은 발전을 위한 방향을 모색할 수 있을 것이며, 정보 비대칭으로 발생하는 사회적 비용의 절감 효과를 얻을 수 있을 것이다. 연구의 결과를 통해 나타난 토픽과 키워드들은 향후 분석에서 핵심 키워드로 재사용될 수 있으며, 비즈니스 측면에서 주차 플랫폼 서비스의 확장과 새로운 공유주차 관련 사업 시행에 응용되어 활용될 것으로 사료된다.
본 연구는 정성적 연구, 기업 및 지역의 사례를 이용하여 기존의 탐색적 연구를 수행한 선행 연구와는 차별화된 연구로 학술적 기여도가 높다고 할 수 있다. LDA분석을 본 연구에 활용하여 나타난 결과를 바탕으로 지역경제 활성화를위한 공유경제 정책 수립에 응용하거나 활용할 수 있다는 실무적 기여도가 있다.
본 연구를 통해 사용자들에게 효율적이고 효과적인 유용한 정보를 제공해 줄 수 있을 것이라 기대된다.
최종적으로 토픽분석을 위한 LDA (Latent dirichlet allocation) 토픽모델링 기법을 활용하여 확률분포에 따른 키워드와 토픽들을 추출하여 분석하는 연구를 진행한다. 본 연구의 결과를 바탕으로 공유주차로부터 파생되는 경제적 효익은 정보불균형으로 인한 사회적 비용 절감 효과와 공유주차와 관련한 신규 일자리 및 정책 창출이 발생될 수 있을 것이다.
또한, 향후 본 연구를 바탕으로 공유경제의 활성화라는 측면에서 유휴자원의 효율적인 이용과 공유경제의 더 나은 발전을 위한 방향을 모색할 수 있을 것이며, 정보 비대칭으로 발생하는 사회적 비용의 절감 효과를 얻을 수 있을 것이다. 연구의 결과를 통해 나타난 토픽과 키워드들은 향후 분석에서 핵심 키워드로 재사용될 수 있으며, 비즈니스 측면에서 주차 플랫폼 서비스의 확장과 새로운 공유주차 관련 사업 시행에 응용되어 활용될 것으로 사료된다.
향후 연구에서는 주차난이 가장 심각한 지역을 대상으로 집중적인 분석과 소규모 단위의 지역을 좀 더 세밀하게 분석할 수 있는 기법을 활용하여 해당 지역의 주차난을 해소할 수 있는 방안을 모색하고자 한다. 이와 더불어, 수집된 데이터 중 소비자의 감정 (Emotion analysis)을 분석하는 연구와 소비자 선호도 (긍정·부정)를 감성분석 (Sentiment analysis)을 통해 연구하여 공유주차에 대한 소비자들의 인식을 파악한다면 공유주차 서비스 개선과 지역 경제 활성화에 도움을 줄 수 있을 것이다.
향후 연구에서는 주차난이 가장 심각한 지역을 대상으로 집중적인 분석과 소규모 단위의 지역을 좀 더 세밀하게 분석할 수 있는 기법을 활용하여 해당 지역의 주차난을 해소할 수 있는 방안을 모색하고자 한다. 이와 더불어, 수집된 데이터 중 소비자의 감정 (Emotion analysis)을 분석하는 연구와 소비자 선호도 (긍정·부정)를 감성분석 (Sentiment analysis)을 통해 연구하여 공유주차에 대한 소비자들의 인식을 파악한다면 공유주차 서비스 개선과 지역 경제 활성화에 도움을 줄 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
공유주차 서비스를 시행하는데 중요한 역할을 하는 토픽은?
본 연구에서는 공유경제의 다양한 비즈니스 모델 중 공유주차로 범위를 제한하고, 이와 관련된 리뷰를 수집한 후 텍스트마이닝 분석을 통해 공유주차가 갖고 있는 사회적 이슈와 소비자 인식에 대해 살펴보고자 한다. 본 실험에서는 TFIDF (Term frequency inverse document frequency) 기법과 LDA (Latent dirichlet allocation) 기법을 이용하여 키워드별 토픽을 추출하여 분석한 결과 소비자들이 필요로 하거나 원하는 정보들을 파악할 수 있었으며, 토픽으로 분류한 결과 지자체 협약, 주차공간협소, 주차문화개선, 시민참여 등 시민들의 불만과 시민의식이 공유주차 서비스를 시행하는데 중요한 역할을 하고 있다는 것을 확인할 수 있었다. 본 연구는 정성적 연구, 기업 및 지역의 사례를 이용하여 기존의 탐색적 연구를 수행한 선행 연구와는 차별화된 연구로 학술적 기여도가 높다고 할 수 있다.
LDA 토픽모델링 기법을 이용해 추출된 키워드들을 통해 알 수 있는 것은?
LDA 토픽모델링 기법을 이용하여 추출된 키워드들 중 수도권을 제외한 지역인 대전시, 대구시, 아산시 등의 키워드가 추출되었고, 응암동, 은평구, 북한산 등과 같은 소규모 단위의 지역구도 언급되었다. 즉, 일부 지역에서 공유주차관련 사업이 시행되고 있다는 것을 파악할 수 있었지만, 지역에서는 공유주차 서비스가 필요함에도 불구하고, 사업이 시행되지 않고 있는 것으로 본 실험을 통해 확인할 수 있었다. 통계청에서 주차 와 관련한 자료에 의하면 전국적으로 많은 주차 면수를 보유하고 있지만 주차면을 효율적으로 활용할 수 있는 방안은 아직까지도 모색중에 있으며, 일부 지역에서만 공유주차 서비스가 활용 되고 있다는 것을 파악할 수 있었다.
대표적인 공유경제 플랫폼 서비스는?
공유경제 플랫폼 서비스는 급속도로 성장한 기술 발전과 새로운 가치 창출로 소비자들의 신뢰성, 안정성, 편리성 등을 제공할 수 있는 다양한 정보와 서비스를 제공하고 있다. 대표적인 플랫폼 서비스는 숙박 공유를 위한 에어비앤비 (Airbnb), 차량 공유를 위한 기업 우버 (Uber)와 쏘카 (Socar) 등을 들 수 있으며, 소비자들의 편익을 도모하기 위해 모바일 기기를 활용하여 전 세계에서 숙소 및 차량을 등록하고, 호스트와의 직접적인 연결을 통해 저렴한 비용으로 원하는 상품의 검색 및 예약 등을 실시간으로 이용할 수 있도록 서비스를 제공 하고 있다. 이 외에도 주차공유, 사무공유, 유휴 공간 및 주거공유 등 다양한 공유경제 비즈니스 모델이 등장하면서 공유경제 시장은 빠르게 확산되어 부가가치를 창출하는 신동력으로 주목받 으면서 활성화가 이루어지고 있다.
참고문헌 (30)
Belk, R. W. (2014). You Are What You Can Access: Sharing and Collaborative Consumption Online, Journal of Business Research, 67(8), 1595-1600.
Bin, M. Y., Jeong, J. E., and Kim, M. J. (2016). Study on Parking Behavior to Introduce Sharing Parking System: In Gyeonggi-do, Transportation Technology and Policy, 13(6), 84-96.
Blei, D., M. (2012). Topic Modeling and Digital Humanities, Journal of Digital Humanities, 2(1), 8-11.
Blei, D. M., Ng, A., Y., and Jordan, M. I. (2003). Latent Dirichlet Allocation, Journal of Machine Learning Research, 3, 993-1022.
Cao, J., Xia, T. Li, J., Zhang, Y., and Tang, S. (2009). A Density-based Method for Adaptive LDA Model Selection, Neurocomputing, 72(7), 1775-1781.
Ding, T., Wang, B., Zheng, L. Xi, J., Wang, S., and Xu, S. (2016). Research on Parking Choice Model Based on Shared Private Parking Space, Green Intelligent Transportation Systems, 419, 935-948.
DMC Report, (2019). Portal Site Usage Behavior Analysis Report in 2019, https://www.digieco.co.kr/KTFront/board/board_view.action?board_idissue_trend&board_seq12851 (Accessed on Nov. 27th, 2019)
Han, J., and Kamber, M. (2011). Data Mining: Concepts and Techniques, 3rd edition, Morgan Kaufmann Publishers.
Hong, T. H., Niu, H., Ren, G., and Park, J. Y. (2018). Multi-Topic Sentiment Analysis using LDA for Online Review, The Journal of Information Systems, 27(1), 89-110.
Kang, B. J., and Choi, M. H. (2013). An Exploratory Study on the Prospect and Challenges of the Sharing Economy, Journal of Policy Development, 13(1), 143-170.
Kim, H. J., Lee, T. H., Ryu, S. E., and Kim, N. R. (2018). A Study on Text Mining Methods to Analyze Civil Complaints: Structured Association Analysis, Journal of the Korea Industrial Information Systems Research, 23(3), 13-24.
Kim, H. S., Oh, S. H., and Kang, T. E. (2019). A Study on Parking Users Perception for Vitalizing the Shared Parking in Residential Priority Parking Areas, Journal of the Korean Society of Civil Engineers, 39(1), 45-53.
Kim, S., Kim, G., and Ahn, I. (2019). A Study on the Parking Efficiency of Block Type Residential Parking Permit Program, Journal of Korean Society of Transportation, 37(1), 1-12.
Koopman, C., Mitchell, M. D., and Thierer, A. D. (2015). The Sharing Economy and Consumer Protection Regulation: The Case for Policy Change, The Journal of Business Entrepreneurship & The Law, 8(2). 528-545.
Lee, H., Kim, Y., Koo, C., and Chung, N. (2018). The Collaborative Economy Market Drivers: Accommodation Sharing Policy Implications for Local Authorities, The Korea Academic Society of Tourism and Leisure, 30(10), 95-112.
Lee, J. H. (2018). Building an SNS Crawling System using Python, Journal of the Korea Industrial Information Systems Research, 23(5), 61-76.
Lee, J. H., and Kil, W. Y. (2019). News Agenda Classification and Media Diversity Analysis using Topic?modeling-based on News on the Presidential New Year Press Conference, Korean Journal of Broadcasting and Telecommunication Studies, 33(1), 161-196.
Lessig, L. (2008). Remix: Making Art and Commerce Thrive in the Hybrid Economy, Penguin.
Mosteller, F., and Wallace, D. (1964). Inference and Disputed Authorship: The Federalist, Stanford University Center for the Study.
Oh, S. H., Shin, S. Y., Rho, S. H., and Jang, T. S. (2018). Revitalizing Local Economies through the Sharing Economy: Focusing on the Cases of North America, Europe, and China, Ordo Economics Journal, 21(2), 115-138.
Owyang, J., Tran, C., and Silva, C. (2013). The Collaborative Economy: Products, Services, and Market Relationships have Changed as Sharing Startups Impact Business Models. To Avoid Disruption, Companies must Adopt the Collaborative Economy Value Chain, Altimeter Research Theme: Digital Economies, https://www.slideshare.net/Altimeter/the-collaborative-economy (Accessed on Jun. 4th, 2013)
Park, J. S., Hong, S. G. and Kim, J. W. (2017). A Study on Science Technology Trend and Prediction Using Topic Modeling, Journal of the Korea Industrial Information Systems Research, 22(4), 19-28.
Salton, G., and Buckley, C. (1988). Term-weighting Approaches in Automatic Text Retrieval, Information Processing & Management, 24(5), 513-523.
Shmueli, G., Bruce, P. C., and Patel, N. R. (2016). Data Mining for Business Analytics, Third edition, Wiley.
Sundararajan, A. (2016). The Sharing Economy: The End of Employment and the Rise of Crowd-Based Capitalism, Cambridge, Massachusetts: MIT Press.
The Korea Economic Daily. (2019). Seoul City Suffers from Illegal Parking, https://www.hankyung.com/society/article/201906140123i (Accessed on Jun. 15th, 2019)
Yang, N. Y., Kim, S. G., and Kang, J. Y. (2018). Researcher and Research Area Recommendation System for Promoting Convergence Research using Text Mining and Messenger, The Journal of Information Systems, 27(4), 71-96.
Yang, S., and Moon, J. (2018). A Study on the Utilization of Apartment Idle Space for Community Recovery Based on Shared Economy, Journal of the Korea Institute of Spatial Design, 13(6), 347-358.
Yoon, A. Y., Kim, S. M., and Koo, C. M. (2017). Users' Experience of Sharing Economy Service and Moderating Effect of Social Interaction: Focused on Bicycle-Sharing Service, The Journal of Information Systems, 26(4), 87-106.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.