소셜 미디어 데이터 분석을 활용한 빅데이터에 대한 인식 변화 비교 분석
A Comparative Analysis of Cognitive Change about Big Data Using Social Media Data Analysis 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.6 no.7, 2017년, pp.371 - 378  

윤유동 (고려대학교 컴퓨터학과) ,  조재춘 (고려대학교 컴퓨터학과) ,  허윤아 (고려대학교 컴퓨터학과) ,  임희석 (고려대학교 컴퓨터학과)

최근 모바일의 확산과 웹 서비스의 도입으로 온라인 상에 데이터가 급격히 증가하게 되어 다양한 분야에서 활용되고 있다. 특히, 빅데이터 분야에서 소셜 미디어의 등장은 축적되는 비정형 데이터의 양이 급격하게 증가하는 계기가 되었다. 이러한 비정형 데이터로부터 의미 있는 정보를 추출하기 위해 다양한 분야에서 빅데이터 기술에 대한 관심이 증가하고 있다. 빅데이터는 선진국을 중심으로 다양한 분야에서 핵심 자원으로서 중요성이 부각되고 있다. 그러나 빅데이터의 긍정적인 미래 전망과 함께 데이터의 침해 및 개인정보 보호에 대한 우려가 지속적으로 언급되고 있다. 이와 같이 긍정적인 시각과 부정적인 시각이 공존하는 빅데이터에 대해 사람들의 의견을 분석하는 연구는 현재 매우 부족한 상황이다. 이에 본 연구에서는 텍스트 마이닝을 활용하여 소셜 미디어에서 수집한 비정형 데이터를 기반으로 빅데이터에 대한 사람들의 인식 변화를 비교하였다. 텍스트 마이닝 결과, 국내 빅데이터에 대한 연도별 키워드와 함께 시간의 흐름에 따라 감소하는 긍정적인 의견과 증가하는 부정적인 의견이 관찰되었다. 그리고 이러한 분석 결과를 기반으로 국내 빅데이터에 대한 흐름을 예측할 수 있었다.

Recently, with the spread of smart device and the introduction of web services, the data is rapidly increasing online, and it is utilized in various fields. In particular, the emergence of social media in the big data field has led to a rapid increase in the amount of unstructured data. In order to ...


문제 정의

  • 본 연구에서는 소셜 미디어 데이터 분석 결과를 기반으로 빅데이터에 대한 사람들의 인식과 트렌드(Trend)를 파악하는 것을 목적으로 한다. 구체적으로는 소셜 미디어에서 최근 빅데이터에 대한 사람들의 의견을 수집하고, 텍스트 마이닝 기법을 기반으로 연도별 분석 결과를 도출하여 연도별 빅데이터에 대한 전반적인 흐름을 예측할 수 있다.
  • 이와 같은 문제를 안고 빅데이터와 관련된 연구가 활발하게 이루어지고 있으나 사람들이 빅데이터에 대해 어떻게 생각하고 있는지에 대한 의견을 분석하는 연구는 매우 부족한 실정이다. 이에 따라 본 연구에서는 소셜 미디어에서 2014년부터 2017년까지 연도별로 수집한 빅데이터 관련 의견 데이터를 기반으로 명사 추출과 오피니언마이닝을 수행하여 빅데이터에 대한 사람들의 인식이 어떻게 변화하는지 살펴보았다.
빅데이터의 시장 성장률은 어떻게 전망되고 있는가? 최근 모바일의 확산과 웹 서비스의 도입으로 인해 온라인 상에 정형 데이터(Formal Data) 뿐만 아니라 비정형 데이터(Informal Data)가 급격히 증가하게 되어, 다양한 분야에서 다양한 방법으로 활용되고 있다. 빅데이터의 경우 활용성이 높아 세계시장에서 2014년부터 2019년까지 23.1%의 연평균 성장률이 전망되었으며, 국내시장에서는 2014년부터 2018년 까지 26.4%의 연평균 성장률이 전망되었다[1]. 특히, 빅데이 터 분야에서 소셜 미디어(Social Media)의 등장은 시간과 장소에 관계없이 개인과 조직으로부터 축적되는 비정형 데이터의 양이 보다 빠르게 확산 및 축적되는 계기가 되었다.
빅데이터의 등장은 인간의 삶에 어떤 변화를 가져왔는가? 빅데이터의 등장은 인간의 삶에 다양한 변화를 가져왔다. 컴퓨터 및 처리기술의 발전으로 빅데이터의 분석이 가능해졌고, 이에 따라 빅데이터가 선진국을 중심으로 산업, 공공, 의료, 과학 등의 다양한 분야에서 핵심 자원 또는 도구로서의 중요성이 부각되고 있다[9]. 그러나 빅데이터의 긍정적인 미래 전망과 함께 지속적으로 언급되는 문제점 중 하나가 데이터의 침해 및 개인정보 보호와 관련된 것이다.
빅데이터를 단순하게 규모만으로 정의할 수 없는 이유는 무엇인가? 그러나 빅데이터를 단순하게 규모만으로 정의할 수는 없다[5, 6]. 빅데이터는 다양한 환경에서 생성되는 데이터로 일반적인 데이터와 비교하여 데이터의 크기가 방대하고, 데이터의 생성 속도가 매우 빠르며 정형 데이터 뿐만 아니라 텍스트, 이미지, 영상, 음성 등 다양한 데이터 형태를 포함하는 대규모 데이터를 의미하기 때문이다. 즉, 빅데이터는 데이터의 크기(Volume), 데이터의 생성 속도(Velocity), 정보형태의 다양성(Variety)의 세 가지 측면에서 기존의 데이터와는 다른 특징을 보이고 있다 [7, 8].
