[국내논문]빅 데이터 가시화 기술을 적용한 공공데이터 콘텐츠 구현 - Map가시화 기법 Implementation of public data contents using Big data Visualization technology - Map visualization technique원문보기
4차 산업화의 가속화로 인하여 우리 주변의 데이터가 급속도로 증가하였다. 이에, 데이터를 수집하는 것 이상으로 데이터 분석을 통해 얻어진 데이터의 성질과 의미를 보다 손쉽게 파악하고 데이터의 가치판단에 유연하게 적용 할 수 있어야 한다. 가시화 표현기술은 현재 많은 분야에서 관심을 받고 있다. 가시화는 데이터 분석 결과를 보다 쉽게 이해할 수 있도록 그래프, 차트 등으로 사용자가 보다 쉽게 데이터의 정보를 파악할 수 있어, 즉각적인 판단이 가능하게 하여 빠른 의사결정을 할 수 있도록 한다. 그중에서도 사용자들의 활용 가치가 높은 공공데이터를 활용한 가시화에 대한 관심도가 높다. 이에 본 논문에서는 가시화를 표현 할 수 있는 다양한 소프트웨어들 중에서 R 라이브러리와 R Studio를 활용하여 전국 자전거 보관소 설치 장소의 공공데이터를 가시화 하는 콘텐츠를 구현하였다.
4차 산업화의 가속화로 인하여 우리 주변의 데이터가 급속도로 증가하였다. 이에, 데이터를 수집하는 것 이상으로 데이터 분석을 통해 얻어진 데이터의 성질과 의미를 보다 손쉽게 파악하고 데이터의 가치판단에 유연하게 적용 할 수 있어야 한다. 가시화 표현기술은 현재 많은 분야에서 관심을 받고 있다. 가시화는 데이터 분석 결과를 보다 쉽게 이해할 수 있도록 그래프, 차트 등으로 사용자가 보다 쉽게 데이터의 정보를 파악할 수 있어, 즉각적인 판단이 가능하게 하여 빠른 의사결정을 할 수 있도록 한다. 그중에서도 사용자들의 활용 가치가 높은 공공데이터를 활용한 가시화에 대한 관심도가 높다. 이에 본 논문에서는 가시화를 표현 할 수 있는 다양한 소프트웨어들 중에서 R 라이브러리와 R Studio를 활용하여 전국 자전거 보관소 설치 장소의 공공데이터를 가시화 하는 콘텐츠를 구현하였다.
Due to the acceleration of the 4th industrialization, the data around us rapidly increased. Therefore, it is necessary to be able to more easily grasp the nature and meaning of data obtained through data analysis than to collect data, and apply it flexibly to the value judgment of data. Visualizatio...
Due to the acceleration of the 4th industrialization, the data around us rapidly increased. Therefore, it is necessary to be able to more easily grasp the nature and meaning of data obtained through data analysis than to collect data, and apply it flexibly to the value judgment of data. Visualization technology is now attracting attention in many fields. Visualization allows the user to more easily grasp the information of the data with graphs, charts, etc. so that the data analysis result can be understood more easily, so that the user can make an immediate judgment and make a quick decision. Among them, there is a high degree of interest in visualization using public data, which is highly useful to users. In this paper, we implemented R - library and R Studio to visualize public data at the installation sites of bicycle storage sites among various software that can express visualization.
Due to the acceleration of the 4th industrialization, the data around us rapidly increased. Therefore, it is necessary to be able to more easily grasp the nature and meaning of data obtained through data analysis than to collect data, and apply it flexibly to the value judgment of data. Visualization technology is now attracting attention in many fields. Visualization allows the user to more easily grasp the information of the data with graphs, charts, etc. so that the data analysis result can be understood more easily, so that the user can make an immediate judgment and make a quick decision. Among them, there is a high degree of interest in visualization using public data, which is highly useful to users. In this paper, we implemented R - library and R Studio to visualize public data at the installation sites of bicycle storage sites among various software that can express visualization.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 R 라이브러리와 R Studio를 통해 공공데이터를 가시화하는 방법에 대해 제안하였다. 급변하는 디지털 정보사회에서 처리해야 할 많은 데이터의 유형은 다양해지고 증가하면서 사람들은 유용한 정보를 직관적이면서 쉽고 빠르게 습득하기를 원한다.
본 논문에서는 빅 데이터의 시장 동향과 공공데이터의 활용법, 또 이를 가시화하는 기법과 솔루션에 대해 알아보고 마지막으로 직접 공공데이터를 활용한 가시화 콘텐츠를 구현하여 가시화 된 데이터의 효용성을 파악하고자 한다. 데이터는 자전거 보관소 관련 공공데이터를 사용하였으며, 개발 가시화 솔루션은 작업화경이 자유로운 R-Studio IDE와 R라이브러리를 사용하였다.
그 중에서도 데이터의 활용 가치가 높은 공공데이터에 대한 관심도는 날도 증가할 것이다. 본 논문에서는 실제 전국 자전거 보관 장소에 대한 공공 데이터를 기존의 텍스트 형태로만 단순히 보았던 데이터를 사람들의 눈으로 데이터를 직접 확인함으로써, 해당 데이터가 갖는 가치 판단에 좀 더 유연하게 적용 해볼 수 있었다.
이처럼 공공데이터는 활용에 따라 사회적, 경제적 가치를 가지며 본 논문에서는 자전거 보관소 관련 공공데이터를 활용하여 사회적, 경제적 가치를 높이고 공공데이터의 사용을 더욱더 활성화 시키고자 한다.
제안 방법
논문에서는 설치 형태에 따른 자전거 보관소 장소에 대한 정보를 점의 형태로 찍기 위해 데이터는 읽어온 Csv를 지정 하였고, Csv에 입력되어있는 위도와 경도 값을 각각 저장하고, Factor 값을 설치형태로 주었으며, 점의 크기는 1로 지정 하였다. 결과는 그림 14와 같다.
데이터가 올바르게 들어왔는지 확인 후, 지도의 위치정보를 얻기 위해 google map API에서 제공하는 geocode() 함수를 통해 경도와 위도 값을 설정한다. 이때, 위도와 경도 값은 string으로 들어오기 때문에 as.
데이터는 자전거 보관소 관련 공공데이터를 사용하였으며, 개발 가시화 솔루션은 작업화경이 자유로운 R-Studio IDE와 R라이브러리를 사용하였다. 또한 가시화 기법 중 하나인 Map을 활용한 가시화 기법을 적용하여 자전거 보관소 위치를 보다 직관적으로 파악할 수 있도록 하였다.
본 논문에서는 다양한 가시화 기법 중 자전거 보관소 관련 공공데이터를 가시화하기에 적절한 공간 가시화 중 지도기반의 Map 가시화 기법을 활용하여 데이터를 가시화를 하였다.
빅 데이터 가시화 방법에는 시간, 분포, 관계, 비교, 공간 가시화가 있다. 본 논문에서는 소셜 네트워크가 모바일 중심으로 발전하면서 활발하게 공유되고 있는 공간 가시화 중 지도기반의 Map 가시화 방법을 적용하여 구현하였으며, 다양한 분야의 빅 데이터 중에서도 앞서 일반적인 데이터 보다 상대적인 가치가 높은 데이터로 공공데이터를 직접 활용하여 구현하였다.
본 논문에서는 중심을 서울로 지정하였으며, map type을 ‘roadmap’으로 지정하였고, Base Layer는 흑백으로 지정하고, Map의 size는 2로 지정하였으며 zoom 값은 7로 지정하였다.
본 논문에서는 편리한 작업환경을 제공 하며 대표적인 가시화 프로그래밍 언어인 R을 사용하는 R Studio를 사용 한다.
이처럼 데이터의 증가에 따라 빅 데이터 시장 또한 함께 성장하고 있다. 이러한 흐름에 발맞추어 본 논문에서는 빅 데이터 중 공공데이터를 활용하여 직접 가시화 콘텐츠를 구현하였다.
대상 데이터
본 논문에서는 빅 데이터의 시장 동향과 공공데이터의 활용법, 또 이를 가시화하는 기법과 솔루션에 대해 알아보고 마지막으로 직접 공공데이터를 활용한 가시화 콘텐츠를 구현하여 가시화 된 데이터의 효용성을 파악하고자 한다. 데이터는 자전거 보관소 관련 공공데이터를 사용하였으며, 개발 가시화 솔루션은 작업화경이 자유로운 R-Studio IDE와 R라이브러리를 사용하였다. 또한 가시화 기법 중 하나인 Map을 활용한 가시화 기법을 적용하여 자전거 보관소 위치를 보다 직관적으로 파악할 수 있도록 하였다.
먼저 공공데이터 포털(data.go.kr)에 접속하여 전국 자전거 보관소 설치 장소 표준데이터를 다운받는다. 다음 R Studio에 접속하여 [Set Working Directory]-[Choose Directory]를 눌러 작업 디렉토리를 설정하고, 다운받은 표준 데이터를 작업 디렉토리에 저장한다.
이론/모형
비교 가시화는 여러 변수의 데이터 값들을 비교하는 방법으로 히트 맵, 스타 차트, 평행 좌표 그래프 등이 사용된다. 또한 군집분석과 같이 각각의 개체를 측정한 뒤 개체들 사이의 유사성과 비유사성을 측정하여 가시화 하는 다차원 척도 법이 사용된다.
성능/효과
적용 가시화 결과로서 자전거 보관소는 대부분 도심에 많이 몰려있는 것을 확인할 수 있었고, 주로 개별 형이 많은 것을 확인할 수 있었다. 이처럼, 무수히 많은 데이터를 일일이다 확인 할 필요도 없이 가시화를 통해 한눈에 알아 볼 수 있도록 하여 기존의 틀을 깨고 심층적으로 데이터를 분석 할 수 있다는 점에서 데이터의 가시화가 앞으로도 많이 활성화 될전망이다.
후속연구
적용 가시화 결과로서 자전거 보관소는 대부분 도심에 많이 몰려있는 것을 확인할 수 있었고, 주로 개별 형이 많은 것을 확인할 수 있었다. 이처럼, 무수히 많은 데이터를 일일이다 확인 할 필요도 없이 가시화를 통해 한눈에 알아 볼 수 있도록 하여 기존의 틀을 깨고 심층적으로 데이터를 분석 할 수 있다는 점에서 데이터의 가시화가 앞으로도 많이 활성화 될전망이다. 향후 연구로는 단순히 가시화만을 표현 한 것이 아닌 새로운 의미를 부여할 수 있는 재사용성이 가능한 콘텐츠 구현으로 쓰일 수 있도록 할 예정이다.
이처럼, 무수히 많은 데이터를 일일이다 확인 할 필요도 없이 가시화를 통해 한눈에 알아 볼 수 있도록 하여 기존의 틀을 깨고 심층적으로 데이터를 분석 할 수 있다는 점에서 데이터의 가시화가 앞으로도 많이 활성화 될전망이다. 향후 연구로는 단순히 가시화만을 표현 한 것이 아닌 새로운 의미를 부여할 수 있는 재사용성이 가능한 콘텐츠 구현으로 쓰일 수 있도록 할 예정이다.
질의응답
핵심어
질문
논문에서 추출한 답변
가시화의 장점은 무엇인가?
가시화 표현기술은 현재 많은 분야에서 관심을 받고 있다. 가시화는 데이터 분석 결과를 보다 쉽게 이해할 수 있도록 그래프, 차트 등으로 사용자가 보다 쉽게 데이터의 정보를 파악할 수 있어, 즉각적인 판단이 가능하게 하여 빠른 의사결정을 할 수 있도록 한다. 그중에서도 사용자들의 활용 가치가 높은 공공데이터를 활용한 가시화에 대한 관심도가 높다.
빅 데이터이란 무엇인가?
IT 기술에서 빅 데이터란 기존 데이터베이스 관리능력을 넘어서는 수십 테라바이트의 정형·비정형의 데이터를 분석하는 기술이다[2], [3]. 빅 데이터는 다양한 형태(Variety), 빠른 생성 속도(Velocity), 데이터 양(Volume)의 성향을 지녀 3V라고 불리며[4] 여기에 시간이 지나면서 매우 빠르게 변화하고 전파되는 빅 데이터의 특성상, 데이터 전체를 분석하고 패턴을 발견하기 어려워짐에 따라 가치(Value)를 더한 네번째 특징으로 4V라고 불리기도 한다[5], [6].
SNS의 발달로 인하여 빅 데이터 활용에 어떤 문제점이 발생하는가?
그러나 SNS의 발달과 동시에 파일, 텍스트, 이미지, 음성과 같은 비정형 데이터가 계속해서 증가하고 있는 추세이다. 이러한 비정형 데이터는 사용자가 데이터의 특성 파악과 의미 전달을 하는데 있어 어려움을 겪게 된다.
참고문헌 (15)
Sang-Chul Kim, Kwang-Ho Kim, "A Study on factors affecting the viewer rating of My Little Television : Focusing on SNS Big Data", The Journal of Digital Contents Society, Vol. 17, No. 1, pp. 1-10, Feb 2016.
James Manyika, Michael Chui, Big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute, p. 1, 2011.
John Gantz, David Reinsel, "Extracting Value from Chaos", 5th annual Digital Universe study from IDC, p. 6, June 2011.
Laney, Douglas (2001, February). 3D Data Management: Controlling Data Volume, Velocity and Variety[Internet]. Available: https://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf
Villanova University. What is Big Data[Internet]? Available: https://www.villanovau.com/resources/bi/what-is-big-data/
Boris Evelson, Brian Hopkins (2011, September). Big Data Enlarges Digital Horizons[Internet]. Available: https://www.forrester.com/report/Expand+Your+Digital+Horizon+With+Big+Data/-/E-RES60751?objectidRES60751
Seung-Yeol Bang, Hyo-Dong Ha, Chang-Jae Kim, "A Study on Big Data-based Software Architecture Design for Utilizing Public Open Data", The Korea Information Technology Society, Vol. 13, No. 10, pp. 99-107, Sep 2015.
Mun-Doo Hwan, Do-Nam Chul, "Big Data", Korean Society of CAD/CAM Engineers, Vol. 18, No. 2, pp. 26-29, August 2012.
Deok-Young Jeong, Jun-Suk Lee, and Sang-Sung Park, "Technology Trend Analysis Using Word Cloud", The Korea Intelligent Systems Society, Vol. 26, No. 1, pp. 17-18, April 2016.
Jung-Woo Ryu, Jin-Hee Song, "Visualization for Big Data", The Korea Contents Association, Vol. 12, No. 1, pp. 21-26, March 2014.
ATUSERVICIO. Uruguay Health Authority Healthcare Management Platform[Internet]. Available: http://atuservicio.uy/
Opower. US Opower's National Home Energy Utilization Comparison Platform[Internet]. Available: https://social.opower.com/maintenance.html
Nathan Yau, Visualize this : the FlowingData guide to design, visualization, and statistics, JohnWiley & SonsInc, pp. 120 - 403, 2011.
Hee-won Jeon, R visualization of data: Visualizing data to convince customers Practical know-how, Hanley Media, pp. 9-15, 2013.
Seon-Hui Bak, Hyun-Bea You, Jong-Hwan Bae, and Tae-Jun Choi, "Implementation Of Public Data contents Using Big Data Visualization Technology - Focusing on Utilization of Map visualization Technique", The Proceedings of the 2017 KIIT.DCS Summer Conference, Kumho Institute of Technology, pp. 143-144, 2017.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.