하루가 다르게 방대한 데이터가 생겨나고, 데이터를 반영한 정책지원이나 콘텐츠들이 증가하면서 데이터에 대한 중요성이 주목받고 있다. 데이터의 시각화 측면에서 모든 데이터를 살펴보는 것에 제약이 따르기 때문에, 시각화의 기술적인 요소뿐만 아니라 데이터를 요약하고, 이해하기 쉽도록 돕는 시각화의 방법론적 요소가 중요하다고 할 수 있다. 본 논문에서는 현재 많이 사용되는 디자인 중심의 인포그래픽을 개선하고 데이터 중심의 인포그래픽을 제안하기 위해 데이터 시각화의 표현 방법을 정리하고, 시각화의 방법을 Tableau Public을 활용하여 데이터 분석 및 인포그래픽 제작사례를 제시고자 한다. 인포그래픽 제작을 위해 광주광역시 버스 이용자 데이터가 사용되었고, 분석결과 정류소 사용 총 승객수는 일반 승객수와는 유사한 결과를 보이지만 환승역 이용 승객, 청소년 승차 환승 승객수에 따른 정류소와는 차이를 보였다. 그래프 유형에 따라 시각적인 결과는 다르게 도출되었다. 데이터 중심의 인포그래픽 시각화는 기존의 인포그래픽의 시각적인 역할만 강조한 것에 비해 데이터를 효율적으로 전달하는 것을 물론 과학적 연구를 위한 도구로 활용될 것으로 기대한다.
하루가 다르게 방대한 데이터가 생겨나고, 데이터를 반영한 정책지원이나 콘텐츠들이 증가하면서 데이터에 대한 중요성이 주목받고 있다. 데이터의 시각화 측면에서 모든 데이터를 살펴보는 것에 제약이 따르기 때문에, 시각화의 기술적인 요소뿐만 아니라 데이터를 요약하고, 이해하기 쉽도록 돕는 시각화의 방법론적 요소가 중요하다고 할 수 있다. 본 논문에서는 현재 많이 사용되는 디자인 중심의 인포그래픽을 개선하고 데이터 중심의 인포그래픽을 제안하기 위해 데이터 시각화의 표현 방법을 정리하고, 시각화의 방법을 Tableau Public을 활용하여 데이터 분석 및 인포그래픽 제작사례를 제시고자 한다. 인포그래픽 제작을 위해 광주광역시 버스 이용자 데이터가 사용되었고, 분석결과 정류소 사용 총 승객수는 일반 승객수와는 유사한 결과를 보이지만 환승역 이용 승객, 청소년 승차 환승 승객수에 따른 정류소와는 차이를 보였다. 그래프 유형에 따라 시각적인 결과는 다르게 도출되었다. 데이터 중심의 인포그래픽 시각화는 기존의 인포그래픽의 시각적인 역할만 강조한 것에 비해 데이터를 효율적으로 전달하는 것을 물론 과학적 연구를 위한 도구로 활용될 것으로 기대한다.
The importance of data is increasing at a high rate as data is massively generated and taken into account in various policy supports and contents. However, because of their speed of growth, it is difficult to find the data that is needed. Both the methodological elements that summarize the data and ...
The importance of data is increasing at a high rate as data is massively generated and taken into account in various policy supports and contents. However, because of their speed of growth, it is difficult to find the data that is needed. Both the methodological elements that summarize the data and the technical elements of the visualization that help to see at a glance are important. This paper summarizes data visualization methods to improve the currently used design - oriented infographics and propose data - centric infographics. In addition, we will present examples of data analysis and infographics production using Tableau Public. The Gwangju metropolitan city bus user data was used for infographics production, and the results show that the total number of passengers using the stopping point is similar to that of the general passengers, while it is different from the numbers of transit passengers and teen riding-and-transit passengers. Data-centric infographics visualization, unlike existing infographics that is pronounced only as a visual role, is expected to be used as a tool for scientific research as well as efficiently delivering data.
The importance of data is increasing at a high rate as data is massively generated and taken into account in various policy supports and contents. However, because of their speed of growth, it is difficult to find the data that is needed. Both the methodological elements that summarize the data and the technical elements of the visualization that help to see at a glance are important. This paper summarizes data visualization methods to improve the currently used design - oriented infographics and propose data - centric infographics. In addition, we will present examples of data analysis and infographics production using Tableau Public. The Gwangju metropolitan city bus user data was used for infographics production, and the results show that the total number of passengers using the stopping point is similar to that of the general passengers, while it is different from the numbers of transit passengers and teen riding-and-transit passengers. Data-centric infographics visualization, unlike existing infographics that is pronounced only as a visual role, is expected to be used as a tool for scientific research as well as efficiently delivering data.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 현재 많이 사용되는 디자인 중심의 인포그래픽을 개선하고 데이터 중심의 인포그래픽을 제안하기 위해 데이터시각화의 표현 방법을 정리하고, 수많은 데이터 속에서 보이지 않았던 패턴이 발견될 수 있는 시각화의 방법을 Tableau Public을 활용하여 데이터 기반의 인포그래픽 제작사례를 제시하고자 한다.
본 논문에서는 현재 대중버스 노선의 이용 실태를 분석하여 정책결정자들을 위한 참고 자료를 제시할 것이며, 이러한 정책 계획과 실행을 결정하기 위한 도구로써 Tableau Public을 이용한 데이터 분석 및 인포그래픽을 제작하여 정책결정자들이 빅데이터에 대한 이해를 쉽게 할 수 있도록 한다.
이 데이터에서는 정류소명, 정류소번호, 승차 일반, 승차 청소년, 승차 어린이, 환승 일반, 환승 청소년, 환승 어린이의 변수를 보여준다. 이 논문에서는 전체 정류소 이용자 수와 일반 승차, 청소년 승차, 일반 환승, 청소년 환승 승객수의 데이터를 바탕으로 분석하도록 할 것이다. 어린이 데이터는 보호자 즉 일반 데이터와 함께 움직일 가능성을 가지고 있어 배제토록 하였다.
본 논문에서는 데이터 시각화의 방향은 사용자가 원하는 데이터를 사람이 직관적으로 이해하기 쉽고 장기간 기억에 남을수 있는 이미지로 전환하여 데이터 분석의 결과를 보여주는 것에 목적을 두고 Tableau Public이라는 프로그램을 활용하여 데이터를 왜곡 없이 그래프화 하고 데이터를 단지 그래프화 시키는 것에서 그치지 않고 데이터를 시각화한 본래의 이미지를 훼손시키지 않는 범위에서 그래픽적 요소를 추가하여 일반적인 그래프의 복잡함을 단순화하여 쉽게 이해할 수 있도록 하는 것을 목적으로 하였다. 그래픽 위주의 지금의 인포그래픽에서 쉽게 이해할 수 있다는 장점을 살리고 그래픽 위주의 인포그래픽일 경우 데이터의 전달이 왜곡되거나 생략되는 단점을 보완할 수 있었다.
가설 설정
너무나도 많은 양의 데이터 때문에 정작 필요로 하는 데이터를 찾는데 어려움을 겪게 된다. 그리고, 모든 사람이 광대한 데이터를 분석할 수 있지는 않을 것이다. 그렇다면 데이터를 분석하여 사용자(고객)가 이해하기 쉽게 시각화하여 제시하는 것은 매우 중요하다고 볼 수 있다.
제안 방법
Lankow et al.[10]이 분류한 인포그래픽 4분면을 참조하여 본 논문에서는 데이터 중심의 인포그래픽 제작을 위해 데이터 시각화 4분면을 그림1과 같이 제시하였다. 4분면의 X축은 인포그래픽의 콘텐츠가 데이터 지향적인지 또는 디자인 지향적인지로 분류하고, Y축은 인포그래픽의 형식이 수동적인지 또는 능동적인지에 따라 분류하였다.
어린이 데이터는 보호자 즉 일반 데이터와 함께 움직일 가능성을 가지고 있어 배제토록 하였다. 기본적인 데이터 분석을 위한 시각화는 Tableau Public을 활용하여 데이터를 분석하고 기본적인 데이터 시각화 방법으로 구현하여 데이터 분석결과를 알아보도록 할 것이다. 여기서 나타나는 결과를 활용하여 Tableau Public을 활용한 대시 보드와 데이터기반의 인포그래픽을 제안하도록 하였다.
기본적인 데이터 분석을 위한 시각화는 Tableau Public을 활용하여 데이터를 분석하고 기본적인 데이터 시각화 방법으로 구현하여 데이터 분석결과를 알아보도록 할 것이다. 여기서 나타나는 결과를 활용하여 Tableau Public을 활용한 대시 보드와 데이터기반의 인포그래픽을 제안하도록 하였다.
가장 단순한 차트 구조인 데이터 값의 크기를 직관적으로 파악할 수 있고, 누구나 쉽게 이해할 수 있다. 따라서 이 논문에서의 데이터시각화 방법은 막대그래프, 원그래프를 기본적으로 활용하였다.
정류소 총사용자 수와 환승 승객수와의 데이터를 비교해 보았다. 환승 승객수가 정류소 총사용자 수와의 연관 관계를 확인해 볼 필요가 있다.
Tableau Public을 활용하여 일반적인 접근의 데이터 시각화와 다른 방법의 시각화를 제안해 보도록 하였다.
Tableau Public의 버블채우기 방식을 사용하여 정류소별 승차 승객수의 관계를 살펴보았다. 이때 마크 값의 요소를 색상과 크기로 두고 서로 바꾸었을 때의 결과 값을 비교해 보았다.
Tableau Public의 버블채우기 방식을 사용하여 정류소별 승차 승객수의 관계를 살펴보았다. 이때 마크 값의 요소를 색상과 크기로 두고 서로 바꾸었을 때의 결과 값을 비교해 보았다.
그림 16에서 왼쪽 상단은 채워진 버블그래프, 오른쪽 상단은 병렬막대그래프, 하단에 막대그래프를 배치하였다. 정류소 총 사용자, 일반 승차 승객 수, 청소년 승차 승객 수를 항목별로 고유색을 지정하여 표시하였다. 이 그래프에서 채워진 버블 그래프는 정류소 총사용자 수는 원의 크기로 확인할 수 있고, 일반 승차 승객 수는 원의 색상(농도)으로 알 수 있으나 청소년 승차 승객 수는 커서를 움직일 때 정류소 명과 나타나는 도구설명에서만 알 수 있는 불편함이 있다.
이를 2개의 변수를 동시에 표현하여 비교하기 쉽게 하였다. 각각의 변수에 고유의 색 지정하고 이를 가공하여 시각화하였다. 변수에 따른 대푯값 즉, 일반승차 및 환승, 청소년 승차 및 환승 승객이 많은 정류소를 전체적으로 한눈에 알 수 있다.
대상 데이터
데이터 시각화를 위한 원자료로는 광주광역시 공공빅데이터 오픈소스 - ‘2015년도 광주광역시 시내버스 정류소별 이용객수’와 ‘2016년도 광주광역시 시내버스 정류소별 이용객 수’ -를 사용하였다.
성능/효과
정류소 사용자 총합계로 본 시각화 결과로 광천터미널이 사용자가 가장 많고, 다음으로 경신여고, 남광주역으로 나타난 것을 알 수 있다. 이렇듯, 변수가 하나일 경우는 비교적 가장 단순한 차트로 구현되며 데이터값 또한 직관적으로 알 수 있다.
정류소 사용자 총합계로 본 시각화 결과와 비교하여 볼 때 일반 승객 사용자가 가장 많은 곳은 광천터미널이 가장 많고 다음으로 경신여고, 전남대병원으로 대체로 유사한 그래프로 나타났지만 3번째 역을 비롯한 몇몇 역은 총계와 일반 승차 승객수의 차이가 있음을 알 수 있다. 병렬막대그래프, 병렬원그래프, 가로막대그래프로 표현된 데이터 시각화 예시들이다.
정류소 사용자 총합계로 본 시각화 결과와 비교하여 볼 때 청소년 승객 사용자가 가장 많은 곳은 광천터미널, 살레시오여고, 경신여고, 대성 여고 순으로 나타났다. 정류소 승객 총계 그래프와 청소년 승차 승객수의 그래프와는 차이가 있음을 알 수 있다.
정류소 사용자 총 승객수로 본 시각화 결과와 비교하여 볼 때 일반 승차 승객수와는 대체로 유사한 그래프로 나타나지만, 청소년 승차 승객수의 그래프는 차이가 확연하게 나타나는 것을 알 수 있다.
그림 7은 정류소 총사용자 수와 일반 환승 승객 수를 비교하여 데이터 시각화하였다. 정류소 사용자 총합계로 본 시각화 결과로 광천터미널, 경신여고, 남광주역으로 나타난 것에 비해 일반 환승 승객 이용자가 가장 많은 정류소는 경신여고, 광천터미널, 남광주역으로 나타났다. 일반 환승 승객수를 나타낸 그래프를 보면 총 승차 승객수의 그래프와 차이가 있음을 알 수 있다.
그림 8은 정류소 총사용자 수와 청소년 환승 승객수를 비교하여 데이터 시각화하였다. 청소년 환승 승객 이용자가 가장 많은 정류소는 광천터미널, 경신여고, 남광주역으로 나타났으며, 정류소 총사용자 수의 그래프에 비해 사용자가 큰 정류소와 적은 정류소가 두드러지게 나타남을 알 수 있다. 이는 청소년 승객의 환승은 일정 정류소에서 많이 이루어진다는 것을 알 수 있다.
정류소 사용자 총 승객수로 본 시각화 결과와 비교하여 볼 때 정류소 총사용자 수와 비교했을 때 일반 승차 승객수와 청소년승객 수는 모두 그래프에서 차이를 보였으며 일반 환승 승객수와 청소년 환승 승객수를 비교했을 때는 대체로 유사한 그래프유형으로 나타나는 것을 알 수 있었다.
본 논문에서는 데이터 시각화의 방향은 사용자가 원하는 데이터를 사람이 직관적으로 이해하기 쉽고 장기간 기억에 남을수 있는 이미지로 전환하여 데이터 분석의 결과를 보여주는 것에 목적을 두고 Tableau Public이라는 프로그램을 활용하여 데이터를 왜곡 없이 그래프화 하고 데이터를 단지 그래프화 시키는 것에서 그치지 않고 데이터를 시각화한 본래의 이미지를 훼손시키지 않는 범위에서 그래픽적 요소를 추가하여 일반적인 그래프의 복잡함을 단순화하여 쉽게 이해할 수 있도록 하는 것을 목적으로 하였다. 그래픽 위주의 지금의 인포그래픽에서 쉽게 이해할 수 있다는 장점을 살리고 그래픽 위주의 인포그래픽일 경우 데이터의 전달이 왜곡되거나 생략되는 단점을 보완할 수 있었다.
후속연구
우리나라에서 활용되고 있는 대부분의 인포그래픽 제작 설계는 1, 3사분면에 있는 서술식, 보도적 관점의 인포그래픽이다. 그러나 데이터 중심의 인포그래픽은 1, 4사분면에 제시된 과학적인 인포그래픽이며, 이는 다양한 의사결정 시스템에 사용되거나, 과학적인 연구에도 사용될 수 있을 것이다.
그렇다면 데이터를 분석하여 사용자(고객)가 이해하기 쉽게 시각화하여 제시하는 것은 매우 중요하다고 볼 수 있다. 또한, 분석된 결과를 한눈에 파악하기 위해서 그에 맞는 적절한 빅데이터 시각화 기법의 연구가 필요하다고 생각된다.
질의응답
핵심어
질문
논문에서 추출한 답변
데이터 시각화의 목적은 무엇인가?
위키백과에서는 데이터 시각화(data visualization)를 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정을 말한다. 데이터 시각화의 목적은 도표(graph)라는 수잔을 통해 정보를 명확하고 효과적으로 전달하는 것이라고 정의하고 있다. 빅데이터의 시각화 측면에서는 모든 데이터를 살펴보는 것에 제약이 따르기 때문에, 시각화의 기술적인 요소와 더불어 데이터를 요약하고, 한눈에 살펴볼 수 있도록 돕는 시각화 방법론적 요소가 중요하다고 할 수 있다.
우리나라에서 활용되고 있는 대부분의 인포그래픽은 어떤 관점의 인포그래픽인가?
우리나라에서 활용되고 있는 대부분의 인포그래픽 제작 설계는 1, 3사분면에 있는 서술식, 보도적 관점의 인포그래픽이다. 그러나 데이터 중심의 인포그래픽은 1, 4사분면에 제시된 과학적인 인포그래픽이며, 이는 다양한 의사결정 시스템에 사용되거나, 과학적인 연구에도 사용될 수 있을 것이다.
Tableau Public의 버블채우기 방식에서 결과값의 모양에 따라 그래프를 어떻게 해석하는가?
버블채우기 결과값의 모양이 비슷한 경우는 두 개의 변수에 따른 결과가 유사한 것이고 서로 다른 모양이 나타나면 결과가 다르다는 것이라고 할 수 있다.
참고문헌 (11)
박혜진, "효율적인 인포그래픽 디자인을 위한 정보 시각화 체계와 표현 특성 연구", 한국브랜드디자인학연구, 제15권, 제3호, 185-201쪽, 2017년 9월
이지선, "빅데이터를 위한 정보디자인의 시각화 방법 및 표현 연구", 기초조형학연구, 제14권, 제3호, 259-269쪽, 2013년 6월
이충권, "빅데이터 정보시스템의 구축 및 사례에 관한 연구", 스마트미디어저널, 제4권, 제3호, 56-61쪽, 2015년 9월
심미희, 류시천, "빅데이터 통계그래픽스의 유형 및 특징-인지적 방해요소를 중심으로-", 스마트미디어저널, 제3권, 제3호, 26-35쪽, 2014년 9월
Visual.ly가 공개한 인포그래픽 자동제작툴 '비주얼닷리 크리에이트' 사용후기(2015년) http://viceversablog.co.kr/220416089284(11, 5, 2018)
Cairo, A. The Functional Art: An Introduction to Information Graphics and Visualization. Berkeley: New Riders, 2012.
Data Analytics(2015) https://blog.naver.com/vipjune85/(11. 5. 2018)
Kim, D.H, "A Case Study of Infographics for National Defense - Focusing on the Data journalism of Afghanistan War in Guardian", Journal of Korea Spatial Information Society, vol.22, no.5, pp.43-52, Oct. 2014
※ AI-Helper는 부적절한 답변을 할 수 있습니다.