$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

XML구조를 이용한 공공 빅데이터의 선별 저장 및 시각화 방법
A Method for Selective Storing and Visualization of Public Big Data Using XML Structure 원문보기

한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.21 no.12, 2017년, pp.2305 - 2311  

백봉현 (Argos Co. Ltd.) ,  하일규 (Department of Computer Engineering, Kyungil University)

초록
AI-Helper 아이콘AI-Helper

최근들어 공공 정보화와 함께 정부기관, 지자체 및 다양한 정부산하기관에서 보유하고 있는 데이터를 공개하고 있는 추세이다. 즉, 공공기관이 업무수행의 결과물로 생성 및 수집한 다양한 전자화된 형태의 데이터를 공공데이터 포털사이트에서 개방하고 있다. 하지만 이를 사용하는 사용자는 데이터 형식의 이해와 데이터 처리 지식의 부족, 데이터에 대한 접근과 관리의 어려움, 수집 및 저장한 데이터의 이해를 위한 시각화 기술의 부족 등으로 빅데이터의 활용에 제한을 받고 있다. 따라서 본 연구에서는 다양한 공공 사이트에서 제공하는 빅데이터를 데이터셋URL 및 API를 사용하여 데이터 포맷에 관계없이 데이터를 수집하며, 수집된 데이터를 XML 구조를 이용하여 재가공하여 데이터베이스화하며, 데이터 융합을 통한 시각화가 가능하도록 하는 공공 빅데이터 수집, 선별 저장 및 시각화 플랫폼을 제안한다.

Abstract AI-Helper 아이콘AI-Helper

In recent years, there have been tries to open public data from various government agencies along with publicization of public information for the public interest. In other words, various kinds of electronic data generated and collected by the public institutions as a result of their work are opened...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서는 공공기관에서 제공하는 데이터를 수집하고 저장하며 이를 재가공하고 시각화하는 자동화 플랫폼을 제안하였다. 제안한 플랫폼은 다음과 같은 분야에서의 효과를 기대할 수 있을 것이다.
  • 공공 데이터의 종류는 과학기술, 보건의료, 사회복지, 공공행정, 재정금융 등 다양하며 API 또는 파일 형태로 지원된다. 한편으로 기업과 개인은 다양한 방법으로 빅데이터를 수집, 가공하여 다양한 목적에 활용하고자 한다. 하지만, 다음과 같은 몇 가지 문제점으로 인해 공공 빅데이터는 그 활용이 제한을 받고 있다.

가설 설정

  • 둘째, 데이터에 대한 접근과 관리의 어려움이다. 현재 각 기관 및 지방자치단체 별로 데이터를 제공하고 있으나, 데이터 접근을 위해서는 모든 사이트별로 회원등록 및 로그인 절차가 필요하며, 수집된 데이터의 관리를 위해서는 데이터파일의 다운로드 등을 통해 자신의 컴퓨터에 저장하고 이용자 스스로 관리를 하여야 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
공공 빅데이터 활용이 제한되는 이유는 무엇인가? 첫째, 데이터 형식의 이해와 데이터 처리 지식의 문제이다. 현재 국내에서는 다양한 기관 즉, 정부, 지방자치단체, 의료분야기관, 농산물기관, 날씨기관 등 다양한 분야에서 XML, EXCEL, CSV, JSON 등 다양한 데이터 형식으로 데이터를 제공하고 있다. 그러나, 데이터 형식의 불일치로 사용자의 이해를 어렵게 하고 있다. 예를 들어 개인의 경우 평범한 EXCEL유형 이외에 XML, JSON 등의 데이터 포맷에 대한 지식과 데이터 처리에 대한 지식이 낮아 데이터 활용에 어려움이 있다. 둘째, 데이터에 대한 접근과 관리의 어려움이다. 현재 각 기관 및 지방자치단체 별로 데이터를 제공하고 있으나, 데이터 접근을 위해서는 모든 사이트별로 회원등록 및 로그인 절차가 필요하며, 수집된 데이터의 관리를 위해서는 데이터파일의 다운로드 등을 통해 자신의 컴퓨터에 저장하고 이용자 스스로 관리를 하여야 한다. 또한 데이터의 분석을 위해서는 외부의 SAS등의 통계분석 시스템과 연계해야 하며, 이에 따라 절차와 시간이 매우 소모가 된다. 셋째, 수집 및 저장한 데이터의 시각화 문제이다. 수집된 빅데이터를 적절하게 저장하고 이를 가공하여 업무에 활용하기 위해서는 다양한 형태로의 시각화하는 기술이 필요하다. 시각화된 자료는 사용자에게 보다 직관적인 정보를 제공하기 때문이다. 하지만 대부분의 일반 사용자는 빅데이터의 수집 및 저장과 함께 시각화에 대한 인식과 기술이 부족하다. 마지막으로, 대용량 데이터의 빠른 저장과 검색을 위한 데이터베이스화의 어려움이다. 사용자가 필요로 하는 대용량 데이터의 안정적인 저장과 빠른 검색을 위해서는 파일 형식이 아닌 데이터베이스가 필요하다. 일반인이 인터넷 상에서 수집한 데이터를 손쉽게 데이터베이스화하는 방법이 필요하며, 기존 RDB를 이용할 경우 비정형적인 빅데이터 처리에 어려움이 있으므로 이를 극복할 수 있는 데이터베이스화 방법이 필요하다.
공공 데이터의 종류에는 무엇이 있는가? 공공 데이터의 종류는 과학기술, 보건의료, 사회복지, 공공행정, 재정금융 등 다양하며 API 또는 파일 형태로 지원된다. 한편으로 기업과 개인은 다양한 방법으로 빅데이터를 수집, 가공하여 다양한 목적에 활용하고자 한다.
데이터의 저장과 대용량 빅데이터의 빠른 처리를 위해 사용하는 시스템은 무엇인가? 제안된 플랫폼에서는 안정적인 데이터의 저장과 대용량 빅데이터의 빠른 처리 속도를 위해 하둡(Hadoop)기반의 분산병렬 시스템을 지원하도록 하며, NoSQL을 활용하여 데이터의 확장성과 빠른 응답을 지원하도록 한다. 그림 4는 수집된 빅데이터를 저장하고 처리하기 위한 하둡기반의 분산병렬 시스템을 보여준다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. X. Wu, X. Zhu, D. Wu and W. Ding, "Data mining with big data," IEEE Transactions on Knowledge and Data Engineering, vol. 26, no. 1, pp. 97-107, Jan. 2014. 

  2. C. Cheng and C. Zhang, "Data-intensive applications, challenges, techniques and technologies: A survey on Big Data," Information Sciences. vol. 275, pp. 314-347, Aug. 2014. 

  3. G. Kim, S. Trimi and J. Chung, "Big-data applications in the government sector," Communications of the ACM, vol. 57, no. 3, pp. 78-85, Mar. 2014. 

  4. Y. Kang, K. Kim, M. Han, J. Kim, "A Study on the Business Strategies based on Big Data Analysis," Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, vol.5, no.5, pp.145-152, 2015. 

  5. S. Bang, H. Ha and C. Kim, "A Study on Big Data-based Software Architecture Design for Utilizing Public Open Data," Journal of Advanced Information Technology and Convergence. vol. 13, no. 10, pp. 99-107, Oct. 2015. 

  6. Y. Chol, "A Study on the Development of Public Big Data Platform Reference Model," Journal of Information Technology and Architecture. vol. 12, no. 4, pp. 495-503, April 2015. 

  7. M. Kim and D. Choi, "An Analysis of the Public Data for Making the Ambient Intelligent Service," JOURNAL OF DIGITAL CONVERGENCE, vol. 12, no. 12, pp. 313-321, Dec. 2014. 

  8. Y. Moon and J. Jung, "The visualization of application utilizing public data," The Treatise on The Plastic Media. vol. 18, no. 1, pp. 63-76, Jan. 2015. 

  9. K. Lee, G. Nam, J. Sim, K. Cho and W. Ryu, "Construction of Knowledge Base for The Utilization of Big Data in Public Domain," Communications of the Korean Institute of Information Scientists and Engineer. vol. 30, no. 6, pp. 40-46, 2012. 

  10. S. Ju, J. Jeong and G. Ryu, "Big Data Technology Trends Big Data Visualization and Public Data Visualization Examples," It's Smart Media. vol. 2, no. 3, pp. 37-43, 2013. 

  11. J. Lee and G. Oh, "A study of application development case built on public section big data - PET 119 IN SUWON," Journal of The Korea Big Data Service Society. vol. 2, no. 1, pp. 19-24, 2015. 

  12. S. Lee and S. Shin, "Design of Health Warning Model on the Basis of CRM by use of Health Big Data," Journal of the Korea Institute of Information and Communication Engineering. vol. 20, no. 8, pp. 1460-1465, 2016. 

  13. M. Lee and B. On, "An Example of Public Data Visualization based on the Big Data Approach," Information & communications magazine. vol. 29, no. 11, pp. 36-42, 2012. 

  14. S. Lee, J. Jung, G. Cha, G. Son, S. Kim and J. Kim, "Social safety net system through big data analysis of public data," Journal of Satellite, Information and Communications. vol. 10, no. 4, pp. 77-82, 2015. 

  15. I. Ha, B. Bak and B. Ahn, "MapReduce functions to analyze sentiment information from social big data," International Journal of Distributed Sensor Networks-Special issue on Advanced Big Data Management and Analytics for Ubiquitous Sensors.vol. 2015. Jan. 2015. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로