$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

텍스트 데이터 시각화를 위한 MVC 프레임워크
A MVC Framework for Visualizing Text Data 원문보기

지능정보연구 = Journal of intelligence and information systems, v.20 no.2, 2014년, pp.39 - 58  

최광선 (솔트룩스 전략사업본부) ,  정교성 (솔트룩스 전략사업본부) ,  김수동 (숭실대학교 컴퓨터학과)

초록
AI-Helper 아이콘AI-Helper

빅데이터의 중요성에 대한 인식이 확산되고, 관련한 기술이 발전됨에 따라, 최근에는 빅데이터의 처리와 분석의 결과를 어떻게 시각화할 것인지가 매우 관심 받는 주제로 부각되고 있다. 이는 분석된 결과를 보다 명확하고 효과적으로 전달하는 데에 있어서 데이터의 시각화가 매우 효과적인 방법이기 때문이다. 시각화는 분석 시스템과 사용자가 소통하기 위한 하나의 그래픽 사용자 인터페이스(GUI)를 담당하는 역할을 한다. 통상적으로 이러한 GUI 부분은 데이터의 처리나 분석의 결과와 독립될 수록 시스템의 개발과 유지보수가 용이하며, MVC(Model-View-Controller)와 같은 디자인 패턴의 적용을 통해 GUI와 데이터 처리 및 관리 부분 간의 결합도를 최소화하는 것이 중요하다. 한편 빅데이터는 크게 정형 데이터와 비정형 데이터로 구분할 수 있는데 정형 데이터는 시각화가 상대적으로 용이한 반면, 비정형 데이터는 시각화를 구현하기가 복잡하고 다양하다. 그럼에도 불구하고 비정형 데이터에 대한 분석과 활용이 점점 더 확산됨에 따라, 기존의 전통적인 정형 데이터를 위한 시각화 도구들의 한계를 벗어나기 위해 각각의 시스템들의 목적에 따라 고유의 방식으로 시각화 시스템이 구축되는 현실에 직면해 있다. 더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.

Abstract AI-Helper 아이콘AI-Helper

As the importance of big data and related technologies continues to grow in the industry, it has become highlighted to visualize results of processing and analyzing big data. Visualization of data delivers people effectiveness and clarity for understanding the result of analyzing. By the way, visual...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • Chord Diagram은 노드 간의 상호작용 관계를 링크로 직관적으로 표현하기 위해 제시된 시각화 방안이다(Hall, 2013). 그러나 본 연구에서 소개하는 Chord Diagram with Split Links는링크의 분리를 허용함으로써 상호작용이 아닌 문서마다의 공통요소의 규모를 비교하기 위한 시각화 방안이다. 즉 텍스트 데이터에서는 문서를 노드, 문서 간의 공통 키워드를 링크로 표현한다.
  • 대표적으로 텍스트 내용 정보 전달을 목적으로 자주 사용 되는 태그 클라우드, 텍스트 관계 정보 전달을 위해 사용되는 Email Map, 그리고 트렌드 정보 전달을 위한 토픽 랭크 등이 있다. 본 연구 에서는 다양한 텍스트 데이터 시각화 기법들의 기능적 패턴을 정리하고, 텍스트 데이터 시각화를 위한 공통된 요구사항을 도출한다.
  • 대표적인 텍스트 데이터로는 오피스 문서, 웹 상의 글과 댓글, 이메일, SMS, SNS 등 소셜 커뮤니케이션 데이터, 기타 이 외의 서지정보와 같은 다양한 메타데이터 상의 텍스트 정보들 등이 있다. 본 연구에서는 이러한 다양한 텍스트 데이터들을 대상으로 시각화 요소를 다음의 3가지의 관점에서 식별하고 이를 통합하여 시각 화를 위한 공통된 정보모델을 도출한다.
  • 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 형태의 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 형태의 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.
  • 본 연구에서는 텍스트 데이터의 시각화에서 재사용성, 유지보수성 및 확장성을 확보하기 위한 방안으로 MVC 디자인 패턴을 적용한 텍스트 데이터 시각화 프레임워크를 제시하였다. 텍스트 데이터 시각화 프레임워크 TexVizu는텍스트 데이터로부터 분석되어 도출될 수 있는 텍스트 데이터 시각화 모델과 다양한 텍스트 시각화 기법들이 요구하는 데이터 요구사항을 바탕으로 구성되어 있다.
  • 본 절에서는 앞서 도출된 텍스트 데이터 시 각화 모델과 시각화 도구의 공통된 요구사항을 바탕으로 텍스트 데이터 시각화를 위한 프레임 워크인 TexVizu를 제시한다. [Figure 2]에 표현된 것과 같이 TexVizu는 수집된 텍스트 데이터를 분석하여 시각화를 위한 공통된 분석적 데이터 모델에 기반한 저장 및 관리구조를 제공하며, 텍스트에 대한 통일된 조회․검색․전송 체계를 제공함으로써 다양한 시각화 도구에 적용 가능한 기반을 제공하는 프레임워크 이다.
  • 따라서 이러한 프레임워크는 데이터나 시각화 방안이 변경되었을 때 활용될 수 없는 문제점이 존재하였다. 이에 따라 본 연구에서는 위와 같이 다양한 도메인의 데이터와 시각화 방안을 모두 적용할 수 있는 통합된 시각화 프레임워크를 제안한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
텍스트 데이터의 대표적인 예로는 무엇이 있는가? 특히 빅데이터(Big Data) 및 이와 관련한 기술들이 관심을 받으면서 비정형 데이터인 텍스트 데이터에 대한 관심도 높아지고 있다. 대표적인 텍스트 데이터로는 오피스 문서, 웹 상의 글과 댓글, 이메일, SMS, SNS 등 소셜 커뮤니케이션 데이터, 기타 이 외의 서지정보와 같은 다양한 메타데이터 상의 텍스트 정보들 등이 있다. 본 연구에서는 이러한 다양한 텍스트 데이터들을 대상으로 시각화 요소를 다음의 3가지의 관점에서 식별하고 이를 통합하여 시각 화를 위한 공통된 정보모델을 도출한다.
텍스트 시각화의 목적은? 일반적으로 텍스트 시각화는 데이터 시각화 연구의 한 분야로, 텍스트 데이터를 시각적으로 표현함으로써 그 데이터 내부에 숨은 정보를 보다 쉽게 파악하는 것을 목적으로 한다. 텍스트 시각화는 일차적으로 텍스트 데이터가 갖는 텍스트의 형식, 구조, 내용, 패턴, 관계, 트렌드 등을 직관적으로 전달한다.
하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 어려운 이유는? 더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (20)

  1. Heijs, A., Big Data: Rethinking Text Visualization, Treparel, 2013. Available at http://treparel.com/wp-content/uploads/2012/07/WP-Big-Data-Rethinking-Text-Visualization.pdf(Downloaded 5 February 2014). 

  2. Baker, C., Email Map, Christopher Baker 2004-2014, 2007. Available at http://christopherbaker.net/projects/mymap(Accessed 5 February 2014). 

  3. Gamma, E., R. Helm, R. Johnson, and J. Vlissides, Design patterns: elements of reusable objectoriented software, Addison-Wesley, Massachusetts, 1995. 

  4. Gansner, E., Y. Hu, and S. North, "Interactive Visualization of Streaming Text Data with Dynamic Maps," Journal of Graph Algorithms and Applications, Vol.17, No.4(2013), 515-540. 

  5. Hall S., Chord Diagrams in D3, 2013. Available at http://www.delimited.io/blog/2013/12/8/chorddiagrams-in-d3(Accessed 15 April 2014). 

  6. Halvey M., and M. T. Keane, "An Assessment of Tag Presentation Techniques," Proceedings of the 16th international conference on World Wide Web, (2007), 1313-1314. 

  7. Irwin, C., MVC is dead, it's time to MOVE on, 2012. Available at http://cirw.in/blog/time-to-move-on (Accessed 15 April 2014). 

  8. Jahiruddin, M. Abulaisa, L. Dey, "A concept-driven biomedical knowledge extraction and visualization framework for conceptualization of text corpora," Journal of Biomedical Informatics, Vol.43, No.6 (2010), 1020-1035. 

  9. Jones, S., S. Payne, B. Hicks, and L. Watts, "Visualization of Heterogeneous Text Data in Collaborative Engineering Projects," The 3rd IEEE Workshop on Interactive Visual Text Analytics, (2013). 

  10. Kim, H. Y. and J. W. Park, "A Review on Expressive Materials and Approaches to Text Visualization," Journal of Korea Contents Association, Vol.13, No.1(2013), 64-72. 

  11. Kim, H. Y. and J. W. Park, "Case Analysis of Bible Visualization based on Text Data Traits - Focused on Content, Structure, Quotation of Text," Journal of Korea Contents Association, Vol.13, No.8 (2013), 83-92. 

  12. Lars, Essential Tools for Keyword Trend Analysis, 2011. Available at http://www.tripwiremagazine.com/2011/07/keyword-trend-analysis.html(Accessed 5 February 2014). 

  13. Lee, J. Y, "A Usability Evaluation on the Visualization of Information Extraction Output," Journal of the Korean Society for Library and Information Science, Vol.39, No.2(2005), 287-304. 

  14. Meyer, M., T. Girba, M. Lungu, "Mondrian: an agile information visualization framework," SoftVis '06 Proceedings of the 2006 ACM symposium on Software visualization, (2006), 135-144. 

  15. Paley, W. B., TextArc: Alice's Adventures in Wonderland, 2009. Available at http://www.textarc.org/(Accessed 5 February 2014). 

  16. Polley T., Studying Four Major NetSci Researchers (ISI Data), 2013. Available at http://wiki.cns.iu.edu/pages/viewpage.action?pageId2200066(Accessed 15 April 2014). 

  17. Posavec, S., G. McInerny, The Evolution of the Origin of Species, 2009. Available at http://www.itsbeenreal.co.uk/index.php?/on-going/about/(Accessed 5 February 2014). 

  18. Saltlux, TopicRank, 2014. Available at http://www.saltlux.com/topicrank/(Accessed 15 April 2014). 

  19. Yau, N., How to Make Bubble Charts, 2010. Available at http://flowingdata.com/2010/11/23/how-to-make-bubble-charts/(Accessed 15 April 2014). 

  20. Zhao, Q., P. Mitra, "Event Detection and Visualization for Social Text Streams," International Conference on Weblogs and Social Media, (2007). 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로