빅데이터의 중요성에 대한 인식이 확산되고, 관련한 기술이 발전됨에 따라, 최근에는 빅데이터의 처리와 분석의 결과를 어떻게 시각화할 것인지가 매우 관심 받는 주제로 부각되고 있다. 이는 분석된 결과를 보다 명확하고 효과적으로 전달하는 데에 있어서 데이터의 시각화가 매우 효과적인 방법이기 때문이다. 시각화는 분석 시스템과 사용자가 소통하기 위한 하나의 그래픽 사용자 인터페이스(GUI)를 담당하는 역할을 한다. 통상적으로 이러한 GUI 부분은 데이터의 처리나 분석의 결과와 독립될 수록 시스템의 개발과 유지보수가 용이하며, MVC(Model-View-Controller)와 같은 디자인 패턴의 적용을 통해 GUI와 데이터 처리 및 관리 부분 간의 결합도를 최소화하는 것이 중요하다. 한편 빅데이터는 크게 정형 데이터와 비정형 데이터로 구분할 수 있는데 정형 데이터는 시각화가 상대적으로 용이한 반면, 비정형 데이터는 시각화를 구현하기가 복잡하고 다양하다. 그럼에도 불구하고 비정형 데이터에 대한 분석과 활용이 점점 더 확산됨에 따라, 기존의 전통적인 정형 데이터를 위한 시각화 도구들의 한계를 벗어나기 위해 각각의 시스템들의 목적에 따라 고유의 방식으로 시각화 시스템이 구축되는 현실에 직면해 있다. 더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.
빅데이터의 중요성에 대한 인식이 확산되고, 관련한 기술이 발전됨에 따라, 최근에는 빅데이터의 처리와 분석의 결과를 어떻게 시각화할 것인지가 매우 관심 받는 주제로 부각되고 있다. 이는 분석된 결과를 보다 명확하고 효과적으로 전달하는 데에 있어서 데이터의 시각화가 매우 효과적인 방법이기 때문이다. 시각화는 분석 시스템과 사용자가 소통하기 위한 하나의 그래픽 사용자 인터페이스(GUI)를 담당하는 역할을 한다. 통상적으로 이러한 GUI 부분은 데이터의 처리나 분석의 결과와 독립될 수록 시스템의 개발과 유지보수가 용이하며, MVC(Model-View-Controller)와 같은 디자인 패턴의 적용을 통해 GUI와 데이터 처리 및 관리 부분 간의 결합도를 최소화하는 것이 중요하다. 한편 빅데이터는 크게 정형 데이터와 비정형 데이터로 구분할 수 있는데 정형 데이터는 시각화가 상대적으로 용이한 반면, 비정형 데이터는 시각화를 구현하기가 복잡하고 다양하다. 그럼에도 불구하고 비정형 데이터에 대한 분석과 활용이 점점 더 확산됨에 따라, 기존의 전통적인 정형 데이터를 위한 시각화 도구들의 한계를 벗어나기 위해 각각의 시스템들의 목적에 따라 고유의 방식으로 시각화 시스템이 구축되는 현실에 직면해 있다. 더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.
As the importance of big data and related technologies continues to grow in the industry, it has become highlighted to visualize results of processing and analyzing big data. Visualization of data delivers people effectiveness and clarity for understanding the result of analyzing. By the way, visual...
As the importance of big data and related technologies continues to grow in the industry, it has become highlighted to visualize results of processing and analyzing big data. Visualization of data delivers people effectiveness and clarity for understanding the result of analyzing. By the way, visualization has a role as the GUI (Graphical User Interface) that supports communications between people and analysis systems. Usually to make development and maintenance easier, these GUI parts should be loosely coupled from the parts of processing and analyzing data. And also to implement a loosely coupled architecture, it is necessary to adopt design patterns such as MVC (Model-View-Controller) which is designed for minimizing coupling between UI part and data processing part. On the other hand, big data can be classified as structured data and unstructured data. The visualization of structured data is relatively easy to unstructured data. For all that, as it has been spread out that the people utilize and analyze unstructured data, they usually develop the visualization system only for each project to overcome the limitation traditional visualization system for structured data. Furthermore, for text data which covers a huge part of unstructured data, visualization of data is more difficult. It results from the complexity of technology for analyzing text data as like linguistic analysis, text mining, social network analysis, and so on. And also those technologies are not standardized. This situation makes it more difficult to reuse the visualization system of a project to other projects. We assume that the reason is lack of commonality design of visualization system considering to expanse it to other system. In our research, we suggest a common information model for visualizing text data and propose a comprehensive and reusable framework, TexVizu, for visualizing text data. At first, we survey representative researches in text visualization era. And also we identify common elements for text visualization and common patterns among various cases of its. And then we review and analyze elements and patterns with three different viewpoints as structural viewpoint, interactive viewpoint, and semantic viewpoint. And then we design an integrated model of text data which represent elements for visualization. The structural viewpoint is for identifying structural element from various text documents as like title, author, body, and so on. The interactive viewpoint is for identifying the types of relations and interactions between text documents as like post, comment, reply and so on. The semantic viewpoint is for identifying semantic elements which extracted from analyzing text data linguistically and are represented as tags for classifying types of entity as like people, place or location, time, event and so on. After then we extract and choose common requirements for visualizing text data. The requirements are categorized as four types which are structure information, content information, relation information, trend information. Each type of requirements comprised with required visualization techniques, data and goal (what to know). These requirements are common and key requirement for design a framework which keep that a visualization system are loosely coupled from data processing or analyzing system. Finally we designed a common text visualization framework, TexVizu which is reusable and expansible for various visualization projects by collaborating with various Text Data Loader and Analytical Text Data Visualizer via common interfaces as like ITextDataLoader and IATDProvider. And also TexVisu is comprised with Analytical Text Data Model, Analytical Text Data Storage and Analytical Text Data Controller. In this framework, external components are the specifications of required interfaces for collaborating with this framework. As an experiment, we also adopt this framework into two text visualization systems as like a social opinion mining s
As the importance of big data and related technologies continues to grow in the industry, it has become highlighted to visualize results of processing and analyzing big data. Visualization of data delivers people effectiveness and clarity for understanding the result of analyzing. By the way, visualization has a role as the GUI (Graphical User Interface) that supports communications between people and analysis systems. Usually to make development and maintenance easier, these GUI parts should be loosely coupled from the parts of processing and analyzing data. And also to implement a loosely coupled architecture, it is necessary to adopt design patterns such as MVC (Model-View-Controller) which is designed for minimizing coupling between UI part and data processing part. On the other hand, big data can be classified as structured data and unstructured data. The visualization of structured data is relatively easy to unstructured data. For all that, as it has been spread out that the people utilize and analyze unstructured data, they usually develop the visualization system only for each project to overcome the limitation traditional visualization system for structured data. Furthermore, for text data which covers a huge part of unstructured data, visualization of data is more difficult. It results from the complexity of technology for analyzing text data as like linguistic analysis, text mining, social network analysis, and so on. And also those technologies are not standardized. This situation makes it more difficult to reuse the visualization system of a project to other projects. We assume that the reason is lack of commonality design of visualization system considering to expanse it to other system. In our research, we suggest a common information model for visualizing text data and propose a comprehensive and reusable framework, TexVizu, for visualizing text data. At first, we survey representative researches in text visualization era. And also we identify common elements for text visualization and common patterns among various cases of its. And then we review and analyze elements and patterns with three different viewpoints as structural viewpoint, interactive viewpoint, and semantic viewpoint. And then we design an integrated model of text data which represent elements for visualization. The structural viewpoint is for identifying structural element from various text documents as like title, author, body, and so on. The interactive viewpoint is for identifying the types of relations and interactions between text documents as like post, comment, reply and so on. The semantic viewpoint is for identifying semantic elements which extracted from analyzing text data linguistically and are represented as tags for classifying types of entity as like people, place or location, time, event and so on. After then we extract and choose common requirements for visualizing text data. The requirements are categorized as four types which are structure information, content information, relation information, trend information. Each type of requirements comprised with required visualization techniques, data and goal (what to know). These requirements are common and key requirement for design a framework which keep that a visualization system are loosely coupled from data processing or analyzing system. Finally we designed a common text visualization framework, TexVizu which is reusable and expansible for various visualization projects by collaborating with various Text Data Loader and Analytical Text Data Visualizer via common interfaces as like ITextDataLoader and IATDProvider. And also TexVisu is comprised with Analytical Text Data Model, Analytical Text Data Storage and Analytical Text Data Controller. In this framework, external components are the specifications of required interfaces for collaborating with this framework. As an experiment, we also adopt this framework into two text visualization systems as like a social opinion mining s
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
Chord Diagram은 노드 간의 상호작용 관계를 링크로 직관적으로 표현하기 위해 제시된 시각화 방안이다(Hall, 2013). 그러나 본 연구에서 소개하는 Chord Diagram with Split Links는링크의 분리를 허용함으로써 상호작용이 아닌 문서마다의 공통요소의 규모를 비교하기 위한 시각화 방안이다. 즉 텍스트 데이터에서는 문서를 노드, 문서 간의 공통 키워드를 링크로 표현한다.
대표적으로 텍스트 내용 정보 전달을 목적으로 자주 사용 되는 태그 클라우드, 텍스트 관계 정보 전달을 위해 사용되는 Email Map, 그리고 트렌드 정보 전달을 위한 토픽 랭크 등이 있다. 본 연구 에서는 다양한 텍스트 데이터 시각화 기법들의 기능적 패턴을 정리하고, 텍스트 데이터 시각화를 위한 공통된 요구사항을 도출한다.
대표적인 텍스트 데이터로는 오피스 문서, 웹 상의 글과 댓글, 이메일, SMS, SNS 등 소셜 커뮤니케이션 데이터, 기타 이 외의 서지정보와 같은 다양한 메타데이터 상의 텍스트 정보들 등이 있다. 본 연구에서는 이러한 다양한 텍스트 데이터들을 대상으로 시각화 요소를 다음의 3가지의 관점에서 식별하고 이를 통합하여 시각 화를 위한 공통된 정보모델을 도출한다.
본 연구에서는 이러한 문제를 해결하기 위하여 다양한 형태의 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 형태의 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.
본 연구에서는 텍스트 데이터의 시각화에서 재사용성, 유지보수성 및 확장성을 확보하기 위한 방안으로 MVC 디자인 패턴을 적용한 텍스트 데이터 시각화 프레임워크를 제시하였다. 텍스트 데이터 시각화 프레임워크 TexVizu는텍스트 데이터로부터 분석되어 도출될 수 있는 텍스트 데이터 시각화 모델과 다양한 텍스트 시각화 기법들이 요구하는 데이터 요구사항을 바탕으로 구성되어 있다.
본 절에서는 앞서 도출된 텍스트 데이터 시 각화 모델과 시각화 도구의 공통된 요구사항을 바탕으로 텍스트 데이터 시각화를 위한 프레임 워크인 TexVizu를 제시한다. [Figure 2]에 표현된 것과 같이 TexVizu는 수집된 텍스트 데이터를 분석하여 시각화를 위한 공통된 분석적 데이터 모델에 기반한 저장 및 관리구조를 제공하며, 텍스트에 대한 통일된 조회․검색․전송 체계를 제공함으로써 다양한 시각화 도구에 적용 가능한 기반을 제공하는 프레임워크 이다.
따라서 이러한 프레임워크는 데이터나 시각화 방안이 변경되었을 때 활용될 수 없는 문제점이 존재하였다. 이에 따라 본 연구에서는 위와 같이 다양한 도메인의 데이터와 시각화 방안을 모두 적용할 수 있는 통합된 시각화 프레임워크를 제안한다.
제안 방법
시각화를 위한 프레임워크의 경우 Meyer는 데이터 시각화 구현에 있어서 데이터에 집중할수 있는 시각화 프레임워크를 제안하였다. 기존에는 시각화 대상이 되는 데이터를 시각화 도구를 활용하여 구현하였다. 반면, Meyer의시각화 프레임워크에서는 데이터 분석 도구에서 활용할 수 있도록 시각화 기법들을 일반화 시켰다.
본 연구에서는 다양한 텍스트 데이터 시각화 기법을 목적별로 분류하고, 각각의 기법에 대해 데이터 관점으로 요구사항을 정리하였다. 시각화 기법의 목적은 크게 텍스트 형식 및 구조 전달, 텍스트 내용 정보 전달, 텍스트 관계 정보 전달, 그리고 텍스트 트렌드 정보 전달로 나누었다.
본 연구에서는 다양한 텍스트 데이터 시각화 기법을 목적별로 분류하고, 각각의 기법에 대해 데이터 관점으로 요구사항을 정리하였다. 시각화 기법의 목적은 크게 텍스트 형식 및 구조 전달, 텍스트 내용 정보 전달, 텍스트 관계 정보 전달, 그리고 텍스트 트렌드 정보 전달로 나누었다. 데이터 요구사항은 텍스트와 관련된 정보로, 각 시각화 기법이 시각화를 위해 필요한 데이터에 해당한다.
한편, 이진희는 시각화 요소에 대한 효용성 분석을 통해 데이터의 유형에 따른 사용자들의 시각화 요소를 제안하였다. 시각화 요소를 네트워크 브라우저, 그래픽 차트, 텍스트 리스트, 지형도로 분류하고 각 분류에 대한 효용성 평가를 수행하였다. 시각화 요소의 효용성은 6가지로 정의하였으며, 각 효용성에 대한 평가 기준을 제시하였다(Lee, 2005).
2절에서는 현재 활용 되고 있는 텍스트 데이터의 다양한 시각화 방안들을 분석하여 공통 요구사항을 도출한다. 우리는 이 두 가지를 만족시키는 프레임워크를 제안함으로써 다양한 텍스트 데이터를 모두 포함할 수 있는 시각화 프레임워크를 제안한다.
이를 위해 본 논문의 2장 ‘관련연구'에서는 텍스트 데이터 시각화에 대한 관련사례들을 검토하고 다양한 텍스트 사례들 중 각각의 특징을 가지는 대표 사례를 조사하며, 3장 '텍스트 데이터 시각화 프레임워크’에서는 다양한 시각화 사례들을 구조적 관점과 상호작용 관점, 내용적 관점에서 분석하여 텍스트 데이터 시각화를 위한 공통 정보 모델을 구성하고, 이를 통해 텍스트 데이터 시각화를 위한 시스템적 공통요구사항을 도출하며, 이를 이용하여 시스템적 프레임워크인 TexVizu를 제시한다.
제안하는 프레임워크는 유지보수성, 확장성 등이 우수한 MVC 디자인 패턴에 기반하여 설 계한다. 즉, 시각화 방안이 표현되는 요소인 뷰를 제외한 모델과 컨트롤러만을 포함한 프레임 워크를 제안함으로써 다양한 시각화 방안을 적용할 수 있는 프레임워크를 제안한다.
제안하는 프레임워크는 유지보수성, 확장성 등이 우수한 MVC 디자인 패턴에 기반하여 설 계한다. 즉, 시각화 방안이 표현되는 요소인 뷰를 제외한 모델과 컨트롤러만을 포함한 프레임 워크를 제안함으로써 다양한 시각화 방안을 적용할 수 있는 프레임워크를 제안한다. 또한 최근 MVC 모델의 문제점을 해소하기 위해 등장한 MOVE 모델에서 역시 뷰를 제외한 모델, 오퍼레이션 그리고 이벤트 요소가 제안하는 프레임워크에 포함된다(Irwin, 2012).
첫 번째 사례로서는 소셜 빅데이터를 이용하여 정치인 들의 여론 피드백을 분석한 “트루스토리 시즌1 정치인”의 시각화를 채택하였다.
특히 텍스트 시각화의 효과 관련 분야에서 김효영, 박진완의 “텍스트 데이터의 특성에 따른 성경 시각화 사례 분석”연구는 성경 데이터 기반의 다양한 시각화의 사례 분석을 통해 텍스트가 갖는 다양한 특성에 따른 시각화 접근 방식에 대한 이론적 토대를 마련하였다. 텍스 트가 가지는 내용적, 구조적 특성 및 인용정보를 텍스트의 특성으로 정의하고, 각 특성에 적합한 텍스트 시각화 사례를 분석하였다. 이를 통해 효과적인 시각화를 설계 또는 해석하기 위해서는 시각화의 재료가 되는 텍스트 데이터에 대한 체계적인 분석이 필요함을 주장하였다(Kim and Park, 2013).
기존에 제시되었던 텍스트 데이터 시각화 프레임워크는 표준화 되어있지 못하였다. 특정 데이터에 의존적이거나 새로운 시각화 기법을 적용할 수 있도록 제안되었다. 따라서 이러한 프레임워크는 데이터나 시각화 방안이 변경되었을 때 활용될 수 없는 문제점이 존재하였다.
[Figure 7]의 연관 키워드 분석은 소셜 데이터에 토픽 키워드에 대한 월별 연관 키워드를 중요도 순으로 보여주는 것이다. 해당 분석은 getTopics 인터페이스 메쏘드를 월별로 호출하여 월별 주요 연관 키워드를 추출한다.
해당 시각화를 수행하기 위해서 시맨틱 검색 시 사용한 키워드를 입력 쿼리로 하는 getTopics를 호출한다. 해당 분석을 통해 나온 연관 키워드를 쿼리에 포함하여 getTopics를 다시 호출함으로써 주제 키워드와 1-depth 연관 키워드를 모두 포함한 2-depth의 연관 키워드를 획득할 수 있고 이를 다시 원형 트리 형태로 시각화한다.
[Figure 10]은 ‘O2D2’ 서비스에서 시맨틱 검색을 수행했을 때 나타나는 결과 중 하나인 토픽 랭크의 시각화 결과로 토픽 랭크 원형 트리 시각화 도구를 사용하였다. 해당 시각화를 수행하기 위해서 시맨틱 검색 시 사용한 키워드를 입력 쿼리로 하는 getTopics를 호출한다. 해당 분석을 통해 나온 연관 키워드를 쿼리에 포함하여 getTopics를 다시 호출함으로써 주제 키워드와 1-depth 연관 키워드를 모두 포함한 2-depth의 연관 키워드를 획득할 수 있고 이를 다시 원형 트리 형태로 시각화한다.
대상 데이터
두 번째 사례로서는 온라인 상의 뉴스를 수집하여 분석한 “O2D2 서비스”의 시각화를 채택하였다. 각각의 사례는 피드백 미디어로서의 소셜 빅데이터와 푸쉬 미디어로서의 온라인 뉴스를 대상으로 하고 있으며, 본 연구를 포함한 시각화 연구의 과정에서 개발된 시연용 서비스이다.
두 번째 사례로서는 온라인 상의 뉴스를 수집하여 분석한 “O2D2 서비스”의 시각화를 채택하였다.
·내용적 관점: 단어나 어구에 내용적 요소에 대한 태깅으로 표현된다. 본 연구에서는 현재 자연언어처리 기술로 자동으로 생성 가능한 수준의 태그들인 단어를 특정 개체와 연결시키는 개체명태그, 개체의 속성을 표현하는 속성태그, 개체들과 연루된 사건을 연결한 사건태그, 문장의 감성적 분위기를 표현하는 감성태그를 대상으로 한다.
이론/모형
분석적 텍스트 데이터는 저장소는 ITextDataLoader 인터페이스를 지원하는 다양한 텍스트 데이터 적재기와 연동할 수 있다. 분석적 텍스트 데이터 컨트롤 러를 통해 다양한 텍스트 시각화 도구에 텍스트 데이터 시각화를 위해 표준화된 인터페이스인 IATDProvider를 제공한다. 이처럼 TexVizu는 단지 텍스트 시각화 도구와의 결합도만이 아니라 텍스트 소스와 결합도도 최소화 할 수 있는 구조를 가지고 있다.
성능/효과
이러한 ‘O2D2’ 서비스의 시각화 항목들의 수행 흐름을 시퀀스 다이어그램으로 표현하면 [Figure 11]와 같다. 각각의 시각화 항목들은 쿼리의 입력 값만 주어진다면 독립적으로 시각화 가능한 형태를 지니고 있고 제안된 인터페이스로 동작이 가능함이 확인 가능하다.
사례연구에서는 이미 개발되어 서비스된 실제 시각화 사례에 대해서 앞서 제시한 TexVizu의인터페이스인 IATDProvider를 구현가능성 여부를 검증함으로써 보편성을 증명한다. 첫 번째 사례로서는 소셜 빅데이터를 이용하여 정치인 들의 여론 피드백을 분석한 “트루스토리 시즌1 정치인”의 시각화를 채택하였다.
트루스토리 서비스의 시각화 항목들을 시퀀스 다이어그램으로 표현하면 [Figure 8]과 같다. 제안된 IATDProvider 인터페이스로 동작이 가능함을 확인 할 수 있다.
후속연구
한편 텍스트 데이터로부터 추출된 정보들중 개체에 대한 데이터(사람, 조직, 지역, 건물, 사건 등)들은 각각의 고유의 속성을 같은 정보 구성요소이다. 그러므로 향후 연구에서는 TexVizu를 이러한 객체 데이터들을 저장, 관리 하고 다양한 객체 정보의 활용을 지원할 수 있는 형태로 발전시키고자 한다.
질의응답
핵심어
질문
논문에서 추출한 답변
텍스트 데이터의 대표적인 예로는 무엇이 있는가?
특히 빅데이터(Big Data) 및 이와 관련한 기술들이 관심을 받으면서 비정형 데이터인 텍스트 데이터에 대한 관심도 높아지고 있다. 대표적인 텍스트 데이터로는 오피스 문서, 웹 상의 글과 댓글, 이메일, SMS, SNS 등 소셜 커뮤니케이션 데이터, 기타 이 외의 서지정보와 같은 다양한 메타데이터 상의 텍스트 정보들 등이 있다. 본 연구에서는 이러한 다양한 텍스트 데이터들을 대상으로 시각화 요소를 다음의 3가지의 관점에서 식별하고 이를 통합하여 시각 화를 위한 공통된 정보모델을 도출한다.
텍스트 시각화의 목적은?
일반적으로 텍스트 시각화는 데이터 시각화 연구의 한 분야로, 텍스트 데이터를 시각적으로 표현함으로써 그 데이터 내부에 숨은 정보를 보다 쉽게 파악하는 것을 목적으로 한다. 텍스트 시각화는 일차적으로 텍스트 데이터가 갖는 텍스트의 형식, 구조, 내용, 패턴, 관계, 트렌드 등을 직관적으로 전달한다.
하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 어려운 이유는?
더욱이나 현재 비정형 데이터 분석의 대상 중 대부분을 차지하고 있는 텍스트 데이터의 경우 언어 분석, 텍스트 마이닝, 소셜 네트워크 분석 등 적용 기술이 매우 다양하여 하나의 시스템에 적용된 시각화 기술을 다른 시스템에 적용하는 것이 용이하지 않다. 이는 현재의 텍스트 분석 결과에 대한 정보 모델이 서로 다른 시스템에 적용될 수 있도록 설계되지 못하는 경우가 많기 때문이다. 본 연구에서는 이러한 문제를 해결하기 위하여 다양한 텍스트 데이터 분석 사례와 시각화 사례들의 공통적 구성 요소들을 식별하여 표준화된 정보 모델인 텍스트 데이터 시각화 모델을 제시하고, 이를 통해 시각화의 GUI 부분과 연결할 수 있는 시스템 모델로서의 시각화 프레임워크인 TexVizu를 제안하고자 한다.
참고문헌 (20)
Heijs, A., Big Data: Rethinking Text Visualization, Treparel, 2013. Available at http://treparel.com/wp-content/uploads/2012/07/WP-Big-Data-Rethinking-Text-Visualization.pdf(Downloaded 5 February 2014).
Baker, C., Email Map, Christopher Baker 2004-2014, 2007. Available at http://christopherbaker.net/projects/mymap(Accessed 5 February 2014).
Gamma, E., R. Helm, R. Johnson, and J. Vlissides, Design patterns: elements of reusable objectoriented software, Addison-Wesley, Massachusetts, 1995.
Gansner, E., Y. Hu, and S. North, "Interactive Visualization of Streaming Text Data with Dynamic Maps," Journal of Graph Algorithms and Applications, Vol.17, No.4(2013), 515-540.
Hall S., Chord Diagrams in D3, 2013. Available at http://www.delimited.io/blog/2013/12/8/chorddiagrams-in-d3(Accessed 15 April 2014).
Halvey M., and M. T. Keane, "An Assessment of Tag Presentation Techniques," Proceedings of the 16th international conference on World Wide Web, (2007), 1313-1314.
Irwin, C., MVC is dead, it's time to MOVE on, 2012. Available at http://cirw.in/blog/time-to-move-on (Accessed 15 April 2014).
Jahiruddin, M. Abulaisa, L. Dey, "A concept-driven biomedical knowledge extraction and visualization framework for conceptualization of text corpora," Journal of Biomedical Informatics, Vol.43, No.6 (2010), 1020-1035.
Jones, S., S. Payne, B. Hicks, and L. Watts, "Visualization of Heterogeneous Text Data in Collaborative Engineering Projects," The 3rd IEEE Workshop on Interactive Visual Text Analytics, (2013).
Kim, H. Y. and J. W. Park, "A Review on Expressive Materials and Approaches to Text Visualization," Journal of Korea Contents Association, Vol.13, No.1(2013), 64-72.
Kim, H. Y. and J. W. Park, "Case Analysis of Bible Visualization based on Text Data Traits - Focused on Content, Structure, Quotation of Text," Journal of Korea Contents Association, Vol.13, No.8 (2013), 83-92.
Lars, Essential Tools for Keyword Trend Analysis, 2011. Available at http://www.tripwiremagazine.com/2011/07/keyword-trend-analysis.html(Accessed 5 February 2014).
Lee, J. Y, "A Usability Evaluation on the Visualization of Information Extraction Output," Journal of the Korean Society for Library and Information Science, Vol.39, No.2(2005), 287-304.
Meyer, M., T. Girba, M. Lungu, "Mondrian: an agile information visualization framework," SoftVis '06 Proceedings of the 2006 ACM symposium on Software visualization, (2006), 135-144.
Paley, W. B., TextArc: Alice's Adventures in Wonderland, 2009. Available at http://www.textarc.org/(Accessed 5 February 2014).
Polley T., Studying Four Major NetSci Researchers (ISI Data), 2013. Available at http://wiki.cns.iu.edu/pages/viewpage.action?pageId2200066(Accessed 15 April 2014).
Posavec, S., G. McInerny, The Evolution of the Origin of Species, 2009. Available at http://www.itsbeenreal.co.uk/index.php?/on-going/about/(Accessed 5 February 2014).
Saltlux, TopicRank, 2014. Available at http://www.saltlux.com/topicrank/(Accessed 15 April 2014).
Yau, N., How to Make Bubble Charts, 2010. Available at http://flowingdata.com/2010/11/23/how-to-make-bubble-charts/(Accessed 15 April 2014).
Zhao, Q., P. Mitra, "Event Detection and Visualization for Social Text Streams," International Conference on Weblogs and Social Media, (2007).
※ AI-Helper는 부적절한 답변을 할 수 있습니다.