퍼지정보 시스템이 요구되는 다량의 데이터들은 퍼지 집합 시각화를 통한 다양한 분석을 필요로 한다. 따라서 본 연구는 퍼지 데이터 집합을 벤 다이어그램을 이용하여 시각화하는 방법을 제안하였다. 여러 주제에 관련되고 관련순위를 갖는 퍼지 데이터를 대상으로 여러 주제를 동시에 갖고 있는 데이터 집합과 여러 주제를 갖고 있는 모든 데이터들의 집합, 그리고 한 주제와 관련되지 않은 데이터 집합을 효과적으로 시각화하여 사용자가 원하는 결과를 제공할 수 있도록 하였다. 또한 서로 다른 주제 클러스터를 겹치거나 포개어서 결과 데이터를 표현하므로 사용자 중심의 정보 검색을 도모한다. 이러한 방법은 웹 검색 엔진 사용자와 웹 개발자에게 원하는 웹 문서를 보다 빠르게 전달 할 수 있는 장점을 갖으며 그 외, 정보 추출과 관련된 여러 목적으로 유용하게 쓰일 수 있는 발전 가능성이 있다.
퍼지 정보 시스템이 요구되는 다량의 데이터들은 퍼지 집합 시각화를 통한 다양한 분석을 필요로 한다. 따라서 본 연구는 퍼지 데이터 집합을 벤 다이어그램을 이용하여 시각화하는 방법을 제안하였다. 여러 주제에 관련되고 관련순위를 갖는 퍼지 데이터를 대상으로 여러 주제를 동시에 갖고 있는 데이터 집합과 여러 주제를 갖고 있는 모든 데이터들의 집합, 그리고 한 주제와 관련되지 않은 데이터 집합을 효과적으로 시각화하여 사용자가 원하는 결과를 제공할 수 있도록 하였다. 또한 서로 다른 주제 클러스터를 겹치거나 포개어서 결과 데이터를 표현하므로 사용자 중심의 정보 검색을 도모한다. 이러한 방법은 웹 검색 엔진 사용자와 웹 개발자에게 원하는 웹 문서를 보다 빠르게 전달 할 수 있는 장점을 갖으며 그 외, 정보 추출과 관련된 여러 목적으로 유용하게 쓰일 수 있는 발전 가능성이 있다.
Much amount of data which demand fuzzy information system requires various analysis through the fuzzy set visualization. Therefore, this study proposes how to visualize fuzzy data set using variation of Venn diagram. For the fuzzy data which are related to many topics and have ranking of relation, t...
Much amount of data which demand fuzzy information system requires various analysis through the fuzzy set visualization. Therefore, this study proposes how to visualize fuzzy data set using variation of Venn diagram. For the fuzzy data which are related to many topics and have ranking of relation, this way gives results that users want by visualizing intersection, union and complementary set. That is, it visualizes the set of fuzzy data which have many topics at once, or the set of all fuzzy data which has topics, or the set of fuzzy data not related to a topic. Users control these sets by overlapping or piling them; visualized with Venn diagram, which is user-oriented. One distinct advantage of this visualization is the fact that it delivers web documents which users of search engine and web developers want much quickly. Furthermore, its possibility can be expanded to several purposes by using for information retrieval.
Much amount of data which demand fuzzy information system requires various analysis through the fuzzy set visualization. Therefore, this study proposes how to visualize fuzzy data set using variation of Venn diagram. For the fuzzy data which are related to many topics and have ranking of relation, this way gives results that users want by visualizing intersection, union and complementary set. That is, it visualizes the set of fuzzy data which have many topics at once, or the set of all fuzzy data which has topics, or the set of fuzzy data not related to a topic. Users control these sets by overlapping or piling them; visualized with Venn diagram, which is user-oriented. One distinct advantage of this visualization is the fact that it delivers web documents which users of search engine and web developers want much quickly. Furthermore, its possibility can be expanded to several purposes by using for information retrieval.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
현재 벤 다이어그램 기반 퍼지 집합 시각화 연구는 소속도 값을 임의로 갖는 임의 데이터를 대상으로 구현되었기 때문에 실재 웹 검색 엔진이나 그 외 객관적인 소속도 값이 계산되어 있는 도메인은 아직 시각화 해보지 않은 상태이다. 따라서 본 연구를 실재 도메인에 적용시킨 후, 그 결과에 대한 사용자 평가를 추진할 계획이다. 또한 본 연구가 사용자에게 편리한지에 대한 분석이 필요하므로, Norman의 사용자 인터페이스의 설계 원칙 [8]과 Jacob Nielson의 휴리스틱 평가 방법 [9]를 토대로 효과적인 시각화와 시각요소에 따른 사용자 평가를 통해 개선시키고자 한다.
따라서 본 연구를 실재 도메인에 적용시킨 후, 그 결과에 대한 사용자 평가를 추진할 계획이다. 또한 본 연구가 사용자에게 편리한지에 대한 분석이 필요하므로, Norman의 사용자 인터페이스의 설계 원칙 [8]과 Jacob Nielson의 휴리스틱 평가 방법 [9]를 토대로 효과적인 시각화와 시각요소에 따른 사용자 평가를 통해 개선시키고자 한다.
본 연구가 비주얼 데이터 마이닝 관점에서 어떤 의미를 갖는지 다음과 같은 질문을 통해 파악하고자 한다.
본 연구는 벤 다이어그램을 변형하여 퍼지 데이터들의 전체적인 요약과 교집합과 합집합을 시각화하는 방법을 제안하였다. 여기서 원의 성질을 이용한 벤 다이어그램은 데이터를 전체적으로 분포시킴과 동시에 교집합, 합집합의 의미를 전달하고자 하는 본 연구의 시각적 도구로 쓰였다.
본 연구는 실제로 웹 검색 엔진 사용자나 웹 문서들을 통해 정보를 추출하고자 하는 개발자에게 원하는 결과를 빠르게 제공하고자 벤 다이어그램에 기반한 퍼지 집합의 시각화 방법을 제안하였다. 하지만 웹 문서 뿐만 아니라 더 나아가 기본적으로 주제별 분류가 가능하고 한 주제에 대한 여러 데이터가 순위를 갖으며, 각 데이터들이 동시에 다양한 주제로 분류가 되는 도메인을 대상으로, 서로 다른 주제 클러스터를 겹치거나 포개어서 다양한 분석 결과를 가져올 수 있다.
이들 영화, 음악과 관련된 웹 문서들의 전체적인 순위 분포와 검색어 ‘영화AND음악’의 결과 문서들을 분석하고자 본 논문이 제안한 방법을 적용해보았다.
퍼지 시스템에서 세부적으로 더 나아가 퍼지 집합의 시각화도 관심을 받고 있는 가운데, 본 연구는 퍼지 집합의 시각화에 대한 방법을 제안하고자 한다. 즉, 퍼지 집합 이론의데이터 마이닝을 통해 새로운 정보를 찾는 과정을 시각화를 통해 보다 쉽게 전달하고자 하는 것이다.
제안 방법
따라서 구현에 쓰일 도메인 데이터들의 소속도를 임의로 정해주어 시각화 시스템 구현에 임하였다. 구현은 정보 시각화 디자이너에게 많이 쓰이는 MIT에서 개발된 자바 기반 Processing [7] 환경에서 진행하였다.
따라서 원의 중심에서 데이터들의 집합에 대한 소속도는 1이고, 원의 가장 자리에서는 0이다. 데이터들을 표시하기 위해 데이터의 소속도가 가리키는 거리를 반지름으로 하는 동심원을 그리는 형태로 분포시켜서 데이터 소속도의 전체적인 요약을 가능하도록 하였다. 예를 들어 그림 1과 같이, 소속도 0.
따라서 그림 9와 같이 먼저 소속도를 갖는 도메인을 대상으로 데이터베이스를 만들어야 한다. 데이터베이스는 크게 분류 주제(클러스터)를 담고 있는 Vector와 겹친 클러스터들을 담는 Array List를 두었다. 주어진 분류주제로 클러스터들을 원으로 시각화한 후에, 도메인 데이터의 소속도 값을 읽고 동심원을 그린다.
클러스터들이 포개어 겹쳐지면 교집합에서와 같이 클러스터들 사이의 합집합 관계를 직관적으로 나타내기 위해 클러스터들의 전체적인 바탕색을 합친 색으로 표시하였다. 또한 각 클러스터의 동심원 선들도 포개어 지므로 동심원 선들의 색도 합쳐지도록 한다. 그러나 이 경우에 사용자가 마우스를 포개어진 클러스터 위에 올리면, 그림 5와 같이 합집합 결과 데이터는 포개기 전 클러스터의 동심원 선 색을 유지한다.
또한 클러스터 A를 제외한 모든 데이터들의 집합, 즉 여집합의 시각화도 가능하다. 이들의 시각화 이전에 퍼지 집합 이론에는 합집합, 교집합, 여집합이 있고, 본 연구는 이 세 가지 논리 연산에 대해 다음과 같은 방법을 제안하였다.
즉 여러 클러스터의 퍼지 데이터들 중 공통으로 포함되는 데이터들로 이루어진 집합이나, 여러 클러스터의 퍼지 데이터들을 모두 합친 집합에 대한 분석이 필요할 때 퍼지 집합의 시각화가 필요하다. 이를 위한 방법으로 본 연구는 벤 다이어그램을 이용하여 퍼지 데이터들의 전체적인 요약을 확인함과 동시에, 퍼지 데이터들의 교집합, 합집합이 의미하는 바를 각각 데이터의 출신 클러스터와 또 그 클러스터와의 소속도를 통해 파악할 수 있도록 하였다. 이와 같은 결과물은 결과 데이터가 포함된 각각 클러스터에 얼마만큼의 소속도로 포함되어 있는지 그 정보를 사용자에게 전달한다.
이를 적용하여, 퍼지 데이터가 분포된 변형 벤 다이어그램들을 서로 얼마나 겹쳤는지에 따라 결과 데이터를 의미적으로 다르게 제공하여 보다 정밀한 정보 분석을 가능하게 하였다. 각 클러스터의 가장자리 근처만 겹쳤을 경우, 즉 겹친 면적이 작을 경우에는 가장자리의 소속도 0과 그 주변의 비교적 작은 소속도를 대조한 결과가 교집합이다.
합집합의 시각화는 사용자들이 클러스터들을 포개어 겹쳤을 경우로 정의 내렸다. 클러스터들이 포개어 겹쳐지면 교집합에서와 같이 클러스터들 사이의 합집합 관계를 직관적으로 나타내기 위해 클러스터들의 전체적인 바탕색을 합친 색으로 표시하였다. 또한 각 클러스터의 동심원 선들도 포개어 지므로 동심원 선들의 색도 합쳐지도록 한다.
퍼지 데이터를 변형 벤 다이어그램에 분포시킬 때 그려지는 동심원들은 그림 3의 클러스터 A, B에서와 같이 소속도에 의해 선 투명도가 원의 중심으로부터 소속도가 0인 가장 자리까지 점점 높아지도록 하였다. 동심원 선의 투명도가 높을수록 소속도는 작은 값을 의미하기 때문에 투명도 ‘alpha’값은 1-소속도 값으로 할당하였다.
퍼지 데이터를 변형 벤 다이어그램에 위와 같이 분포시킨 다음, 클러스터 A와 B에 공통으로 포함되는 데이터들로 이루어진 집합, 즉 교집합과 클러스터 A와 클러스터 B의 데이터들을 모두 합친 집합, 즉 합집합을 추출하기 위해 사용자는 클러스터 A와 B를 마우스로 겹치거나 포개어 추출된 데이터들이 어떤 데이터들인지 분석하고자 한다. 또한 클러스터 A를 제외한 모든 데이터들의 집합, 즉 여집합의 시각화도 가능하다.
성능/효과
결과 데이터의 소속도와 출신 클러스터의 분포를 통해 사용자는 결과 데이터가 어떤 군집 안에서 어떤 내용을 주로 다루고, 얼마만큼의 중요성을 갖는지 한 눈에 파악이 가능하다. 예를 들어 사용자가 A와 B에 대해 동시에 얼마만큼의 중요성을 갖는 데이터를 찾고자 할 때, A에 포함되지 않지만 C에 대해 얼마만큼의 중요도를 갖는 데이터들을 찾고자 할 때, 시행착오 없이 정확한 데이터를 빠르게 얻을 수 있다.
원 벤 다이어그램에서 원은 원의 중심으로부터 같은 거리에 있는 데이터들을 표현하기에 유용하고, 벤 다이어그램은 형식 논리에 있어 가장 기본적인 다이어그램으로 서로 다른 집합들 사이의 관계를 보여주기 위한 그림이다. 따라서 사용자에게 보다 직관적이고 정확한 정보를 전달하기 위한 시각적 도구로 벤 다이어그램이 적합하며, 이것을 변형시킨 새로운 벤 다이어그램으로 퍼지 데이터의 시각화를 가능하게 하였다.
클러스터가 겹쳐진 부분의 바탕색은 두 클러스터의 교집합 관계를 직관적으로 나타내기 위해 두 클러스터의 전체적인 바탕색을 합친 색으로 표시하였다. 또한 사용자의 마우스 오버에 의한 결과 데이터 확인을 가능하게 하여 겹친 부분이 교집합을 의미함을 보여주었다. 이로써 교집합 데이터들이 어떤 색의 동심원 위에 있는지에 따라 어떤 클러스터에 포함되어 있는지 각각 자신의 출신 클러스터를 확인할 수 있으며, 동심원 선의 투명도를 통해 교집합 데이터들의 소속도를 파악할 수 있다.
하지만 웹 문서 뿐만 아니라 더 나아가 기본적으로 주제별 분류가 가능하고 한 주제에 대한 여러 데이터가 순위를 갖으며, 각 데이터들이 동시에 다양한 주제로 분류가 되는 도메인을 대상으로, 서로 다른 주제 클러스터를 겹치거나 포개어서 다양한 분석 결과를 가져올 수 있다. 본 연구의 시각화를 통해 사용자가 얻는 정보는 교집합, 합집합, 여집합의 복합 연산에 의해 결정된 결과 데이터들의 직관적인 시각 요소들에 의해 파악이 가능하다. 그리고 얻은 정보를 이용한 다양한 자료 분석이 이루어진다.
질의응답
핵심어
질문
논문에서 추출한 답변
데이터 마이닝은 어떤 분야에서 많이 쓰이는가?
비주얼 데이터 마이닝이라는 데이터 마이닝과 정보 시각화의 결합은 복잡하고 많은 양의 데이터의 분석과 이의 빠른 이해를 위해 점점 더 높은 관심을 받고 있다. 데이터 마이닝은 마케팅, 의학 분야, 회계 분야, 공학 분야, 바이오 정보학 분야에서 많이 쓰이고 있으며, 이러한 분야들의 데이터 마이닝을 이해하기 쉽게 사용자에게 전달하기 위해 정보 시각화를 필요로 하고 있다. 따라서 비주얼 데이터 마이닝은 사용자에게 큰 데이터 저장소로부터 발견될 수 있는 지식을 위한 새로운 해석을 얻을 수 있는 가능성을 제공한다.
실제 세계에서 많은 양의 데이터는 왜 대부분 퍼지 이론을 따르고 있는가?
실제 세계에서 많은 양의 데이터는 비선형적이고 불확실성을 갖고 있기 때문에 대부분 퍼지 이론을 따르고 있으며, 이 데이터들을 잘 수행하기 위한 퍼지 시스템이 요구된다. 그러나 이러한 정보의 불확실성으로 빚어지는 복잡성으로 퍼지 시스템이 수행하는 것 - data들 사이 상호관계의 불확실성을 해석하는 것, 그리고 그러한 불확실성의 파장이 모든 결과물의 확실성 수준에 어떠한 영향을 미칠 것인지에 대한 분석 - 을 사용자가 직접적으로 이해하는 것은 더 어려워진다.
시스템 사용자 및 시스템을 최적화하는 방법을 찾는 디자이너들은 퍼지 시스템의 더 쉬운 이해를 위한 방법을 요규하는 이유는 무엇인가?
실제 세계에서 많은 양의 데이터는 비선형적이고 불확실성을 갖고 있기 때문에 대부분 퍼지 이론을 따르고 있으며, 이 데이터들을 잘 수행하기 위한 퍼지 시스템이 요구된다. 그러나 이러한 정보의 불확실성으로 빚어지는 복잡성으로 퍼지 시스템이 수행하는 것 - data들 사이 상호관계의 불확실성을 해석하는 것, 그리고 그러한 불확실성의 파장이 모든 결과물의 확실성 수준에 어떠한 영향을 미칠 것인지에 대한 분석 - 을 사용자가 직접적으로 이해하는 것은 더 어려워진다. 이로 인해, 시스템 사용자 및 시스템을 최적화하는 방법을 찾는 디자이너들은 퍼지 시스템의 더 쉬운 이해를 위한 방법들을 요구하고 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.