최근 유비쿼터스 컴퓨팅의 관심이 증대되면서, 방대하고 다양한 형태의 데이터에 대한 효율성과 효과성을 고려한 지식 탐사연구의 필요성이 요구된다. 공간 특성화 방법은 공간과 비공간 속성들을 고려하여 특성화 지식을 발견하는 방법으로, 기존의 특성화 방법을 확장하여 공간 영역에 대한 다양한 형태의 지식을 발견할 수 있다. 기존 공간 특성화기법에 대한 연구들은 다음과 같은 문제점을 가진다. 첫째, 기존의 연구는 탐사된 지식의 결과가 다각적인 공간 분석을 수행하지 못하는 문제점을 가진다 둘째, 공간 탐색 시 사용자에 의해 미리 정해진 위치 영역만을 고려하여 탐색함으로 유용한 지식탐사를 보장하지 못하는 문제점을 가진다. 따라서 본 연구에서는 밀도 기반의 클러스터링이 적용된 새로운 공간 특성화기법을 제안한다.
최근 유비쿼터스 컴퓨팅의 관심이 증대되면서, 방대하고 다양한 형태의 데이터에 대한 효율성과 효과성을 고려한 지식 탐사연구의 필요성이 요구된다. 공간 특성화 방법은 공간과 비공간 속성들을 고려하여 특성화 지식을 발견하는 방법으로, 기존의 특성화 방법을 확장하여 공간 영역에 대한 다양한 형태의 지식을 발견할 수 있다. 기존 공간 특성화기법에 대한 연구들은 다음과 같은 문제점을 가진다. 첫째, 기존의 연구는 탐사된 지식의 결과가 다각적인 공간 분석을 수행하지 못하는 문제점을 가진다 둘째, 공간 탐색 시 사용자에 의해 미리 정해진 위치 영역만을 고려하여 탐색함으로 유용한 지식탐사를 보장하지 못하는 문제점을 가진다. 따라서 본 연구에서는 밀도 기반의 클러스터링이 적용된 새로운 공간 특성화기법을 제안한다.
LRecently, with increasing interest in ubiquitous computing, knowledge discovery method is needed with consideration of the efficiency and the effectiveness of wide range and various forms of data. Spatial Characterization which extends former characterization method with consideration of spatial an...
LRecently, with increasing interest in ubiquitous computing, knowledge discovery method is needed with consideration of the efficiency and the effectiveness of wide range and various forms of data. Spatial Characterization which extends former characterization method with consideration of spatial and non-spatial property enables to find various form of knowledge in spatial region. The previous spatial characterization methods have the problems as follows. Firstly, former study shows the problem that the result of searched knowledge is unable to perform the multiple spatial analysis. Secondly, it is unable to secure the useful knowledge search since it searches the limited spatial region which is allocated by the user. Thus, this study suggests spatial characterization which applies to density based clustering.
LRecently, with increasing interest in ubiquitous computing, knowledge discovery method is needed with consideration of the efficiency and the effectiveness of wide range and various forms of data. Spatial Characterization which extends former characterization method with consideration of spatial and non-spatial property enables to find various form of knowledge in spatial region. The previous spatial characterization methods have the problems as follows. Firstly, former study shows the problem that the result of searched knowledge is unable to perform the multiple spatial analysis. Secondly, it is unable to secure the useful knowledge search since it searches the limited spatial region which is allocated by the user. Thus, this study suggests spatial characterization which applies to density based clustering.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
밀도 기반 클러스터링방법은 <알고리즘 2>와 같다.[적용 예제1]을 통하여 제안하는 공간 특성화의 수행방법에 대하여 알아본다.
따라서 이러한 문제점을 해결하기 위하여 본 연구에서는 일반화 기법을 확장한 공간 데이터마이닝 모듈과 밀도 기반의 클러스터링 모듈을 통합한 공간 데이터마이닝 시스템을 제안한다. 제안된 방법은 기존의 특성화기법을 공간 특성화 기법으로 확장하여 특성화 규칙을 생성하고, 밀도 기반의 클러스터링 기법을 적용하여 생성된 규칙의 효과성을 높이고자 한다[7].
따라서, 본 연구는 밀도 기반 클러스터링을 적용하여, 특성화 작업을 수행하고자 하였다. 제안된 방법은 공간적 밀도를 고려하여 군집화하고, 이를 기반으로 비공간.
제안 방법
이러한 공간 객체에 대한 일반화 수행 시, 영역 전문가 혹은 도메인 전문가에 의해 미리 정의해 놓은 영역만을 사용함으로 사용자가 분석하고자하는 공간영역의 범위를 줄이게 된다. 그러나 "인구가 밀집한 어떤 지역을 대상으로 소비와 수입에 대한 패턴을 분석하여라.”와 같은 유형의 질의는 불필요한 지식이 포함되어 있는 지역이 제외된 공간 영역만을 대상으로 분석하며, 이러한 결과는 사용자에게 공간 영역에 대해 추론할 수 있는 범위를 넓혀주고 다양한 질의를 제공할 수 있게 된다.
데이터도 지원한다. DBSCAN 방법을 사용함으로서공간 영역에 대해 추론할 수 있는 범위를 넓혀주어 사용자에게 다각적인 분석을 하도록 유도한다.
속성에 대해서 특성화작업을 수행한다. 또한, 제안된 방법을 이용하여, 사용자에게 높은 유용성을 가지는 특성화 지식을 탐사할 수 있는 공간 특성화 시스템을 설계 및 구현을 하였다.
방법에 대하여 기술한다. 본 논문에서 제안하는 방법은 첫째, 밀도 기반 클러스터링을 특성화 과정에 적용하고, 공간 속성을 가진 데이터에 대한 사전작업을 수행하여주어 진 공간 영역에서 발견된 특성화 지식의 효과성을 높인다. 둘째, 공간 계념 계층을 이용한 자동 공간 속성을 질의에 포함시켜 사용자에게 다양한 분석의 결과와 질의 편리성을 제공하는 장점을 가진다.
요약정보를 제공한다. 본 연구에서 제안하는 밀도 기반 클러스터링을 이용한 공간 특성화 시스템은 세부적으로 총 5단계의 과정을 통하여 수행된다. 제안하는 공간 특성화의 수행과정은<그림 2>과 같다.
Ester는 BAVARIA 데이터베이스를 기반으로 Economic Geography시스템을 제안하였다[7]. 이 시스템은 전체 데이터베이스를 이용하지 않고, 공간과 비공간의 상대 빈도수 특성들을 이용하여 특성화를 수행한다. 즉, 주어진 목표 지점과 목표 지점에 인접한 객체들의 상대 빈도수만을 이용하여 특성화의 효율을 높였다.
제안된 공간 특성화 엔진은 지식을 탐색할 수 있는 방법으로 크게 공간 특성화와 밀도 기반 클러스터링 모듈로 구성된다. 두 가지 모듈 중 첫 번째로 공간 특성화 모듈은 공간 데이터베이스로부터 입력된 데이터들의 튜플들을 일반화하며, 밀도 기반 클러스터링 모듈은 공간적 위치속성을 가지고 있는 공간 객체를 대상으로 밀도 기반의 클러스터링을 통하여 공간분석을 위한 사전단계로 주어진 공간 영역을 각각의 클래스영역으로 나누어주는 모듈이다.
작업을 수행하고자 하였다. 제안된 방법은 공간적 밀도를 고려하여 군집화하고, 이를 기반으로 비공간. 속성에 대해서 특성화작업을 수행한다.
제안된 방법은 기존의 특성화기법을 공간 특성화 기법으로 확장하여 특성화 규칙을 생성하고, 밀도 기반의 클러스터링 기법을 적용하여 생성된 규칙의 효과성을 높이고자 한다[7].
대상 데이터
첫째, 질의 처리기는 공간 특성화를 지원한다. 둘째, 본 시스템에서 이용하는 공간 데이터베이스는 GMS를 이용한다. 셋째, 공간 특성화를 지원하는 개념 계층에 대한 인터페이스를 통하여, 사용자가 직접 개념 계층을 구성할 수 있다.
본 시스템은 GMS공간 데이터베이스를 이용한다[9]. GMS는 SQL92 표준을 기반으로 0GC게서 표준으로 제안하는 7개의 기본 공간 데이터 타입과 9개의 공간 관계, 확장된 공간 데이터 타입 및 공간 관계연산자 및 공간 함수를 지원한다.
이론/모형
주어진 공간 영역을<그림 7>의 (a)와 같이 인천지역의 모든 오브젝트들을 대상으로 특성화를 수행하는 것이 아니라, 밀도 기반의 클러스터링을 이용하여 공간 오브젝트가 밀집해 있는 영역을 군집화를 통해 탐사하고 발견된 영역에 공간 특성화기법을 사용한다. 즉, 사용자가 밀도가 높은 군집된 영역을 생성하기 위하여 클러스터 임계값을 기준으로 범위 안에 있는 공간 객체들을 각각의 클러스터로 만든다.
작성된 질의문은 질의 처리기 (Query Processor) 의 파서를 통하여 처리한다. 공간 데이터마이닝을 위하여 사용자가 사용을 하는 질의언어는 본 연구의 사전 연구결과인 SMQL(Spatial Mining Query Language)을 사용하여 질의문을 작성한다[1이. 특성화를 위한 SMQL질의어의 BNF는<그림 9>와 같다.
공간 클러스터링은 사용자가 탐색하고자하는 영역에 대해 군집화를 수행한다. 본 연구에서 공간 클러스터링은 공간 특성화방법에서 사용되는 공간영역을 군집화하고 공간을 분석하기 위한 기본 도구로서 사용된다[7].
본 연구에서 사용한 군집화는 대표적인 밀도 기반 클러스터링 방법인 DBSCAN을 기반으로 한다. 그러나 공간상에서 좀 더 흥미로운 지식이나 패턴을 발견하기 위해서는 공간 객체를 표현하는 단순한 점 형태뿐만 아니라, 다각형 형태의 공간 객체를 다루어야 한다.
<그림 6>의 객체 속성은 각 공간 오브젝트의 공간 정보를 나타내는 포인터 (pointer)를 저장하며, 주어진 공간 영역에 대하여 다양한 지식발견을 위하여 공간 오브젝트들의 각 공간 속성을 이용하여 공간 군집화를 수행한다. 본 연구에서 사용한 군집화는 주어진 영역에서 밀도가 높은 지역에 대하 여군 집화를 이루는 방법으로 대표적인 밀도 기반 클러스터링 방법인 DBSCAN을 기반으로 한다.<그림 6>는 본 연구에서 제안한 밀도 기반 클러스터링의 군집화와 그와 관련된 일반화된 속성들에 대한 특성화의 결과를 보여준다.
본 연구에서 제안하는 기법의 성능분석은 정보이론 (Information Theory) 에서 정보의 불확실성을 포착하기 위해 사용하는 엔트로피 (Entropy)를 이용하였다. 엔트로피는 (식 1)과 같이 정의된다.
성능/효과
위의<표 3>에서 (a)의 경우가 (b)의 경우보다 클러스터의 모든 공간 객체들의 속성들에 대해서, 높은 Gairr을가지며, 이는 본 논문에서 제안한 밀도 기반 특성화 방법이 기존의 방법보다 더욱 대표적인 정보를 특성화할 수 있었다. 또한, 동일한 공간 영역을 대상으로 동일한 입력 파라미터를 사용하여 기존 시스템과 제안하는 공간 특성화를 수행시킨 결과, 본 논문에서 제안한 밀도 기반의 클러스터링을 이용한 공간 특성화 시스템이 다양한 질의에도 높은 정보 이득의 결과를 보여주었다.
본 논문에서 제안하는 방법은 첫째, 밀도 기반 클러스터링을 특성화 과정에 적용하고, 공간 속성을 가진 데이터에 대한 사전작업을 수행하여주어 진 공간 영역에서 발견된 특성화 지식의 효과성을 높인다. 둘째, 공간 계념 계층을 이용한 자동 공간 속성을 질의에 포함시켜 사용자에게 다양한 분석의 결과와 질의 편리성을 제공하는 장점을 가진다. 다음은 본 연구에서 사용하는 기법인 밀도 기반 클러스터링을 적용한 공간 특성화 기법에 대하여 기술한다.
있었다. 또한, 동일한 공간 영역을 대상으로 동일한 입력 파라미터를 사용하여 기존 시스템과 제안하는 공간 특성화를 수행시킨 결과, 본 논문에서 제안한 밀도 기반의 클러스터링을 이용한 공간 특성화 시스템이 다양한 질의에도 높은 정보 이득의 결과를 보여주었다.
이 시스템은 전체 데이터베이스를 이용하지 않고, 공간과 비공간의 상대 빈도수 특성들을 이용하여 특성화를 수행한다. 즉, 주어진 목표 지점과 목표 지점에 인접한 객체들의 상대 빈도수만을 이용하여 특성화의 효율을 높였다. 이러한 Economic Geography는 주어진 목표 영역을 사용자에게 선택할 기회를 제공하여 보다 쉽고 편리하게 지식을 탐사할 수 있는 장점을 가진다.
첫째, 질의 처리기는 공간 특성화를 지원한다. 둘째, 본 시스템에서 이용하는 공간 데이터베이스는 GMS를 이용한다.
후속연구
본 논문에서 사용하는 DBSCAN방법을 수행하기 위해서 적절한 파라메터가 요구된다. 사용되는 파라메터는 공간 객체들의 집합인 SetOfObjects, 그리고 클러스터에 포함되는지 여부를 판단하는 이진 프레디킷인 NP(Neighborhood Predicate)과 초기 클러스터를 생성하기 위한 MinNP가사용된다.
향후, 본 연구의 방법을 기반으로 공간상 존재하는 공간객체 간의 거리를 장애물(예를 들어, 산, 강, 도로 등)을 고려한 거리계산 방법을 이용하여, 특성화 결과의 유용성을 더욱 높이고자 한다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.