[논문]밀도 클러스터링을 이용한 공간 특성화 시스템 설계 및 구현

유재현; 박태수; 안찬민; 박상호; 홍준식; 이주홍

문제 정의

밀도 기반 클러스터링방법은 <알고리즘 2>와 같다.[적용 예제1]을 통하여 제안하는 공간 특성화의 수행방법에 대하여 알아본다.
따라서 이러한 문제점을 해결하기 위하여 본 연구에서는 일반화 기법을 확장한 공간 데이터마이닝 모듈과 밀도 기반의 클러스터링 모듈을 통합한 공간 데이터마이닝 시스템을 제안한다. 제안된 방법은 기존의 특성화기법을 공간 특성화 기법으로 확장하여 특성화 규칙을 생성하고, 밀도 기반의 클러스터링 기법을 적용하여 생성된 규칙의 효과성을 높이고자 한다[7].
따라서, 본 연구는 밀도 기반 클러스터링을 적용하여, 특성화 작업을 수행하고자 하였다. 제안된 방법은 공간적 밀도를 고려하여 군집화하고, 이를 기반으로 비공간.

제안 방법

이러한 공간 객체에 대한 일반화 수행 시, 영역 전문가 혹은 도메인 전문가에 의해 미리 정의해 놓은 영역만을 사용함으로 사용자가 분석하고자하는 공간영역의 범위를 줄이게 된다. 그러나 "인구가 밀집한 어떤 지역을 대상으로 소비와 수입에 대한 패턴을 분석하여라.”와 같은 유형의 질의는 불필요한 지식이 포함되어 있는 지역이 제외된 공간 영역만을 대상으로 분석하며, 이러한 결과는 사용자에게 공간 영역에 대해 추론할 수 있는 범위를 넓혀주고 다양한 질의를 제공할 수 있게 된다.
데이터도 지원한다. DBSCAN 방법을 사용함으로서공간 영역에 대해 추론할 수 있는 범위를 넓혀주어 사용자에게 다각적인 분석을 하도록 유도한다.
속성에 대해서 특성화작업을 수행한다. 또한, 제안된 방법을 이용하여, 사용자에게 높은 유용성을 가지는 특성화 지식을 탐사할 수 있는 공간 특성화 시스템을 설계 및 구현을 하였다.
방법에 대하여 기술한다. 본 논문에서 제안하는 방법은 첫째, 밀도 기반 클러스터링을 특성화 과정에 적용하고, 공간 속성을 가진 데이터에 대한 사전작업을 수행하여주어 진 공간 영역에서 발견된 특성화 지식의 효과성을 높인다. 둘째, 공간 계념 계층을 이용한 자동 공간 속성을 질의에 포함시켜 사용자에게 다양한 분석의 결과와 질의 편리성을 제공하는 장점을 가진다.
요약정보를 제공한다. 본 연구에서 제안하는 밀도 기반 클러스터링을 이용한 공간 특성화 시스템은 세부적으로 총 5단계의 과정을 통하여 수행된다. 제안하는 공간 특성화의 수행과정은<그림 2>과 같다.
Ester는 BAVARIA 데이터베이스를 기반으로 Economic Geography시스템을 제안하였다[7]. 이 시스템은 전체 데이터베이스를 이용하지 않고, 공간과 비공간의 상대 빈도수 특성들을 이용하여 특성화를 수행한다. 즉, 주어진 목표 지점과 목표 지점에 인접한 객체들의 상대 빈도수만을 이용하여 특성화의 효율을 높였다.
제안된 공간 특성화 엔진은 지식을 탐색할 수 있는 방법으로 크게 공간 특성화와 밀도 기반 클러스터링 모듈로 구성된다. 두 가지 모듈 중 첫 번째로 공간 특성화 모듈은 공간 데이터베이스로부터 입력된 데이터들의 튜플들을 일반화하며, 밀도 기반 클러스터링 모듈은 공간적 위치속성을 가지고 있는 공간 객체를 대상으로 밀도 기반의 클러스터링을 통하여 공간분석을 위한 사전단계로 주어진 공간 영역을 각각의 클래스영역으로 나누어주는 모듈이다.
작업을 수행하고자 하였다. 제안된 방법은 공간적 밀도를 고려하여 군집화하고, 이를 기반으로 비공간. 속성에 대해서 특성화작업을 수행한다.
제안된 방법은 기존의 특성화기법을 공간 특성화 기법으로 확장하여 특성화 규칙을 생성하고, 밀도 기반의 클러스터링 기법을 적용하여 생성된 규칙의 효과성을 높이고자 한다[7].

대상 데이터

첫째, 질의 처리기는 공간 특성화를 지원한다. 둘째, 본 시스템에서 이용하는 공간 데이터베이스는 GMS를 이용한다. 셋째, 공간 특성화를 지원하는 개념 계층에 대한 인터페이스를 통하여, 사용자가 직접 개념 계층을 구성할 수 있다.
본 시스템은 GMS공간 데이터베이스를 이용한다[9]. GMS는 SQL92 표준을 기반으로 0GC게서 표준으로 제안하는 7개의 기본 공간 데이터 타입과 9개의 공간 관계, 확장된 공간 데이터 타입 및 공간 관계연산자 및 공간 함수를 지원한다.

이론/모형

주어진 공간 영역을<그림 7>의 (a)와 같이 인천지역의 모든 오브젝트들을 대상으로 특성화를 수행하는 것이 아니라, 밀도 기반의 클러스터링을 이용하여 공간 오브젝트가 밀집해 있는 영역을 군집화를 통해 탐사하고 발견된 영역에 공간 특성화기법을 사용한다. 즉, 사용자가 밀도가 높은 군집된 영역을 생성하기 위하여 클러스터 임계값을 기준으로 범위 안에 있는 공간 객체들을 각각의 클러스터로 만든다.
작성된 질의문은 질의 처리기 (Query Processor) 의 파서를 통하여 처리한다. 공간 데이터마이닝을 위하여 사용자가 사용을 하는 질의언어는 본 연구의 사전 연구결과인 SMQL(Spatial Mining Query Language)을 사용하여 질의문을 작성한다[1이. 특성화를 위한 SMQL질의어의 BNF는<그림 9>와 같다.
공간 클러스터링은 사용자가 탐색하고자하는 영역에 대해 군집화를 수행한다. 본 연구에서 공간 클러스터링은 공간 특성화방법에서 사용되는 공간영역을 군집화하고 공간을 분석하기 위한 기본 도구로서 사용된다[7].
본 연구에서 사용한 군집화는 대표적인 밀도 기반 클러스터링 방법인 DBSCAN을 기반으로 한다. 그러나 공간상에서 좀 더 흥미로운 지식이나 패턴을 발견하기 위해서는 공간 객체를 표현하는 단순한 점 형태뿐만 아니라, 다각형 형태의 공간 객체를 다루어야 한다.
<그림 6>의 객체 속성은 각 공간 오브젝트의 공간 정보를 나타내는 포인터 (pointer)를 저장하며, 주어진 공간 영역에 대하여 다양한 지식발견을 위하여 공간 오브젝트들의 각 공간 속성을 이용하여 공간 군집화를 수행한다. 본 연구에서 사용한 군집화는 주어진 영역에서 밀도가 높은 지역에 대하 여군 집화를 이루는 방법으로 대표적인 밀도 기반 클러스터링 방법인 DBSCAN을 기반으로 한다.<그림 6>는 본 연구에서 제안한 밀도 기반 클러스터링의 군집화와 그와 관련된 일반화된 속성들에 대한 특성화의 결과를 보여준다.
본 연구에서 제안하는 기법의 성능분석은 정보이론 (Information Theory) 에서 정보의 불확실성을 포착하기 위해 사용하는 엔트로피 (Entropy)를 이용하였다. 엔트로피는 (식 1)과 같이 정의된다.

성능/효과

위의<표 3>에서 (a)의 경우가 (b)의 경우보다 클러스터의 모든 공간 객체들의 속성들에 대해서, 높은 Gairr을가지며, 이는 본 논문에서 제안한 밀도 기반 특성화 방법이 기존의 방법보다 더욱 대표적인 정보를 특성화할 수 있었다. 또한, 동일한 공간 영역을 대상으로 동일한 입력 파라미터를 사용하여 기존 시스템과 제안하는 공간 특성화를 수행시킨 결과, 본 논문에서 제안한 밀도 기반의 클러스터링을 이용한 공간 특성화 시스템이 다양한 질의에도 높은 정보 이득의 결과를 보여주었다.
본 논문에서 제안하는 방법은 첫째, 밀도 기반 클러스터링을 특성화 과정에 적용하고, 공간 속성을 가진 데이터에 대한 사전작업을 수행하여주어 진 공간 영역에서 발견된 특성화 지식의 효과성을 높인다. 둘째, 공간 계념 계층을 이용한 자동 공간 속성을 질의에 포함시켜 사용자에게 다양한 분석의 결과와 질의 편리성을 제공하는 장점을 가진다. 다음은 본 연구에서 사용하는 기법인 밀도 기반 클러스터링을 적용한 공간 특성화 기법에 대하여 기술한다.
있었다. 또한, 동일한 공간 영역을 대상으로 동일한 입력 파라미터를 사용하여 기존 시스템과 제안하는 공간 특성화를 수행시킨 결과, 본 논문에서 제안한 밀도 기반의 클러스터링을 이용한 공간 특성화 시스템이 다양한 질의에도 높은 정보 이득의 결과를 보여주었다.
이 시스템은 전체 데이터베이스를 이용하지 않고, 공간과 비공간의 상대 빈도수 특성들을 이용하여 특성화를 수행한다. 즉, 주어진 목표 지점과 목표 지점에 인접한 객체들의 상대 빈도수만을 이용하여 특성화의 효율을 높였다. 이러한 Economic Geography는 주어진 목표 영역을 사용자에게 선택할 기회를 제공하여 보다 쉽고 편리하게 지식을 탐사할 수 있는 장점을 가진다.
첫째, 질의 처리기는 공간 특성화를 지원한다. 둘째, 본 시스템에서 이용하는 공간 데이터베이스는 GMS를 이용한다.

후속연구

본 논문에서 사용하는 DBSCAN방법을 수행하기 위해서 적절한 파라메터가 요구된다. 사용되는 파라메터는 공간 객체들의 집합인 SetOfObjects, 그리고 클러스터에 포함되는지 여부를 판단하는 이진 프레디킷인 NP(Neighborhood Predicate)과 초기 클러스터를 생성하기 위한 MinNP가사용된다.
향후, 본 연구의 방법을 기반으로 공간상 존재하는 공간객체 간의 거리를 장애물(예를 들어, 산, 강, 도로 등)을 고려한 거리계산 방법을 이용하여, 특성화 결과의 유용성을 더욱 높이고자 한다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

밀도 클러스터링을 이용한 공간 특성화 시스템 설계 및 구현
Design and Implementation of Spatial Characterization System using Density-Based Clustering 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

밀도 클러스터링을 이용한 공간 특성화 시스템 설계 및 구현 Design and Implementation of Spatial Characterization System using Density-Based Clustering 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

이 논문을 인용한 문헌

저자의 다른 논문 :

박태수 (3) 안찬민 (4) 박상호 (4) 이주홍 (35)

관련 콘텐츠

원문 보기

원문 URL 링크

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

밀도 클러스터링을 이용한 공간 특성화 시스템 설계 및 구현
Design and Implementation of Spatial Characterization System using Density-Based Clustering 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper