[논문]하둡 및 Spark 기반 공간 통계 핫스팟 분석의 분산처리 방안 연구

김창수; 이주섭; 황규문; 성효진

doi:10.5626/jok.2018.45.2.99

하둡 및 Spark 기반 공간 통계 핫스팟 분석의 분산처리 방안 연구
Distributed Processing Method of Hotspot Spatial Analysis Based on Hadoop and Spark

정보과학회논문지 = Journal of KIISE, v.45 no.2, 2018년, pp.99 - 105

김창수 (포스웨이브 기업부설연구소) , 이주섭 (포스웨이브 기업부설연구소) , 황규문 (포스웨이브 기업부설연구소) , 성효진 (포스웨이브 기업부설연구소)

초록
AI-Helper

공간통계 분석중 하나인 핫스팟 분석은 "인접해 있는 것은 멀리 있는 것 보다 더 연관성이 있다"는 법칙에 따라 공간속성이나 사건의 공간 패턴을 쉽게 파악할 수 있는 기법 중 하나 이지만, 공간의 인접성이 고려되어야 하므로 분산 처리하기 용이하지 않다. 본 논문에서는 핫스팟 분석의 분산처리 방안을 기술하고 성능을 하둡 및 인메모리 기반인 Spark으로 평가한 결과 단일 시스템 대비 하둡기반 처리는 625.89%, Spark기반 처리는 870.14%의 성능향상을 확인하였으며, 하둡 기반과 Spark기반의 비교에서는 대용량 데이터 셋을 처리 할수록 Spark기반의 성능향상율이 높아짐을 확인하였다.

Abstract ▼ AI-Helper

One of the spatial statistical analysis, hotspot analysis is one of easy method of see spatial patterns. It is based on the concept that "Adjacent ones are more relevant than those that are far away". However, in hotspot analysis is spatial adjacency must be considered, Therefore, distributed processing is not easy. In this paper, we proposed a distributed algorithm design for hotspot spatial analysis. Its performance was compared to standalone system and Hadoop, Spark based processing. As a result, it is compare to standalone system, Performance improvement rate of Hadoop at 625.89% and Spark at 870.14%. Furthermore, performance improvement rate is high at Spark processing than Hadoop at as more large data set.

주제어

참고문헌 (20)

Cisco. Cisco Mobile Visual Networking Index, Cisco, Jun. 2017.
Franklin, Carl and Paula Hane, "An introduction to GIS: linking maps to databases," Database, Vol.15, No. 2, pp. 17-22, Apr. 1992.
W.R. Tobler, "A Computer Movie Simulating Urban Growth in the Detroit Region," Economic Geography, Vol. 46, pp. 234-240, 1970.

상세보기
Kim Changsoo, "Hadoop based Spatial Bigdata Index Creation and Processing," Korea Computer Congress, pp. 87-89, Jun. 2016.
H. Kang, "Hotspot Analysis: Basic of Spatial Analysis, Understanding and utilization to Closet Grouping Analysis and Local Moran I," PLANNING AND POLICY, pp. 116-121, Oct. 2008.
[Online]. Available: http://hadoop.apache.org/
[Online]. Available:http://spark.apache.org/
Ablimit Aji and et. al., "Hadoop GIS: a high performance spatial data warehousing system over mapreduce," Proc. VLDB Endowment, Vol. 6, No. 11, Aug. 2013.
Ahmed Eldawy and Mohamed F. Mokbel, "Spatial Hadoop: A MapReduce Framework for Spatial Data," Proc. of the IEEE International Conference on Data Engineering, ICDE 2015, Seoul, South Korea, Apr. 2015.
Anthony Fox, Chris Eichelberger, James Hughes, Skylar Lyon, "Spatio-temporal Indexing in Non-relational Distributed Databases," IEEE Big Data Conference 2013, Santa Clara, CA, 2013.
Geomesa, [Online]. Available: http://www.geomesa.org
Geohash, [Online]. Available: http://geohash.org/site/tips.html
Jason Long, "GIS Tools for Hadoop: Big Data Spatial Analytics for the Hadoop Framework," Esri blog, http://esri.github.io/gis-tools-for-hadoop/
How Hot Spot Analysis (Getis-Ord Gi*) works, [Online]. Available: http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/h-how-hot-spot-analysis-getis-ord-gi-spatial-stati.htm
Biz-gis XsDB, [Online]. Available: http://www.biz-gis.com/XsDB/
Geovision, [Online]. Available: http://www.geovision.co.kr/
Cluster and outlier analysis, [Online]. Available: http://pro.arcgis.com/en/pro-app/tool-reference/spatial-statistics/cluster-and-outlier-analysis-anselin-local-moran-s.htm
Hotspot Analysis, [Online]. Available: http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/optimized-hot-spot-analysis.htm
Spatial Autocorrelation, [Online]. Available: http://pro.arcgis.com/en/pro-app/tool-reference/spatial-statistics/spatial-autocorrelation.htm
Incremental Spatial Autocorrelation, [Online]. Available: http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/incremental-spatial-autocorrelation.htm

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

AI-Helper ※ AI-Helper는 을 사용합니다.

AI-Helper

안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증