$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

클라우드 컴퓨팅 기반 공간분석의 연산 효율성 분석
Evaluating Computational Efficiency of Spatial Analysis in Cloud Computing Platforms 원문보기

한국지리정보학회지 = Journal of the Korean Association of Geographic Information Studies, v.21 no.4, 2018년, pp.119 - 131  

최창락 (경희대학교 이과대학 지리학과) ,  김예린 (경희대학교 이과대학 지리학과) ,  홍성연 (경희대학교 이과대학 지리학과)

초록
AI-Helper 아이콘AI-Helper

휴대용 기기와 다양한 위치 기반 서비스의 확산으로 공간데이터의 양적 팽창이 가속화됨에 따라 대용량의 공간데이터를 효율적으로 다룰 수 있는 기술의 중요성이 점차 커지고 있다. 클라우드 컴퓨팅은 인터넷을 통해 스토리지, 메모리, 애플리케이션 등 다양한 전산 자원을 공유할 수 있는 서비스 환경으로, 최근 이를 활용해 대용량의 공간데이터를 처리, 분석하는 방법과 그 필요성에 관한 연구가 활발히 수행되어 왔다. 그러나 아직까지 대용량 공간데이터의 분석에 클라우드 컴퓨팅 플랫폼을 활용했을 때 어느 정도의 성능 향상을 기대할 수 있는지에 대한 실증적 연구는 비교적 많이 이루어지지 않았으며, 본 연구의 목표는 이러한 논의의 공백을 채우는 것이다. 이를 위해 연구에서는 클라우드 컴퓨팅 플랫폼에서 병렬 연산을 사용했을 때 모란지수와 지리가중회귀분석의 연산 속도가 어느 정도 향상되는지 살펴보았으며, 그 결과를 통해 클라우드 컴퓨팅을 활용한 공간분석의 효율성을 평가하였다. 실험 결과, 중앙처리장치의 클록 수가 더 높은 로컬 컴퓨터에 비해 병렬 연산에 적합한 환경을 갖춘 공용 클라우드 컴퓨팅 플랫폼에서 좀 더 효율적인 연산이 가능했으며, 데이터의 규모가 클수록 격차가 더욱 크게 나타났다.

Abstract AI-Helper 아이콘AI-Helper

The increase of high-resolution spatial data and methodological developments in recent years has enabled a detailed analysis of individual experiences in space and over time. However, despite the increasing availability of data and technological advances, such individual-level analysis is not always...

주제어

표/그림 (7)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 다음으로는 실험 결과를 통해 클라우드 컴퓨팅 플랫폼에서 공간데이터 분석의 효율성을 확인하고, 경제성과 안정성 측면에서 클라우드 컴퓨팅이 갖는 장점에 대해 논할 것이다. 결론에서는 실험을 통해 도출된 결과를 다시 정리하고, 본 연구의 한계점과 향후 연구 방향에 대해 논의한다.
  • 병렬 처리를 통한 연산 속도의 향상은 공간분석 과정을 정량적으로 가속할 뿐만 아니라, 분석을 통해 해결할 수 있는 문제의 범위를 확대한다는 점에서 의미가 있다(Turton and Openshaw, 1998). 그러나 아직까지 대용량 공간데이터의 분석에 클라우드 컴퓨팅 플랫폼을 활용했을 때 어느 정도의 성능 향상을 기대할 수 있는지에 대한 실증적 연구는 활발히 이루어지지 않고 있으며, 따라서 본 논문에서는 이를 중점적으로다룸으로써 논의의 공백을 채우고자 한다. 본연구에서는 클라우드 컴퓨팅 플랫폼에서 병렬연산을 적용했을 때 대표적인 공간분석 기법인 모란지수와 지리가중회귀분석의 연산 속도가 어느 정도 향상되는지 살펴보고 그 결과를 바탕으로 클라우드 컴퓨팅을 활용한 공간분석의 효율성을 평가하고자 한다.
  • 본 연구는 공용 클라우드 서비스 중 가장 사용자 수가 많은 AWS의 아마존 일래스틱 컴퓨트 클라우드(Amazon Elastic Compute Cloud; Amazon EC2)를 기반으로 분석을 수행한다. EC2는 AWS의 핵심적인 요소로, 물리적인 전산 자원을 인스턴스라 불리는 여러 대의 가상서버로 나누어 제공한다.
  • 본 연구에서는 최근 빅데이터 분석을 위한 합리적인 대안으로 활발하게 논의되어 온 클라우드 컴퓨팅 플랫폼에서 실제 공간분석을 수행할 때 기대할 수 있는 효율성과 효과성을 실험을 통해 확인하고자 한다. 클라우드 컴퓨팅이란 사용자가 필요로 하는 소프트웨어와 스토리지, 메모리 등의 전산 자원을 필요한 만큼 사용하고, 이에 따라 비용을 지급하는 서비스 모델을 의미한다(Kim et al.
  • 본 연구의 가장 큰 의의는 실험을 통해 클라우드 컴퓨팅 플랫폼에서의 공간분석이 갖는 효율성과 효과성을 실증적으로 밝혔다는 점일 것이다. 그러나 본 연구에서는 무작위로 분포된 임의의 포인트 데이터를 활용하여 분석을 수행했으며, 몬테카를로 시뮬레이션의 원활한 실행을 위해 데이터의 규모 또한 일정 정도로 제한할 수밖에 없었다.
  • 그러나 아직까지 대용량 공간데이터의 분석에 클라우드 컴퓨팅 플랫폼을 활용했을 때 어느 정도의 성능 향상을 기대할 수 있는지에 대한 실증적 연구는 활발히 이루어지지 않고 있으며, 따라서 본 논문에서는 이를 중점적으로다룸으로써 논의의 공백을 채우고자 한다. 본연구에서는 클라우드 컴퓨팅 플랫폼에서 병렬연산을 적용했을 때 대표적인 공간분석 기법인 모란지수와 지리가중회귀분석의 연산 속도가 어느 정도 향상되는지 살펴보고 그 결과를 바탕으로 클라우드 컴퓨팅을 활용한 공간분석의 효율성을 평가하고자 한다. 병렬 연산은 통계 프로그램 R에 parallel, foreach와 같은 추가 패키지를 설치하여 수행하며, 계산 과정에서 프로세서 간 상호작용 및 영향이 없는 간단한 형태의 처치 곤란 병렬(embarrassingly parallel) 알고리즘이 사용될 것이다.
  • 로컬 컴퓨터는 일반적인 연구 환경을 대표하기 위해 가격 대비효율이 높은 것으로 알려진 대중적인 부품들로 구성하였으며, 가상 서버 인스턴스도 개인이 충분히 감당 가능한 중저가의 서비스를 선택해 비교 분석을 수행하였다. 이를 통해 클라우드 컴퓨팅 환경에서 공간분석을 수행할 때 체감할 수 있는 현실적인 성능 향상 효과를 파악하는 것이 본 연구의 일차적인 목표가 된다.
  • 또한, 전산 자원의 유지와 보수, 관리를 서비스 제공자에게 맡기고, 사용자는 안정된 환경에서 분석에만 집중할 수 있다는 장점이 있다(Choi and Noh, 2011). 이에 따라 본 연구에서는 클라우드 컴퓨팅 플랫폼에서 크기가 다른 여러 개의 공간데이터를 분석하고, 그 결과를 바탕으로 공간데이터의 크기에 따라 클라우드 컴퓨팅의 효율성이 어떻게 변화하는지 살펴볼 것이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
국지적 통계기법에는 어떤 것들이 있는가? 공간분석에 사용되는 데이터 규모에 비례한 연산량의 증가는 컴퓨팅 측면에서 여러 가지 어려움을 수반하게 된다. 특히 국지적 모란지수(Local Moran’s I)나 지리가중회귀분석(Geographically Weighted Regression; GWR)과 같은 국지적 통계기법은 각 공간 단위에서 반복적으로 연산을 수행해야 하므로 높은 수준의 알고리즘 최적화와 많은 전산 자원을 필요로 한다. 그러나 일반적으로 사용되는 많은 GIS 프로그램에서는 한 번에 처리 가능한 데이터의 규모가 일정 이하로 제한되는 경우가 많고(Zhang, 2016), 따라서 대용량 공간데이터의 효율적인 분석과 활용을 위해서는 새로운 접근법을 모색하는 것이 필요하다(Kitchin, 2013).
병렬연산이란 무엇인가? (2011)는 특히 대규모의 병렬 연산(parallel computing)이 필요할 때 클라우드컴퓨팅의 작업 환경이 유용하다고 밝혔다. 병렬연산은 데이터 또는 연산과정에서 반복적으로 계산이 필요한 부분을 분리하고 이를 여러 개의 전산 자원이 동시에 나누어 수행하는 기술을 말하는데(Quinn, 1987), 독립적인 연산이 가능한 자원이 많을수록 효율이 높아진다. 일반적으로 공용 클라우드 컴퓨팅 플랫폼에서는 매우 많은 수의 가상 서버를 동시에 운용할 수 있으므로 대용량 데이터를 분산시켜 병렬로 연산하는 것이 상대적으로 수월하며, 따라서 최근의 많은 연구에서는 클라우드 컴퓨팅과 병렬 연산을 접목하여 대용량 공간데이터 분석 과정에서 발생하는 특정한 문제점을 해결하고자 시도하였다(Healey et al.
클라우드 컴퓨팅은 어떤 방식으로 관련 비용을 절감할 수 있는가? 클라우드 컴퓨팅을 활용한다면 기존의 슈퍼컴퓨터 기반 분석의 단점으로 꼽히는 막대한 시설 구축 비용과 유휴 자원에 의한 낭비를 최소화할 수 있다. 즉, 빅데이터 분석에 요구되는 방대한 연산을 위해 고성능의 하드웨어를 직접 구축하지 않고 필요할 때에만 자원을 임대해서 사용함으로써 관련 비용을 절감할 수 있는 것이다. 또한, 전산 자원의 유지와 보수, 관리를 서비스 제공자에게 맡기고, 사용자는 안정된 환경에서 분석에만 집중할 수 있다는 장점이 있다(Choi and Noh, 2011).
질의응답 정보가 도움이 되었나요?
LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로