빅 데이터는 일반적으로 사용되는 데이터 관리 시스템으로 데이터의 처리, 수집, 저장, 탐색, 분석을 할 수 없는 큰 규모의 데이터를 말한다. 빅 데이터 기술인 맵 리듀스(MapReduce)를 이용한 병렬 GA 연구는 Hadoop 분산처리환경을 이용하여, 맵 리듀스에서 GA를 수행함으로써 GA의 병렬처리를 쉽게 구현할 수 있다. 기존의 맵 리듀스를 이용한 GA들은 GA를 맵 리듀스에 적절히 변형하여 적용하였지만 잦은 데이터 입출력에 의한 수행시간 지연으로 우수한 성능을 보이지 못하였다. 본 논문에서는 기존의 맵 리듀스를 이용한 GA의 성능을 개선하기 위해, 맵과 리듀싱과정을 개선하여 맵 리듀스 특징을 이용한 새로운 MRPGA(MapReduce Parallel Genetic Algorithm)기법을 제안하였다. 기존의 PGA의 topology 구성과 migration 및 local search기법을 MRPGA에 적용하여 최적해를 찾을 수 있었다. 제안한 기법은 기존에 맵 리듀스 SGA에 비해 수렴속도가 1.5배 빠르며, sub-generation 반복횟수에 따라 최적해를 빠르게 찾을 수 있었다. 또한, MRPGA를 활용하여 빅 데이터 기술의 처리 및 분석 성능을 향상시킬 수 있다.
빅 데이터는 일반적으로 사용되는 데이터 관리 시스템으로 데이터의 처리, 수집, 저장, 탐색, 분석을 할 수 없는 큰 규모의 데이터를 말한다. 빅 데이터 기술인 맵 리듀스(MapReduce)를 이용한 병렬 GA 연구는 Hadoop 분산처리환경을 이용하여, 맵 리듀스에서 GA를 수행함으로써 GA의 병렬처리를 쉽게 구현할 수 있다. 기존의 맵 리듀스를 이용한 GA들은 GA를 맵 리듀스에 적절히 변형하여 적용하였지만 잦은 데이터 입출력에 의한 수행시간 지연으로 우수한 성능을 보이지 못하였다. 본 논문에서는 기존의 맵 리듀스를 이용한 GA의 성능을 개선하기 위해, 맵과 리듀싱과정을 개선하여 맵 리듀스 특징을 이용한 새로운 MRPGA(MapReduce Parallel Genetic Algorithm)기법을 제안하였다. 기존의 PGA의 topology 구성과 migration 및 local search기법을 MRPGA에 적용하여 최적해를 찾을 수 있었다. 제안한 기법은 기존에 맵 리듀스 SGA에 비해 수렴속도가 1.5배 빠르며, sub-generation 반복횟수에 따라 최적해를 빠르게 찾을 수 있었다. 또한, MRPGA를 활용하여 빅 데이터 기술의 처리 및 분석 성능을 향상시킬 수 있다.
Big Data is data of big size which is not processed, collected, stored, searched, analyzed by the existing database management system. The parallel genetic algorithm using the Hadoop for BigData technology is easily realized by implementing GA(Genetic Algorithm) using MapReduce in the Hadoop Distrib...
Big Data is data of big size which is not processed, collected, stored, searched, analyzed by the existing database management system. The parallel genetic algorithm using the Hadoop for BigData technology is easily realized by implementing GA(Genetic Algorithm) using MapReduce in the Hadoop Distribution System. The previous study that the genetic algorithm using MapReduce is proposed suitable transforming for the GA by MapReduce. However, they did not show good performance because of frequently occurring data input and output. In this paper, we proposed the MRPGA(MapReduce Parallel Genetic Algorithm) using improvement Map and Reduce process and the parallel processing characteristic of MapReduce. The optimal solution can be found by using the topology, migration of parallel genetic algorithm and local search algorithm. The convergence speed of the proposal method is 1.5 times faster than that of the existing MapReduce SGA, and is the optimal solution can be found quickly by the number of sub-generation iteration. In addition, the MRPGA is able to improve the processing and analysis performance of Big Data technology.
Big Data is data of big size which is not processed, collected, stored, searched, analyzed by the existing database management system. The parallel genetic algorithm using the Hadoop for BigData technology is easily realized by implementing GA(Genetic Algorithm) using MapReduce in the Hadoop Distribution System. The previous study that the genetic algorithm using MapReduce is proposed suitable transforming for the GA by MapReduce. However, they did not show good performance because of frequently occurring data input and output. In this paper, we proposed the MRPGA(MapReduce Parallel Genetic Algorithm) using improvement Map and Reduce process and the parallel processing characteristic of MapReduce. The optimal solution can be found by using the topology, migration of parallel genetic algorithm and local search algorithm. The convergence speed of the proposal method is 1.5 times faster than that of the existing MapReduce SGA, and is the optimal solution can be found quickly by the number of sub-generation iteration. In addition, the MRPGA is able to improve the processing and analysis performance of Big Data technology.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 논문에서 이 점을 개선하기 위해 맵 리듀스를 이용한 새로운 PGA 기법인 MRPGA기법을 제안하고자 한다. 제안하고자 하는 MRPGA 구조는 다음 그림 4와 같다.
따라서 본 논문에서는 기존의 맵 리듀스를 이용한 GA의 성능을 개선하기 위해, Hadoop환경에서 맵 리듀스를 이용한 효율적인 PGA 기법을 제안한다. 제안한 MRPGA(MapReduce Parallel Genetic Algorithm)은 기존의 맵 리듀스 SGA(Scaling Simple Genetic Algorithm)방법에서 맵과 리듀싱과정을 개선하여 새로운 맵 리듀스 PGA 기법을 제안하였다.
추후 연구로는 population 초기화 방법을 통해 PGA 의 성능을 개선하고, 병렬처리를 극대화하기 위해 효율적인 다중 리듀싱 방법 연구와 싱글 리듀서에서 Local Search 및 휴리스틱 알고리즘을 환경에 맞게 적용하여 하이브리드 형태의 맵 리듀스 PGA를 연구하고자 한다. 또한, 제안하는 기법을 이용하여 빅 데이터 기술의 성능을 향상시키는 연구를 하고자 한다.
본 논문에서는 Hadoop환경으로부터 분산환경을 구축하여, 맵 리듀스를 통해 PGA를 구현하는 방법을 제안하였다. 또한 기존의 방법들을 개선하기 위해 새로운 맵 리듀스 PGA 방법을 제시하였다.
본 논문에서는 제안하는 기법을 평가하기 위해 Hadoop Framework 환경에서 맵 리듀스를 이용한 Simple Scaling Genetic Algorithm과 제안하는 기법을 실험한다.
본 논문을 통해 효율적인 맵 리듀스 병렬 유전자 알고리즘 기법을 제안하였고, 실험을 통해 우수한 성능을 증명하였다. 추후 연구로는 population 초기화 방법을 통해 PGA 의 성능을 개선하고, 병렬처리를 극대화하기 위해 효율적인 다중 리듀싱 방법 연구와 싱글 리듀서에서 Local Search 및 휴리스틱 알고리즘을 환경에 맞게 적용하여 하이브리드 형태의 맵 리듀스 PGA를 연구하고자 한다.
본 실험에서는 제안하는 기법의 각 sub-population에서의 sub-generation 횟수에 따른 성능 분석을 하였다. sub-generation 반복에 의해 제안하는 기법에서는 각 mapper에서 local search를 수행하게 되어 좀 더 빠르게 전역 최적해를 탐색할 수 있도록 하였다.
제안 방법
MRPGA의 처리능력과 확장성을 분석하기 위해 먼저 각 맵의 sub-population을 100개로 고정하고, individual 당 유전자 개수를 100개로 고정하였다. 그리고 mapper의 개수를 늘려 문제영역을 확장하여 소요되는 시간을 측정하였다.
맵 리듀스를 이용한 SGA[15]에서는 맵과 리듀스에 맞게 변형된 GA 초기모델을 제시하였다. SGA 기법 중 Selecto-recombinative genetic algorithms[16], [17]의 단계를 맵과 리듀스 과정에 적절하게 모델링하여 구현하였다. 이 논문에서 맵 리듀스 데이터 흐름은 그림 3과 같다.
본 실험에서는 제안하는 기법의 각 sub-population에서의 sub-generation 횟수에 따른 성능 분석을 하였다. sub-generation 반복에 의해 제안하는 기법에서는 각 mapper에서 local search를 수행하게 되어 좀 더 빠르게 전역 최적해를 탐색할 수 있도록 하였다. 따라서 반복회수 증가에 따른 GA의 성능(수렴 속도)을 평가하였다.
실험은 총 population크기는 400개, individual 당 유전자 개수를 100개로 하였고 mapper의 개수는 4개이다. 각 1회, 10회, 50회의 sub-generation을 수행하여 fitness 값을 계산하여 수렴속도를 분석하였다.
MRPGA의 처리능력과 확장성을 분석하기 위해 먼저 각 맵의 sub-population을 100개로 고정하고, individual 당 유전자 개수를 100개로 고정하였다. 그리고 mapper의 개수를 늘려 문제영역을 확장하여 소요되는 시간을 측정하였다. 문제 영역이 mapper에 개수에 따라 확장되면서 population의 다양성 보장과 우수한 글로벌 최적해를 찾을 수 있다.
기존의 PGA 방법들의 장점을 활용하여 싱글 리듀싱을 통해 각 서브 Population의 값을 통합하고 근사해를 탐색하며, 맵으로의 재입력으로 값들을 섞음으로써 다양성을 유지, 수렴속도를 향상시켰다. 맵에서 데이터를 만들고, 리듀스에서는 계산과 통계과정만 거침으로써 맵 리듀스의 구조의 활용도를 극대화할 수 있었다.
두 번째 실험으로 sub-generation 횟수별 1세대 당 소요 시간을 측정하였다. 이는 반복횟수에 따른 overhead가 발생하는 것을 분석하기 위해서다.
sub-generation 반복에 의해 제안하는 기법에서는 각 mapper에서 local search를 수행하게 되어 좀 더 빠르게 전역 최적해를 탐색할 수 있도록 하였다. 따라서 반복회수 증가에 따른 GA의 성능(수렴 속도)을 평가하였다. 결과는 그림 8과 같다.
본 논문에서는 Hadoop환경으로부터 분산환경을 구축하여, 맵 리듀스를 통해 PGA를 구현하는 방법을 제안하였다. 또한 기존의 방법들을 개선하기 위해 새로운 맵 리듀스 PGA 방법을 제시하였다. I/O 횟수를 줄여 PGA의 속도를 개선하였고, 싱글 리듀싱을 통해 탐색영역의 통합과 분산 맵으로 유전자의 다양성을 유지할 수 있었다.
제안한 방법은 맵 리듀싱과정에서의 sub-generation을 수행하여 파일 입출력 시간을 최소화함으로써 속도를 개선하였다. 또한 맵과정에서 local search를 수행함으로써 우수한 최적해를 빠르게 찾도록 하였다.
잡은 입력 데이터, 맵 리듀스 프로그램과 설정 정보로 구성된다. 또한 잡은 Map 태스크와 Reduce 태스크로 나누어 실행한다. 잡 실행 과정의 제어를 위해 하나의 잡 트래커(job tracker)와 다수의 태스크 트래커(task tracker)가 사용된다[9].
본 실험에서 제안하는 알고리즘이 최적해로 수렴하는 시간을 알아보았다. 102 variable의 individual 크기로 4개의 mapper을 사용하였고, 총 population size는 400개로 sub-generation은 10회, 실험결과는 아래 그림 5와 같다.
앞서 SGA논문에서 사용한 Selecto-recombinative genetic algorithms을 응용 및 개선하여 selection과 crossover를 연계한 local search 형태의 맵 구조를 제안하고, 우수한 individual을 reduce에 전달하면서 맵 리듀스 구조를 이용한 migration을 적용하였다. 과정을 요약하면 아래와 같다.
따라서 본 논문에서는 기존의 맵 리듀스를 이용한 GA의 성능을 개선하기 위해, Hadoop환경에서 맵 리듀스를 이용한 효율적인 PGA 기법을 제안한다. 제안한 MRPGA(MapReduce Parallel Genetic Algorithm)은 기존의 맵 리듀스 SGA(Scaling Simple Genetic Algorithm)방법에서 맵과 리듀싱과정을 개선하여 새로운 맵 리듀스 PGA 기법을 제안하였다. 또한 기존의 PGA의 topology 구성과 migration 기법을 MRPGA에 적용하여, 우수한 전역해를 찾을 수 있었다.
제안한 방법은 맵 리듀싱과정에서의 sub-generation을 수행하여 파일 입출력 시간을 최소화함으로써 속도를 개선하였다. 또한 맵과정에서 local search를 수행함으로써 우수한 최적해를 빠르게 찾도록 하였다.
대상 데이터
본 실험에서 제안하는 알고리즘이 최적해로 수렴하는 시간을 알아보았다. 102 variable의 individual 크기로 4개의 mapper을 사용하였고, 총 population size는 400개로 sub-generation은 10회, 실험결과는 아래 그림 5와 같다.
결과는 그림 8과 같다. 실험은 총 population크기는 400개, individual 당 유전자 개수를 100개로 하였고 mapper의 개수는 4개이다. 각 1회, 10회, 50회의 sub-generation을 수행하여 fitness 값을 계산하여 수렴속도를 분석하였다.
데이터처리
20GHz)이며, RAM은 3GB이다. 실험에 사용된 Hadoop 모드는 단일 PC에서 가상의 분산환경을 구성할 수 있는 pseudo-distribution mode를 활용하여 병렬처리를 수행한다.
이론/모형
이 과정에서 정해진 mapper의 개수에 따라 subpopulation이 구성되며, 각 subpopulation별로 모든 individual에 대해서 GA의 연산자를 수행한다. 여기서 선택 방법은 tourment selection 방법을 사용하고, 교차는 uniform crossover[18]을 사용한다. 맵의 자세한 과정은 표 1에 수도코드에 나타나 있다.
최적해를 찾기위한 문제는 널리 사용되고 있는 간단한 최적화 문제인 OneMax Problem[19]를 사용하였다. 이 문제는 #일 때 fitness값이 최대인 값을 찾는 문제로 #는 다음과 같다.
성능/효과
또한 기존의 방법들을 개선하기 위해 새로운 맵 리듀스 PGA 방법을 제시하였다. I/O 횟수를 줄여 PGA의 속도를 개선하였고, 싱글 리듀싱을 통해 탐색영역의 통합과 분산 맵으로 유전자의 다양성을 유지할 수 있었다. 또한 sub-population별로 반복수행을 통한 local search로 PGA의 성능을 개선하였고, 맵 리듀스의 특성을 이용해 효율적인 migration을 구현하였다.
Reducer는 단일 Reducer로 구성하여, 맵에서 전달되는 값 가장 우수한 값(해)만을 찾는데 사용한다. Reducer의 결과 값이 정해진 기준에 도달하지 않거나 정해진 generation만큼 반복하지 않으면, 다시 맵 리듀스를 반복 수행함으로써 기존의 PGA의 Migration 형태의 방법으로 다양성을 유지한다. 리듀스에서는 계산 및 통계만 수행하기 때문에 간단하게 구성되어 있으며, 슈도코드는 표 2와 같다.
실험 결과를 살펴보면 약 53 세대부터 최적해에 근접하여 수렴하는 것을 확인할 수 있었다. 각 세대별 수행시간은 평균 20.625초가 걸리기 때문에 결과적으로 약 1000초정도 진행되면 수렴하는 것을 볼 수 있었다. 맵 리듀스 SGA 기법 과 비교해보면 그림 6과 같다.
두 가지 실험을 통해 제안하는 기법은 반복을 하지 않는 것에 비해 약 140%(1.4배)정도의 빠른 속도로 수렴하였고, 100회의 generation 후 얻은 최적해도 1회는 fitness값이 598, 10회와 50회는 fitness 값이 600으로 더 우수한 전역 최적해를 얻는 것을 확인할 수 있었다. 따라서 제안하는 기법은 overhead가 거의 없이 속도와 탐색(수렴) 성능에서 우수한 성능을 나타내는 것을 확인할 수 있었다.
그리고 기존 SGA 방법의 경우 리듀스에서 GA를 수행하고 있는데, 맵 리듀스의 구조적 특성상 리듀스의 역할은 주로 데이터의 통계만 수행하고, 맵에서 데이터를 만들어서 보내준다. 따라서 맵에서 GA의 주 요 연산을 수행하여 데이터를 만들어서 보내주면, 리듀스에서는 계산 및 통계적인 작업만 수행하는 것이 효율적이다. 또한 기존의 PGA 알고리즘들의 장점인[3] subpopulation 별 세대 반복과 migration을 수행할 수 없으며 subpopulation의 topology 구성간의 특성을 얻기가 어렵다.
4배)정도의 빠른 속도로 수렴하였고, 100회의 generation 후 얻은 최적해도 1회는 fitness값이 598, 10회와 50회는 fitness 값이 600으로 더 우수한 전역 최적해를 얻는 것을 확인할 수 있었다. 따라서 제안하는 기법은 overhead가 거의 없이 속도와 탐색(수렴) 성능에서 우수한 성능을 나타내는 것을 확인할 수 있었다. 다만, sub-generation의 횟수가 너무 클 경우 local search에 의해 GA가 조기 수렴할 수 있다.
5배)의 우수한 성능(속도)으로 전역 최적해를 빠르게 탐색하여 수렴한다고 판단할 수 있다. 따라서, MRPGA 기법이 기존의 방법보다 최적해를 찾는 성능이 우수하다는 것을 알 수 있다.
50회의 경우 약 50세대부터 수렴을 시작하여 최적해로 수렴하였다. 따라서, sub-population 별 반복에 따라 local search를 수행하는 것이 GA의 성능을 개선시켜주는 것을 확인할 수 있었다.
I/O 횟수를 줄여 PGA의 속도를 개선하였고, 싱글 리듀싱을 통해 탐색영역의 통합과 분산 맵으로 유전자의 다양성을 유지할 수 있었다. 또한 sub-population별로 반복수행을 통한 local search로 PGA의 성능을 개선하였고, 맵 리듀스의 특성을 이용해 효율적인 migration을 구현하였다.
제안한 MRPGA(MapReduce Parallel Genetic Algorithm)은 기존의 맵 리듀스 SGA(Scaling Simple Genetic Algorithm)방법에서 맵과 리듀싱과정을 개선하여 새로운 맵 리듀스 PGA 기법을 제안하였다. 또한 기존의 PGA의 topology 구성과 migration 기법을 MRPGA에 적용하여, 우수한 전역해를 찾을 수 있었다. 제안한 기법은 기존에 맵 리듀스 SGA에 비해 수렴속도가 1.
맵 리듀스 SGA도 수행시간을 측정한 결과 한 세대별 수행시간은 두 기법이 소요시간이 약 20초로 유사한 것을 확인할 수 있었다.
기존의 PGA 방법들의 장점을 활용하여 싱글 리듀싱을 통해 각 서브 Population의 값을 통합하고 근사해를 탐색하며, 맵으로의 재입력으로 값들을 섞음으로써 다양성을 유지, 수렴속도를 향상시켰다. 맵에서 데이터를 만들고, 리듀스에서는 계산과 통계과정만 거침으로써 맵 리듀스의 구조의 활용도를 극대화할 수 있었다. 다만, mapper의 개수가 적으면 기존의 맵 리듀스 PGA 방법들에 비해 병렬처리효율이 떨어져서 전반적인 효율성이 급격히 떨어질 수 있다.
실험 결과를 살펴보면 약 53 세대부터 최적해에 근접하여 수렴하는 것을 확인할 수 있었다. 각 세대별 수행시간은 평균 20.
이 논문에서는 기존의 SGA의 구조를 쉽게 맵 리듀스에 적용할 수 있도록 알고리즘을 제안하였고, 이로 인해 SGA를 맵 리듀스에 맞게 변형하고, 대규모 분산처리를 통해 큰 크기의 문제를 해결할 수 있었다.
맵 리듀스 SGA도 수행시간을 측정한 결과 한 세대별 수행시간은 두 기법이 소요시간이 약 20초로 유사한 것을 확인할 수 있었다. 이를 통해 제안하는 MRPGA 기법이 맵 리듀스 SGA 기법에 비해 164%(약 1.5배)의 우수한 성능(속도)으로 전역 최적해를 빠르게 탐색하여 수렴한다고 판단할 수 있다. 따라서, MRPGA 기법이 기존의 방법보다 최적해를 찾는 성능이 우수하다는 것을 알 수 있다.
5배 빠르며, sub-generation 반복횟수에 따라 우수한 최적해를 빠르게 찾을 수 있었다. 이를 통해 제안한 기법이 맵 리듀스 환경에서 효율적으로 병렬처리를 수행하여 우수한 성능을 나타낸다는 것을 입증할 수 있었다. 제안한 MRPGA는 최적화를 통해 빅 데이터의 처리에 성능을 향상시킬 수 있다.
Hadoop기반의 맵 리듀스(MapReduce)를 이용한 병렬 GA 연구는 이러한 부분을 개선하여 기존의 Hadoop 분산환경을 활용하여, 맵 리듀스에서 GA를 수행함으로써 GA의 병렬처리를 쉽게 구현할 수 있었다. 이미 분산 환경을 구성하기 용이하게 개발된 Hadoop Framework와 병렬처리 성능이 우수한 맵 리듀스를 이용하여 GA 구현이 용이하였고, 기존의 다양한 GA 방법들을 큰 변형없이 맵과 리듀스에 적절히 구성할 수 있었다.
이를 통해 제안한 기법이 맵 리듀스 환경에서 효율적으로 병렬처리를 수행하여 우수한 성능을 나타낸다는 것을 입증할 수 있었다. 제안한 MRPGA는 최적화를 통해 빅 데이터의 처리에 성능을 향상시킬 수 있다.
또한 기존의 PGA의 topology 구성과 migration 기법을 MRPGA에 적용하여, 우수한 전역해를 찾을 수 있었다. 제안한 기법은 기존에 맵 리듀스 SGA에 비해 수렴속도가 1.5배 빠르며, sub-generation 반복횟수에 따라 우수한 최적해를 빠르게 찾을 수 있었다. 이를 통해 제안한 기법이 맵 리듀스 환경에서 효율적으로 병렬처리를 수행하여 우수한 성능을 나타낸다는 것을 입증할 수 있었다.
후속연구
추후 연구로는 population 초기화 방법을 통해 PGA 의 성능을 개선하고, 병렬처리를 극대화하기 위해 효율적인 다중 리듀싱 방법 연구와 싱글 리듀서에서 Local Search 및 휴리스틱 알고리즘을 환경에 맞게 적용하여 하이브리드 형태의 맵 리듀스 PGA를 연구하고자 한다.
질의응답
핵심어
질문
논문에서 추출한 답변
유전자 알고리즘이란?
유전자 알고리즘(GA : Genetic Algorithm)은 선택, 교차, 변이로 이루어진 유전자 오퍼레이터를 반복적으로 수행 하면서 최적의 해를 얻는 알고리즘이다. 유전자 알고리즘은 자연계에서 진화과정의 기반인 적자생존을 원리에 기초하여 최적의 해를 찾아가는 최적화 기법이다.
GA알고리즘의 장점은?
유전자 알고리즘(GA : Genetic Algorithm)은 선택, 교차, 변이로 이루어진 유전자 오퍼레이터를 반복적으로 수행 하면서 최적의 해를 얻는 알고리즘이다. 유전자 알고리즘은 자연계에서 진화과정의 기반인 적자생존을 원리에 기초하여 최적의 해를 찾아가는 최적화 기법이다. 또한, 단일점이 아닌 여러 점들의 집단에서 동시에 탐색을 하기 때문에 지역해(local optimal)가 아닌 전역 해(global optimal)를 찾을 수 있다. 이러한 장점 때문에 유전자 알고리즘은 퍼지 시스템, 신경망 등과 결합하여 다양한 분야에 적용되고 있다[2]
빅 데이터에서 주요 이슈는 무엇인가?
빅 데이터에 분석은 공학, 과학뿐만 아니라 기업, 정부 등 데이터를 수집하고 관리하는 모든 분야에서 관심사가 되고 있다[1]. 빅 데이터에서 주요 이슈는 데이터 규모, 데이터의 다양성, 데이터의 처리 속도를 효과적으로 대처하는 것이다. Hadoop은 이러한 빅 데이터를 저장, 관리, 처리, 분석하기 위한 도구로 잘 알려진 오픈 플랫폼이다.
참고문헌 (19)
Young Jun Kim1, Kyung Soon Hwang and Keon Myung Lee, "A MapReduce-based Algorithm for Semantic Hashing with Extended Boundaries," Proceedings of KIIS Fall Conference, Vol. 22, No. 2, 2012
Chong-Ho Yi and Dong W. Kim, "Comparisons of Robot-Moving Strategies with Evolutionary Algorithm and Neuro-Fuzzy Method", Journal of KIIT, Vol. 10, No. 2, pp. 227-232, 2012..
E. Cantu-Paz, "A survey of parallel genetic algorithms," Calculateurs Paralleles, Reseaux et Systemes Repartis, Vol. 10, No. 2, pp. 141-171, 1998.
Jae Hoon Cho , Dae-Jong Lee , Jin-Il Park , Myung-Geun Chun, "Hybrid Feature Selection Using Genetic Algorithm and Information Theory," INTERNATIONAL JOURNAL of FUZZY LOGIC and INTELLIGENT SYSTEMS, Vol.13 No.1, pp 69-77, 2013
Myung-Mook Han, "Parallel Genetic Algorithm based on a Multiprocessor System FIN and Its Application to a Classifier Machine," INTERNATIONAL JOURNAL of FUZZY LOGIC and INTELLIGENT SYSTEMS, Vol.8, No5, pp 61-71, 1998
Dongho Song, Yougil Lee, Tae-Hyoung Kim, "A Study on Distributed Particle Swarm Optimization Algorithm with Quantum-infusion Mechanism," INTERNATIONAL JOURNAL of FUZZY LOGIC and INTELLIGENT, Vol.22, No.4, pp 527-531, 2012
Seung-Hyung Jung, Jeoung-Nae Chi, Sung-Kwun Oh, Hyun-ki Kim, "Design of Optimized Fuzzy PD Cascade Controller Based on Parallel Genetic Algorithms," INTERNATIONAL JOURNAL of FUZZY LOGIC and INTELLIGENT, Vol.19, No.3, pp 329-336, 2009
Dean, J. and Ghemawat, S., "MapReduce: Simplified Data Processing on Large Clusters," Communication of the ACM, Vol. 51, No. 1, pp.107-113, 2008.
Yun-Hee Kang amd Myoung-Woo Hong, "Sensory Data Processing by Using Hadoop Framework," Journal of KIIT, Vol. 11, No.2, pp 169-174 , 2013
Feng Wang, Jie Qiu, Jie Yang, Bo Dong, Xinhui Li, and Ying Li, "Hadoop high availabilitythrough metadata replication", Proceeding of the first International Workshop on Cloud datamanagement, pp. 37-44, 2009.
Suan Lee and Jinho Kim, "Sort-Based Distributed Parallel Data Cube Computation Algorithm using MapReduce," Journal of The Institute of Electronics Engineers of Korea, Vol. 49, NO. 9, 2012.
Ghemawat, S., Gobioff, H., and Leung, S. T.,"The Google File System," In Proc. 19th on Operating Systems Principles, pp. 29-43, 2003.
HDFS, http://hadoop.apache.org/hdfs/.
Hadoop, http://hadoop.apache.org/.
Abhishek Verma, Xavier Llor'a, David E. Goldberg, and Roy H. Campbell., "Scaling Genetic Algorithms Using MapReduce," In Proceedings of the Ninth International Conference on Intelligent Systems Design andApplications (ISDA) , 2009.
D. E. Goldberg. Genetic algorithms in search, optimization, and machine learning. Addison-Wesley, Reading, MA, 1989.
D. E. Goldberg. The Design of Innovation: Lessons fromand for Competent Genetic Algorithms. Kluwer Academic Publishers, Norwell, MA, 2002.
G. Sywerda., "Uniform crossover in genetic algorithms," Proceedings of the third international conference on Genetic algorithms, pages 2-9, San 1989.
J. Schaffer and L. Eshelman., "On Crossover as an Evolutionary Viable Strategy," Proceedings of the 4th International Conference on Genetic Algorithms, pp 61-68, 1991.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.