본 논문에서는 복제 데이터 간 링 기반 연결 구조를 이용한 부하 분산 기법을 제안한다. 그리드 데이터베이스에서는 일반적으로 각 노드의 데이터가 처리 성능과 가용성 향상을 위해 서로 다른 위치에 복제되어 저장되고, 사용자 질의는 목적 데이터를 포함하는 노드로 전송된 후 처리된다. 그러나 이러한 환경에서는 작업부하의 불균형으로 인한 성능 저하가 나타날 수 있다. 기존 연구는 노드의 수가 많고 사용자 질의가 유동적으로 변하는 그리드 데이터베이스에는 적용하기 힘들다. 제안 기법은 각각의 동일 복제본이 포함된 노드들을 하나의 링 구조로 연결한다. 노드의 작업 부하가 한계를 넘게 되면, 이후 입력되는 질의의 목적 데이터에 따라 다음 연결 노드로 질의를 전송한다. 그리고 이 노드는 작업 부하가 적어질 때까지 새로운 질의를 입력받지 않는다. 이후, 이전 노드로 메시지를 전송하여 이 노드로 질의가 전달되지 않도록 연결 구조를 변경한다. 제안 기법은 성능평가를 통해 기존 방식에 비해 다수의 노드를 포함하면서 구조가 동적으로 변화하는 환경에서 기존 기법보다 우수한 성능을 보인다.
본 논문에서는 복제 데이터 간 링 기반 연결 구조를 이용한 부하 분산 기법을 제안한다. 그리드 데이터베이스에서는 일반적으로 각 노드의 데이터가 처리 성능과 가용성 향상을 위해 서로 다른 위치에 복제되어 저장되고, 사용자 질의는 목적 데이터를 포함하는 노드로 전송된 후 처리된다. 그러나 이러한 환경에서는 작업부하의 불균형으로 인한 성능 저하가 나타날 수 있다. 기존 연구는 노드의 수가 많고 사용자 질의가 유동적으로 변하는 그리드 데이터베이스에는 적용하기 힘들다. 제안 기법은 각각의 동일 복제본이 포함된 노드들을 하나의 링 구조로 연결한다. 노드의 작업 부하가 한계를 넘게 되면, 이후 입력되는 질의의 목적 데이터에 따라 다음 연결 노드로 질의를 전송한다. 그리고 이 노드는 작업 부하가 적어질 때까지 새로운 질의를 입력받지 않는다. 이후, 이전 노드로 메시지를 전송하여 이 노드로 질의가 전달되지 않도록 연결 구조를 변경한다. 제안 기법은 성능평가를 통해 기존 방식에 비해 다수의 노드를 포함하면서 구조가 동적으로 변화하는 환경에서 기존 기법보다 우수한 성능을 보인다.
In this paper, a load balancing method using ring network structure in the Grid database is proposed. In the Grid database, generally, data is replicated for performance and availability. And, user's request is transferred to node and processed in that node which has target data. But, in such enviro...
In this paper, a load balancing method using ring network structure in the Grid database is proposed. In the Grid database, generally, data is replicated for performance and availability. And, user's request is transferred to node and processed in that node which has target data. But, in such environment, a decline of performance can be occurred because unbalanced workload. A traditional research is proposed to solve unbalanced load problem. However, the Grid database has a number of systems and user's request always changes dynamically. Therefore, a traditional research can not be applied. The proposed method connects each node which has a same replicated data through ing network structure. If workload is overflowed in some node, user's request is transferred to a linked node which has a target data. And, this node stops another request processing until workload is decreased. Then, it changes the link structure through sending a message to a previous node, to stop request forwarding from a previous node. This paper shows a proposed method increases performance than existing research through performance evaluation and is more suitable for a complex and dynamic environment.
In this paper, a load balancing method using ring network structure in the Grid database is proposed. In the Grid database, generally, data is replicated for performance and availability. And, user's request is transferred to node and processed in that node which has target data. But, in such environment, a decline of performance can be occurred because unbalanced workload. A traditional research is proposed to solve unbalanced load problem. However, the Grid database has a number of systems and user's request always changes dynamically. Therefore, a traditional research can not be applied. The proposed method connects each node which has a same replicated data through ing network structure. If workload is overflowed in some node, user's request is transferred to a linked node which has a target data. And, this node stops another request processing until workload is decreased. Then, it changes the link structure through sending a message to a previous node, to stop request forwarding from a previous node. This paper shows a proposed method increases performance than existing research through performance evaluation and is more suitable for a complex and dynamic environment.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 링 기반 연결 구조를 이용한 부하 분산 기법올 제안하고, 이에 대한 다른 기법과의 성능평가를 수행하였다. 제안 기법은 그리드 데이터베이스를 구성하는 모든 노드의 복제본들을 중심으로 링 구조를 구성하였으며, 이러한 링 구조를 통한 작업부하의 분산 과정을 포함한다.
분산 데이터베이스가 데이터의 공유, 유통 및 투명성에 초점이 맞추어 있다면, 데이터베이스 클러스터는 고속의 네트워크 연결하여 데이터 처리의 성능, 신뢰성, 가용성을 향상 시키는데 목적이 있다. 데이터베이스 클러스터에서는 작업 부하를 분산시키기 위하여 부하 분산 기법을 사용하여 데이터베이스의 작업량을 균형 있게 분배한다.
가설 설정
([알고리즘 3]에서 설명됨). 04~07라인은 [그림 5]의 (b)인 상태에서 N2가 보통 상태로 전환되는 경우 이용된다. 이를 통해 N2의 정방향 링크는 자신을 가리키게 되며, [그림 5]의 (a)와 같은 상태가 된다.
제안 방법
대해 설명하고., 클라이언트 수, 질의집중도 등의 환경 변화에 따른 제안기법과 기존 기법과의 성능 비교를 수행한다.
그리고 제안 기법은 본 논문에서 제안하는 구조를 그대로 구현하여 사용하며, 명칭을 RING으로 한다.
대기열의 길이가 길어질수록 작업 대기시간이'길어져…전체적인 처리'성능이떨어짐을 알 수 있다. 대기열의 길이를 1~20개의 범위를 두어 설정하였으나, 실제 실험평가에서 대기열의 길이에 따른 결과값의 변화가 미미하여 이에 대한 평가는 생략하였다.
이는 기존의 부하 분산 기법들의 적용 환경, 부하 분산 방식이 노드 단위로 적용되는데 반해 제안 기법은 복제된 데이터를 기준으로 부하 분산과정을 수행하기 때문에 평가를 위한 기준을 세우기가 어렵다. 따라서 COORD 방식은 코디네이터가 모든 데이터의 메타 정보를 포함하고 있으며, 본 논문에서 제안하는 복제본 기반의 부하 분산 방식을 적용하였다.
만일 N3를 보통 상태로 바꾸면서 N1 으로 보낸 메시지를 N3가 받지 못한다면, N3의 정방향 링크는 NULL값에서 바뀌지 않을 것이다. 따라서 본 논문에서는 정방향 링크의 변경을 위해 메시지를 받은 노드가 과부하 상태인 경우 다음 노드에도 동일한 메시지를 전달하여 노드의 상태 변경 정보를 확산시킨다.
그리고 이 노드는 작업부하가 적어질 때까지 다른 질의에 대한 처리를 중지한다. 또한, 역방향 링크를 통해 메시지를 보내어 자신의 이전 노드가 자신에게 질의를 전달하지 않도록 링크 구조를 수정한다. 작업 부하가 적어지면, 다시 메시지를 이전 노드로 보내어 링크 구조를 원래대로 바꾸며, 질의 처리 과정에 참여하게 된다.
본 논문에서는 위와 같이 부하 분산을 수행하지 않는 SIMPLE과 코디네이터를 통해 부하 분산을 수행하는 COORD기법을 통해 제안기법의 비교평가를 수행한다. 이는 기존의 부하 분산 기법들의 적용 환경, 부하 분산 방식이 노드 단위로 적용되는데 반해 제안 기법은 복제된 데이터를 기준으로 부하 분산과정을 수행하기 때문에 평가를 위한 기준을 세우기가 어렵다.
제안 기법은 각각의 동일 복제본이 포함된 노드들을 하나의 링 구조로 연결한다. 각각의 복제본들은 정방향 링크와 역방향 링크를 통해 서로 연결되며, 하나의 노드는 자신이 가지는 복제본의 수만큼 연결링크들을 갖게 된다.
수행하였다. 제안 기법은 그리드 데이터베이스를 구성하는 모든 노드의 복제본들을 중심으로 링 구조를 구성하였으며, 이러한 링 구조를 통한 작업부하의 분산 과정을 포함한다. 성능 평가에서는 모든 노드의 작업 부하를 취합해 이를 바탕으로 부하 분산을 유도하는 기존 기법에 비해 좋은 성능을 보였다.
제안기법의 구현을 위해 다수의 클라이언트와 서버를 구성하였으며, 모든 서버에 제안한 자료구조를 저장하였다. 제안기법의 비교 평가 대상이 되는 기존기법의 구성을 위해 코디네이터와 서버의 작업 부하 값을 계산하여 전송하는 기능들을 추가 구현하였다.
제안기법의 비교 평가 대상이 되는 기존기법의 구성을 위해 코디네이터와 서버의 작업 부하 값을 계산하여 전송하는 기능들을 추가 구현하였다. 전체 구현에 소요된 라인 수는 약 1700라인이며, MS Visual C++ 6.
코디네이터는 모든 복제본들에 대한 카탈로그 정보를 가지고 있다. 해당 카탈로그 정보와 취합된 각 노드들의 작업 부하 정보를 바탕으로 최적의 노드를 선택하여 해당 노드로 질의를 전송한다.
대상 데이터
본 실험 평가에서는 클라이언트의 수, 서버의 수, 질의 집중 비율을 주요 평가 인자로 사용하였다. 이외에도 복제본의 수, 질의 처리 시간, 질의 전송 시간 등의 몇몇 값을 바꾸어 가며 평가하였지만, 실험 결과의 변위 값의 증감 외에는 별 다른 변동사항이 없어 본 논문에서는 설명하지 않는다.
제안기법의 비교 평가 대상이 되는 기존기법의 구성을 위해 코디네이터와 서버의 작업 부하 값을 계산하여 전송하는 기능들을 추가 구현하였다. 전체 구현에 소요된 라인 수는 약 1700라인이며, MS Visual C++ 6.0을 사용하였다. 전체적인 구성은 가능한 실제 환경에 맞게끔 구현하였으며, 평가 환경은 다음과 같이 구성하였다.
이론/모형
본 논문에서는 제안기법의 평가를 위해 C/C++ 언어 기반 시뮬레이션 툴인 CSIM을 사용하였다. CSIMe 분산 환경에서의 컴퓨팅 모델, 알고리즘 평가 등 대부분의 시뮬레이션이 가능한 툴이다.
실험을 위한 비교 평가 대상은 첫 번째로 부하 분산을 수행하지 않고 입력되는 질의를 해당 노드에서 바로 처리하는 방식을 사용하였으며, 이후 명칭을 SIMPLE로 사용한다.
성능/효과
이는 코디네이터의 처리 한계로 인한 것으로 판단된다. SIMPLE 방식과 RING 방식은 거의 같은 성능을 나타내었으나, RING 방식이 약간의 성능 향상을 나타내고 있다. 이는 RING 방식 에서 수행되는 부하 분산으로 일어난 현상이다.
복제본의 수와는 상관없이 실험 결과는 [그림 10]과 비슷하게 나왔다. SIMPLE 방식은 질의 집중 비율이 증가할수록 성능이 떨어졌으며, COORD 방식은 질의 집중 비율에 상관없이 항상 동일한 성능을 나타내었다. 본 논문에서 제안하는 RING 방식은 질의 집중 비율이 높아질수록 처리 성능이 안 좋아졌으나, COORD와 SIMPLE 방식 보다는 좋은 성능을 나타내었다.
[그림 8]의 a)에서COORD 방식은 클라이언트 수를 11개 이상으로 늘렸을 때 더 이상성능 향상이 되지 않았다. 이는 코디네이터의 처리 한계로 인한 것으로 판단된다.
가지 면에서 성능이 향상됨을 보인다. 또한, 기존기법보다 그리드 데이터베이스에 적합함을 보인다.
SIMPLE 방식은 질의 집중 비율이 증가할수록 성능이 떨어졌으며, COORD 방식은 질의 집중 비율에 상관없이 항상 동일한 성능을 나타내었다. 본 논문에서 제안하는 RING 방식은 질의 집중 비율이 높아질수록 처리 성능이 안 좋아졌으나, COORD와 SIMPLE 방식 보다는 좋은 성능을 나타내었다.
제안 기법은 그리드 데이터베이스를 구성하는 모든 노드의 복제본들을 중심으로 링 구조를 구성하였으며, 이러한 링 구조를 통한 작업부하의 분산 과정을 포함한다. 성능 평가에서는 모든 노드의 작업 부하를 취합해 이를 바탕으로 부하 분산을 유도하는 기존 기법에 비해 좋은 성능을 보였다.
나타낸다. 이번 실험을 통해 COORD 방식은 서버의 수와는 상관없이 코디네이터의 처리 성능에 전체 처리량이 결정되는 것을 확인할 수 있다.
제안 기법은 성능평가를 통해 기존 방식에 비해 여러 가지 면에서 성능이 향상됨을 보인다. 또한, 기존기법보다 그리드 데이터베이스에 적합함을 보인다.
후속연구
제안 기법은 노드의 추가와 삭제가 자유롭고 다른 노드와의 연결 구조가 동적이며, 노드의 수가 방대한 환경에서 유용하게 사용될 수 있다. 복제본 간의 연결구조를 통해 데이터 중심의 부하 분산 방식을 실현하였으며, 어떠한 어플리케이션에도 적용 가능하다.
향후 연구로는 각종 응용 환경에서 네트워크 구성, 부하 분산 방식 등이 서로 다른 기법 간의 성능평가가 필요하다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.