InfiniBand RDMA 통신을 위한 Apache Storm의 재구성
Reconfiguration of Apache Storm for InfiniBand Communications

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.7 no.8, 2018년, pp.297 - 306  

양석우 (강원대학교 컴퓨터과학과) ,  손시운 (강원대학교 컴퓨터과학과) ,  문양세 (강원대학교 컴퓨터과학과)

AI-Helper 아이콘AI-Helper

본 논문에서는 분산 스트림 처리 프레임워크인 Apache Storm을 고성능 통신 장비인 InfiniBand에 적용하는 방안을 다룬다. InfiniBand 상에서 Storm을 동작시키는 쉬운 방법은 IPoIB (IP over InfiniBand)를 사용하는 것이다. 그러나 이 방법은 노드에 심각한 CPU 부하를 발생시키는데, 이는 잦은 문맥 전환과 버퍼 복사에서 기인하는 것으로 나타났다. 이를 해결하기 위해, Storm에서 InfiniBand의 RDMA (Remote Direct Memory Access) 기능을 사용하는 새로운 통신 방식을 제안한다. 첫째, Storm에서 RDMA 기능을 이용하기 위해, 기존 통신 프레임워크인 Netty를 대체하는 새로운 프레임워크인 RJ-Netty (RDMA/JXIO Netty)를 설계 및 구현한다. 둘째, Storm이 기존 Netty와 RJ-Netty를 모두 사용할 수 있도록 관련 클래스들을 개선한다. 셋째, RJ-Netty의 성능을 최대화하기 위해 멀티스레드를 지원하도록 JXIO 서버 기능을 개선한다. 실험 결과, 제안한 RJ-Netty는 Ethernet은 물론 IPoIB에 비해서 메시지 처리량을 향상시키면서도 CPU 부하를 크게 줄인 것으로 나타났다. 본 논문은 Apache Storm을 InfiniBand 상에서 동작시킨 최초의 시도로, 고성능의 InfiniBand RDMA를 사용하여 Storm의 처리 성능을 향상시킨 우수한 연구 결과라 사료된다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we address how to apply Apache Storm, a distributed stream processing framework, to InfiniBand, a high performance communication device. An easy way to run Storm on InfiniBand is to simply use IPoIP (IP over InfiniBand). However, this method causes a serious CPU load on the node, whic...



핵심어 질문 논문에서 추출한 답변
Storm은 어떤 구조로 구분할 수 있는가? Apache Storm은 대용량 데이터 스트림을 안정적으로 처리할 수 있는 실시간 분산 처리 프레임워크이다. Storm은 크게 물리적 구조와 논리적 구조로 구분할 수 있다. 먼저, Storm 클러스터의 물리적 구조는 하나의 마스터 노드와 다수의 슬레이브 노드를 갖는 마스터/슬레이브 구조이다.
Apache Storm에서 님버스와 슈퍼바이저 간의 상태 정보를 공유하기 위해 무엇을 사용하는가? 즉, Storm의 님버스(Nimbus)는 마스터 노드, 슈퍼바이저(Supervisor)는 슬레이브 노드에 해당한다. 또한 님버스와 슈퍼바이저 간의 상태 정보를 공유하기 위해 서드파티(third-party) 개념으로 Apache Zookeeper[17, 18]를 사용한다.
Apache Storm이란? Apache Storm은 대용량 데이터 스트림을 안정적으로 처리할 수 있는 실시간 분산 처리 프레임워크이다. Storm은 크게 물리적 구조와 논리적 구조로 구분할 수 있다.
질의응답 정보가 도움이 되었나요?

