현재 광대역 통합망의 사용으로 인해 확장된 망을 사용하는 트래픽의 양이 많아지고, 어플리케이션의 발달로 인해 트래픽의 종류도 증가하고 있다. 특히 IPTV, VOD, 온라인 게임 등의 멀티미디어 속성을 가진 트래픽의 증가가 두드러지고 있다. 이러한 멀티미디어 트래픽은 페이로드의 크기가 클 뿐만 아니라 실시간 처리를 요하기 때문에 라우터에서 트래픽 속성에 따라 차등한 대역폭을 지원하는 연구가 진행 중에 있다. 트래픽의 속성을 정확히 구분하기 위해선 어플리케이션 계층을 분석하여야 하는데, 기존의 네트워크 프로세서 구조에선 L2-4 처리와 L7처리를 순차적으로 처리하고 있다. 본 논문에서는 L2-4와 L7을 병렬로 처리하기 위해 글로벌 캐시를 둔 새로운 병렬 네트워크 프로세서 구조를 제안한다. 제안하는 구조를 검증하기 위해 기존의 네트워크 시스템과 제안한 구조의 네트워크 시스템을 SystemC로 모델링하였으며, L2-4, L7 처리 시간을 측정하기 위해 EEMBC-와 SNORT를 이용하여 동일한 시스템에서 시뮬레이션 하였다. 멀티미디어 속성의 동일한 트래픽이 연속적으로 입력될 경우 제안한 구조에서 약 85%의 성능 향상을 보였다.
현재 광대역 통합망의 사용으로 인해 확장된 망을 사용하는 트래픽의 양이 많아지고, 어플리케이션의 발달로 인해 트래픽의 종류도 증가하고 있다. 특히 IPTV, VOD, 온라인 게임 등의 멀티미디어 속성을 가진 트래픽의 증가가 두드러지고 있다. 이러한 멀티미디어 트래픽은 페이로드의 크기가 클 뿐만 아니라 실시간 처리를 요하기 때문에 라우터에서 트래픽 속성에 따라 차등한 대역폭을 지원하는 연구가 진행 중에 있다. 트래픽의 속성을 정확히 구분하기 위해선 어플리케이션 계층을 분석하여야 하는데, 기존의 네트워크 프로세서 구조에선 L2-4 처리와 L7처리를 순차적으로 처리하고 있다. 본 논문에서는 L2-4와 L7을 병렬로 처리하기 위해 글로벌 캐시를 둔 새로운 병렬 네트워크 프로세서 구조를 제안한다. 제안하는 구조를 검증하기 위해 기존의 네트워크 시스템과 제안한 구조의 네트워크 시스템을 SystemC로 모델링하였으며, L2-4, L7 처리 시간을 측정하기 위해 EEMBC-와 SNORT를 이용하여 동일한 시스템에서 시뮬레이션 하였다. 멀티미디어 속성의 동일한 트래픽이 연속적으로 입력될 경우 제안한 구조에서 약 85%의 성능 향상을 보였다.
The mount of network traffic from the Internet is increasing because of the use of Broadband Convergence Networks(BcN). Network traffic is also increasing because of the development of application, especially multimedia traffic from IPTV, VOD, and online games. This multimedia traffic not only has a...
The mount of network traffic from the Internet is increasing because of the use of Broadband Convergence Networks(BcN). Network traffic is also increasing because of the development of application, especially multimedia traffic from IPTV, VOD, and online games. This multimedia traffic not only has a huge payload but also should be considered a threat in real time. For this reason, this study examines the ways that routers distribute the bandwidth in accordance to traffic properties. To classify the property of the traffic, it is essential to analyze the application layer. However, the general network processor architecture serially processes the L2-4 and L7 layer. We propose a novel parallel network processor architecture with a global cache that processes L2-4 and L7 in parallel. To verify the proposed architecture, we simulated both of the architecture with SystemC. EEMBC and SNORT was used to measure L2-4 and L7 processing time. When multimedia traffic was entered into the network processor in the same flow, the proposed architecture showed about 85% higher performance than general architecture.
The mount of network traffic from the Internet is increasing because of the use of Broadband Convergence Networks(BcN). Network traffic is also increasing because of the development of application, especially multimedia traffic from IPTV, VOD, and online games. This multimedia traffic not only has a huge payload but also should be considered a threat in real time. For this reason, this study examines the ways that routers distribute the bandwidth in accordance to traffic properties. To classify the property of the traffic, it is essential to analyze the application layer. However, the general network processor architecture serially processes the L2-4 and L7 layer. We propose a novel parallel network processor architecture with a global cache that processes L2-4 and L7 in parallel. To verify the proposed architecture, we simulated both of the architecture with SystemC. EEMBC and SNORT was used to measure L2-4 and L7 processing time. When multimedia traffic was entered into the network processor in the same flow, the proposed architecture showed about 85% higher performance than general architecture.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
앞으로 다가올 인터넷에서 트래픽을 어플리케이션레이어 까지 보다 효율적으로 처리하기 위해 본 연구에서는 Global Cache를 이용하는 구조를 제안한다. 시뮬레이션에서 연속된 플로우의 패킷이 증가할수록 제안된 구조에서는 네트워크 처리 속도가 빨라짐을 볼 수 있다.
플로우를 이용하여 네트워크 트래픽을 처리하는 현재의 시스템에서 기존의 네트워크 프로세서의 성능으로는 앞으로 증가가 예상되는 네트워크 트래픽을 처리하기에 어려움이 따른다 따라서 본 논문에서는 앞으로 증가가 예상되는 네트워크 트래픽의 속성과 이를 이용한 보다 진보된 네트워크 프로세서의 구조를 제안한다.
가설 설정
2. 전처리 프로세서는 L2-4 프로세서에 분할한 패킷을 전달한다.
5. L2~4프로세서에서 나온 패킷은 출력 큐에 저장이 된다.
제안 방법
따라서 본 논문에서는 과거 L7처리 결과를 글로벌캐시로 정의한 히스토리 테이블(history table)에 저장하고 현재 입력된 패킷이 히스토리 테이블에 있으면, 과거 L7 처리결과를 사용하여 L2-4와 L7처리를 병렬로 하여 성능을 높이는 구조를 제안한다.
하지만 L2~4와 L7을 병렬로 처리하는 것은 패킷 헤더 처리 시간은 비교적 일정한 반면 페이로드 처리는 패킷의 크기에 비례하여선 형적으로 증가하기 때문에 패킷의 크기가 증가하는 미래 인터넷에서는 단순히 L2~4와 L7을 병렬처리 하는 것으로는 높은 성능 향상을 기대하기 어렵다. 따라서 본 논문에서는 그림 3과 같이 글로벌 캐시를 이용하여 L7의 처리 이력을 기록하고 이를 이용하여 처리된 이력이 있는 플로우의 패킷은 L2~4에서 처리하여 속도를 높이는 방법을 제안한다. 그림 4는 제안하는 네트워크 프로세서에서 패킷을 처리하는 흐름도이다
일반적인 구조와 제안된 구조를 SystemC로 설계하고 EEMBC와 SNORT를 이용하여 테스트를 수행하였다. 시뮬레이션에서 사용한 테스트 벡터는 Shmoo Group에서 제공하는 Defcon 9 capture the Flag Data 를 이용하여 데이터를 검증하였다가
제안된 구조에서는 동일한 플로우의 패킷이 들어오는 확률을 이용하여 실험하였다. 동일한 플로우가 각각 0%, 25%, 50%, 75%, 100%의 비율로 들어온다고 가정했을 때 결과는 그림 8과 같이 보여진다.
대상 데이터
EEMBC间는 버퍼의 크기를 512KB(374 패킷), 1MB(72O 패킷), 2MB(1412패킷), 4MB(2824 패킷) 4 가지로 나눠서 시뮬레이션이 진행된다. 각 크기에 따라서 한 iteration에서 처리하는 패킷의 양이 달라진다.
이 실험에는 Intel의 Core2Duo E8400 3GHz와 2*2GB의 메모리, Asus P5K SE 메인보드, 1Gbit의 network interface 등으로 구성되어았다. 운영체제는 Ubuntu Linux 9.
데이터처리
시뮬레이션에서 사용한 테스트 벡터는 Shmoo Group에서 제공하는 Defcon 9 capture the Flag Data 를 이용하여 데이터를 검증하였다가
L7의 프로세싱은 패킷의 길이, 룰셋의 적용 방법, 패킷에 포함된 데이터의 종류 등에 영향을 받기 때문에 같은 길이의 패킷이 같은 처리 시간을 갖는 것은 아니다. 실험을 통해 구해진 데이터의 신뢰도를 높이기 위해서 회귀분석(regression analysis)를 이용하여 데이터를 구하였다.
성능/효과
앞으로의 네트워크가 IPTV, VOD등 연속된 플로우의 패킷이 증가하기 때문에 앞으로의 네트워크에서 본 논문에서 제안된 네트워크 프로세서의 구조를 통해서 큰 성능 향상이 기대된다. IDC에서 예상한 결과와 시뮬레이션을 통해서 얻은 결과를 종합해 볼 때 기존에 비해 약 85%의 성능 향상이 이루어졌다
제안한다. 시뮬레이션에서 연속된 플로우의 패킷이 증가할수록 제안된 구조에서는 네트워크 처리 속도가 빨라짐을 볼 수 있다. 앞으로의 네트워크가 IPTV, VOD등 연속된 플로우의 패킷이 증가하기 때문에 앞으로의 네트워크에서 본 논문에서 제안된 네트워크 프로세서의 구조를 통해서 큰 성능 향상이 기대된다.
위의 결과에서 l(X)Obyte 이상의 길이가 긴 패킷이 연속된 플로우로 들어온다고 가정했을 때 확률에 따라서 각각 29.88%, 85.24%, 22284%, H58.92%의 성능 향상효과가 있으므로 IDC자료에서 예상한 50% 정도가 IPTV, VOD등의 스트리밍에서 발생되는 패킷일 때 약 85%의 성능 향상이 있을 것이다. 그림 9는 위의 확률을 로그 스케일을 사용하여 나타낸 것이다*
후속연구
시뮬레이션에서 연속된 플로우의 패킷이 증가할수록 제안된 구조에서는 네트워크 처리 속도가 빨라짐을 볼 수 있다. 앞으로의 네트워크가 IPTV, VOD등 연속된 플로우의 패킷이 증가하기 때문에 앞으로의 네트워크에서 본 논문에서 제안된 네트워크 프로세서의 구조를 통해서 큰 성능 향상이 기대된다. IDC에서 예상한 결과와 시뮬레이션을 통해서 얻은 결과를 종합해 볼 때 기존에 비해 약 85%의 성능 향상이 이루어졌다
참고문헌 (9)
P. C. Mark A. Franklin, Network processor design: issues and practices, 2nd ed., 2003.
R. Ennals, et al., "Task Partitioning for Multi-core Network Processors," ed, 2005, pp. 76-90.
"Cisco Visual Networking Index - Forecast and Methodology, 2008-2013," A Cisco White Paper 2009.
N. Dukkipati, et al., "Processor Sharing Flows in the Internet," ed, 2005, pp.271-285.
T. Wolf, et al., "Predictive scheduling of network processors," Computer Networks, Vol. 41, pp.601-621, 2003.
D. L. Schuff, et al., "Conservative vs. Optimistic Parallelization of Stateful Network Intrusion Detection," in Performance Analysis of Systems and software, 2008. ISPASS 2008. IEEE International Symposium on, 2008, pp. 32-43.
Shmoo Group DEFCON 9 Capture the Flag Data. Available: http://ictf.cs.ucsb.edu/data/defcon_ctf_09/
※ AI-Helper는 부적절한 답변을 할 수 있습니다.