[논문]웹 환경에 적합한 보관수명 기반 캐시 교체정책

한성민; 박흥순; 권태욱

doi:10.7840/kics.2015.40.6.1091

웹 환경에 적합한 보관수명 기반 캐시 교체정책
Shelf-Life Time Based Cache Replacement Policy Suitable for Web Environment 원문보기

한국통신학회논문지 = The Journal of Korean Institute of Communications and Information Sciences, v.40 no.6, 2015년, pp.1091 - 1101

한성민 (Dept. of Computer Science & Engineering, Korea National Defense University) , 박흥순 (Dept. of Computer Science & Engineering, Korea National Defense University) , 권태욱 (Dept. of Computer Science & Engineering, Korea National Defense University)

초록
AI-Helper

오랜기간 컴퓨터 분야의 연구주제였던 캐시 메커니즘은 네트워크 영역에서 웹 캐시로 응용되었다. 응답시간 감소, 네트워크 자원 절약 등의 다양한 이점을 갖는 웹 캐시는 교체정책에 의해 성능이 좌우되므로, 보다 나은 교체정책의 설계를 위해 웹 캐시가 운용되는 환경에 대한 분석과 고찰이 필수적이다. 따라서 과거에 비해 급속도로 다변화된 현재 웹 환경에서는 그러한 변화를 반영할 수 있는 교체정책이 요구된다. 따라서 본 논문에서는 현재 웹 환경의 특성을 규정하고, 이에 적합한 캐시 교체정책을 설계하고 평가한다.

Abstract ▼ AI-Helper

Cache mechanism, which has been a research subject for a significant period of time in computer science, has become realized in the form of web caching in network practice. Web caching has various advantages, such as saving of network resources and response time reduction, depends its performance on cache replacement policy, therefore, analysis and consideration of the environment in which a web cache operates is essential for designing better replacement policies. Thus, in the current web environment where is rapidly changing relative to the past, a new cache replacement policy is necessary to reflect those changes. In this paper we stipulate some characteristics of the web at present, propose a new cache replacement policy, and evaluate it.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

콘텐츠가 빠르게 생성되고 사용자의 관심이 새롭게 생겨나는 콘텐츠에 일시적 집중되는 현재의 웹 환경에서 캐시 교체정책은 이러한 환경적 특성을 적절히 반영해야 한다. 따라서 본 논문에서는 현재의 웹 환경이 과거에 비해 어떠한 측면에서 변화하였는지 정의하고, 이에 적합한 캐시 교체정책을 설계하여 성능을 평가하는 것을 목표로 하였다. 이를 위해 논문은 다음과같이 구성되었다.
앞서 언급했듯 현재의 웹 환경은 콘텐츠 생성 후 요청 감소, 파급력 증가, 빠른 콘텐츠 생성과 같은 특성을 갖는데, 실제 환경에서 이러한 특성은 무수한 다양성을 갖기 때문에 일반화가 어려운 요소이다. 이러한 어려움을 해결하고 제안한 LRU＋SLT와 LFU＋SLT 의 성능을 기존의 캐시 교체정책과 비교하기 위해 본 장에서는 (1) 요청횟수 감소, (2) 파급력, (3) 콘텐츠 생성량이라는 세 가지 특성을 낮은 수준에서 높은 수준으로 변화시키면서 제안한 교체정책의 성능과 기존의 교체정책을 비교 및 해석하고, 특정구간에서 세부적 관찰을 통해 교체정책의 신뢰성을 보이고자 한다.
웹 환경은 초기에 비해 사용자들의 선택폭이 넓어졌고, 시시각각으로 사용자의 관심이 변화하며, 사용자는 주도적이 되었다. 이러한 특성을 반영하기 위해본 논문에서는 보관수명의 개념을 도입하여 현재 웹환경에 적합한 캐시 교체정책을 제안하고 성능을 평가하였다. 앞서 이야기한 바와 같이 새로운 교체정책은 기존에 비해 조금 더 나아진 성능을 보이며, 이는 오래된 콘텐츠에 대한 사용자의 요청 감소정도가 클수록, 그리고 새로운 콘텐츠의 파급력이 클수록 좋은 성능을 보인다.
일반적으로 캐시 교체정책의 성능을 평가하는 기준에는 (1) HR(적중률, Hit Rate), (2) BHR(byte 적중률, Byte Hit Rate), (3) DSR(지연절약비, Delay Saving Ratio)가 있는데^[3], 본 논문에서는 (1)의 기준에서 성능을 향상시킬 수 있는 캐시 교체정책의 설계를 목표로 하였다. 적중률은 일반적으로 캐시 메모리의 크기에 영향을 받는다.
첫째는 각 콘텐츠의 보관수명을 산출하여 비교하는 직접적인 방식이고, 다른 하나는 콘텐츠의 보관수명을 산출하지는 않더라도 정황적 판단에 의해 콘텐츠 상호간 누가 우위에 있는지 비교가 가능토록 하는 간접적인 방식이다. 직접산출 방식은 관련연구를 통해 보았던 Ted Karczewski의 발표처럼 비디오 콘텐츠는 3시간, SNS는 1시간 등 콘텐츠 특성을 일반화하여 각각의 보관수명을 직접 산출함으로써 달성 가능하나, 이러한 방식을 수많은 다양성이 있는 웹 환경에 적용하기엔 일반화에 있어 많은 어려움이 따를 수 있으므로, 몇 가지 요소의 비교와 계산, 그리고 절차적 방식에 의해 이루어질 수 있는 간접적인 방법으로 문제를 해결하고자 한다.

가설 설정

• 시간이 지날수록 콘텐츠에 대한 관심은 감소한다.

제안 방법

개별 요소가 성능에 미치는 영향을 분석하는 2절에서는 분석을 위한 요소를 제외한 나머지를 변인 통제하여 결과를 산출하고 세부적인 의미를 분석한다. 난수 생성기는 기반 시뮬레이터가 제공하는 생성기를 사용하였으며, 신뢰도 상승을 위해 반복수행하여 평균값을 도출하였고, 대조실험간에는 난수모의가 동일한 값을 얻도록 하여 대조실험이 동일조건에서 공정히 비교될 수 있도록 구성하였다. 또한 컨텐츠 전체에 대한 요청의 분포는 zipf분포를 따르도록 하였다.
네트워크 영역에서의 캐시 메커니즘의 응용은 그림1에서 보는 바와 같이 사용자와 원천서버의 중간에 있는 캐시 서버(Cache server)를 이용하여 자주 요청되거나, 미래에 예측될 가능성이 높은 콘텐츠를 저장하였다가 사용자의 요청이 있을 경우 캐시 서버가 원천 서버를 대신하여 응답하는 웹 캐시의 형태로 이루어졌다. 이를 통해 네트워크 관리자는 캐시 서버에서 원천 서버에 이르는 구간의 네트워크 자원을 절약하고, 응답시간을 감소시켜 사용자들의 서비스 만족도를향상시킬 수 있었다.
때문에 본 절에서는 위의 실험 중임의구간(초당 10∼20개의 신규 콘텐츠가 생성되고,생성초기에 초당 200개 이하의 요청을 받으며, 모든콘텐츠에 대한 요청이 20%씩 감소)을 선정하여 세 가지 특성을 유지한 상태에서 캐시 저장공간의 크기를증가시켜가면서 교체정책의 성능변화를 측정하였다.
이러한 문제점을 해결하기 위해 보정(Aging)과 같은 기법들이 도입되었지만, 무엇을 기준으로 보정할 것인지에 대한 판단이 중요하다. 본 논문에서 제안하는 LFU+SLT는 생성시간을 이용하여 콘텐츠의 요청횟수를 보정하는 방식으로 기존의 LFU에 보관수명의 개념을 도입한다. 즉, 어떤 콘텐츠가 상대적으로 생성된 시간에 비해 충분한 요청을 받지 못하고 있는가를 판단한다.
그림 8은 신규 콘텐츠가 생성초기 얻는 요청의 크기에 따른 교체 정책의 성능변화이다. 앞선 실험과 마찬가지로 이를 측정하기 위해 캐시 용량과 오래된 콘텐츠에 대한 요청의 감소비율을 동일하게 통제한 상태에서 콘텐츠의 생성초기 집중되는 요청크기를 변화시켰다.
이를 위해 본 논문에서는 “보관수명”을 “콘텐츠가 생성된 시점”에서부터 “사용자들의 충분한 관심을 받지 못해 캐시할 가치를 잃는 특정 시점”까지로 정의하는데, 이 경우 크게 두 가지 방법에 의해 콘텐츠 상호간 보관수명 비교가 가능하다.
지금까지 현재의 웹 환경이 갖는 특성을 정의하고,이러한 특성을 보다 적절히 반영할 수 있는 새로운 교체정책이 필요함을 밝히고, 새롭게 제안한 캐시 교체정책의 성능을 평가하였다. 최초에 캐시 메커니즘이 고안되었을 때 캐시는 운용되는 환경적 특성에서 출발했다.
최초에 캐시 메커니즘이 고안되었을 때 캐시는 운용되는 환경적 특성에서 출발했다. 환경적 특성을 기반으로 메커니즘의 성능을 최대한 발휘할 수 있는 교체정책을 설계하였다. 오랜 기간 캐시 메커니즘은 다양한 분야에 응용되어왔고, 현재에도 상당한 영향력을 발휘한다.

이론/모형

난수 생성기는 기반 시뮬레이터가 제공하는 생성기를 사용하였으며, 신뢰도 상승을 위해 반복수행하여 평균값을 도출하였고, 대조실험간에는 난수모의가 동일한 값을 얻도록 하여 대조실험이 동일조건에서 공정히 비교될 수 있도록 구성하였다. 또한 컨텐츠 전체에 대한 요청의 분포는 zipf분포를 따르도록 하였다.^[16]

성능/효과

그림 8에서 보여지는 것과 같이 모든 정책이 새로 운 콘텐츠의 파급력이 클수록 성능이 향상하는 모습을 보였다. 새로운 콘텐츠가 얻는 요청이 크다는 것은기존에 캐시되어 있던 콘텐츠보다 잦은 빈도로 많이 요청됨을 의미하므로 이는 직관적으로도 예측 가능하다.
그림에서보는 바와 같이 LRU와 LFU는 각각 약 18%와 22%의 성능을 보인 것에 반하여, LRU＋SLT와 LFU＋SLT는 약 30%와 24%의 적중률을 각각 보임으로써 기존의 교체정책의 성능에 비해 제안한 정책이 약 2∼12%가량 향상된 적중률을 보였다.
또한 관련 연구에서 요청횟수 기반 정책의 문제점으로 지적했던 사용자의 관심이 변화할 때 성능문제가 위의 실험에서도 확연히 보여지는데, 신규 콘텐츠에 대한 일시적 요청이 증가하자 LRU의 성능이 LFU을 점차 초과하는 모습이 그것이다. 논문을 통해 제안했던 보관수명 기반의 LRU+SLT와 LFU+SLT정책은 모두 기존의 정책에 비해 향상된 성능을 보여준다.LRU+SLT은 시간에 따라 적중률이 점차 특정값으로 수렴하는 것으로 보여지는데, 이는 캐시용량의 한계로 인한 것으로 판단된다.
2절에서 살펴본 바와 같이 (1) 요청횟수 감소, (2)파급력, (3) 콘텐츠 생성량이라는 세 가지 특성이 존재하는 환경에서는 일반적으로 제안한 캐시 교체정책의 성능이 우위에 있음을 알 수 있다. 또한 그러한 양상이 복합적으로 나타나고 두드러질수록 제안한 캐시교체정책의 성능이 기존의 정책에 비해 우수할 것임을 판단할 수 있다. 하지만, 이러한 성능이 특정 캐시용량에서만 나타나는 것이라면 교체정책의 신뢰성이확보될 수 없을 것이다.
또한 지속적으로 콘텐츠가 생성되는 환경에서 시간 에 따른 캐시율 변화를 세부적으로 살펴보면 그림 11에서 보는 바와 같이 시간이 지날수록 콘텐츠가 증가하게 되고 LFU는 적중률이 지속적으로 낮아지는 반면 LFU+SLT는 특정 수준을 유지함으로써 장기간 캐시 운영시 성능의 차이를 보이게 될 것으로 예상된다.반면, LRU가 특정 수준의 적중률을 지속적으로 유지하는 반면, LRU+SLT가 조금 낮아지는 양상을 보이는 것으로 볼 수 있으나, 전체적으로 볼 때,LRU+SLT가 LRU에 비해 지속적으로 높은 수준의성능을 보이면서 LFU+SLT와 동일하게 특정 수준에서 수렴하며 할 것으로 예상된다.
세부적으로 볼 때, 캐시 용량증가 시 LFU＋SLT는LFU에 비해 지속적으로 약 2∼3%가량 우수한 성능을 보이며, LRU＋SLT의 경우 LRU에 비해 8∼12% 의 적중률 향상을 관찰할 수 있다.
이러한 특성을 반영하기 위해본 논문에서는 보관수명의 개념을 도입하여 현재 웹환경에 적합한 캐시 교체정책을 제안하고 성능을 평가하였다. 앞서 이야기한 바와 같이 새로운 교체정책은 기존에 비해 조금 더 나아진 성능을 보이며, 이는 오래된 콘텐츠에 대한 사용자의 요청 감소정도가 클수록, 그리고 새로운 콘텐츠의 파급력이 클수록 좋은 성능을 보인다. 물론, 논문에서 제안한 방식이 변화하는 양상에서 교체정책을 위한 최선의 방법이 될 수는 없다.
네트워크 영역에서의 캐시 메커니즘의 응용은 그림1에서 보는 바와 같이 사용자와 원천서버의 중간에 있는 캐시 서버(Cache server)를 이용하여 자주 요청되거나, 미래에 예측될 가능성이 높은 콘텐츠를 저장하였다가 사용자의 요청이 있을 경우 캐시 서버가 원천 서버를 대신하여 응답하는 웹 캐시의 형태로 이루어졌다. 이를 통해 네트워크 관리자는 캐시 서버에서 원천 서버에 이르는 구간의 네트워크 자원을 절약하고, 응답시간을 감소시켜 사용자들의 서비스 만족도를향상시킬 수 있었다.^[2] 때문에 어떤 콘텐츠를 캐시 메모리에 보관할 것인지 결정하는 교체 알고리즘의 중요성이 자연스레 관심의 대상이 되었는데, 이는 부적절한 교체 알고리즘이 적용될 경우 불필요한 콘텐츠가 메모리에 보관됨으로써 캐시 검색에 따른 부수적인 지연을 발생시켜 비용과 노력의 투입에도 불구하고 만족할 만한 효과를 얻을 수 없었기 때문이다
이는 기존의 정책에 비해 제안한 정책이 환경적 특성을 적절히 반영 한 결과로 보여진다. 특이한 점은 LRU에 SLT를 적용했을 때의 성능 증가폭이, LFU에 SLT를 적용했을 때의 성능 증가폭보다 높음에 따라 LRU+SLT가LFU+SLT에 비해 성능면에서 우위를 보인다는 점이 다. 이는 시간적 지역성의 반영이라는 LRU의 강점을SLT를 통해서 보완함으로써 상승효과가 발생하는 것으로 보여진다.
예측한바와 같이 콘텐츠 생성량이 많을수록 기존의 정책과 제안한 교체정책 모두 성능은 저하된다.하지만, 그림에서 보여지는 바와 같이 각 정책이 특정값으로 수렴하는 양상을 보이고 있으며 성능에 있어서 제안한 교체정책이 약간 더 우위에 있음을 볼 수 있다.

후속연구

보다 세밀하게 환경적 요소가 검토되고, 정확히특성화되어진다면, 더욱 우수하고 발전적인 교체정책의 설계가 가능할 것이다. 따라서 본 논문을 통해 캐시가 운용되는 환경에 대한 세밀한 고찰이 이루어지고, 각각의 환경에 더욱 적합한 교체정책이 제안될 것으로 기대한다.
물론, 논문에서 제안한 방식이 변화하는 양상에서 교체정책을 위한 최선의 방법이 될 수는 없다. 보다 세밀하게 환경적 요소가 검토되고, 정확히특성화되어진다면, 더욱 우수하고 발전적인 교체정책의 설계가 가능할 것이다. 따라서 본 논문을 통해 캐시가 운용되는 환경에 대한 세밀한 고찰이 이루어지고, 각각의 환경에 더욱 적합한 교체정책이 제안될 것으로 기대한다.

질의응답

핵심어	질문	논문에서 추출한 답변
	교체정책은 어떤 방식으로 분류되는가?	그래서 많은 연구자들은 다양한 기준과 고려요소들을 함께 병합하여 다양한 웹 캐시 교체정책을 고안하였고, 이러한 다양한 교체정책을 각각의 특성에 따라 분류하고자 하는 연구도 지속적으로 이루어졌다. [3][4][5]이러한 연구들을 전반적 종합하여 봤을 때, 교체정책은 각각 최근요청(Recency), 빈도(Frequency), 함수(Function), 임의(Random), 혼합(Hybrid) 방식으로 표1과 같이 분류될 수 있다. [3]
	캐시 교체정책의 성능을 평가하는 기준은 무엇이 있는가?	일반적으로 캐시 교체정책의 성능을 평가하는 기준에는 (1) HR(적중률, Hit Rate), (2) BHR(byte 적중률, Byte Hit Rate), (3) DSR(지연절약비, Delay Saving Ratio)가 있는데[3], 본 논문에서는 (1)의 기준에서 성능을 향상시킬 수 있는 캐시 교체정책의 설계를 목표로 하였다. 적중률은 일반적으로 캐시 메모리의 크기에 영향을 받는다.
	현재의 웹 환경에서 콘텐츠가 갖는 두드러진 특성은 무엇인가?	• 콘텐츠가 빠른 속도로 생성된다 • 콘텐츠는 생성초기에 사용자들의 일시적인 관심을 받는다 • 시간이 지날수록 콘텐츠에 대한 관심은 감소한다.

참고문헌 (16)

P. J. Denning. "The locality principle," Commun. ACM, vol. 48, no. 7, pp. 19-24, Jul. 2005.

상세보기
B. D. Davison, "A web caching primer," IEEE Internet Computing, vol. 5, no. 4, pp. 38-45, 2001.

상세보기
S. Podling and L. Boszormenyi, "A survey of web cache replacement strategies," ACM Computing Surveys(CSUR), vol. 35, no. 4, pp. 374-398, 2003.

상세보기
C. Aggarwal, J. L. Wolf, and P. S. Yu, "Caching on the world wide web," IEEE Trans. Knowledge and Data Eng., vol. 11, no. 1, pp. 94-107, 1999.

상세보기
S. Jin and A. Bestavros, "GreedyDual* Web caching algorithm: exploiting the two sources of temporal locality in Web request streams," J. Comput. Commun., vol. 24, no. 2, pp. 174-183, 2001.

상세보기
J. Chen and L. Subramanian, "Interactive web caching for slow or intermittent networks," in Proc. 4th Annu. Symp. Comput. for Development (ACM DEV-4 '13), no. 5, 2013.
Y. Li, H. Xie, Y. Wen, and Z. Zhang, "Coordinating in-network caching in contentcentric networks: model and analysis," IEEE ICDCS, pp. 62-72, Philadelphia, Jul. 2013.
T. o'Reilly, What is web 2.0, O'Reilly Media, Inc., 2009.
Cisco, Cisco visual networking index: Forecast and methodology, 2013-2018," Retrieved Nov., 2, 2015, from "http://www.cisco.com/c/en/us/solutions/collateral/service-provider/ip-ngn-ip-next-generation-network/white_paper_c11-481360.html
K. C. Laudon and J. P. Laudon, Essentials of management information systems, Upper Saddle River : Pearson, 2011.
T. Karczewski, How long does your content last online?, Retrieved Nov., 10, 2014, from http://www.skyword.com/contentstandard/enter prise-marketing/how-long-does-your-content-last-online-data/
M. Cha, H. Kwak, P. Rodriguez, Y. Ahn, and S. Moon. "Analyzing the video popularity characteristics of large-scale user generated content system," IEEE/ACM Trans. Networking (TON), vol. 17, no. 5, pp. 1357-1370, 2009.

상세보기
T, Zaman, E. B. Fox, and E. T. Bradlow, "A bayesian approach for predicting the popularity of tweets," The annals of Applied Statistics, vol. 8, no. 3, pp. 1583-1611, 2014.

상세보기
G. Szabo and B. A. Huberman, "Predicting the popularity of online content," Commun. ACM, vol. 53, no. 8, pp. 80-88, 2010.
C. Castillo, M. El-Haddad, J. Pfeffer, and M. Stempeck, "Characterizing the life cycle of online news stories using social media reactions," in Proc. 17th ACM Computer supported cooperative work & social computing, pp. 211-223, 2014.
L. Breslau, P. cao. L. fan, G. Philips, and S. Shenker, "Web caching and zipf-like distributions : Evidence and implications," IEEE INFOCOM'99, vol. 1, 1999.

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증