$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

분산 파일 시스템 기반 NoSQL의 데이터 안정성을 위한 범용 트랜잭션 관리 기법
General-purpose Transaction Management Technique for Data Stability of NoSQL on Distributed File System 원문보기

디지털콘텐츠학회 논문지 = Journal of Digital Contents Society, v.16 no.2, 2015년, pp.299 - 306  

권영현 (Emerging Technology R&D Center, WISEnut, Inc.) ,  윤도현 (Emerging Technology R&D Center, WISEnut, Inc.) ,  박호진 (Emerging Technology R&D Center, WISEnut, Inc.)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는, 분산 파일 시스템을 기반으로 하는 NoSQL의 데이터 안정성 확보를 연구하였다. 본 논문의 궁극적 목표인 분산 파일 시스템 기반의 NoSQL을 구현하는 과정에서 분산 파일 시스템의 제약 조건인 랜덤 쓰기 문제에 봉착했고, 이 문제의 해결을 위해 중간파일의 개념을 사용함으로써 어떠한 장애 상황에서도 데이터의 오염을 방지할 수 있었다. 또한 중간파일을 쓰는 과정에서 기존 파일 시스템에 비해 분산 파일 시스템이 가지는 성능적 열세를 인식하여, NoSQL을 위한 파일 블록 단위를 다시 정의하는 방법으로 성능적 손실을 크게 줄였다. 결과적으로, 본 논문에서는 보편적 분산 파일 시스템의 확장성을 가진 NoSQL을 개발함과 동시에 원자성, 일관성, 고립성, 성능 등의 조건을 만족하는 트랜잭션 관리 기법을 사용함으로써 데이터 안정성을 가지면서 실용적 사용에도 무리가 없는 NoSQL을 구현하였다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we research to secure stability of data storing/searching on NoSQL implemented on Distributed File System. When implementing NoSQL on Distributed File System, we faced that random write on Distributed File System is almost impossible. To solve this problem, a concept of Intermediate-F...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이것은 파일이 저장되면 되돌릴 수 없다는 것과 동일한 이야기이므로 데이터 오염에 대한 회피가 불가능하다는 것을 알 수 있다. 본 논문에서는 이 문제를 해결하기 위해 중간파일(IF: Inter-File)의 개념을 제안하고자 한다. 중간파일은 트랜잭션에 대한 COMMIT 이 이루어질 때까지 임시 파일에 내용을 저장하고 COMMIT이 이루어지는 순간부터 중간파일의 내용을 원본파일로 옮겨 저장하는 작업을 시작 한다.
  • 본 논문에서는 이러한 문제점을 해결하기 위하여 분산 파일 시스템을 기반으로 하는 NoSQL 구현 시 활용될 수 있는 트랜잭션 기법을 개발하였다.
  • 본 논문에서는, 이러한 시류에 맞추어, 거시적 관점에서 수평적 확장성이라는 공통분모를 가지는 두 시스템의 통합 과정을 설명하고 필연적으로 발생할 수 밖에 없는 데이터 안정성 저하의 문제점을 살펴보고 해결책을 연구한다.
  • 본 논문은 분산 파일 시스템의 확장 용이성을 활용한 문서기반의 NoSQL 시스템을 구축하는 과정에서 분산 파일 시스템의 제약조건으로 인한 데이터 안정성 측면의 문제를 인식하고 원자성, 일관성, 고립성의 조건을 만족하는 트랜잭션 기법에 대해 연구했다. 본 장에서는 분산 파일 시스템에 NoSQL을 접목할 때 발생할 수 있는 문제를 설명하고 다음 장에서 본 논문의 접근 방식으로 해결 방안을 제시한다.
  • 데이터 저장소를 구현하는데 있어 이상적인 트랜잭션 처리는 (1)완전히 반영되거나 전혀 반영되지 않는 “전부 혹은 아무것도”(all-or-nothing)의 원자성 속성을 지켜야만하며, 이를 위해 지불해야할 (2)성능 측면의 비용이 최대한 작아야만 한다. 본 논문의 방법론은 실상 적대적인 요구조건인 (1), (2)간의 최적의 중간 지점을 찾아 실용적 환경에서 사용할 수 있도록 하는 것을 목표로 하였다.
  • 이 과정에서 랜덤 쓰기가 금지된 분산 파일 시스템 상에서의 데이터 안정성을 고려하여 중간파일의 개념을 도입하였다. 이를 통해 안전하고 신뢰성 있는 데이터 저장 기능을 제공하는 동시에 사용자가 일관된 데이터를 검색할 수 있도록 하였다. 또한, 이 과정에서 발생할 수 있는 시스템의 성능 측면의 손실을 최소화하려고 노력했다.

가설 설정

  • 랜덤 쓰기가 가능한 분산 파일 시스템을 가정해보자. 하나의 논리적 파일이 n개의 물리적인 파일(블록)로 나뉘어 있고 이 물리적인 파일은 각각 m개의 복사본을 갖는다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
데이터 저장소를 구현하는데 있어 이상적인 트랜잭션 처리 조건은 무엇인가? 이 두 가지 관점 중 본 논문에서 초점을 맞추는 부분은 분산 파일 시스템과 NoSQL을 연동하였을 경우에 한 트랜잭션 안에서 발생할 수 있는 프로세스의 비정상 종료에 의한 데이터 오염을 방지하는 것이다. 데이터 저장소를 구현하는데 있어 이상적인 트랜잭션 처리는 (1)완전히 반영되거나 전혀 반영되지 않는 “전부 혹은 아무것도”(all-or-nothing)의 원자성 속성을 지켜야만하며, 이를 위해 지불해야할 (2)성능 측면의 비용이 최대한 작아야만 한다. 본 논문의 방법론은 실상 적대적인 요구조건인 (1), (2)간의 최적의 중간 지점을 찾아 실용적 환경에서 사용할 수있도록 하는 것을 목표로 하였다.
랜덤 쓰기 작업이 분산 파일 시스템에서 매우 큰 영향을 미치는 원인은 무엇인가? 로컬 파일 시스템에서의 쓰기 작업과 다르게, 대용량 데이터 저장과 잦은 읽기에 최적화되어 있는 분산 파일 시스템에서는 랜덤 쓰기 작업을 허용할 경우, 시스템에 미치는 영향은 매우 크다. 이것의 근본적인 원인은 (1)하나의 논리적 파일이 여러 개의 물리적 파일로 쪼개져 네트워크 기반으로 분산되어 있고, (2)데이터 가용성과 신뢰성과 실패 관용성을 위해 복사본(Replica)을 만들기 때문이다.
Rani et al.은 분산 파일 시스템 설계 고려사항으로 무엇을 언급하였는가? 분산 파일 시스템은 네트워크 기반의 파일 시스템으로서, Rani et al.[7] 은 시스템 설계 고려사항으로 사용자가 마치 일반적인 파일 시스템을 사용하고 있는 것과 마찬가지의 인식만을 가지게 해야 한다는 관점에서의 투명성과 커널에 종속적이지 않아야 한다는 유연성을 설명했다.또 어떠한 에러 상황에서도 접근이 가능해야 한다는 신뢰성, 그리고 단일 프로세서에서 사용하는 것에 비할만한 성능을 갖춰야 한다는 조건을 기술했으며, 허용되지 않은 접근이나 그를 통한데이터 오염에 대한 보안 문제의 해결에 대한 필요도 언급했다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. Hilbert, M, Lopez, P., "The World's Technological Capacity to Store, Communicate, and Compute Information," Science 332 (6025): 60-65. doi:10.1126/science.1200970, PMID 21310967, 2011. 

  2. IBM, "What is big data?-Bringing big data to theenterprise," http://www-01.ibm.com/software/data/bigdata/what-is-big-data.html, Retrieved 2013-08-26. 

  3. Sanjay Ghemawat, Howard Gobioff, Shun-Tak Leung, The Google file system, Proceedings of the nineteenth ACM symposium on Operating systems principles, Bolton Landing, NY, USA [doi>10.1145/945445.945450], October 19-22, 2003 

  4. Konstantin Shvachko, Hairong Kuang, Sanjay Radia, Robert Chansler, "The Hadoop Distributed File System," Proceedings of the 2010 IEEE 26th Symposiumon Mass Storage Systems and Technologies (MSST), p.1-10, [doi>10.1109/MSST.2010.5496972], May03-07, 2010. 

  5. Jing Han, Haihong, E., Guan Le; Jian Du, "Surveyon NoSQL database," Pervasive Computing and Applications (ICPCA), 2011 6th International Conference on, vol., no., pp.363-366, doi: 10.1109/ICPCA.2011.6106531, 26-28 Oct. 2011. 

  6. Younghyun Kwon, Yongseung Kang, Youngmin Ahn, "Business Intelligence Applying Document-TypeBigdata Analysis", Korea information processing society review, vol.19 no.2, pp.86-94, 2012. 

  7. L.Sudha Rani, K. Sudhakar, S.Vinay Kumar, / (IJCSIT) International Journal of Computer Science and Information Technologies, Vol. 5 (3),3716-3721, 2014. 

  8. Sunita Mahajan"Distributed Computing", Oxford University Press. 

  9. Jeffrey Dean, Sanjay Ghemawat, MapReduce: simplified data processing on large clusters, Proceedingsof the 6th conference on Symposium on OpeartingSystems Design & Implementation, p.10-10, San Francisco, CA, December 06-08, 2004. 

  10. Apache, "HDFS Architecture Guide," http://hadoop.apache.org/docs/r1.2.1/hdfs_design.html, Retrieved2015-03-06. 

  11. Strozzi, Carlo, "NoSQL-A relational database management system," http://www.strozzi.it/cgi-bin/CSA/tw7/I/en_US/nosql/Home%20Page, Retrieved 2015-03-06. 

  12. Gajendran, Santhosh Kumar. "A survey on nosqldatabases." University of Illinois, 2012. 

  13. Stonebraker, Michael. "SQL databases v. NoSQLdatabases," Communications of the ACM 53.4, 10-11, 2010. 

  14. Wei, Zhou, Guillaume Pierre, and Chi-Hung Chi, "CloudTPS: Scalable transactions for Web applicationsin the cloud," Services Computing, IEEE Transactions on 5.4, 525-539, 2012. 

  15. Peng, Daniel, and Frank Dabek, "Large-scale Incremental Processing Using Distributed Transactions and Notifications," OSDI. Vol. 10. 2010. 

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로