$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

하둡 기반 빅 데이터 기법을 이용한 웹 서비스 데이터 처리 설계 및 구현
Design and Implementation of an Efficient Web Services Data Processing Using Hadoop-Based Big Data Processing Technique 원문보기

한국산학기술학회논문지 = Journal of the Korea Academia-Industrial cooperation Society, v.16 no.1, 2015년, pp.726 - 734  

김현주 (단국대학교 대학원 전자전기공학부 컴퓨터응용 전공)

초록
AI-Helper 아이콘AI-Helper

데이터를 구조화하여 사용하는 관계형 데이터베이스가 현재까지 데이터 관리에 가장 많이 사용되고 있다. 그러나 관계형 데이터베이스는 데이터가 증가되면 데이터를 저장하거나 조회할 때 읽기, 쓰기 연산 수행에 제약 조건이 발생되어 서비스가 느려지는 현상이 나타난다. 또 새로운 업무가 추가되면 데이터베이스 내 데이터는 증가되고 결국 이를 해결하기 위해 하드웨어의 병렬 구성, CPU, 메모리, 네트워크 등 추가적인 인프라 구성을 필요로 하게 된다. 본 논문에서는 관계형 데이터베이스의 데이터 증가로 느려지는 웹 정보서비스 개선을 위해 기존 관계형 데이터베이스의 데이터를 하둡 HDFS로 전송하고 이를 일원화하여 데이터를 재구성한 후 사용자에게 하둡 데이터 처리로 대량의 데이터를 빠르고 안전하게 추출하는 모델을 구현한다. 본 시스템 적용을 위해 웹 기반 민원시스템과 비정형 데이터 처리인 이미지 파일 저장에 본 제안시스템을 적용하였다. 적용결과 관계형 데이터베이스 시스템보다 제안시스템 데이터 처리가 0.4초 더 빠른 결과를 얻을 수 있었고 기존 관계형 데이터베이스와 같은 대량의 데이터를 처리를 빅 데이터 기법인 하둡 데이터 처리로도 웹 정보서비스를 지원이 가능하였다. 또한 하둡은 오픈소스로 제공되어 소프트웨어 구매 비용을 줄여주는 장점이 있으며 기존 관계형 데이터베이스의 데이터 증가로 효율적인 대용량 데이터 처리를 요구하는 조직에게 도움을 줄 수 있을 것이다.

Abstract AI-Helper 아이콘AI-Helper

Relational databases used by structuralizing data are the most widely used in data management at present. However, in relational databases, service becomes slower as the amount of data increases because of constraints in the reading and writing operations to save or query data. Furthermore, when a n...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서 하둡을 이용한 데이터 처리 모델을 제안한다. 본 논문의 데이터 처리는 전통적인 RDBMS 데이터베이스의 업무 효율성 증진과 기존 인프라의 추가 시설 없이 서비스 증가로 인한 데이터 읽기 부하, 쓰기 부하를 개선해 보고자 시도된 데이터 서비스 모델이다.
  • 본 논문에서는 다형화 되는 데이터 증가로 인한 기관내 RDBMS 간의 데이터 처리에 관심을 두고 사용자에게는 신속한 정보서비스와 효율적인 데이터 관리를 위해기존 RDBMS 데이터 운영 방식에서 벗어나 확장성 있는 데이터 운영에 관심을 두었다. 더불어 경제적 비용을 최소화하며 데이터 증가로 인한 서비스 지연 현상을 개선하여 빠른 데이터 처리에 초점을 두고 본 제안시스템을 구현하였다.
  • 본 논문에서는 현재까지 용이하게 사용되어 온 RDBMS 데이터 운영 방식에서 벗어나 효율적 데이터 처리와 경제적으로 유용한 데이터 처리 방식의 연구에 관심을 두었다. 이를 활용하기 위해 하둡(Hadoop)HDFS(Hadoop Distributed File System) 파일 처리를 이용하였다.
  • 본 논문에서 하둡을 이용한 데이터 처리 모델을 제안한다. 본 논문의 데이터 처리는 전통적인 RDBMS 데이터베이스의 업무 효율성 증진과 기존 인프라의 추가 시설 없이 서비스 증가로 인한 데이터 읽기 부하, 쓰기 부하를 개선해 보고자 시도된 데이터 서비스 모델이다. 본모델은 RDBMS 데이터를 하둡 기반 HDFS로 일원화하고 맵리듀스를 이용하여 데이터를 재구성하여 사용자에게 대량의 데이터를 빠르고 안전하게 추출하는 모델로 하둡 기반 빅 데이터 처리 기법을 적용하였다.

가설 설정

  • 1. Data 전송은 RDBMS에서 데이터 전처리기(Preprocessing)로 데이터를 전송하는 과정이다. RDBMS에서 데이터 갱신 트리거가 발생되면 RDBMS 스케줄러(Scheduler)에 의해 갱신된 RDBMS의 자료를 하둡 HDFS 파일시스템으로 데이터를 전송한다.
  • 2. Data 저장은 사용자에 의해 해당 정보서비스 모듈의 데이터 변경 작업이 진행되는 과정이다. 사용자가 사용자 아이디와 암호를 이용하여 웹 시스템에 접속하면 인증검사와 유효성검사 진행 후 사용자는 해당 서비스모듈로 이동하여 변경데이터를 발생시킨다.
  • 이들 정보로 다양한 분야에서 기존 데이터에서 찾을 수 없는 새로운 정보를 얻을 수 있다. 셋째, 속도(velocity)이다. 데이터는 과거와 다르게 기하급수적으로 증가되고 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
빅 데이터가 주요 자산으로 여겨지는 이유는 무엇 때문인가? 우리나라에서도 국가정보화를 데이터 기반으로 변경하는 등 빅 데이터는 차세대 산업 기술로 주목받고 있다[1]. 이처럼 빅 데이터가 기업경쟁력이나 국가경쟁력을 좌우하는 주요 자산으로 여겨지는 이유는 기존의 일부 데이터를 분석하여 얻어지는 결과보다 분석 결과의 정확도가 높으며 이로 인해 기존에 몰랐던 새로운 사실을 발견할 수 있기 때문이다. 또한 빅 데이터는 향후 국가 기반 주요 기술로 성장할 것 이라는 것에 대해서는 모두가 의심하지 않고 있다[2-5].
빅 데이터를 구성하는 세 가지 속성은 무엇인가? 빅 데이터의 구성은 규모(volume), 형태(variety), 속도(velocity) 3가지 속성으로 구성되며 이 3가지 속성이 충족 될 때 빅 데이터의 구성이 가능하다. 이 3가지 속성을 기준으로 빅 데이터의 특징을 구분한다.
빅 데이터의 활용은 어떠한 단계를 거치는가? 빅 데이터의 활용은 다음의 단계를 거친다. 생성→수집→저장→분석→표현의 단계를 거쳐 각 단계별 기술이 적용된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (17)

  1. Y. J. Song, "Policy Challenges for the Future of Data-Based Country Strategy", NIA , IT Future Strategy No. 3, Apr 2013. 

  2. G. S. Hang, "Big Data Platform Strategy: Big Data is Changing Business Platform Future Revolution", Electronic Times, (pp. 83-97, 101-105, 193-203), 22013. 

  3. M. R. Choi, "United States?Japan: Big Data R&D Strategies and Country of the Corresponding Problem", Nipa, IT R&D Policy Review, Mar 2013. 

  4. Ms Park Presidential Election Camp, "Creative Economy", New World, 2012. 

  5. DongA, "[2012 General Election-Big Data Presidential Election Campaign] 'Big Data 'Election Period", Available From: http://news.donga.com/3/all/20120202/43722588/1, Feb, 02, 2012. 

  6. Seth Gilbert, Nancy Lynch, "Brewer's Conjecture and the Feasibility of Consistent, Available, Partition-Tolerant Web Services", ACM SIGACT, (pp. 51-59), vol 33 Issue 2, (accessed June, 2002). 

  7. Anonymous. http://develop.sunshiny.kr/883?category50, 2013. 

  8. Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung, "The Google File System", 19th ACM Symposium on Operating Systems Principles, Lake George, NY, [Online] Available: http://research.google.com/archive/gfs.html, (accessed Oct, 2003). 

  9. Anonymous. "Big Data at the Speed of Business" http://www-01.ibm.com/software/data/bigdata/. 

  10. STAMFORD, Conn, http://www.gartner.com/newsroom/id/1731916, June 27, 2011. 

  11. McKinsey Global Institute, "Big Data: The next frontier for innovation, competition. and productivity", McKinsey Global Institute, 2011. 

  12. PHILIP CARTER, "Big Data Analytics: Future Architectures, Skills and Roadmaps for the CIO", WHITE PAPER, IDC sponsored by SAS, 2011. 

  13. Vitaly Friedman, "Data Visualization & Infographics", Graphics, Monday Inspiration, January 14th, Jan, 2008. 

  14. Anonymous. "Big Data Era-Hadoop", http://cfic.tistory.com/5, May 25, 2012. 

  15. J. Dean, S. Ghemawat "MapReduce: Simplified Data Processing on Large Clusters", Communications of the ACM, vol. 51, No. 1, Jan, 2008. 

  16. Colin White, "MapReduce and Data Scientist", BI Research, 2012. 

  17. Brian Proffittm, "Cost Analysis of Hadoop and RDBM S…Grenada is a Three-Fold Difference in Operating Costs.", IDG KOREA, Technology Trends, Jan, 12, 2012. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로