$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

빅데이터의 효과적인 처리 및 활용을 위한 클라이언트-서버 모델 설계
Design of Client-Server Model For Effective Processing and Utilization of Bigdata 원문보기

지능정보연구 = Journal of intelligence and information systems, v.22 no.4, 2016년, pp.109 - 122  

박대서 (강원대학교 컴퓨터정보통신학과) ,  김화종 (강원대학교 컴퓨터정보통신학과)

초록
AI-Helper 아이콘AI-Helper

최근 빅데이터 분석은 기업과 전문가뿐만 아니라 개인이나 비전문가들도 큰 관심을 갖는 분야로 발전하였다. 그에 따라 현재 공개된 데이터 또는 직접 수집한 이터를 분석하여 마케팅, 사회적 문제 해결 등에 활용되고 있다. 국내에서도 다양한 기업들과 개인이 빅데이터 분석에 도전하고 있지만 빅데이터 공개의 제한과 수집의 어려움으로 분석 초기 단계에서부터 어려움을 겪고 있다. 본 논문에서는 빅데이터 공유를 방해하는 개인정보, 빅트래픽 등의 요소들에 대한 기존 연구와 사례들을 살펴보고 정책기반의 해결책이 아닌 시스템을 통해서 빅데이터 공유 제한 문제를 해결 할 수 있는 클라이언트-서버 모델을 이용해 빅데이터를 공개 및 사용 할 때 발생하는 문제점들을 해소하고 공유와 분석 활성화를 도울 수 있는 방안에 대해 기술한다. 클라이언트-서버 모델은 SPARK를 활용해 빠른 분석과 사용자 요청을 처리하며 Server Agent와 Client Agent로 구분해 데이터 제공자가 데이터를 공개할 때 서버 측의 프로세스와 데이터 사용자가 데이터를 사용하기 위한 클라이언트 측의 프로세스로 구분하여 설명한다. 특히, 빅데이터 공유, 분산 빅데이터 처리, 빅트래픽 문제에 초점을 맞추어 클라이언트-서버 모델의 세부 모듈을 구성하고 각 모듈의 설계 방법에 대해 제시하고자 한다. 클라이언트-서버 모델을 통해서 빅데이터 공유문제를 해결하고 자유로운 공유 환경을 구성하여 안전하게 빅데이터를 공개하고 쉽게 빅데이터를 찾는 이상적인 공유 서비스를 제공할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

Recently, big data analysis has developed into a field of interest to individuals and non-experts as well as companies and professionals. Accordingly, it is utilized for marketing and social problem solving by analyzing the data currently opened or collected directly. In Korea, various companies and...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 또한, 사전 분석을 통해 공개 수준에 따라 다양한 크기의 데이터를 제공하도록 본 논문에서 제시하였다. 이러한 방식은 기존의 다수 시스템에서 원시데이터만을 공유하는 방식과 비교 하였을 때 트래픽 발생량이 낮게 나타날 것으로 기대된다.
  • 또한, 공유되는 데이터에 대해서도 그 속성과 간단한 정보를 파악하기 위해서는 전체 데이터를 다운로드 받고 살펴보아야하기 때문에 빅트래픽 문제도 발생 할 수 있다. 이러한 문제들을 해결해 빅데이터가 활성화 될 수 있도록 본 논문에서는 빅데이터 공유, 분산 빅데이터 처리, 빅트래픽의 3가지 문제에 초점을 맞추어 이를 해결할 수 있는 클라이언트-서버 모델의 모듈을 소개하고 설계 방법에 대하여 기술한다.

가설 설정

  • 또한, 빅데이터는 그 내용 자체가 방대하기 때문에 직접 그 내용을 파악하는데 많은 시간이 소요된다. 빅데이터가 공개되면 사용자가 공개된 빅데이터를 빠르게 파악하여 다운받고 이용할 수 있어야 빅데이터 공유가 활성화 될 수 있다. 원본데이터를 그대로 다운받고 활용하기 전에 시스템 상에서 원본데이터를 전반적으로 이해하고 파악할 수 있는 요약, 샘플데이터 정보가 제공 되어야 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
빅데이터 처리와 활용에 있어 나타나는 빅데이터 공유 문제는 어떤 문제인가? 빅데이터 처리와 활용에 있어 3가지 문제를 다음과 같이 정의 할 수 있다. 첫째는 빅데이터 공유 문제로 빅데이터 공유 활성화를 어렵게 하는 프라이버시, 공유 서비스 부족 등에 대한 문제이다. 최근 빅데이터를 이용한 성공적인 서비스 혁신 사례들이 소개되면서 빅데이터가 개인정보 유출이나 프라이버시 침해를 가속화 할 것 이라는 우려도 커지고 있으며 빅데이터의 성공적인 활용은 사람들의 신뢰를 필요로 하기 때문에 프라이버시 침해에 대한 안전성이 확보되어야 한다(Choi et al.
Server Agent의 Job Distribution 모델과 Pre-Analysis Module의 차이점은 무엇인가? Server Agent의 Job Distribution Module은 SPARK를 사용하며 빅데이터를 분산 처리해 사용자 요청에 맞는 사전분석결과를 빠르게 재 생성하여 사용자가 요청한 데이터를 제공한다. Pre-Analysis Module과의 차이점은 Pre-Analysis Module은 데이터 사용자의 검색과 탐색을 위한 Data descriptor를 생성해 게시하는 작업을 수행하고 Job Distribution Module은 사용자가 요청한 데이터를 네트워크 상태(트래픽)에 따라 원시 데이터로부터 빠르게 재 생성하여 사용자에게 제공한다. [Figure 3]과 같은 프로세스로 동작하며 원시 데이터와 트래픽 정보를 통해서 Transformed Data를 생성한다.
Server Agent는 무엇을 생성하는가? Server Agent는 데이터 제공자에게 필요한 Agent로서 빅데이터의 사전 분석을 수행하여 Sample Data, Summary Data, Raw Data의 정보를 갖는 Data Descriptor를 생성한다. 또한, 빅데이터 분산처리를 통해서 빠르고 효율적인 빅데이터 전처리를 수행하며 네트워크 트래픽을 지속적으로 감시한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Bok, K. S, M. S. Yook, Y. W. Noh, J. E. Han, Y. W. Kim, J. T. Lim, J. S. Yoo, "In-Memory Based Incremental Processing Method for Stream Query Processing in Big Data Environments", Journal of The Korea Contents Association, Vol. 16, No. 2(2016), 163-173. 

  2. Choi, J. K, "Current status and implications of big data analysis at home and abroad", Korea Institute of S&T Evaluation and Planning, 2016. Available at http://www.kistep.re.kr (Downloaded 16 November, 2016). 

  3. Choi, K, H. J. Kim, "A Suggestion on the Strategy for Common Sharing of Big-DATA", Korea Institute of Information & Telecommunication Facilities Engineering, (2013), 108-114. 

  4. Jeon, Y. H, J. S. Jang,"Big Data Networking Considerations and Cisco Case Studies", Korean Institute of Information Technology Magazine, Vol. 10, No. 3(2012), 11-16. 

  5. Judith, R, "Round and Round the Garden? Big Data, Small Government and the Balance of Power in the Information Age", Journal of Law & Economic Regulation, Vol. 8, No. 1(2015), 49-61. 

  6. Jun, S. H, "A New Statistical Sampling Method for Reducing Computing time of Machine Learning Algorithms", Korean Institute of Intelligent Systems, Vol. 21, No. 2(2011), 171-177. 

  7. Kim, H. J, "ODI-based data access framework for spread Big data"Information and Communications Magazine, vol. 31, No. 11(2014), 67-71. 

  8. Kim. T. H, "A Hybrid Under-sampling Approach for Better Bankruptcy Prediction", Journal of Intelligence and Information Systems, Vol. 21, No. 2(2015), 173-190. 

  9. Kim, Y. S,"Agile Network Delay Time Modeling of Web Traffic", Journal of KIIT, Vol. 11, No. 9(2013), 103-110. 

  10. Lee, H. S, D. W. Lim, H. J. Zo,"Personal Information Overload and User Resistance in the Big Data Age", Journal of Intelligence and Information Systems, Vol. 19, No. 1(2013), 125-139. 

  11. Heo, S. W, "Big Data Legal Issues in Korea", Journal of Law & Economic Regulation, vol. 7, No. 2(2014), 7-21. 

  12. Oh, J. H, "Big Data Industry Top 10 News & Issues in 2015", National Information Society Agency(NIA), 2016. Available at http://www.nia.or.kr (Downloaded 15 November, 2016). 

  13. Park, J. H, H. J. Kim, S. W. Choi, S. R. Yoon, "Comparative Performance Analysis of Logistic Regression on Apache Spark Framework", Korea Computer Congress, (2015), 1531-1533. 

  14. Shoro, A. G, T. R Soomro, "Big Data Analysis: Apache Spark Perspective", Global Journal of Computer Science and Technology, Vol. 15, No. 1-C(2015), 7-14. 

  15. Um, J. H, T. H. Kim, S. W. Lee, C. H. Jung and H. M, Jung, "Next-generation real-time big data distribution system trend", Institute for Information & communications Technology Promotion, 2014. Available at http://www.itfind.or.kr/itfind (Downloaded 16 November, 2016). 

  16. Zaharia, M, M. Chowdhury, T. Das, A. Dave, J. Ma, M. McCauley, M. Franklin, S. Shenker, and I. Stoica, "Resilient Distributed Datasets: A fault-tolerant abstraction for in-memory cluster computing", Networked Systems Design and Implementation(NSDI), Vol. 12, No. 4(2012), 15-28. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로