최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기응용통계연구 = The Korean journal of applied statistics, v.27 no.2, 2014년, pp.169 - 183
최요셉 (부산대학교 통계학과) , 최용석 (부산대학교 통계학과)
Massive and various types of data recorded everywhere are called big data. Therefore, it is important to analyze big data and to nd valuable information. Besides, to standardize unstructured big data is important for the application of statistical methods. In this paper, we will show how to standard...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
맵리듀스란? | 맵리듀스는 대용량의 데이터를 처리하기 위한 분산 처리 시스템의 프레임워크 구조이다. 맵리듀스는단어의 의미 그대로 매핑(mapping)을 하는 맵(map) 단계와 데이터를 줄이는 리듀스(reduce) 단계로 구성되어 있다. | |
빅 데이터의 특성을 나타내는 3가지 키워드는? | 빅 데이터의 특성은 크기(volume), 다양성(variety), 속도(velocity) 3개의 키워드로 나타낼 수 있다. 크기는 앞서 언급한 것과 같이 시대와 데이터를 다루는 대상에 따라 상대적으로 다를 수는 있지만, 현재는 수십 테라바이트에서 수십 페타바이트(petabyte) 이상 크기의 데이터량을 말하며, 일반적으로는 데이터를 관리하는 기존의 기술역량을 넘어서는 크기의 데이터량을 말한다. | |
맵리듀스는 어떤 과정을 통해 생성되는가? | 맵리듀스는단어의 의미 그대로 매핑(mapping)을 하는 맵(map) 단계와 데이터를 줄이는 리듀스(reduce) 단계로 구성되어 있다. 맵 단계에서는 입력데이터(input data)로부터 분리된 데이터(separated data)의<키(key), 값(value)>을 입력 받아 맵 함수를 통해 매핑된 <키(list(key)), 값(list(value))>의 쌍으로 내보내며 이렇게 생성된 쌍은 리듀스 단계를 거쳐 맵 단계에서 매핑된 키를 기준으로 집계 연산된 새로운 쌍의 <키(key), 값(value)>을 생성한다. |
Adrian, M. (2011). It's going mainstream, and it's your next opportunity, Teradata Magazine, AR-6309.
Choi, Y. S. (2001). Understanding and Application of Correspondence Analysis using SAS, Freedom Academy, Seoul.
Chiang, O. (2011). Twitter Hits Nearly 200M Accounts, 110M Tweets Per Day, Focuses On Global Ex- pansion, Forbes, Available from: http://www.forbes.com/sites/oliverchiang/2011/01/19/twitter-hits- nearly-200m-users-110m-tweets-per-day-focuses-on-global-expansion/
Dean, J. and Ghemawat, S. (2004). MapReduce: Simplied Data Processing on Large Clusters, OSDI, 1.
Gantz, J. and Reinsel, D. (2010). The digital universe decade-are you ready, White Paper, IDC.
Gantz, J. and Reinsel, D. (2011). Extracting value from chaos, IDC iView, 1-12.
Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S. and Brilliant, L. (2008). Detecting in uenza epidemics using search engine query data, Nature, 457(7232), 1012-1014.
Greenacre, M. J. (1984). The and Applications of Correspondence Analysis, Academic Press, New York.
Gruman, G. (2010). Tapping into the power of big data, Technology Forecast, 2010(3), 4-13.
Jeong, J. S. (2011). New value creation engine, new possibilities of big data and the corresponding strategy, IT & Future Strategy, 18, National Information Society Agency.
Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C. and Byers, A. H. (2011). big data: The next frontier for innovation, competition, and productivity, McKinsey Global Institute, 1-137.
Special Report (2010.02.25). Data, data everywhere, The Economist, Available from: http://www.eco- nomist.com/node/15557443
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.