$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 그룹특징기반 슬라이딩 윈도우 클러스터링에서의 k-means와 k-medoids 비교 평가
Comparison between k-means and k-medoids Algorithms for a Group-Feature based Sliding Window Clustering 원문보기

한국전자거래학회지 = The Journal of Society for e-Business Studies, v.23 no.3, 2018년, pp.225 - 237  

양주연 (Dept of Computer Science, Sookmyung Women's University) ,  심준호 (Dept of Computer Science, Sookmyung Women's University)

초록
AI-Helper 아이콘AI-Helper

대용량 데이터의 발생과 처리가 대중화되면서 대용량 데이터 스트림 처리에 대한 수요가 급격하게 증가하고 있다. 이 수요에 따라 다양한 대용량 데이터 처리 기술이 개발되고 있다. 한 분야로 주목받고 있는 방식은 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링이다. 슬라이딩 윈도우를 사용한 데이터 스트림 클러스터링은 윈도우가 이동할 때마다 새로운 클러스터를 생성한다. 기존의 슬라이딩 윈도우 상의 클러스터링 기법은 코어셋(Coreset)을 기반으로 데이터 스트림 클러스터링을 구현하고 있다. 이 연구에서는 코어셋을 활용한 그룹특징을 이용한 알고리즘 내에서 이용하는 클러스터링 알고리즘을 변경하였다. 그리고 이를 통해 제안 알고리즘과 기존 알고리즘의 파라미터 값 변화에 따른 성능 비교 실험을 진행하였다. 개선된 사항에 대해 논하여 두 알고리즘을 비교하고 실험자에게 파라미터에 따른 이용 방향을 제시한다.

Abstract AI-Helper 아이콘AI-Helper

The demand for processing large data streams is growing rapidly as the generation and processing of large volumes of data become more popular. A variety of large data processing technologies are being developed to suit the increasing demand. One of the technologies that researchers have particularly...

Keyword

표/그림 (12)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서는 대형 데이터 스트림을 실시간으로 처리하는 클러스터링 기법 중 실시간 처리에 중점을 두는 알고리즘에 대해 이야기하고자 한다. 데이터 값을 그룹화[2]하고 클러스터링을 진행하는 과정을 구분하는 두 단계로 진행하는 클러스터링 방식[9]을 기반으로 하여 그룹화 하는 과정에서 사용하는 클러스터링 기법의 변화가 데이터 클러스터링 결과에 어떠한 영향을 미치는 지 확인하였다.
  • 또한 데이터의 모든 정보의 가중치를 동일하다고 계산하여 데이터의 실질 분별에 있어서 신뢰도가 낮다는 단점을 가지고 있다. 따라서 k-means 알고리즘의 단점을 보강하기 위해 제시된 k-medoids 알고리즘을 적용하여 최종 클러스터링 값에 미치는 영향을 파악하고 개선 방향을 제시해보고자 한다.
  • 그럼에도 k-means 알고리즘이 이상 값에 크게 반응한다는 단점을 해결하기 위해서 가장우선적으로 k-medoids 알고리즘을 대체하고자 한다. 데이터셋의 형태를 따라 k-means 알고리즘을 적용한 클러스터링과 k-medoids 알고리즘을 적용한 클러스터링의 결과 값을 비교하여 클러스터링 성능과 시간 성능을 개선하는 알고리즘의 기반을 제시하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
빅데이터를 활용하기 위해 대형 데이터 스트림의 처리가 필수적인 이유는 무엇인가? 빅데이터에서 사용되는 대용량 데이터는 실시간으로 수집되는 정보를 기반으로 한다. 따라서 빅데이터를 제대로 활용하기 위해서는 대형 데이터 스트림의 처리가 필수적이다.
빅데이터는 무엇인가? 빅데이터[6, 8]는 정보, 기술, 효과, 방법론의 총 집합체로서 정보 기술의 최신 동향으로 주시되고 있다. 빅데이터는 이름 그대로 대용량데이터를 처리하고 이를 통해 추출한 정보를 이용하여 기술적, 혹은 사회적 적용을 하는 것까지 포함하는 매우 포괄적인 정의를 가진다.
데이터 스트림을 실시간으로 클러스터링 처리하는 기법이 제시되는 이유는 무엇인가? 대형 데이터 스트림을 처리하는 방식에는 다양한 방식이 존재한다[11]. 데이터 스트림은 실시간으로 정보 값이 변화하는 특수성을 가지고 있고, 이를 통해 변화하는 추이를 확인하기 위해야 한다는 특수성을 가지고 있기 때문에 데이터 스트림을 실시간으로 클러스터링 처리하는 기법이 제시된다.
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

LOADING...

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로