최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보처리학회 2018년도 춘계학술발표대회, 2018 May 11, 2018년, pp.271 - 274
장민서 (성균관대학교 문과대학) , 오수진 (성균관대학교 정보통신대학) , 김응모 (성균관대학교 소프트웨어대학)
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
TF-IDF란 무엇인가? | TF-IDF는 주로 정보 검색과 텍스트마이닝에서 이용하는 가중치 지표로 어떤 단어가 특정 문서내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다. 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정하거나, 문서들 사이의 비슷한 정도를 구하는 등의 용도로 사용된다. | |
데이터마이닝의 6단계는? | 데이터마이닝(Data Mining)은 자동화되고 지능을 갖춘 데이터베이스 분석기법이다. 데이터마이닝은 일반적으로 데이터 선택, 데이터 정제, 데이터 변환, 데이터마이닝, 패턴평가, 지식 표현의 6단계로 되어있다. 데이터 패턴을 추출하기 위해서 실제 데이터마이닝 알고리즘이 적용되는 단계는 데이터마이닝 전 과정 중 핵심 단계로서 일반적으로 데이터마이닝이라고 한다. | |
k-means 알고리즘은 어떻게 수행되는 기법인가? | k-means 알고리즘은 가장 널리 알려진 클러스터링 알고리즘이다. 비계층적 클러스터링 기법으로 문서와 군집의 중심 값을 나타내는 센트로이드와의 유사도를 측정하여 문서를 적합한 군집에 재배치하는 기법이다. 여기에서 클러스터 센트로이드(중심)는 클러스터에 속하는 문서들의 평균 백터 값을 이용한다. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.