최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회, 2013 Oct. 06, 2013년, pp.160 - 162
조희선 (금오공과대학교 컴퓨터소프트웨어공학과) , 김수아 (금오공과대학교 컴퓨터소프트웨어공학과) , 이현아 (금오공과대학교 컴퓨터소프트웨어공학과)
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
TF와 IDF를 분류로 확장시킨 특성 추출 알고리즘의 정확률 실험 결과는 어떠한가? | 본 논문에서는 블로그 포스트를 자동으로 분류하기 위해 TF와 IDF를 분류로 확장시킨 특성 추출 알고리즘을 사용하여 정확률을 실험하였다. 제안된 방식에서 나이브베이즈를 사용한 분류 모델이 비교적 높은 정확률을 보였고, IDF를 사용한 것 보다 IECDF를 사용했을 때 블로그 문서의 분류가 더 정확하게 수행되었다. TF보다는 분류로 확장한 CDF나 CTF를 사용하는 것이 더 정확한 결과를 보였다. | |
IDF란? | IDF는 문서 빈도를 이용하여 단어의 희소성이나 정보 성을 표현하는 통계적 방법으로, 첫 번째 방식에서는 IDF로 단어 wi의 주제 분별 점수를 구한다. IDF(wi)는 전체 문서수에서 단어 wi가 발생한 문서의 빈도를 나눈 값에 log를 취한 값으로서 식으로 표현하면 다음 식 (2)과 같다. | |
CTF란? | CTF-IECDF는 분류 c에서의 단어 누적 빈도와 c를 제외한 분류에서의 IDF값을 통해, 분류 c에서의 단어 중요도를 계산한다. CTF는 문서내 빈도인 TF를 분류 내빈도로 확장시킨 값이며, IECDF는 특정 분류를 제외한 IDF를 의미한다. 이 방식에서는 단어 wi의 누적빈도가 가장 큰 분류를 단어 wi의 대표 분류로 보고, 해당당 분류 Cmax를 수식 (3)으로 얻는다. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.