$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

퍼지추론 기반 대표 키워드 추출방법의 성능 평가
Performance Evaluation of the Extractiojn Method of Representative Keywords by Fuzzy Inference 원문보기

한국산업정보학회논문지 = Journal of the Korea Industrial Information Systems Research, v.10 no.1, 2005년, pp.28 - 37  

노순억 (금오공과대학교 컴퓨터공학부) ,  김병만 (금오공과대학교 컴퓨터공학부) ,  오상엽 (금오공과대학교 컴퓨터공학부) ,  이현아 (금오공과대학교 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

본 논문은 퍼지 추론을 이용하여 소수문서로부터 대표 용어들을 추출하고 가중치를 부여하는 기존 방법의 유용성을 평가하고자 GIS (Generalized Instance Set) 알고리즘에 이를 적용시켜 그 성능을 평가하여 보았다. GIS 는 학습 문서 집합에 대한 일반화 (generalization) 과정을 통해 문서 그룹들을 형성하고 이 그룹의 대표 문서 (generalized instance)를 생성한 후 k- 알고리즘을 적용하는 방법이다. 본 논문에서는 바로 이 일반화 과정의 한 방법으로 퍼지 추론을 이용한 방법을 사용하였다. 상대적 성능 평가를 위하여 이 일반화(generalization) 과정에 Rocchio와 Widrow-Hoff 방법도 적용시켜 문서 분류 성능을 비교하였다. 실험 결과, 긍정적 문서만을 고려할 경우는 좋은 성능을 보이지만 부정적 문서를 같이 고려할 경우는 성능이 상대적으로 좋지 않음을 확인 할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

In our previous works, we suggested a method that extracts representative keywords from a few positive documents and assigns weights to them. To show the usefulness of the method, in this paper, we evaluate the performance of a famous classification algorithm called GIS(Generalized Instance Set) whe...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 하지만 ⑵의 방법은 사용자가 피드백하는 문서가 소수이며 긍정적인 문서만 피드백한다는 가정 하에서 제안되었다. 따라서, 본 논문에서는 [2]의 방법을 다수의 문서가 주어진 경우와 부정적 문서도 같이 주어진 경우로 확장하여 그 유용성을 확인하고자 하였다. 이를 위해 GIS (Generalized Instance Set) 알고리즘 [10, 11]에 [2]의 방법을 적용시켜 그 성능을 평가하였다.
  • 본 논문에서는 소수의 긍정적 문서 집합을 대상으로 문서들의 내용을 대표하는 중요 용어들을 추출하고 이들의 가중치를 부여하는 문제를 해결하기 위한 방법인 퍼지 추론 및 용어 발생 빈도 수의 유사성을 이용한 가중치 재산정 접근 방법을 GIS 알고리즘에 적용시켜 문서분류 성능을 비교해 보았다. GIS 알고리즘에 적용시켜 봄으로써 소수 학습 문서 집합을 대상으로 한다는 제약성을 극복할 수 있었으며 긍정적 문서들만을 일반화에 사용한 실험에서 나은 성능을 보여줌으로써 성능 향상의 가능성을 확인할 수 있었다.
  • 위 실험을 통하여 본 방법은 적당수 (10 ~ 30개)의 관련문서가 주어진 경우 좋은 성능을 보임을 확인할 수 있었다. 본 실험에서는 사용자로부터 더 많은 수의 관심 문서들이 주어진 경우를 고려하여 위 방법의 성능을 확인하고자 하였다. 우선 다수 의 문서 집합에 대한 위 방법의 성능을 살펴본 후 문서들을 여러 개의 소수 문서 집합들로 분할한 뒤 각각에 대해 위 방법을 적용시키는 방법에 대한 성능을 살펴보았다.

가설 설정

  • [2]에서는 학습 문서에 퍼지 추론을 적용시켜 초기 중요 단어들을 추출하고 이 단어들을 초기 질의어로 간주하여 기존의 질의 자동 확장 방법을 적용시켜 중요도를 재산정하는 방법을 제안하였고 실험을 통해 그 유용성을 확인하였다. 하지만 ⑵의 방법은 사용자가 피드백하는 문서가 소수이며 긍정적인 문서만 피드백한다는 가정 하에서 제안되었다. 따라서, 본 논문에서는 [2]의 방법을 다수의 문서가 주어진 경우와 부정적 문서도 같이 주어진 경우로 확장하여 그 유용성을 확인하고자 하였다.
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로