$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

TextRank를 이용한 키워드 정련 -TextRank를 이용한 집단 지성에서 생성된 콘텐츠의 키워드 정련-
Keywords Refinement using TextRank Algorithm 원문보기

한국HCI학회 2009년도 학술대회, 2009 Feb. 09, 2009년, pp.285 - 289  

이현우 (창원대학교 컴퓨터공학과) ,  한요섭 (한국과학기술연구원) ,  김래현 (한국과학기술연구원) ,  차정원 (창원대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

태그콘텐츠를 대표하는 신뢰도가 높은 키워드이다. 하지만 일부 기업과 사람들이 콘텐츠와 관련이 없는 키워드를 태그로 사용하여 본 논문에서는 무분별하게 사용된 키워드를 정련하는 알고리듬을 제안한다. 키워드 정련과 관련된 연구는 진행되지 않았지만, 본 논문에서는 단어와 단어사이에 가상의 링크를 생성, TextRank 알고리듬을 적용하여 콘텐츠에서 단어의 중요도를 계산하여 중요도가 낮은 단어의 일부를 콘텐츠의 제작자가 작성한 키워드에서 제거하여 키워드 정련을 하였다. 그 결과, 단순히 단어의 중요도가 낮은 하위 n%의 단어를 제거하는 방법보다는 신뢰도 구간을 만족할 때까지 제거하는 방법이 훨씬 좋은 키워드 정련 결과를 보였다.

Abstract AI-Helper 아이콘AI-Helper

Tag is important to retrieve and classify contents. However, someone uses so many unrelated tags with contents for the high ranking In this work, we propose tag refinement algorithm using TextRank. We calculate the importance of keywords occurred a title, description, tag, and comments. We refine ta...

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 어떤 문서에 특정 문서로 향하는 하이퍼링크(hyperlink)는 문서를 작성자의 판단이 인코딩 되어 있는데, 중요한 문서일수록 그 문서로 향하는 하이퍼링크 개수가 많아진다. 그래서 [4]는 권위 있는 문서를 특정 질의와 관련성 높은 문서들의 하이퍼링크의 구조를 분석하여 해결하고자 하였다.
  • 키워드를 추천하는 연구는 다수 존재하나, 존재하는 키워드를 정련하는 분야의 연구는 아직 이루어지지 않았다. 그래서 정련에 대한 이전 연구 대신에 태그 추천 시스템과 관련된 연구와 문서의 중요도를 계산할 수 있는 연구로 대신하고자 한다.
  • 본 논문에서는 콘텐츠를 대표하는 핵심어인 태그가 올바른 방향으로 사용될 수 있도록 TextRank 알고리듬[5]을 이용한 키워드 정련 알고리즘을 제안한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
태그란 무엇인가? 블로그(Blog), 위키위키(WikiWiki)와 같은 1인 미디어 시대를 대표하는 매체에서 자신이 작성한 콘텐츠를 대표하는 핵심어(키워드)를 태그(tags)라고 한다.
태그는 어떤 구조로 되어 있는가? 태그는 시스템에서 자동으로 생성되지 않으며, 사용자가 직접 입력하는 구조로 되어 있다. 그래서 해당 콘텐츠를 대표하는 단어로 높은 신뢰도를 가지고 있다.
TextRank 알고리듬을 사용한 방법은 어떤 특징을 가지는가? [5]에서는 문서에서 하나의 문장을 하나의 문서로 가정하여 문장과 문장사이에 유사도가 임계값 이상일 때 문장과 문장 간에 링크를 생성하여 [1]의 PageRank 알고리듬을 변형한 TextRank 알고리듬으로 문장의 중요도를 계산하여 중요도가 가장 높은 문장을 문서를 요약한 문장으로 사용하였다. 문장과 문장의 링크 방향에 따라 다른 성능을 나타내었지만 언어처리 도구를 사용하지 않아 다양한 언어에 적용할 수 있다는 특징을 가지고 있다.
질의응답 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로