[논문]스피치 요약을 위한 태그의미분석과 잠재의미분석간의 비교 연구

김현희

doi:10.4275/kslis.2013.47.3.343

문제 정의

따라서 본 연구는 스피치 요약을 위해서 플리커의 태그 클러스터와 워드넷의 동의어 정보를 이용하여 태그를 확장하여 태그의 희박성 문제를 해결하고, 더 나아가 전문가의 요약 패턴에 근접하기 위해서 의미적으로 연관성이 높은 단어들을 포함한 세그먼트에 더 높은 가중치를 부여하게 하는 알고리즘(태그의미분석 방법)을 제안하고 그 효율성을 평가해 보고자 한다.
본 연구는 스피치 요약을 위해서 비디오 태그를 확장하고 태그 간의 의미적 관계 정보를 이용할 수 있는 태그의미분석 방법을 제안하였다. 그런 다음, 플리커의 태그 클러스터와 워드넷의 동의어 정보가 태그 간의 의미적 관계를 분석하는데 얼마나 효과적으로 이용될 수 있는지 분석하고 제안한 방법의 특성과 효율성을 조사해 보기 위해서 이를 잠재의미분석 방법과 비교해 보았다.
본 연구는 스피치 요약을 위해서 태그를 확장하여 태그의 희박성 문제를 해결하고 의미상 연관성이 높은 단어들을 포함한 문장에 더 높은 가중치를 부여하기 위한 태그의미분석 방법을 제안한다. 태그의미분석 방법은 복잡한 계산 과정 없이 태그 간의 의미적 관계 정보를 이용할 수 있는 알고리즘을 활용한다.
비디오 11의 태그 ‘commencement’는 두 개의 플리커 태그 클러스터(태그 클러스터 1: graduation, university, college; 태그 클러스터 2: Tacoma, bay, Washington)를 갖고 있다. 본 연구는 의미적으로 관련 있는 적합한 태그 클러스터(들)를 선택하는 조건으로 태그 클러스터에 속한 용어(태그)가 초기 태그 리스트에 있으면 관련된 태그 클러스터로 판단하고 해당 태그 클러스터를 선정한다. 비디오 11의 경우 두 개의 클러스터 중에서 태그 클러스터 1이 초기 태그 리스트에 있는 ‘graduation’을 갖고 있기 때문에 선택되었다.
본 연구의 목적은 스피치 요약을 위해서 태그 의미분석 방법을 제안하고 제안한 방법을 잠재 의미분석 방법과 비교해 본 후 태그의미분석 방법의 특성과 효율성을 조사해 봄으로써 효율적인 스피치 요약 방안을 제안하는 데 있다.
플리커의 태그 클러스터가 비디오 태그를 확장하고 태그 간의 의미적 관계를 분석하는데 얼마나 효과적으로 적용될 수 있는지 그리고 워드 넷의 동의어 정보가 태그를 확장하고 비디오 태그 간의 의미적 관계를 분석하는데 얼마나 효과적으로 적용될 수 있는지 분석해 보았다.

가설 설정

한편 T₂과 T₉는 약한 의미적 관계를 갖고 있는데 이는 TC₂는 T₉을 포함하지만, TC₉이 T₂를 포함하지 않기 때문이다. T₁과 T₂는 이들 클러스터들이 서로 간의 태그를 포함하고 있지 않기 때문에 관계가 전혀 없다고 가정한다. 각 문장(S_i) 내에 있는 태그들 간의 의미적 관계를 계산하는 공식(3)은 다음과 같다.
그런 다음 샷 단위의 태그들을 이벤트 질의와 매칭시켜 적합성 점수를 계산하였다. 검색된 비디오 집단에서 자주 출현하는 유사한 샷들은 키샷일 가능성이 높을 것이라는 가정하에 유사 중복 키 프레임 검출 알고리즘(near-duplicate keyframe detection algorithm)을 이용하여 키샷들을 확인하였다. 이렇게 추출된 키샷들은 비디오 스킴 이나 비주얼-텍스트 스토리보드를 구성하기 위해서 이용하였다.

제안 방법

(1) 태그 점수 계산: 비디오 11에 속한 문장 1(“I am honored to be with you today at your commencement from one of the finest university in the world”)의 태그 점수를 계산하기 위해서, 의 10개의 태그를 이용하여 다음과 같이 문장 1(S1)과 태그(T ex)의 용어 벡터를 만들었다.
(4) 추가된 태그의 관련어 및 동의어 수집: 두 개의 추가된 태그의 플리커 태그 클러스터와 워드넷 용어 클러스터를 수집하였다. 수집한 결과, 비디오 자막에 출현하는 새로운 태그로 ‘campus’와 ‘school’이 확인되었으나 이들을 두 번째 태그 클러스터 수집 단계에서는 초기 태그 리스트에 추가하지 않았다.
(2003)은 개체명은 텍스트 요약보다 스피치 요약에서 더 중요한 기준이 된다고 보고하고 있다. 60개의 표본 비디오에 할당된 총 336개 태그와 720개의 본문 키워드(각 표본 비디오 자막에서 출현빈도가 3번 이상이면서 불용어 및 기능어를 제외한 단어)가 개체명(인명, 지명, 기관명 및 연도)을 얼마나 포함하고 있는지 분석해 보았다. 분석 결과, 태그의 경우는 16.
본 장에서는 표본 비디오 60개를 이용하여 연구 문제 1(플리커의 태그 클러스터와 워드넷의 동의어 정보가 비디오 태그를 확장하고 태그 간의 의미적 관계를 분석하는데 얼마나 효과적으로 이용될 수 있는가)을 분석해 본다. 그런 다음 잠재의미분석 방법이 어떤 방식에 의해서 중요한 문장들을 추출하는지 기술한 후 연구 문제 2(스피치 요약에 태그의미분석 방법과 잠재 의미분석 방법을 적용할 때 이 두 방법에 의한 요약문이 품질면에서 어떤 차이를 보일 것인가)를 검증해 본다.
또한 김현희(2012)는 스피치 요약의 알고리즘을 구성하기 위해서 이용자 태그 기법, 문장 위치 및 문장 중복도 제거 기법의 효율성을 분석해 보았다. 그런 다음, 분석 결과를 기초로 하여 스피치 요약 방법을 구성, 평가하여 효율적인 스피치 요약 방안을 제안하였다.
첫째, 복수개의 텍스트 문헌의 내용을 요약하기 위해서 문헌의 본문에 출현한 단어와 각 단어의 빈도수를 추출하였다. 그런 다음, 플리커에서 제공된 태그 클러스터들을 이용하여 문헌 내에 존재하는 단어의 빈도수를 갱신하여 문헌 내의 중요 단어들을 등급화하였다. 이를 기반으로 문헌 내에 존재하는 단어들의 문헌 내 기여도와 단어들 간의 의미적인 연관성을 분석하여 문헌 내의 핵심이 되는 단어들 위주로 문헌을 요약하는 방안을 제안하고, 제안한 방법의 효율성을 입증하였다.
본 연구는 스피치 요약을 위해서 비디오 태그를 확장하고 태그 간의 의미적 관계 정보를 이용할 수 있는 태그의미분석 방법을 제안하였다. 그런 다음, 플리커의 태그 클러스터와 워드넷의 동의어 정보가 태그 간의 의미적 관계를 분석하는데 얼마나 효과적으로 이용될 수 있는지 분석하고 제안한 방법의 특성과 효율성을 조사해 보기 위해서 이를 잠재의미분석 방법과 비교해 보았다. 그 결과를 요약하면 다음과 같다.
<표 1>에서 확인할 수 있는 것처럼 플리커 태그 클러스터 1과 워드넷 용어 클러스터 2가 관련어 및 동의어 태그 클러스터 2(TC 2)에 저장된다. 나머지 7개의 오리지널 태그에 대해서 앞에서 기술한 절차대로 분석하여 태그 및 용어 클러스터를 수집하였다.
둘째, 태그의 동의어를 수집하기 위해서 워드넷을 사용했다. 워드넷은 프린스턴 대학에 의해 개발된 영어를 위한 가장 큰 어휘 데이터베이스이다.
끝으로 제안한 태그의미분석 방법에서 자막 분석을 위해서 태그와 함께 표제의 키워드를 함께 사용한다면 좀 더 높은 품질의 요약물을 생성할 수 있을 것으로 생각된다. 본 연구에서 제안한 알고리즘은 실제 자막에 출현한 태그가 최소한 2개 이상이 되어야만 태그를 확장하고 태그 간의 의미적 관계를 분석할 수 있다. 60개 표본 비디오를 분석해 본 결과, 6개의 비디오들 (10.
본 장에서는 표본 비디오 60개를 이용하여 연구 문제 1(플리커의 태그 클러스터와 워드넷의 동의어 정보가 비디오 태그를 확장하고 태그 간의 의미적 관계를 분석하는데 얼마나 효과적으로 이용될 수 있는가)을 분석해 본다. 그런 다음 잠재의미분석 방법이 어떤 방식에 의해서 중요한 문장들을 추출하는지 기술한 후 연구 문제 2(스피치 요약에 태그의미분석 방법과 잠재 의미분석 방법을 적용할 때 이 두 방법에 의한 요약문이 품질면에서 어떤 차이를 보일 것인가)를 검증해 본다.
스피치 요약 알고리즘을 구성하기 위해서 요약 모형을 설계한다. 제안한 요약 모형은 태그 집합과 가장 관련 있는 문장이면서 의미적으로 서로 관련 있는 태그들을 많이 포함한 문장에 더 높은 가중치를 부여하여 주요 문장을 선택하도록 하는 스피치 요약 알고리즘에 이용된다.
표본 비디오의 전체를 대상으로 한 제안한 방법과 잠재의미분석 방법의 효율성을 비교하기 전에 4개 비디오의 요약문 본문을 비교해 보기로 한다. <표 6>에서 확인할 수 있는 것처럼 선정된 문장의 수는 같지만, 잠재의미분석 방법은 제안한 방법에 비해서 상대적으로 긴 문장들을 선정하였다. 밑줄 친 문장은 표준 요약과 일치하는 문장을 나타낸다.
즉, 이용자들이 하나의 페이지를 북마크할 때 사용하는 태그(들)를 각 질의어로 하여 탐색 엔진으로 페이지를 검색한 다음 검색된 페이지의 요약(들)의 각 세그먼트의 가중치를 측정한 후 등급화하여 비디오 요약을 구성하였다. 이들은 제안한 방안을 표층적 자연언어처리기법과 통계적 단어 빈도 방법을 결합한 방식을 채택한 두 개의 텍스트 요약 시스템 즉, 오픈 텍스트 요약기 (Open Text Summarizer)와 MEAD 시스템과 비교하였다. 비교 결과, 제안한 방안이 두 개의 시스템들보다 더 높은 품질의 요약문을 생성하는 것으로 나타났다.
태그의미분석 방식의 효율성을 평가하기 위해서 각 비디오의 표준 요약을 두 명의 연구자들이 공동으로 작성하였다. 작성 방법은 연구자들이 비디오를 시청한 다음 유튜브 사이트에 있는 텍스트 요약 및 메타데이터 내용을 세밀히 분석한 후 비디오 자막을 마침표를 기준으로 문장 단위로 구분한 후 비디오의 내용을 가장 잘 나타내는 문장들을 선정하였다. 선정된 문장 중에 두 명의 연구자가 똑같이 선정한 문장은 그대로 사용하고 서로 다른 문장을 선정한 경우는 서로 상의하여 최종적으로 적합한 문장을 선택하여 표준 요약을 구성하였다.
제4단계-문장 점수 계산: 각 문장의 점수는 세 가지 절차를 통해서 측정하였다. 비디오 11의 스크립트에 속한 각 문장의 점수는 태그 점수와 태그 간의 의미적 점수를 요약 모형(W_tot(S_i))에 적용하여 계산한다.
태그의미분석 방법은 복잡한 계산 과정 없이 태그 간의 의미적 관계 정보를 이용할 수 있는 알고리즘을 활용한다. 제안한 방법은 태그간의 의미적 관계 즉, 동등관계와 연관관계를 파악하기 위해서 워드넷(WordNet) 2.1의 동의어(텍소노미)와 플리커의 관련어 태그(폭소노미) 정보를 이용한다. 이 두 가지 정보원을 이용하는 이유는 플리커의 관련어 태그들은 태그에서 많은 비중을 차지하는 개체명(사람 이름, 장소명, 조직명, 날짜 등)과 같은 고유 명사 또는 신조어를 많이 포함하고 있는데 워드넷과 같은 전통적인 텍소노미는 이러한 고유 명사나 신조어를 많이 포함하고 있지 않기 때문이다.
이렇게 추출된 키샷들은 비디오 스킴 이나 비주얼-텍스트 스토리보드를 구성하기 위해서 이용하였다. 제안한 비디오 요약 방법을 평가하기 위해서 만여 개의 표본 웹 비디오, 각 웹 비디오에 할당된 태그들, 그리고 60개의 표본 이벤트 질의를 이용하여 비디오 요약을 구성하였다. 이들은 구성된 비디오 요약의 질을 평가하기 위해서 11명의 이용자들에게 본 연구에서 제안한 방식에 의한 비디오 요약과 Hong et al.
스피치 요약 알고리즘을 구성하기 위해서 요약 모형을 설계한다. 제안한 요약 모형은 태그 집합과 가장 관련 있는 문장이면서 의미적으로 서로 관련 있는 태그들을 많이 포함한 문장에 더 높은 가중치를 부여하여 주요 문장을 선택하도록 하는 스피치 요약 알고리즘에 이용된다.
즉, 이용자들이 하나의 페이지를 북마크할 때 사용하는 태그(들)를 각 질의어로 하여 탐색 엔진으로 페이지를 검색한 다음 검색된 페이지의 요약(들)의 각 세그먼트의 가중치를 측정한 후 등급화하여 비디오 요약을 구성하였다.
(2013)은 전문가들이 문헌을 요약할 경우 빈도수가 높은 단어를 기준으로 하기보다는 기여도가 높고 의미적으로 연관성이 높은 단어들 위주로 요약을 수행하고 있다고 보고 다음과 같은 알고리즘을 이용하여 문헌을 요약하였다. 첫째, 복수개의 텍스트 문헌의 내용을 요약하기 위해서 문헌의 본문에 출현한 단어와 각 단어의 빈도수를 추출하였다. 그런 다음, 플리커에서 제공된 태그 클러스터들을 이용하여 문헌 내에 존재하는 단어의 빈도수를 갱신하여 문헌 내의 중요 단어들을 등급화하였다.
첫째, 태그의 관련어를 수집하기 위해서, 플리커의 태그 클러스터를 이용하였다(http://w ww.flickr.com/services/api/explore/flickr.ta gs.getClusters). 태그 클러스터는 태그의 동시 출현(co-occurrence) 빈도에 기초하여 생성되며(Specia & Motta 2007), 태그의 동음이의어를 구분하는데 유용하게 사용된다.
표본 비디오로 영어 비디오를 선정한 이유는 소셜 태그를 풍부하게 포함하고 있기 때문이며, 또한 본 연구에서 제안한 스피치 요약 알고리즘은 언어에 관계없이 모두 적용될 수 있기 때문이다. 표본 비디오의 선정 기준은 음성으로 많은 정보를 표현하는 강의, 교육 및 연설 비디오로 4개 이상의 태그를 갖고 있으면서 재생시간이 4분~25분 사이에 있는 것들을 선택하였다. 60개의 표본 비디오를 분석한 결과, 오리지널 태그 평균수가 14.
표본 비디오의 전체를 대상으로 한 제안한 방법과 잠재의미분석 방법의 효율성을 비교하기 전에 4개 비디오의 요약문 본문을 비교해 보기로 한다. <표 6>에서 확인할 수 있는 것처럼 선정된 문장의 수는 같지만, 잠재의미분석 방법은 제안한 방법에 비해서 상대적으로 긴 문장들을 선정하였다.
태그 점수(Sim(S_i, T_ex))는 문장(S _i)과 확장된 태그 집합(T_ex) 간의 유사도를 나타내며, 코싸인 유사계수를 사용하여 각 문장의 단어(들)와 태그 간의 매칭에 의해서 측정한다. 한편, 태그 간의 의미적 관계 점수(W_sr(S_i)) 는 플리커의 태그 클러스터와 워드넷 동의어들을 이용하여 문장 내에서 태그 간의 관계를 분석하여 측정한다. 즉, 주어진 문장에서 의미적으로 관련된 태그들이 많을수록 높은 태그 간의 의미적 점수를 할당하는 방법이다.

대상 데이터

(2) 오리지널 태그의 관련어 및 동의어 수집: 각 오리지널 태그의 관련어 및 동의어로 구성된 용어 클러스터를 수집하기 위해서 두 가지 용어 데이터베이스를 이용하였다.
(3) 새로운 태그 추가: 세 개의 관련어 및 동의어 태그 클러스터(TC2 , TC4 , TC8 )에서 수집한 10개 용어들 중에서 두 개의 단어(university & college)가 새로운 태그로 선정되었다.
비디오 20(“Clay Shirky: How cellphones, Twitter, Facebook can make history”)의 자막에서 출현 빈도가 3 이상인 단어들 중 불용어와 기능어를 제외한 15개의 키워드를 최종 추출하였다.
이러한 연구 문제들을 조사하기 위한 표본 비디오 자료는 음성으로 많은 정보를 표현하는 강의, 교육 및 연설 비디오로 정하고 TEDTalks 사이트와 유투브 사이트에서 총 60개의 영어로 된 비디오들을 선정하였다. 스피치 요약의 효율성을 평가하기 위해서 요약 기법의 성능을 평가하는 내재적 평가를 하였다(정영미 2005).
제1단계-표본 비디오 수집: 비디오 태그 및 스피치 내용 분석을 위해서 60개의 영어로 된 표본 비디오를 선정하였다. 표본 비디오로 영어 비디오를 선정한 이유는 소셜 태그를 풍부하게 포함하고 있기 때문이며, 또한 본 연구에서 제안한 스피치 요약 알고리즘은 언어에 관계없이 모두 적용될 수 있기 때문이다.
수집한 결과, 비디오 자막에 출현하는 새로운 태그로 ‘campus’와 ‘school’이 확인되었으나 이들을 두 번째 태그 클러스터 수집 단계에서는 초기 태그 리스트에 추가하지 않았다. 최종적으로 10개의 태그로 구성된 최종 태그 리스트를 얻었다. 그리고 단일어 태그에는 가중치 ‘1’을 복합어 태그에는 가중치 ‘2’를 부여한다.
비디오 20(“Clay Shirky: How cellphones, Twitter, Facebook can make history”)의 자막에서 출현 빈도가 3 이상인 단어들 중 불용어와 기능어를 제외한 15개의 키워드를 최종 추출하였다. 키워드 추출을 위해서는 Wordcounter 사이트(http://www.wordcounter.com/)를 이용하였다. <표 4>는 단어-문장 행렬로 15개의 단어가 34개의 문장에 분포된 것을 기술한 것이다.
태그의미분석 방식의 효율성을 평가하기 위해서 각 비디오의 표준 요약을 두 명의 연구자들이 공동으로 작성하였다. 작성 방법은 연구자들이 비디오를 시청한 다음 유튜브 사이트에 있는 텍스트 요약 및 메타데이터 내용을 세밀히 분석한 후 비디오 자막을 마침표를 기준으로 문장 단위로 구분한 후 비디오의 내용을 가장 잘 나타내는 문장들을 선정하였다.

데이터처리

60개의 전체 표본 비디오를 사용하여 제안한 방식과 잠재의미분석 방식을 표준 요약문을 기준으로 하여 정확률과 재현율을 대체하는 하나의 척도인 F 측정((2 × 재현율 × 정확률) / (재현율 + 정확률))을 이용하여 비교해 보았다.
내재적 평가를 위해서 연구팀은 스피치 대본에서 비디오의 의미를 가장 잘 나타내는 문장들을 추출하여 표준 요약을 구성하였고(자세한 설명은 “4.2 태그의미분석 방법과 잠재의미분석 방법 간의 비교 분석” 참조), 통계 분석을 위해서 SPSS 통계 패키지를 사용하였다.

이론/모형

(2) 태그 간의 의미적 점수 계산: 태그 간의 의미적 관계 점수를 측정하기 위해서, Heu et al.(2013)가 사용한 알고리즘을 활용하였다. 문장 1에서의 태그 간의 의미적 관계 점수를 측정하기 위해서 먼저, <표 1>을 활용하여 구성한 태그 관계 테이블(TRT)에 기초하여 태그 간의 관계를 확인한다(<표 2> 참조).
제4단계-문장 점수 계산: 각 문장의 점수는 세 가지 절차를 통해서 측정하였다. 비디오 11의 스크립트에 속한 각 문장의 점수는 태그 점수와 태그 간의 의미적 점수를 요약 모형(W_tot(S_i))에 적용하여 계산한다. 태그 점수(Sim(S_i, T_ex))는 문장(S _i)과 확장된 태그 집합(T_ex) 간의 유사도를 나타내며, 코싸인 유사계수를 사용하여 각 문장의 단어(들)와 태그 간의 매칭에 의해서 측정한다.
개념 1은 제1주제를 나타내고 개념 2는 제2 주제를 나타낸다. <표 5>에서 개념을 잘 나타낸 문장(들)을 추출하는 방법으로 교차 방법(cross method)을 이용하였다. 교차 방법은 각 개념의 평균값을 계산한 후 평균값 이하인 값을 영(0)으로 변환한 후 두 개념의 합을 계산한 후 합계가 높은 값 순으로 문장을 선정하는 방안이다.
잠재의미분석 방법에 의한 스피치 요약을 하기 위해서 MATLAB 7.1 패키지를 이용하였다. 비디오 20(“Clay Shirky: How cellphones, Twitter, Facebook can make history”)의 자막에서 출현 빈도가 3 이상인 단어들 중 불용어와 기능어를 제외한 15개의 키워드를 최종 추출하였다.

성능/효과

60개 비디오에 포함된 총 336개 태그를 플리커 태그 클러스터에 매칭했을 때 매칭 기준(태그 클러스터에 속한 태그가 초기 태그 리스트에 있다면 해당 태그 클러스터를 선정함)에 적합한 태그는 118개로 35.0%의 매칭율을 나타냈다. 이에 반해서 336개 태그를 워드넷 동의어 클러스터에 매칭했을 때 매칭 기준에 적합한 태그는 30개로 8.
본 연구에서 제안한 알고리즘은 실제 자막에 출현한 태그가 최소한 2개 이상이 되어야만 태그를 확장하고 태그 간의 의미적 관계를 분석할 수 있다. 60개 표본 비디오를 분석해 본 결과, 6개의 비디오들 (10.0%)은 단지 하나의 태그만이 해당 비디오 자막에 출현하였고 한 비디오(1.7%)는 태그가 전혀 출현하지 않아서 요약을 할 수 없었다. 따라서 태그의미분석 방법은 태그를 표제의 키워드와 함께 활용하여 이런 문제점이 보완된다면 소셜 메타데이터가 생성되는 환경에서 스피치 요약에 유용하게 이용될 수 있을 것이다.
표본 비디오의 선정 기준은 음성으로 많은 정보를 표현하는 강의, 교육 및 연설 비디오로 4개 이상의 태그를 갖고 있으면서 재생시간이 4분~25분 사이에 있는 것들을 선택하였다. 60개의 표본 비디오를 분석한 결과, 오리지널 태그 평균수가 14.4개로 나타났다. 구체적으로, 단일어 태그의 평균 수는 12.
6개가 되었다. 6개의 비디오들(10.0%)은 단지 하나의 태그만이 해당 비디오 자막에 출현하였고 한 비디오(1.7%)는 태그가 전혀 출현하지 않았다.
결론적으로 플리커의 태그 클러스터는 태그를 확장하고 비디오 태그 간의 의미적 관계를 분석하는데 효율적으로 이용되었지만, 워드넷의 동의어 정보는 효율적으로 이용되지 못한 것으로 나타났다. 이와 같은 분석 결과로 볼 때 규모가 큰 비디오 표본 데이터를 통해서 검증해 볼 필요는 있지만 TEDTalks, 유튜브 등과 같은 대중을 대상으로 한 강의 자료를 분석할 경우 태그 간의 의미적 관계 정보를 얻기 위해서 플리커 태그 클러스터만을 사용해도 큰 무리는 없는 것으로 보인다.
끝으로, 요약문 내용 비교의 결과에서 확인할 수 있는 것처럼 태그의미분석 방식은 잠재의미 분석 방식과는 다른 특성을 갖는 요약문을 추출하는 것으로 생각된다. 특히 잠재의미분석 방법은 몇몇 중요한 개념을 집중적으로 다루는 문장을 선택하는 경향이 있는 반면, 태그의미분석 방식은 상대적으로 더 많은 개념 또는 개체명을 표현하는 문장이 선택되는 경향을 보인다.
밑줄 친 문장은 표준 요약과 일치하는 문장을 나타낸다. 두 개의 방식에 의해서 선정된 동일한 문장의 비율은 60개의 요약문을 비교해 결과, 12.0%로 그다지 높지 않게 나타났다.
둘째, 제안한 방법의 F값(0.27)이 잠재의미 분석 방법의 F값(0.22)보다 높게 나타났으나 통계적으로 유의미한 차이는 없었다. 이와 같이 평균 5.
첫째, 제안한 방식은 플리커의 태그 클러스터 데이터베이스를 이용하여 간단한 알고리즘으로 구현할 수 있는 반면 잠재의미분석 방식은 대규모의 단어-문헌 행렬과 같은 입력 데이터가 필요하고 복잡한 특이 값 분해 계산이 요구된다. 둘째, 태그 간의 의미적 관계 정보는 스피치를 요약하는 것 외에 스피치 비디오의 검색 시 질의 확장 또는 비디오 검색 결과를 브라우징하는 정보검색 환경에서 유용하게 사용될 수 있다는 점이다.
이러한 결과는 비디오 태그가 색인어로서 충분한 가치가 있다는 주장한 Heckner, Neubauer, & Wolff(2008)과 김현희(2011)의 연구를 확인시켜 준다. 둘째, 태그는 본문 키워드보다 개체명(named entities)을 더 많이 포함하고 있는 점이다. Christensen et al.
60개의 표본 비디오에 할당된 총 336개 태그와 720개의 본문 키워드(각 표본 비디오 자막에서 출현빈도가 3번 이상이면서 불용어 및 기능어를 제외한 단어)가 개체명(인명, 지명, 기관명 및 연도)을 얼마나 포함하고 있는지 분석해 보았다. 분석 결과, 태그의 경우는 16.4%가 본문 키워드의 경우는 4.9%가 개체명에 속해 있었다. 즉, 태그가 본문 키워드보다 대략 세 배 정도 더 많이 개체명을 포함하고 있었다.
(2011)이 제안한 이벤트 기반 웹비디오 요약 방식에 의한 비디오 요약을 서로 비교하게 하였다. 비교 결과, 제안한 방식이 더 우수한 것으로 확인되었다.
이들은 제안한 방안을 표층적 자연언어처리기법과 통계적 단어 빈도 방법을 결합한 방식을 채택한 두 개의 텍스트 요약 시스템 즉, 오픈 텍스트 요약기 (Open Text Summarizer)와 MEAD 시스템과 비교하였다. 비교 결과, 제안한 방안이 두 개의 시스템들보다 더 높은 품질의 요약문을 생성하는 것으로 나타났다.
비교한 결과, 제안한 방식의 평균 F값(0.27)이 잠재의미분석방식의 평균 F값(0.22)보다 높게 나타났으나 t-검증 결과 통계적으로 유의미한 차이는 없었다(p(=0.21) > 0.05)( 참조).
그런 다음, 플리커에서 제공된 태그 클러스터들을 이용하여 문헌 내에 존재하는 단어의 빈도수를 갱신하여 문헌 내의 중요 단어들을 등급화하였다. 이를 기반으로 문헌 내에 존재하는 단어들의 문헌 내 기여도와 단어들 간의 의미적인 연관성을 분석하여 문헌 내의 핵심이 되는 단어들 위주로 문헌을 요약하는 방안을 제안하고, 제안한 방법의 효율성을 입증하였다.
0%의 매칭율을 나타냈다. 이에 반해서 336개 태그를 워드넷 동의어 클러스터에 매칭했을 때 매칭 기준에 적합한 태그는 30개로 8.9%의 상대적으로 낮은 매칭율을 나타났다. 30개 중 14개 태그(4.
첫째, 비디오 태그를 확장하고 태그 간의 의미적 관계를 분석하는데 플리커의 태그 클러스터는 효과적으로 이용되었지만, 워드넷의 동의어 정보는 효과적으로 이용되지 못한 것으로 나타났다. 이와 같은 분석 결과로 볼 때 규모가 큰 표본 데이터를 통해서 다시 검증해 볼 필요는 있지만, 일반 대중을 대상으로 한 스피치 자료를 분석할 경우 태그 간의 의미적 관계 정보를 얻기 위해서 플리커 태그 클러스터만을 사용해도 큰 무리는 없는 것으로 보인다.
4개) 가 상대적으로 적음에도 불구하고 잠재의미분석 방식의 요약문 품질과 동일한 또는 조금 우수한 것으로 나타난 것은 다음과 같은 이유 때문으로 생각된다. 첫째, 이용자가 비디오의 주제를 인지한 후 할당한 태그를 사용한 태그 방식이 본문 텍스트 전체를 처리하여 중요한 개념을 추출한 잠재의미분석 방식보다 비디오의 주제를 좀 더 효율적으로 표현한다고 추측할 수 있다. 이러한 결과는 비디오 태그가 색인어로서 충분한 가치가 있다는 주장한 Heckner, Neubauer, & Wolff(2008)과 김현희(2011)의 연구를 확인시켜 준다.
8개이다. 태그가 해당 비디오 자막에 출현한 경우만을 계산했을 때 평균수가 14.4개에서 5.1개로 줄어들었고, 확장된 태그를 포함했을 때 최종적으로 평균 태그 수가 5.6개가 되었다. 6개의 비디오들(10.

후속연구

끝으로 제안한 태그의미분석 방법에서 자막 분석을 위해서 태그와 함께 표제의 키워드를 함께 사용한다면 좀 더 높은 품질의 요약물을 생성할 수 있을 것으로 생각된다. 본 연구에서 제안한 알고리즘은 실제 자막에 출현한 태그가 최소한 2개 이상이 되어야만 태그를 확장하고 태그 간의 의미적 관계를 분석할 수 있다.
7%)는 태그가 전혀 출현하지 않아서 요약을 할 수 없었다. 따라서 태그의미분석 방법은 태그를 표제의 키워드와 함께 활용하여 이런 문제점이 보완된다면 소셜 메타데이터가 생성되는 환경에서 스피치 요약에 유용하게 이용될 수 있을 것이다. 또한, 태그 간의 의미적 관계 정보는 스피치 비디오를 검색할 때 질의 확장이나 비디오 검색 결과를 브라우징하는 정보검색 환경에서 유용하게 사용될 수 있을 것이다.
따라서 대규모 표본 비디오들을 대상으로 한 실험과 분석을 통해서 이러한 경향에 대한 좀 더 심층적인 검증이 필요해 보인다.
따라서 태그의미분석 방법은 태그를 표제의 키워드와 함께 활용하여 이런 문제점이 보완된다면 소셜 메타데이터가 생성되는 환경에서 스피치 요약에 유용하게 이용될 수 있을 것이다. 또한, 태그 간의 의미적 관계 정보는 스피치 비디오를 검색할 때 질의 확장이나 비디오 검색 결과를 브라우징하는 정보검색 환경에서 유용하게 사용될 수 있을 것이다.
김현희(2009)는 텍스트 요약에 적용된 이론과 방법이 오디오 요약에도 적용될 수 있을 것이라는 가정하에 오디오 요약을 위해서 태그와 표제의 키워드를 함께 사용하는 태그 확장 방법을 제안하여 태그의 희박성 문제를 해결하고자 하였다. 이 연구는 좀 더 효율적인 오디오 요약을 구현하기 위해서는 오디오 정보의 특성에 맞춘 요약 기법에 대한 연구가 요망된다고 기술하고 있다. 또한 김현희(2012)는 스피치 요약의 알고리즘을 구성하기 위해서 이용자 태그 기법, 문장 위치 및 문장 중복도 제거 기법의 효율성을 분석해 보았다.
태그의미분석 방식이 잠재의미분석 방식과 비교하여 동일한 또는 더 효율적으로 나타난 것은 여러 가지 면에서 의미가 있다. 첫째, 제안한 방식은 플리커의 태그 클러스터 데이터베이스를 이용하여 간단한 알고리즘으로 구현할 수 있는 반면 잠재의미분석 방식은 대규모의 단어-문헌 행렬과 같은 입력 데이터가 필요하고 복잡한 특이 값 분해 계산이 요구된다. 둘째, 태그 간의 의미적 관계 정보는 스피치를 요약하는 것 외에 스피치 비디오의 검색 시 질의 확장 또는 비디오 검색 결과를 브라우징하는 정보검색 환경에서 유용하게 사용될 수 있다는 점이다.

핵심어	질문	논문에서 추출한 답변
	정보 검색 환경에 맞춰 뉴스기사를 400자 이내로 요약해주는 야후의 기술은?	생산되는 콘텐츠는 기하급수적으로 증가하고 있는데 반해서, 콘텐츠를 표현하는 가상 공간은 좁아지고 있다. 이러한 정보 검색 환경에 맞추어 최근 야후는 뉴스 기사를 400자 내외로 요약해주는 ‘섬리(Summly)’ 기술을 도입한 새로운 모바일 앱을 출시했다(http://www.bb c.
	최근 태그가 사용되고 있는 이유는?	최근 비디오나 텍스트 문헌의 요약을 위해서 태그가 사용되고 있다. Heckner, Neubauer, & Wolff(2008)는 비디오 태그가 색인어로서 충분한 가치가 있다는 주장하였고, 김현희(2009; 2012)와 Zhu et al.
	태그의 확보가 보장되지 않는 경우의 문제를 해결하기 위해 Zhu et al.(2009)이 제안한 방법은?	Zhu et al.(2009)은 이러한 태그 희 박성 문제를 해결하기 위해서 연관 마이닝 기술을 이용하여 태그를 확장하고 태그에서의 잡음을 줄이는 태그 랭킹 알고리즘을 이용한 태그 기반 웹 문서 요약 방법을 제안하였다. 김현희 (2009)는 태그의 희박성 문제를 해결하기 위해서 표제의 키워드를 태그와 함께 사용하는 방안을 제안하였다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

스피치 요약을 위한 태그의미분석과 잠재의미분석간의 비교 연구
Comparing the Use of Semantic Relations between Tags Versus Latent Semantic Analysis for Speech Summarization 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

스피치 요약을 위한 태그의미분석과 잠재의미분석간의 비교 연구 Comparing the Use of Semantic Relations between Tags Versus Latent Semantic Analysis for Speech Summarization 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

김현희 (53)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

스피치 요약을 위한 태그의미분석과 잠재의미분석간의 비교 연구
Comparing the Use of Semantic Relations between Tags Versus Latent Semantic Analysis for Speech Summarization 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper