정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.
정보 통신기술이 발전함에 따라 멀티미디어 데이터를 포함하는 디지털 기록물의 양은 기하급수적으로 증가하고 있다. 특히 뉴스 비디오는 시대상을 반영하는 풍부한 정보를 내포하고 있으므로, 이를 효과적으로 관리하고 분석하기 위한 뉴스 비디오 데이터베이스 및 뉴스 비디오 마이닝은 광범위하게 연구되어왔다. 그러나 현재까지의 뉴스 비디오 관련 연구들은 뉴스 기사에 대한 브라우징, 검색, 요약에 치중되어 있으며, 뉴스 비디오에 내재되어 있는 풍부한 잠재적 지식을 탐사하는 고수준의 의미 분석 단계에는 이르지 못하고 있다. 본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는, 멀티모달 방법론과 텍스트 마이닝 기반의 뉴스 비디오 마이닝 시스템을 제안한다. 제안된 시스템은 텍스트 마이닝의 군집분석을 통해 뉴스 기사들을 자동 분류하고, 분류 결과에 대해 기간별 군집 추이그래프, 군집성장도 분석 및 네트워크 분석을 수행함으로써, 뉴스 비디오의 기사별 주제와 관련한 다각적 분석을 수행한다. 제안된 시스템의 타당성 검증을 위하여 "2007년 제2차 남북 정상회담" 관련 뉴스 비디오를 대상으로 뉴스 비디오 분석을 수행하였다.
With rapid growth of information and computer communication technologies, the numbers of digital documents including multimedia data have been recently exploded. In particular, news video database and news video mining have became the subject of extensive research, to develop effective and efficient...
With rapid growth of information and computer communication technologies, the numbers of digital documents including multimedia data have been recently exploded. In particular, news video database and news video mining have became the subject of extensive research, to develop effective and efficient tools for manipulation and analysis of news videos, because of their information richness. However, many research focus on browsing, retrieval and summarization of news videos. Up to date, it is a relatively early state to discover and to analyse the plentiful latent semantic knowledge from news videos. In this paper, we propose the news video mining system based on multi-modal approach and text mining, which uses the visual-textual information of news video clips and their scripts. The proposed system systematically constructs a taxonomy of news video stories in automatic manner with hierarchical clustering algorithm which is one of text mining methods. Then, it multilaterally analyzes the topics of news video stories by means of time-cluster trend graph, weighted cluster growth index, and network analysis. To clarify the validity of our approach, we analyzed the news videos on "The Second Summit of South and North Korea in 2007".
With rapid growth of information and computer communication technologies, the numbers of digital documents including multimedia data have been recently exploded. In particular, news video database and news video mining have became the subject of extensive research, to develop effective and efficient tools for manipulation and analysis of news videos, because of their information richness. However, many research focus on browsing, retrieval and summarization of news videos. Up to date, it is a relatively early state to discover and to analyse the plentiful latent semantic knowledge from news videos. In this paper, we propose the news video mining system based on multi-modal approach and text mining, which uses the visual-textual information of news video clips and their scripts. The proposed system systematically constructs a taxonomy of news video stories in automatic manner with hierarchical clustering algorithm which is one of text mining methods. Then, it multilaterally analyzes the topics of news video stories by means of time-cluster trend graph, weighted cluster growth index, and network analysis. To clarify the validity of our approach, we analyzed the news videos on "The Second Summit of South and North Korea in 2007".
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 다단계 구조를 가지고 있는 MASD (multi-phase anchor shot detection)"]을 이용하고자 한다. MASD는 4개의 구성요소로 구성되어 있다.
선행 연구 결과물!丄끼로써, 본 논문에서는 전처리 과정을 개괄적으로 요약하여 서술한다.
심층적인 분석이 요구되는 주제가 선택되면, 코 클러스터링을 통해 해당 주제로 분류된 기사들에 대해 계층적 군집 분석을 수행하고, 군집 분석 결과에 대한 다각적 분석을 수행한다. 계층적 군집 분석 수행 시, 전처리 과정에서 추출된 영상 정보와 텍스트 정보를 모두 이용함으로써 보다 정확한 분석을 수행하고자 한다. 본 논문에서 제안하는 뉴스 비디오 마이닝의 전체 시스템 구조는 그림 1과 같다.
이용하는 멀티모달 방법론을 취하고자 한다. 단, 전술한 기존의 방법론과는 달리 이미 기술적으로 성숙한 텍스트 마이닝 기법을 스크립트에 적용함으로써, 뉴스 비디오 분석의 기술적 한계를 간접적으로 극복하고자 한다. 즉, 뉴스 비디오 마이닝의 전처리과정으로서, 뉴스 기사별 대표 영상(key-frame) 추출과 해당 스크립트의 형태소 분석 작업을 통하여 영상 정보와 텍스트 정보를 모두 이용한 뉴스 기사 간 유사도 행렬을 생성한다.
본 논문에서는 군집간의 상관관계 및 연관성을 확인하기 위하여 패스파인더 네트워크 스케일링(p굲thfinder network scaling)을 이용한 네트워크 분석(network analysis)을 수행한다. 패스파인더 네트워크는 가중치가 있는 모든 링크가 생성된 상태에서 삼각 부등식 (triangle ineqii쥬lity)을 위반하는 경로를 제거함으로써 생성되는 네트워크이다.
본 논문에서는 뉴스 비디오의 고수준 분석을 위하여 뉴스 비디오 클립(news video clip)과 스크립트를 동시에 이용하는 멀티모달 방법론을 취하고자 한다. 단, 전술한 기존의 방법론과는 달리 이미 기술적으로 성숙한 텍스트 마이닝 기법을 스크립트에 적용함으로써, 뉴스 비디오 분석의 기술적 한계를 간접적으로 극복하고자 한다.
과정이다. 본 논문에서는 뉴스 비디오의 영상정보와 텍스트 정보를 대상으로 코클러스터링을 수행함으로써 분할된 뉴스 기사를 주제별로 분류하고자 한다[11]. 뉴스 기사별 스크립트로부터 형태소 분석을 통하여 단어들을 추출하고, 동영상 클립으로부터 대표 영상을 추출한다.
본 절에서는 기간별 군집 성향 분석을 통하여, “2007 년 제2차 남북 정상 회담”에 관한 TV 뉴스 기사의 변화를 알아보고자 한다. 방영된 뉴스의 개괄적인 동향 파악을 위하여, 기간을 남북 정상회담 이전, 남북 정상회담 기간, 남북 정상회담 이후로 나누었으며 군집화 결과의 제 1계층에서의 기간별 군집 성향 분석을 수행하였다.
제안 방법
또한 군집 네트워크 분석을 통하여 군집간의 상관관계 분석을 수행한다. 결국, 뉴스 비디오를 기사 주제별로 분류하고, 뉴스 기사들 간의 연관성 및 해당 뉴스 기사의 전개 상황 추이 분석 등을 수행한다. 제안하는 방법론의 타당성 검증을 위해 “2007년 제2차 남북 정상회담'' 관련 뉴스 기사들을 대상으로 뉴스 비디오 분석을 수행한다.
Wu 등[11] 이 소개한 뉴스 비디오의 영상 정보와 텍스트 정보를 모두 이용한 유사도 함수를 이용하여 유사도 행렬을 정의한다. 계층적 군집 분석의 입력으로 사용될 뉴스 기사 간유 사도 행렬을 생성하기 위하여, 형태소 분석을 통하여 실험 데이터 집합에 포함되어 있는 스크립트로부터 단어를 추출하고, 동영상 클립으로부터 대표 영상을 추출한다. 추출된 단어와 대표 영상을 대상으로 식 (3)과 식 (4)의 tf-idf 함수를 이용하여 단어별 가중치 및 대표 영상의 가중치를 계산한다.
실험데이터 집합에 대한 계층적 군집화 결과는 다음의 그림 2와 같다. 계층적 군집화를 통하여 생성된 덴드로그램 (dendrogram) 분석 시, 각 군집의 이름은 해당 군집에 소속되어 있는 뉴스기사들의 제목을 고려하여 본 논문의 저자들이 결정하였다.
남북 정상회담 관련 뉴스 기사를 보다 세밀한 분석을 위하여, 군집 결과를 저)3계층에서 일자별 군집 추이 분석을 수행하였다. 그림 5에 의하면 남북 정상회담이 한반도 주변 국가 및 정세에 끼칠 영향에 대한 기사(C2) 는 그 방송 분포는 상대적으로 많지 않으나 여러 날에 걸쳐 방송되었음을 보여준다.
남북 정상회담관련 뉴스 기사의 군집 분석 후 각 군집들 간의 상관관계를 알아보기 위하여 패스파인더 네트워크 분석을 수행하였으며 그 결과를 그림 7에 제시하였다. 각 노드의 숫자는 그림 2의 제3계층에서의 군집번호이며, 각 노드를 연결하는 링크의 굵기는 각 노드 간의 관련 정도를 나타낸다.
남북 정상회담에 대한 보다 세밀한 뉴스 기사의 동향을 파악하기 위하여, 군집 결과의 제3계층에서의 기간별 군집 추이 분석을 수행하였다. 그림 4에 의하면 방북 전에는 남북 정상회담이 2007년도 대통령 선거에 미칠 영향에 대한 우려의 목소리를 담은 기사들(C4)이 많이 방영되었으나, 남북 정상회담 시작을 기점으로■.
본 논문에서는 뉴스 비디오의 영상정보와 텍스트 정보를 대상으로 코클러스터링을 수행함으로써 분할된 뉴스 기사를 주제별로 분류하고자 한다[11]. 뉴스 기사별 스크립트로부터 형태소 분석을 통하여 단어들을 추출하고, 동영상 클립으로부터 대표 영상을 추출한다. 뉴스 기사별로 추출된 단어와 대표 영상을 이용하여 이분 그래프(bipartite graph) 모델을 생성한다.
뉴스 기사별 스크립트로부터 형태소 분석을 통하여 단어들을 추출하고, 동영상 클립으로부터 대표 영상을 추출한다. 뉴스 기사별로 추출된 단어와 대표 영상을 이용하여 이분 그래프(bipartite graph) 모델을 생성한다.
즉, 가중 군집 성장 지수는 증가한 뉴스 기사 수에 비례하여 값이 커진다. 따라서 가중군집 성장 지수가 보다 분별력 있는 지표이며, 본 논문에서는 가중 군집 성장 지수를 사용하여 군집의 시기별 분석을 수행한다.
뉴스 기사들은 크게 '회담 일정 및 회담 내용', , 남북경협', '평화체제', '회담결과'로 구분될 수 있었으며, 최하위 계층인 제3계층은 총 19개의 세부 군집으로 구성된 계층적 구조를 파악할 수 있었다. 또한, 계층별 기간-군집 추이 그래프, 가중 군집 성장 지수 분석 및 패스파인더 네트워크 분석을 통하여 기간별 남북 정상 회담 관련 기사의 동향과 각 군집의 성장패턴을 분석하였을 뿐만 아니라 각 군집들 간의 상호 연관관계를 분석하였다. 그 결과 "2007년 제2차 남북 정상회담” 관련 뉴스 기사들의 분류와 시간의 변화에 따른 뉴스 기사 내용의 변화 등과 같은 잠재적 지식을 도출할 수 있었다.
알아보고자 한다. 방영된 뉴스의 개괄적인 동향 파악을 위하여, 기간을 남북 정상회담 이전, 남북 정상회담 기간, 남북 정상회담 이후로 나누었으며 군집화 결과의 제 1계층에서의 기간별 군집 성향 분석을 수행하였다. 그림 3에 의하면, 남북 정상회담이 시작되기 전에는 회담 결과에 대한 기대감이 매우 높았으나(C1), 회담이 진행되면서 실질적으로 해결해야 될 많은 문제점들이 도출됨으로 인해서 점점 기대감이 사라지고 있으며, 남북 간의 당면한 문제인 평화 체제 구축(C2)에 관련된 기사가 남북 정상회담의 시작을 기점으로 늘어나고 있음을 보여준다.
제안하는 방법론의 타당성 검증을 위해 “2007년 제2차 남북 정상회담'' 관련 뉴스 기사들을 대상으로 뉴스 비디오 분석을 수행한다. 본 논문에서 제안하는 방법론은 멀티모달 방법론과 텍스트 마이닝을 늄스 비디오에 적용함으로써, 기존의 뉴스 비디오 분석 기술력의 한계점을 극복할 수 있는 의미 있는 연구라고 할 수 있다.
본 논문에서는 뉴스 비디오의 계층적 군집 분석을 위하여 뉴스 기사별 비디오 클립과 스크립트를 동시에 사용한다. 본 논문에서는 X. Wu 등[11] 이 소개한 뉴스 비디오의 영상 정보와 텍스트 정보를 모두 이용한 유사도 함수를 이용하여 유사도 행렬을 정의한다. 계층적 군집 분석의 입력으로 사용될 뉴스 기사 간유 사도 행렬을 생성하기 위하여, 형태소 분석을 통하여 실험 데이터 집합에 포함되어 있는 스크립트로부터 단어를 추출하고, 동영상 클립으로부터 대표 영상을 추출한다.
본 논문에서는 뉴스 비디오 클립과 스크립트를 동시에 이용하는 멀티모달 방법론 및 스크립트에 대한 텍스트 마이닝을 적용하여 뉴스 비디오의 고수준 의미 분석을 수행하였다. 즉, 텍스트 마이닝 및 지적구조 분석에서 널리 사용되고 있는 계층적 군집화 기법을 뉴스 비디오 분석에 적용하여 뉴스 기사들을 자동 분류하였으며, 군집 분석 결과를 토대로 기간별 군집 추이 그래프, 군집 성장도 분석기법과 패스파인더 네트워크 분석기법을 통하여 뉴스 기사들의 다각적 분석을 수행하였다.
한다. 본 논문에서는 뉴스 비디오의 계층적 군집 분석을 위하여 뉴스 기사별 비디오 클립과 스크립트를 동시에 사용한다. 본 논문에서는 X.
따라서 앵커 샷과 다음 앵커 샷 전까지가 하나의 뉴스 기사를 이룬다. 본 논문에서는 앞서 설명한 뉴스 비디오의 구조적 특징을 이용하여 앵커 샷들을 기준으로 뉴스 기사. 경계를 탐지한다.
본 논문의 뉴스 비디오 마이닝 시스템은 뉴스 비디오 클립과 스크립트를 모두 이용하여 관련 뉴스 기사들에 대한 다각적이고 심층적인 분석을 수행한다. 제안하는 뉴스 비디오 마이닝 시스템은 크게 전처리 과정과 데이터 분석 과정으로 구성된다.
성장 정도를 분석하였다. 본 연구에서는 방북 이전을 제 1.기로, 방북 이후를 저〕2기로 하여 가중 군집 성장 지수를 계산하였다.
본 절에서는 가중 군집 성장 지수를 통하여 각 군집의 성장 정도를 분석하였다. 본 연구에서는 방북 이전을 제 1.
즉, 뉴스 비디오 마이닝의 전처리과정으로서, 뉴스 기사별 대표 영상(key-frame) 추출과 해당 스크립트의 형태소 분석 작업을 통하여 영상 정보와 텍스트 정보를 모두 이용한 뉴스 기사 간 유사도 행렬을 생성한다. 생성된 유사도 행렬을 기반으로 텍스트 마이닝의 계층적 군집 분석을 수행하여 뉴스 기사들을 자동 분류하고, 군집 분석 결과에 대한 기간별 군집 추이그래프와 군집 성장도 분석을 수행하여 뉴스 기사를 다각적으로 분석한다. 또한 군집 네트워크 분석을 통하여 군집간의 상관관계 분석을 수행한다.
제안하는 뉴스 비디오 마이닝 시스템은 크게 전처리 과정과 데이터 분석 과정으로 구성된다. 전처리 과정은 뉴스 비디오를 기사- 단위로 나누는 뉴스 비디오 기사 분할 과정과 분할된 뉴스 기사 각각에 대하여 대표 영상 몇 스크립트를 추출하고 코클러스터링(coyhistering)을 이용하여 뉴스 기사들을 주제별로 분류하는 과정으로 구성된다.
제안하는 뉴스 비디오 마이닝 시스템의 전처리를 위한 두 번째 단계는 분할된 뉴스 기사를 주제별로 분류하는 과정이다. 본 논문에서는 뉴스 비디오의 영상정보와 텍스트 정보를 대상으로 코클러스터링을 수행함으로써 분할된 뉴스 기사를 주제별로 분류하고자 한다[11].
수행하였다. 즉, 텍스트 마이닝 및 지적구조 분석에서 널리 사용되고 있는 계층적 군집화 기법을 뉴스 비디오 분석에 적용하여 뉴스 기사들을 자동 분류하였으며, 군집 분석 결과를 토대로 기간별 군집 추이 그래프, 군집 성장도 분석기법과 패스파인더 네트워크 분석기법을 통하여 뉴스 기사들의 다각적 분석을 수행하였다. 또한 본 논문에서 제안하는 방법론의 타당성을 보이기 위하여 "2007년 제2차 남북 정상회담” 관련 뉴스 기사들을 대상으로 뉴스 비디오 분석을 수행하였다.
대상 데이터
즉, 텍스트 마이닝 및 지적구조 분석에서 널리 사용되고 있는 계층적 군집화 기법을 뉴스 비디오 분석에 적용하여 뉴스 기사들을 자동 분류하였으며, 군집 분석 결과를 토대로 기간별 군집 추이 그래프, 군집 성장도 분석기법과 패스파인더 네트워크 분석기법을 통하여 뉴스 기사들의 다각적 분석을 수행하였다. 또한 본 논문에서 제안하는 방법론의 타당성을 보이기 위하여 "2007년 제2차 남북 정상회담” 관련 뉴스 기사들을 대상으로 뉴스 비디오 분석을 수행하였다.
대해 마이닝 분석을 수행하였다. 분석 대상이 되는 뉴스 비디오는 2007년 8월 6일부터 남북 정상 회담 직후인 2007년 10월 6일까지의 뉴스 중 "남북 정상회담” 관련 기사들이다. 실험에 사용된 데이터 집합은 KBS 85개 MBC 95개 총 180개의 뉴스 기사로 구성이 되어있으며, 해당 뉴스 기사의 비디오 클립과 스크립트를 모두 사용하였다.
결국, 뉴스 비디오를 기사 주제별로 분류하고, 뉴스 기사들 간의 연관성 및 해당 뉴스 기사의 전개 상황 추이 분석 등을 수행한다. 제안하는 방법론의 타당성 검증을 위해 “2007년 제2차 남북 정상회담'' 관련 뉴스 기사들을 대상으로 뉴스 비디오 분석을 수행한다. 본 논문에서 제안하는 방법론은 멀티모달 방법론과 텍스트 마이닝을 늄스 비디오에 적용함으로써, 기존의 뉴스 비디오 분석 기술력의 한계점을 극복할 수 있는 의미 있는 연구라고 할 수 있다.
본 논문에서 제안하는 계층적 군집화를 이용한 뉴스 비디오 마이닝의 타당성을 검증하기 위하여, 2007년 8월부터 2007년 10월 사이의 KBS와 MBC 뉴스 비디오 중, “2007년 저|2차 남북 정상회담”을 주제로 갖는 뉴스 기사들에 대해 마이닝 분석을 수행하였다. 분석 대상이 되는 뉴스 비디오는 2007년 8월 6일부터 남북 정상 회담 직후인 2007년 10월 6일까지의 뉴스 중 "남북 정상회담” 관련 기사들이다.
분석 대상이 되는 뉴스 비디오는 2007년 8월 6일부터 남북 정상 회담 직후인 2007년 10월 6일까지의 뉴스 중 "남북 정상회담” 관련 기사들이다. 실험에 사용된 데이터 집합은 KBS 85개 MBC 95개 총 180개의 뉴스 기사로 구성이 되어있으며, 해당 뉴스 기사의 비디오 클립과 스크립트를 모두 사용하였다. 데이터 집합에 대한 설명을 표 1에 정리하였다.
데이터처리
남북 정상회담 관련 기사의 계층.군집화 결과(그림 2) 를 기준으로 하여 가중 군집 성장 지수 분석을 수행하였으며, 제3계층에서의 가중 군집 성장 지수 그래프는 그림 6에 제시하였다. 분석결과, 남북 정상회담이 진행됨에 따라 '남북 경협 기대감, 에 대한 뉴스 기사가 급격히 감소하고 있음을 보여준다.
생성된 유사도 행렬을 기반으로 텍스트 마이닝의 계층적 군집 분석을 수행하여 뉴스 기사들을 자동 분류하고, 군집 분석 결과에 대한 기간별 군집 추이그래프와 군집 성장도 분석을 수행하여 뉴스 기사를 다각적으로 분석한다. 또한 군집 네트워크 분석을 통하여 군집간의 상관관계 분석을 수행한다. 결국, 뉴스 비디오를 기사 주제별로 분류하고, 뉴스 기사들 간의 연관성 및 해당 뉴스 기사의 전개 상황 추이 분석 등을 수행한다.
이론/모형
계층적 군집화를 통한 “2007년 제2차 남북 정상회담” 에 관한 뉴스 기사들의 분류 및 분석을 위하여 평균 연결법을 이용한 계층적 군집화 방법을 사용하였다. 실험데이터 집합에 대한 계층적 군집화 결과는 다음의 그림 2와 같다.
뉴스 비디오 기사 분할의 마지막 단계인 뉴스 기사 경계 탐지를 위해서 본 논문에서는 비교적 간단한 휴리스틱(heuristic)을 이용하고자 한다[9]. 전형적으로 뉴스 기사는 앵커 샷으로 시작을 하고 인터뷰와 기자의 취재 내용을 포함하는 뉴스 기사의 본 내용이 방영된다.
잘못됥 가능성이 있다. 따라서 본 논문에서는 각 군집에 포함된 모든 구성원들의 값을 사용하는 평균 연결법 U8]을 사용하였다,
계층적 군집화란 처음 각 대상이 독립군집으로 출발하여, 유사도가 가장 큰 대상끼리 군집을 생성하고, 생성된 군집간의 비교를 통하여 상위 개념의 새로운 군집을 생성하는 작업을 반복하여 최종적으로 하나의 군집으로 묶는 방법이다. 본 논문에서 사용한 계층적 군집화 방법은 평균 연결법에 근간을 두고 있다. 평균 연결법이란 군집간의 거리를 계산할 때, 한 군집의 모든 구성원들과 다른 군집의 모든 구성원들 간의 거리의 평균을 기준으로 하는 방법이다[18丄 제일 근접한 U, V 개체를 한 군집으로 묶은 뒤 (4V) 군집과 序군집과의 유사도는 다음과 같이 정의 된다.
그래프(sub-graph)로 분할한다. 본 논문에서는 [11]에서 제안된 코클러스터링 알고리즘을 이용하여 뉴스 기사들을 주제별로 분류하였다.
본 논문에서는 각 군집 소속 뉴스 기사의 방송 시기별 분포를 확인하기 위하여 J. Lee 등[14]이 제안한 시기별 분석을 수행하였다 전체 기간을 1기와 2기로 나누고, 식 (7)의 군집 성장 지수(CGI: cluster growth index) 를 계산한다. 군집 성장 지수는 1기와 비교하여 2기에 뉴스 기사가 증가하여 군집이 성장한 정도를 상대적 비율로 비교하기 위한 지표이다,
본 논문에서는 계층적 군집화를 통한 뉴스 기사들의 분류 및 분석을 위하여 평균 연결법(aversige linkage) 을 이용한 계층적 군집화 방법을 사용한다. 계층적 군집화란 처음 각 대상이 독립군집으로 출발하여, 유사도가 가장 큰 대상끼리 군집을 생성하고, 생성된 군집간의 비교를 통하여 상위 개념의 새로운 군집을 생성하는 작업을 반복하여 최종적으로 하나의 군집으로 묶는 방법이다.
뉴스 비디오 기사 분할은 일반적으로 샷 경계 탐지, 앵커 샷 탐지, 그리고 뉴스 기사 경계 탐지의 세 단계로 구성 된다U-9丄 뉴스 비디오 기사 분할의 첫 단계는 뉴스 비디오의 샷과 샷 사이의 쟝면 변환의 경계를 탐지하여 비디오를 샷들로 분할하는 샷 경계 탐지이다. 본 논문에서는 뉴스 비디오 분할에 적합하도록 최적화된 샷 경계 탐지 알고리즘을 이용하고자 한다[2丄 본 논문에서 사용된 샷 경계 탐지 알고리즘은 SVDtsingular value decomposition)# 기반으로 점증적 클러스터링 알고리즘인 ART(adaptive reso- nance theory)에 커널 대치(kernel substitution) 혹은 커널 트릭(kernel trick)이라 불리는 기법을 적용한 알고리즘으로 다음과 같은 특징을 갖는다[2]. 1) 급격한 장면 변환과 점진적 장면 변환을 하나의 알고리즘으로 탐지하여 한 번의 데이터 탐색으로 샷 분할을 수행한다; 2) 뉴스 비디오 샷 경계 탐지의 재현율을 높임으로써 앵커 샷 탐지 단계의 입력으로 사용되는 데이터의 오류를 최소화한다; 3) 분할된 샷들을 정적 샷과 동적 샷으로 분류함으로써 앵커 샷 탐지 단계의 탐색 공간을 축소한다; 4) SVD를 통해 뉴스 비디오를 구성하는 연속적인 프레임에서 잡음과 아주 작은 변화를 제거하여 분류 성능을 높일 뿐만 아니라 커널 방법을 도입함으로써 서로 가까이 매핑되어 있는 샷들을 보다 효과적으로 탐지한다.
성능/효과
본 논문에서는 뉴스 비디오 분할에 적합하도록 최적화된 샷 경계 탐지 알고리즘을 이용하고자 한다[2丄 본 논문에서 사용된 샷 경계 탐지 알고리즘은 SVDtsingular value decomposition)# 기반으로 점증적 클러스터링 알고리즘인 ART(adaptive reso- nance theory)에 커널 대치(kernel substitution) 혹은 커널 트릭(kernel trick)이라 불리는 기법을 적용한 알고리즘으로 다음과 같은 특징을 갖는다[2]. 1) 급격한 장면 변환과 점진적 장면 변환을 하나의 알고리즘으로 탐지하여 한 번의 데이터 탐색으로 샷 분할을 수행한다; 2) 뉴스 비디오 샷 경계 탐지의 재현율을 높임으로써 앵커 샷 탐지 단계의 입력으로 사용되는 데이터의 오류를 최소화한다; 3) 분할된 샷들을 정적 샷과 동적 샷으로 분류함으로써 앵커 샷 탐지 단계의 탐색 공간을 축소한다; 4) SVD를 통해 뉴스 비디오를 구성하는 연속적인 프레임에서 잡음과 아주 작은 변화를 제거하여 분류 성능을 높일 뿐만 아니라 커널 방법을 도입함으로써 서로 가까이 매핑되어 있는 샷들을 보다 효과적으로 탐지한다.
후속연구
향후 연구과제로서는, 기존의 데이터 마이닝 및 텍스트 마이닝에서 사용되고 있는 다양한 방법론들을 뉴스 비디오를 포함하는 멀티미디어 마이닝으로 확장하는 방법에 대한 연구를 수행할 계획이며, 또한 멀티미디어 자체의 특성을 최대한 고려한 특화된 멀티미디어 마이닝 알고리즘의 개발에 대한 연구를 수행할 계획이다.
참고문헌 (20)
H. Lee, Y. Im, D. Park, S. Lee, "News Video Shot Boundary Detection using Singular Value Decomposition and Incremental Clustering," Journal of KIISE: Software and Applications, vol.36, no.2, pp.169-177, Feb. 2009. (in Korean)
H. Lee, J. Yu, Y. Im, J. Gil, D. Park, "A Unified Scheme of Shot Boundary Detection and Anchor Shot Detection in News Video Story Parsing," Multimed Tools Appl., 2010. DOI 10.1007/s11042-010-0462-x (online published)
Z. Cernekova, I. Pitas, C. Nikou, "Information Theory-Based Shot Cut/Fade Detection and Video Summarization," IEEE Trans. Circuits Syst. Video Technol., vol.16, no.1, pp.82-91, 2006.
X. Luan, Y. Xie, L. Wu, J. Wen, S. Lao, "AnchorClu: An anchorperson shot detection method based on clustering," Proc. of Int. Conf. on Parallel and Distributed Computing, Appl. and Technol., pp.840-844, 2005.
X. Gao, J. Li, B. Yang, "A Graph-Theoretical Clustering based Anchorperson Shot Detection for News Video Indexing," Proc. of Int. Conf. on Computational Intelligence and Multimedia Appl., pp.108-113, 2003.
H. Lee, Y. Im, J. Park, D. Park, "A New Anchor Shot Detection System for News Video Indexing," Journal of KIIS, vol.18, no.1, pp.133-138, Feb. 2008.
C. Ko, W. Xie, "News Video Segmentation and Categorization Techniques for Content-Demand Browsing," Proc. of Cong. on Image and Sig. Proc., vol.2, pp.530-534, 2008.
Y. Fang, X. Zhai, J. Fan, "News Video Story Segmentation," Proc. of Int. Conf. on Multimedia Modeling, pp.397-400, 2006.
H. Lee, A Data Cube System for The Semantic Analysis of News Video, Ph.D. Dissertation, Korea University, Korea, December 2007.
I. Ide, H. Mo, N. Katayama, S. Satoh, "Topic Threading for Structuring a Large-scale News Video Archive," Proc. of Int. Conf. on Image and Video Retrieval, LNCS, vol.3115, pp.123-131, 2004.
X. Wu, C.-W. Ngo, Q. Li, "Threading and Autodocumenting News Videos: a promising solution to rapidly browse news topics," IEEE Sig. Proc. Magazine, vol.23, issue. 2, pp.59-68, 2006.
J. Kim, H. Chang, Y. Kim, K. Kang, M. Kim, J. Kim, H. Kim, "Multimodal Approach for Summarizing and Indexing News Video," ETRI Journal, vol.24, no.1, pp.1-11, Feb. 2002.
J. Shen, D. Tao, X. Li, "Modality Mixture Projections for Semantic Video Event Detection," IEEE Trans. Circuits Syst. Video Technol., vol.18, no.11, Nov. 2008.
J. Lee, J. Moon, H. Kim, "Examining the Intellectual Structure of Records Management & Archival Science in Korea with Text Mining," Journal of Korean Society for Library and Information Science, vol.41, no.1, pp.345-369, 2007. (in Korean)
P. Losiewicz, D. Oard, R. Kostoff, "Textual data mining to support science and technology management," Journal of Intelligent Information Systems, vol.15, no.2, pp.99-119, 2000.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.