이미지를 각각의 카테고리로 분류하는 일은 컴퓨터 비전 분야의 중요한 문제 중 하나이다. 그러나 이미지에 존재하는 가변성, 모호성, 스케일 문제 등으로 인해 매우 도전적인 문제라고 할 수 있다. 본 논문에서는 장면 이미지를 구성하는 시멘틱 속성들의 고차원의 상호작용 관계를 고려 가능한 하이퍼그래프 기반의 모델링 기법을 제시하고 이를 장면 이미지 분류에 적용한다. 각 장면 카테고리에 준최적화된 하이퍼그래프를 생성하기 위해 확률 부분공간 기법에 기반을 둔 탐색기법을 제안하고, 이들 부분 공간 내에 속한 시멘틱 속성들의 발현량을 축약하기 위한 우도비 기반의 선형 변환 기법을 제안한다. 제안한 기법의 우수성을 검증하기 위한 실험을 통하여 제시한 기법을 통해 생성된 특징 벡터의 분별력이 기존의 기법들에서 사용된 특징 벡터들의 분별력보다 우수함을 보인다. 또한 제안한 기법을 장면 분류 데이터에 적용한 결과 기존의 기법들과 비교하여 경쟁력 있는 분류 성능을 보인다. 제안 한 기법은 이미지 분류에서 일반적으로 사용 되는 기법인 BoW+SPM 모델과 비교하여 3~4%이상의 성능 향상을 보였다.
이미지를 각각의 카테고리로 분류하는 일은 컴퓨터 비전 분야의 중요한 문제 중 하나이다. 그러나 이미지에 존재하는 가변성, 모호성, 스케일 문제 등으로 인해 매우 도전적인 문제라고 할 수 있다. 본 논문에서는 장면 이미지를 구성하는 시멘틱 속성들의 고차원의 상호작용 관계를 고려 가능한 하이퍼그래프 기반의 모델링 기법을 제시하고 이를 장면 이미지 분류에 적용한다. 각 장면 카테고리에 준최적화된 하이퍼그래프를 생성하기 위해 확률 부분공간 기법에 기반을 둔 탐색기법을 제안하고, 이들 부분 공간 내에 속한 시멘틱 속성들의 발현량을 축약하기 위한 우도비 기반의 선형 변환 기법을 제안한다. 제안한 기법의 우수성을 검증하기 위한 실험을 통하여 제시한 기법을 통해 생성된 특징 벡터의 분별력이 기존의 기법들에서 사용된 특징 벡터들의 분별력보다 우수함을 보인다. 또한 제안한 기법을 장면 분류 데이터에 적용한 결과 기존의 기법들과 비교하여 경쟁력 있는 분류 성능을 보인다. 제안 한 기법은 이미지 분류에서 일반적으로 사용 되는 기법인 BoW+SPM 모델과 비교하여 3~4%이상의 성능 향상을 보였다.
Image classification is an important problem in computer vision. However, it is a very challenging problem due to the variability, ambiguity and scale change that exists in images. In this paper, we propose a method of a hypergraph based modeling can consider the higher-order relationships of semant...
Image classification is an important problem in computer vision. However, it is a very challenging problem due to the variability, ambiguity and scale change that exists in images. In this paper, we propose a method of a hypergraph based modeling can consider the higher-order relationships of semantic attributes of a scene image and apply it to a scene image classification. In order to generate the hypergraph optimized for specific scene category, we propose a novel search method based on a probabilistic subspace method and also propose a method to aggregate the expression values of the member semantic attributes that belongs to the searched subsets based on a linear transformation method via likelihood based estimation. To verify the superiority of the proposed method, we showed that the discrimination power of the feature vector generated by the proposed method is better than existing methods through experiments. And also, in a scene classification experiment, the proposed method shows a competitive classification performance compared with the conventional methods.
Image classification is an important problem in computer vision. However, it is a very challenging problem due to the variability, ambiguity and scale change that exists in images. In this paper, we propose a method of a hypergraph based modeling can consider the higher-order relationships of semantic attributes of a scene image and apply it to a scene image classification. In order to generate the hypergraph optimized for specific scene category, we propose a novel search method based on a probabilistic subspace method and also propose a method to aggregate the expression values of the member semantic attributes that belongs to the searched subsets based on a linear transformation method via likelihood based estimation. To verify the superiority of the proposed method, we showed that the discrimination power of the feature vector generated by the proposed method is better than existing methods through experiments. And also, in a scene classification experiment, the proposed method shows a competitive classification performance compared with the conventional methods.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
SD 이론에 따르면, 부분집합들의 생성 수가 많아질수록 본래 데이터의 분포를 잘 근사 할 수 있다. 그러나 이를 위해서는 많은 비용이 따르기 때문에, 본 논문에서는 좀 더 효율적으로 해당 모델을 근사 할 수 있는 특징 부분집합들을 탐색하기 위한 기법을 제안한다. 또한 생성된 하이퍼그래프를 분류에 이용하기 위해 우리는 분류 모델(discriminative model)을 사용한다.
본 논문에서는 각 특징들의 중요도에 기반을 두어 효율적으로 부분집합 생성이 가능한 확률적 부분집합 탐색 기법 PSM(probabilistic subset method)을 제안한다. PSM을 이용하여 장면 분류를 위한 시멘틱 속성들의 부분집합을 생성하기 위해서, 먼저 각 속성들의 중요도를 측정 할 필요가 있다.
본 논문에서는 장면 이미지 분류 문제에 있어서 시멘틱 속성들을 개별적으로 고려하는 경우 발생할 수 있는 측정 잡음 및 모호성 문제 등을 해결하기 위해, 각 카테고리에 준최적화된 속성 부분 집합(하이퍼에지) 기반의 하이퍼그래프를 생성하고, 이를 장면분류에 활용하는 기법을 제안하였다. 하이퍼그래프 기반의 표현 방법을 통해 특정 장면 카테고리에서 발생하는 시멘틱 속성들의 고차원의 상호작용 관계를 고려한 분석이 가능해진다.
하이퍼그래프 기반의 표현 방법을 통해 특정 장면 카테고리에서 발생하는 시멘틱 속성들의 고차원의 상호작용 관계를 고려한 분석이 가능해진다. 본 논문에서는 학습을 통해 생성된 하이퍼그래프를 장면 분류에 적용하기 위해 분류 모델과 결합하는 기법을 제안하였다. 이를 통해 SVM 등 기존에 여러 분야에서 활용되어 성능이 입증된 분류기를 활용하는 것이 가능하였다.
이를 위해서는 하이퍼그래프로부터 새로운 특징 벡터의 생성이 필요한데, 따라서 탐색된 각 하이퍼에지들을 구성하는 각 멤버 속성들의 발현 값을 요약하는 기법을 사용할 필요가 있다. 이를 위해 본 논문에서는 각 특징들의 클래스 별 조건부 확률 분포에서의 우도비(likelihood ratio)를 이용하는 요약 기법을 제시한다.
학습 된 하이퍼그래프를 기반으로 장면 분류에 적용하기 위해 분류 모델(discriminative model)을 사용한다. 이를 위해서는 학습 데이터와 테스트 데이터에 대한 각각의 특징 벡터를 생성할 필요가 있는데, 본 논문에서는 우도비 기반의 요약 기법을 사용한 특징 벡터 생성 기법을 제안한다.
가설 설정
T-test을 이용하여 positive와 negative 클래스 두 그룹에 속한 특징들의 모집단의 모평균이 같을 것이라고 가정하는 귀무가설(null hypothesis) H0 : μp = μn를 기각 할 수 있는 확률인 p-value를 계산 할 수 있다.
이는 해당 시멘틱 속성의 발현 값이 어떤 클래스에서 발생했을 가능성이 높은지에 대한 확률을 의미한다. 이를 위해 본 논문에서는 각 클래스에서의 시멘틱 속성의 발현 값이 평균 #, 표준편차 #의 값을 갖는 정규분포를 따른다고 가정한다. 이들 파라미터는 학습 데이터로부터 예측 한 값을 이용한다.
제안 방법
SD 이론은 중심극한정리(central limit theorem)에 기반하여 전체 특징 공간으로부터 생성 가능한 부분집합들 중, enrichment, uniformity, projectability의 특성을 만족하는 부분집합 생성을 통해 분류를 위한 모델을 근사할 수 있음을 이론적으로 증명하고, 실험을 통해 입증하였다. 우리는 이를 구현한 기법 중 하나인 RSM(random subsapce method)[8]을 개선하여 각 카테고리에 적합한 속성들의 부분집합들을 탐색하고, 이를 분류에 적용하고자 한다.
SVM은 공개 라이브러리인 LIBSVM을 이용하여 구현하였다. SVM 분류기 사용 시 필요한 파라미터 C와 Chi-square 커널의 정규화 계수 σ 그리고 분류에 사용할 특징벡터의 크기는 학습 데이터에 대한 5-fold 교차 검증 과정을 통해 얻어진 최적의 파라미터 값을 사용한다.
비교를 위해 단일 시멘틱 속성의 분별력과 랜덤하게 선택된 부분집합으로부터 생성한 특징 벡터의 분별력을 함께 도시하였다. (이들은 각각 Single SA와 Random으로 표기) 그림 3에서 알 수 있듯이 본 논문에서 제안된 확률적 부분 집합 탐색 기법과 우도비 기반의 요약 기법을 통하여 생성 한 특징 벡터들이 대부분의 카테고리에서 우수한 분별력을 보임을 알 수 있다.
앞서 말했듯이 본 논문에서는 각 이미지를 구성하는 시멘틱 속성들을 탐색하고, 이들의 발현 값을 특징 벡터 생성 시 활용한다. 따라서 각 시멘틱 속성들에 대한 탐색기가 필요한데, 이를 위해 [5]에서 Su 등이 제안한 속성 분류기를 사용한다.
우리는 이를 구현한 기법 중 하나인 RSM(random subsapce method)[8]을 개선하여 각 카테고리에 적합한 속성들의 부분집합들을 탐색하고, 이를 분류에 적용하고자 한다.
일반적으로 고차원의 특징 공간으로부터 최적의 부분집합을 탐색하는 작업은 NP-완비 문제에 해당하는 것으로 현실적으로 모든 공간을 탐색하기에는 문제가 따른다. 이를 위해 본 논문에서는 Kleinberg의 SD(stochastic discrimination) 이론에 따라, 특징 공간으로 부터 특징 부분집합을 생성하여 분류에 작업에 적합한 준최적 하이퍼그래프를 생성하고자 한다[7].
그러나 최고의 분류 성능을 내는 특징 벡터의 차원의 수는 알 수 없으므로 적절한 값을 선택 할 필요가 있다. 이를 위해 분류에 사용되는 특징 벡터의 차원의 수는 학습 데이터에 대한 교차 검증 과정을 통하여 최고의 분류 성능을 내는 값으로 설정하였다. 이 과정을 통해 결정된 각 카테고리에 대한 특징벡터의 차원의 수는 평균 4.
제안 한 기법의 성능을 검증하기 위해 먼저 생성된 특징 벡터들의 분별력을 분석하였다. 이는 분별력이 우수한 특징 벡터를 생성 할 수 있어야 높은 분류 성능을 획득할 수 있기 때문이다.
대상 데이터
검증을 위해 기존의 연구들에서와 동일한 방식으로 매 반복 실험에서, 각 카테고리에서 100개의 이미지를 랜덤하게 선택하여 훈련 데이터로 사용하고, 나머지는 검증을 위한 테스트 데이터로 사용한다.
각 이미지들의 평균적인 크기는 250 × 300 픽셀이고, 그레이스케일 이미지이다. 두 번째 Scene-15 데이터셋은 Scene-13 데이터셋에 2가지의 카테고리 Industrial (311)과 Store (315)가 추가된 것으로 [11]의 실험에서 사용되었다.
이 속성 분류기는 전역(35) 및 지역(16) 장면 요소, 재료(14), 모양(7), 색상(8), 특정 물체(30) 등으로 구성된 110개의 개별적인 시멘틱 속성들에 대한 발현 값을 구할 수 있다. 본 논문에서는 이들 중 전역 장면 속성 35개와 색상 속성 8개를 제외한 67개의 속성들만을 사용하였다. 이들은 각 속성의 발현 값을 구하기 위해 한 이미지에 대해 100개의 지역 패치를 생성하고 이들을 시멘틱 속성 분류기를 이용하여 분류한 결과를 종합하여 사용한다.
실험을 위해 장면 분류와 관련된 연구들에서 일반적으로 사용되는 두 종류의 데이터셋(Scene-13, Scene-15)을 사용하였다. 첫 번째로 Scene-13 데이터셋[3]은 13개의 실내와 실외에서의 장면 카테고리로 다음과 같이 구성되어있다.
데이터처리
SVM 분류기 사용 시 필요한 파라미터 C와 Chi-square 커널의 정규화 계수 σ 그리고 분류에 사용할 특징벡터의 크기는 학습 데이터에 대한 5-fold 교차 검증 과정을 통해 얻어진 최적의 파라미터 값을 사용한다.
또한 다수의 카테고리가 포함된 멀티 클래스 분류 문제에 속하므로 One-versus-all 방식을 사용한 분류를 수행한다. 성능평가 결과는 전체 카테고리에 대한 평균 분류율(average classification rate)을 사용하여 계산한다. 최종 평가 결과는 동일한 실험을 50회 반복한 결과를 평균하여 얻은 결과를 사용한다.
이론/모형
SVM 분류기 사용 시 필요한 파라미터 C와 Chi-square 커널의 정규화 계수 σ 그리고 분류에 사용할 특징벡터의 크기는 학습 데이터에 대한 5-fold 교차 검증 과정을 통해 얻어진 최적의 파라미터 값을 사용한다. 또한 다수의 카테고리가 포함된 멀티 클래스 분류 문제에 속하므로 One-versus-all 방식을 사용한 분류를 수행한다. 성능평가 결과는 전체 카테고리에 대한 평균 분류율(average classification rate)을 사용하여 계산한다.
그러나 이를 위해서는 많은 비용이 따르기 때문에, 본 논문에서는 좀 더 효율적으로 해당 모델을 근사 할 수 있는 특징 부분집합들을 탐색하기 위한 기법을 제안한다. 또한 생성된 하이퍼그래프를 분류에 이용하기 위해 우리는 분류 모델(discriminative model)을 사용한다. 그래프를 기반으로 하는 모델들은 그 특성으로 인해 일반적으로 생성 모델(generative model)을 이용하여 분류에 이용된다.
장면 분류를 수행하기 위해 본 논문에서는 다수의 연구결과들을 통해 히스토그램 기반의 이미지 분류에 가장 적합한 것으로 알려진 Chi-square 커널 기반의 SVM을 사용하였다[12]. Chi-square 커널은 아래와 같이 구할 수 있다.
적합도를 구하기 위한 다양한 기법이 존재 할 수 있지만, 본 논문에서는 빠른 연산이 가능하면서도 견고한 적합도 값을 얻기 위해, 다변량 검정에 사용되는 Hotelling's T2-test를 사용한다[10].
학습 된 하이퍼그래프를 기반으로 장면 분류에 적용하기 위해 분류 모델(discriminative model)을 사용한다. 이를 위해서는 학습 데이터와 테스트 데이터에 대한 각각의 특징 벡터를 생성할 필요가 있는데, 본 논문에서는 우도비 기반의 요약 기법을 사용한 특징 벡터 생성 기법을 제안한다.
성능/효과
비교를 위해 단일 시멘틱 속성의 분별력과 랜덤하게 선택된 부분집합으로부터 생성한 특징 벡터의 분별력을 함께 도시하였다. (이들은 각각 Single SA와 Random으로 표기) 그림 3에서 알 수 있듯이 본 논문에서 제안된 확률적 부분 집합 탐색 기법과 우도비 기반의 요약 기법을 통하여 생성 한 특징 벡터들이 대부분의 카테고리에서 우수한 분별력을 보임을 알 수 있다. 이는 곧 분류 성능의 향상과 관련 된다.
RSM(random subspace method)은 SD 이론을 기반으로 하여, 랜덤하게 생성된 특징들의 부분 집합을 이용하여 분류에 적용하는 기법이다. 그리고 실험을 통해 생성 되는 부분집합의 수가 늘어날수록 분류 성능이 점진적으로 증가함을 보였다. 기존의 RSM에서 선택 되는 특징들은 모두 균등 분포에 기반한 선택 확률을 갖는다.
해당 기법은 집단 간의 차이를 종합적으로 검정하는 기법이기 때문에 제1종 오류(Type 1 error)의 팽창문제를 완화하는 장점이 있다. 또한 계산 과정에서 구성 요소들 간의 상관관계와 상호의존성을 고려하므로, 부분집합을 구성하는 시멘틱 속성들의 고차원 상호작용 관계를 통계적으로 평가하는데 적합하다. 생성된 부분집합들에 대한 Hotelling's T2-test score는 다음과 같이 구할 수 있다.
특히 하이퍼그래프를 구성하는 각 속성들의 부분집합인 하이퍼에지들을 구성하는 멤버 속성들의 발현 값을 하나의 값으로 나타내는 우도비 기반의 선형변환 과정을 통해 단일 속성들에 비해 높은 분별력을 갖는 특징 벡터를 생성할 수 있음을 실험을 통해 확인하였다. 또한 두 가지의 데이터집합에 대한 실험을 통해 제안한 기법이 경쟁력 있는 분류 성능을 갖고 있음을 확인하였다. 특히 제안한 기법은 일반적으로 이미지 분류 분야에서 높은 분류 성능을 보이는 것으로 알려진 Bag-of-Words 모델과 공간 피라미드 기법을 결합한 모델보다 약 3~4% 이상의 성능향상을 보였다.
Scene-13 데이터셋 실험에서 pLSA(probabilistic latent semantic analysis)로 표기한 실험은 Bag-of-Words 기반의 저수준 특징벡터를 기반으로 확률 모델링 기반의 토픽 모델인 pLSA를 이용하여 중간 수준의 특징벡터를 생성 한 후 분류에 적용한 결과이다[1]. 이들 pLSA 기반의 중간 수준의 특징벡터를 사용하는 실험 결과는 기존의 Bag-of-Words 모델 기반의 저수준 특징벡터를 그대로 사용한 경우과 유사한 분류 성능을 보임을 알 수 있다(각각 pLSA, BoW로 표기). 이들을 공간 피라미드 기법과 결합한 경우(각각 BoW+SPM, pLSA+SPM로 표기) 약간의 분류 성능의 향상을 보이지만, 제안한 기법은 공간 피라미드 기법과 결합한 결과들과 비교하여 3.
이들 pLSA 기반의 중간 수준의 특징벡터를 사용하는 실험 결과는 기존의 Bag-of-Words 모델 기반의 저수준 특징벡터를 그대로 사용한 경우과 유사한 분류 성능을 보임을 알 수 있다(각각 pLSA, BoW로 표기). 이들을 공간 피라미드 기법과 결합한 경우(각각 BoW+SPM, pLSA+SPM로 표기) 약간의 분류 성능의 향상을 보이지만, 제안한 기법은 공간 피라미드 기법과 결합한 결과들과 비교하여 3.2% 이상 향상 된 우수한 분류 성능을 보였다.
본 논문에서는 학습을 통해 생성된 하이퍼그래프를 장면 분류에 적용하기 위해 분류 모델과 결합하는 기법을 제안하였다. 이를 통해 SVM 등 기존에 여러 분야에서 활용되어 성능이 입증된 분류기를 활용하는 것이 가능하였다.
그림 4는 생성 된 특징 벡터들을 이용한 분류 성능을 비교한 결과이다. 제안 한 기법이 Scene-13 데이터셋과 Scene-15 데이터셋에 적용한 실험에서 기존의 기법들과 비교하여 우수한 분류 성능을 보임을 알 수 있다.
Scene-15 데이터셋 실험에서 Semantic[5]과 Object Bank[4]로 표기된 실험들은 단일 시멘틱 속성들을 이용한 기법들로써 Bag-of-Words 모델만을 사용한 실험에서보다는 우수한 분류 성능을 보였으나, Bag-of-Words 모델을 공간 피라미드 기법과 결합하여 사용한 실험 결과[1] 보다는 낮은 분류 성능을 보임을 알 수 있다(각각 BoW, BoW+SPM로 표기). 제안한 기법은 공간 피라미드 기법과 결합하지 않았음에도 Bag-of-Words 모델에 기반한 다른 두 실험 결과보다 4% 이상 향상된 우수한 분류 성능을 보임을 알 수 있다.
또한 두 가지의 데이터집합에 대한 실험을 통해 제안한 기법이 경쟁력 있는 분류 성능을 갖고 있음을 확인하였다. 특히 제안한 기법은 일반적으로 이미지 분류 분야에서 높은 분류 성능을 보이는 것으로 알려진 Bag-of-Words 모델과 공간 피라미드 기법을 결합한 모델보다 약 3~4% 이상의 성능향상을 보였다.
특히 하이퍼그래프를 구성하는 각 속성들의 부분집합인 하이퍼에지들을 구성하는 멤버 속성들의 발현 값을 하나의 값으로 나타내는 우도비 기반의 선형변환 과정을 통해 단일 속성들에 비해 높은 분별력을 갖는 특징 벡터를 생성할 수 있음을 실험을 통해 확인하였다. 또한 두 가지의 데이터집합에 대한 실험을 통해 제안한 기법이 경쟁력 있는 분류 성능을 갖고 있음을 확인하였다.
후속연구
하지만 본문에서 언급했던 것과 같이 제안한 기법은 개별 시멘틱 속성 분류기의 성능에 영향을 크게 받을 수밖에 없다. 따라서 보다 우수한 분류 성능을 얻기 위해서는 향후 개별 시멘틱 속성 분류기의 분류 성능 및 재현성을 높이기 위한 연구가 뒷받침 되어야 할 필요가 있다.
흥미롭게도 두 데이터셋에 대한 실험에서 모두 공간 피라미드 기법(spatial pyramid method)[10]을 결합할 경우 분류 성능 향상이 나타나는 것을 볼 수 있는데, 이는 이미 지 상의 공간적 문맥 정보(spatial contextual information)를 결합한 결과라고 할 수 있다. 따라서 향후 제안한 시멘틱 속성 결합 기법과 공간 피라미드 기법을 결합 할 경우 더 높은 분류 성능을 얻을 수 있을 것으로 기대할 수 있다.
제안 한 기법은 차원을 효과적으로 감소시키면서도 우수한 분류 성능을 보여주는 모델로서, 향후 속성들의 수가 증가 되었을 때에도 활용 가능성이 매우 크다고 할 수 있다. 하지만 본문에서 언급했던 것과 같이 제안한 기법은 개별 시멘틱 속성 분류기의 성능에 영향을 크게 받을 수밖에 없다.
특정 장면 카테고리를 하이퍼그래프를 이용하여 모델링하기 위해, 해당 장면 카테고리를 구성하는 학습 샘플 이미지들로부터 얻을 수 있는 시멘틱 속성들의 동시 발현 (co-occurrence expression) 양상을 이용하거나, 해당 이미지를 설명하기 위해 추가된 텍스트 기반의 주석(annotation) 정보를 활용할 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
기존의 그래프 기반의 모델링 기법은 어떤 어려움이 있는가?
시멘틱 속성들 사이의 상호작용을 표현해내기 위해 일반 적으로 고려할만한 기법은 그래프 기반의 모델링 기법이라 할 수 있다. 하지만 기존의 그래프 기반의 기법들은 노드와 노드의 단일 상호작용들의 결합으로만 나타낼 수 있다는 한계가 있기 때문에 시멘틱 속성들에서의 고차원의 상호작용 특성을 온전히 표현해내는데 어려움이 있다.
이미지 상에서 나타나는 시멘틱 속성이란 무엇인가?
최근 보다 높은 수준의 문맥 정보(contextual information)를 분류에 활용하기 위해 이미지 내에 존재하는 시멘틱 속성(semantic attribute) 등을 이용하는 연구가 활발히 진행 중에 있다[4,5]. 이미지 상에서 나타나는 시멘틱 속성들은 매우 직관적인 것으로 장면을 구성하는 각 사물들을 의미하거나 혹은 하나의 물체를 구성하는 특정한 부분 (구성 물질 혹은 특성)들을 의미하는 것이기도 하다. 이러한 시멘틱 속성들은 일반적으로 이미지 내에서 고차원의 상호 작용을 하며 나타나는 특성들이 있는데, 특히 이러한 특성은 장면 이미지들에서 더욱 두드러지게 나타난다.
이미지에는 어떤 문제가 존재하는가?
이미지를 각각의 카테고리로 분류하는 일은 컴퓨터 비전 분야의 중요한 문제 중 하나이다. 그러나 이미지에 존재하는 가변성, 모호성, 스케일 문제 등으로 인해 매우 도전적인 문제라고 할 수 있다. 본 논문에서는 장면 이미지를 구성하는 시멘틱 속성들의 고차원의 상호작용 관계를 고려 가능한 하이퍼그래프 기반의 모델링 기법을 제시하고 이를 장면 이미지 분류에 적용한다.
참고문헌 (15)
A. Bosch, A. Zisserman, X. Munoz, "Scene Classification Using a Hybrid Generative /Discriminative Approach," IEEE Trans. PAMI ., 30(4), pp.712-727, 2008.
J. Sivic, A. Zisserman, "Video google: A text retrieval approach to object matching in videos," In: Proc. ICCV, 2003.
L. Fei-Fei, P. Perona, "A bayesian hierarchical model for learning natural scene categories," In: Proc. CVPR, 2005.
L. Li, H. Su, E. Xing, Li Fei-Fei, "Object bank: a high-Level image representation for scene classification and semantic feature sparsification," In: Proc. NIPS, 2010.
Yu Su, F. Jurie, "Improving Image Classification Using Semantic Attributes," International Journal of Computer Vision, 100(1), pp.59-77, 2012.
C. Ding, H. Peng, "Minimum redundancy feature selection from microarray gene expression data," Journal of Bioinformatics and Computational Biology, vol.3(2), pp.185-205, 2005.
S. Lazebnik, C. Schmid, J. Ponce, "Beyond bags of features: Spatial pyramid matching for recognizing natural scene categories," In: Proc. CVPR, 2006.
O. Chapelle, P. Haffner, V. Vapnik, "Support vector machines for histogram-based image classification," IEEE Trans. Neural Networks, 10(5), pp.1055-1064, 1999.
Jonh-Tae Joo, Dae-Wook Kim, Kwee-Bo Sim, "Pattern Classification Algorithm of DNA Chip Image using ANN," Journal of The Korean Institute of Intelligent Systems, No.16, Vol.5, pp.556-561, 2006.
Yoon-Cheol Shin, Young-Hun Park, Hoon Kang, "Image Pattern Classification and Recognition by Using the Associative Memory with Cellular Neural Networks," Journal of The Korean Institute of Intelligent Systems, No.13, Vol.2, pp.154-162, 2003.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.