본 논문에서는 다중 클래스 아다부스트 기반의 분류기를 이용하여 엘리베이터 내 군집 밀도를 추정하는 방법을 제안한다. SOM을 사용하는 기존의 방법은 재현성이 떨어지며 충분한 성능을 내지 못한다. 제안한 방법은 GLDM(Grey-Level Dependency Matrix)과 GGDM(Grey-Gradient Dependency Matrix)의 텍스처 특징과 다중 클래스 아다부스트 기반의 분류기를 통해 실내 군집 밀도를 추정한다. 다중 클래스를 분류하기 위해 기존의 아다부스트 알고리즘에서 웨이트 업데이트 식을 변형하여 더 높은 성능의 약한 분류기를 생성하도록 하였다. 군집 밀도는 인원수에 따라 0명, 1~2명, 3~4명, 5명 이상 등 네 가지 클래스로 구분하였다. 엘리베이터 내 영상을 이용한 모의 실험 결과 제안된 방법은 기존의 방법보다 약 20% 정도의 검출률 향상을 나타내었다.
본 논문에서는 다중 클래스 아다부스트 기반의 분류기를 이용하여 엘리베이터 내 군집 밀도를 추정하는 방법을 제안한다. SOM을 사용하는 기존의 방법은 재현성이 떨어지며 충분한 성능을 내지 못한다. 제안한 방법은 GLDM(Grey-Level Dependency Matrix)과 GGDM(Grey-Gradient Dependency Matrix)의 텍스처 특징과 다중 클래스 아다부스트 기반의 분류기를 통해 실내 군집 밀도를 추정한다. 다중 클래스를 분류하기 위해 기존의 아다부스트 알고리즘에서 웨이트 업데이트 식을 변형하여 더 높은 성능의 약한 분류기를 생성하도록 하였다. 군집 밀도는 인원수에 따라 0명, 1~2명, 3~4명, 5명 이상 등 네 가지 클래스로 구분하였다. 엘리베이터 내 영상을 이용한 모의 실험 결과 제안된 방법은 기존의 방법보다 약 20% 정도의 검출률 향상을 나타내었다.
In this paper, an crowd density in elevator estimation method based on multi-class Adaboost classifier is proposed. The SOM (Self-Organizing Map) based conventional methods have shown insufficient performance in practical scenarios and have weakness for low reproducibility. The proposed method estim...
In this paper, an crowd density in elevator estimation method based on multi-class Adaboost classifier is proposed. The SOM (Self-Organizing Map) based conventional methods have shown insufficient performance in practical scenarios and have weakness for low reproducibility. The proposed method estimates the crowd density using multi-class Adaboost classifier with texture features, namely, GLDM(Grey-Level Dependency Matrix) or GGDM(Grey-Gradient Dependency Matrix). In order to classify into multi-label, weak classifier which have better performance is generated by modifying a weight update equation of general Adaboost algorithm. The crowd density is classified into four categories depending on the number of persons in the crowd, which can be 0 person, 1-2 people, 3-4 people, and 5 or more people. The experimental results under indoor environment show the proposed method improves detection rate by about 20% compared to that of the conventional method.
In this paper, an crowd density in elevator estimation method based on multi-class Adaboost classifier is proposed. The SOM (Self-Organizing Map) based conventional methods have shown insufficient performance in practical scenarios and have weakness for low reproducibility. The proposed method estimates the crowd density using multi-class Adaboost classifier with texture features, namely, GLDM(Grey-Level Dependency Matrix) or GGDM(Grey-Gradient Dependency Matrix). In order to classify into multi-label, weak classifier which have better performance is generated by modifying a weight update equation of general Adaboost algorithm. The crowd density is classified into four categories depending on the number of persons in the crowd, which can be 0 person, 1-2 people, 3-4 people, and 5 or more people. The experimental results under indoor environment show the proposed method improves detection rate by about 20% compared to that of the conventional method.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
또한 사용하는 특징의 차원이 높아질수록 학습 및 검출 시간이 크게 증가하는 단점이 존재한다. 본 논문에서는 학습 방법의 용이성 및 시간을 고려하여 아다부스트 알고리즘을 적용한 접근법을 제안한다. 아다부스트 학습 방법은 훈련 데이터의 순서에 독립적인 학습 결과를 보이며, 구현 및 학습 속도가 기존의 방법 보다 빠른 장점을 지닌다.
본 논문에서 제안한 방법의 효용성을 보이기 위하여 모의 실험을 하였다. 실험 DB는 엘리베이터 내부 환경에서의 CCTV영상으로 구성하였다.
본 논문에서는 다중 클래스 아다부스트를 이용한 실내 군집 밀도 추정 알고리즘을 제안하였다. 제안한 방법의 효용성을 위해 기존의 자가 조직화 신경망 방식의 검출기와 비교 평가하였다.
제안 방법
그러나 추적 방법은 사람의 수가 증가할수록 연산량이 증가하는 문제점을 가지고 있다. 군집 밀도를 추정하는 두 번째 방법은 입력 영상으로부터 특징을 추출하고, 미리 정해놓은 기준이 되는 밀도와 유사도를 비교 한다. 이 방법은 정확한 사람의 수를 세지 않고 거시적인 관점에서 군집의 밀도를 구한다.
훈련 특징으로는 GLDM 과 더불어 GGDM(Grey-Gradient Dependency Matrix)의 텍스처 특징을 사용하였다. 제안된 방법은 GLDM과 GGDM의 텍스처 정보와 다중 클래스 아다부스트 훈련 기법을 통해 정의된 네 가지 클래스의 군집 밀도를 추정한다.
CCTV는 엘리베이터 왼쪽 상단 구석에 설치하였으며 CCTV로부터 수집된 영상의 해상도는 320x240 크기이다. 군집 밀도 분류를 위해 엘리베이터 문이 닫힌 상태일 때 엘리베이터 내부의 사람 수를 기준으로 실험 DB를 나누었다. 클래스 분류는 총 4개의 클래스로 나누었으며 각각 엘리베이터 내부에 사람이 0명 / 1~2명 / 3~4명 / 5명 이상이 있을 경우로 나누었다.
학습 및 분류를 위한 특징은 GLDM과 GGDM에 대해 각각 실험을 진행하였다. 분류기는 제안한 멀티 클래스 아다부스트 기법을 이용한 분류기와 자가 조직화 신경망 방법[14]을 이용한 분류기와 SVM을 이용한 분류기의 성능을 비교 실험하였다.
본 논문의 모의실험에서 GLDM은 d=1, θ∈{0º, 45º, 90º, 135º, 180º, 225º, 270º, 315o}와 θ∈{0º, 45º, 90º, 135º}을 사용하였다.
본 논문의 모의실험에서 GLDM은 GGDM와 같이 d=1, θ∈{0º, 45º, 90º, 135º, 180º, 225º, 270º, 315º}와 θ∈{0º, 45º, 90º, 135º}을 사용하였다.
대상 데이터
GLDM과 GGDM이 추출되는 패치 영상(patch image)은 40x40크기와 20x20크기를 사용하였으며 패치 영상은 패치 영상 한 변의 절반 길이만큼 이동하며 매 위치마다 GLDM과 GGDM을 추출한다. 추출된 GLDM과 GGDM의 특성을 파악하기 위해 식 (4)~(7)과 같은 대비(Contrast), 동질성(Homogeneity), 에너지(Energy), 엔트로피(Entropy) 지표를 사용하였다[2,20].
본 논문에서 제안한 방법의 효용성을 보이기 위하여 모의 실험을 하였다. 실험 DB는 엘리베이터 내부 환경에서의 CCTV영상으로 구성하였다. CCTV는 엘리베이터 왼쪽 상단 구석에 설치하였으며 CCTV로부터 수집된 영상의 해상도는 320x240 크기이다.
실험 DB는 엘리베이터 내부 환경에서의 CCTV영상으로 구성하였다. CCTV는 엘리베이터 왼쪽 상단 구석에 설치하였으며 CCTV로부터 수집된 영상의 해상도는 320x240 크기이다. 군집 밀도 분류를 위해 엘리베이터 문이 닫힌 상태일 때 엘리베이터 내부의 사람 수를 기준으로 실험 DB를 나누었다.
클래스 분류는 총 4개의 클래스로 나누었으며 각각 엘리베이터 내부에 사람이 0명 / 1~2명 / 3~4명 / 5명 이상이 있을 경우로 나누었다. 각 클래스마다 학습 DB로 2000장과 테스트 DB로 500장을 사용하였다. 그림 3은 DB의 클래스 분류에 관한 예제 사진이다.
데이터처리
학습 및 분류를 위한 특징은 GLDM과 GGDM에 대해 각각 실험을 진행하였다. 분류기는 제안한 멀티 클래스 아다부스트 기법을 이용한 분류기와 자가 조직화 신경망 방법[14]을 이용한 분류기와 SVM을 이용한 분류기의 성능을 비교 실험하였다. 성능평가는 학습 시간, 검출 속도, 검출률에 대해 이루어 졌다.
성능평가는 학습 시간, 검출 속도, 검출률에 대해 이루어 졌다. 트레이닝 속도와 검출 속도는 2.67GHz 듀얼코어 CPU, 4GB RAM의 컴퓨터에서 Matlab2010a를 이용하여 측정하였다.
본 논문에서는 다중 클래스 아다부스트를 이용한 실내 군집 밀도 추정 알고리즘을 제안하였다. 제안한 방법의 효용성을 위해 기존의 자가 조직화 신경망 방식의 검출기와 비교 평가하였다. 제안한 방법의 검출률은 기존의 방법보다 약 20% 정도 향상된 결과를 보였다.
이론/모형
GLDM(Grey-Level Dependency), 푸리에 스펙트럼 (Fourier spectrum), 민코프스키 프렉탈 차원(Minkowski fractal dimension) 등을 특징으로 하여 텍스처 정보를 비교하는 방법이 제안되었다[14-16]. 텍스처 특징 정보를 학습 시키는 방법으로는 자가 조직화 신경망 방법(self organizing neural maps)이 적용되었다. 단일 영상에서 텍스처 정보를 뽑는 방법 외에도 연속된 영상에서 중요한 특징 들을 추가적으로 추출하여 신경망 방법으로 밀도에 대한 모델링을 하는 방법도 제안되었다[17].
훈련 특징으로는 GLDM 과 더불어 GGDM(Grey-Gradient Dependency Matrix)의 텍스처 특징을 사용하였다.
추출된 GLDM과 GGDM의 특성을 파악하기 위해 식 (4)~(7)과 같은 대비(Contrast), 동질성(Homogeneity), 에너지(Energy), 엔트로피(Entropy) 지표를 사용하였다[2,20].
성능/효과
또한 자가 조직화 신경망 알고리즘은 특징의 개수가 증가할수록 학습에 소요되는 시간이 크게 증가하는것을 알 수 있다. 프레임 당 검출 속도에서는 다중 클래스 아다부스트 알고리즘은 거의 고르게 실시간 처리가 가능한 2~3ms/frame의 속도를 가졌으나, 자가 조직화 신경망 알고리즘과 SVM 알고리즘은 특징의 개수에 따라 크게 차이를 보였다. 전체 평균 검출률도 제안한 방법이 자가 조직화 신경망 알고리즘보다 약 20%정도 더 높게 나타났으며 SVM 알고리즘보다는 약 10%정도 더 높게 나타났다.
프레임 당 검출 속도에서는 다중 클래스 아다부스트 알고리즘은 거의 고르게 실시간 처리가 가능한 2~3ms/frame의 속도를 가졌으나, 자가 조직화 신경망 알고리즘과 SVM 알고리즘은 특징의 개수에 따라 크게 차이를 보였다. 전체 평균 검출률도 제안한 방법이 자가 조직화 신경망 알고리즘보다 약 20%정도 더 높게 나타났으며 SVM 알고리즘보다는 약 10%정도 더 높게 나타났다.
제안한 방법의 효용성을 위해 기존의 자가 조직화 신경망 방식의 검출기와 비교 평가하였다. 제안한 방법의 검출률은 기존의 방법보다 약 20% 정도 향상된 결과를 보였다. 또한 기존의 방법은 특징의 개수가 증가함에 따라 검출 속도가 급격히 저하되는 모습을 보였지만, 제안한 방법의 검출 속도는 특징의 개수 변화에 강인한 모습을 나타내었다.
제안한 방법의 검출률은 기존의 방법보다 약 20% 정도 향상된 결과를 보였다. 또한 기존의 방법은 특징의 개수가 증가함에 따라 검출 속도가 급격히 저하되는 모습을 보였지만, 제안한 방법의 검출 속도는 특징의 개수 변화에 강인한 모습을 나타내었다. 향후 연구 계획은 본 논문의 훈련 방법을 바탕으로 더 많은 장소의 DB를 이용하여 추가 실험을 할 것이며 군집 밀도 추정에 적합한 새로운 특징 추출 연구를 수행할 예정이다.
후속연구
또한 기존의 방법은 특징의 개수가 증가함에 따라 검출 속도가 급격히 저하되는 모습을 보였지만, 제안한 방법의 검출 속도는 특징의 개수 변화에 강인한 모습을 나타내었다. 향후 연구 계획은 본 논문의 훈련 방법을 바탕으로 더 많은 장소의 DB를 이용하여 추가 실험을 할 것이며 군집 밀도 추정에 적합한 새로운 특징 추출 연구를 수행할 예정이다.
질의응답
핵심어
질문
논문에서 추출한 답변
CCTV로부터 얻어지는 군집 밀도 정보는 어떠한 도움을 줄 수 있는가?
공공장소와 같이 다수의 사람이 있는 장소에서 사고가 발생한다면 사람들이 급격히 모일 가능성이 높으며 모인 군중에 의한 추가적인 사고 발생의 위험도 높아지게 된다. CCTV로부터 얻어지는 군집 밀도 정보는 이러한 잠재적인 위험 요소를 가지고 있는 군집 밀집 상황에 대해 효과적인 대처가 가능하도록 도움을 줄 수 있다. 또한 장소에 대한 군집 밀도의 통계 자료를 구축하여 경우에 따라 위험 사건 발생에 대한 가능성을 예측하여 운용자의 감시의 집중도를 높이거나 보행자의 수를 조절할 수도 있다.
아다부스트 학습 방법은 어떠한 장점을 지니는가?
본 논문에서는 학습 방법의 용이성 및 시간을 고려하여 아다부스트 알고리즘을 적용한 접근법을 제안한다. 아다부스트 학습 방법은 훈련 데이터의 순서에 독립적인 학습 결과를 보이며, 구현 및 학습 속도가 기존의 방법 보다 빠른 장점을지닌다. 훈련 특징으로는 GLDM 과 더불어 GGDM(Grey-Gradient Dependency Matrix)의 텍스처 특징을 사용하였다.
군집 밀도를 자동적으로 추정하는 방법 중, 카메라로부터 얻어지는 영상에서 각각의 사람을 찾고 그 수를 세는 방법은 어떠한 단점이 있는가?
첫 번째는 카메라로부터 얻어지는 영상에서 각각의 사람을 찾고 그 수를 세는 방법이다[5-8]. 그러나 이러한 방법들은 전체 사람을 한명씩 세야하기 때문에 사람의 수가 많은 환경에서는 심각한 겹침(occlusion) 문제로 인해 성능이 저하된다. 이러한 겹침 문제를 해결하기 위해 Haar 웨이블렛 변환(Haar wavelet transform)이나 서포트 벡터 머신(support vector machine)을 이용하여 얼굴 모양 윤곽을 인식하는 방법이 제안되었으며[9], 사람의 몸을 부분 부분으로 나누어 검출기를 학습시키는 방법이 제안되었다 [10-12].
참고문헌 (22)
W. Hu, T. Tan, L. Wang and S. Maybank, "A survey on visual surveillance of object motion and behaviors", IEEE transactions on Systems, Man and Cybernetics - Part C, Vol. 34, No. 3, pp. 334-352, 2004
H. Rahmalan, M. S. Nixon, and J. N. Carter. "On crowd density estimation for surveillance." In International Conference on Crime Detection and Prevention, pp.540C-545C, 2006.
N. Dong, F. Liu and Z. Li, "Crowd Density Estimation Using Sparse Texture Features," Journal of Convergence Information Technology, vol. 5, pp. 125-137, 2010.
J. C. S. J. Junior , S. R. Musse and C. R. Jung "Crowd analysis using computer vision techniques: A survey", IEEE Signal Process. Lett., vol. 27, no. 5, pp.66 - 77 , 2010.
B. Zhan, D. N. Monekosso, P. Remagnino, S. A. Velastin, and L. Xu. "Crowd analysis: A survey.", Journal of Machine Vision and Applications, vol.19, pp.345-357, 2008.
P. Viola, M. Jones, and D. Snow, "Detecting pedestrians using patterns of motion and appearance", International Journal of Computer Vision, Springer US, vol.63, no.2, pp.153-161, 2005.
H. Tao, D. Kong, D. Gray, "Counting Pedestrians in Crowds Using Viewpoint Invariant Training", In Proceedings of the British Machine Vision Conference, pp.1-8, 2005.
T. Zhao and R. Nevatia, "Bayesian human segmentation in crowded situations", In Proceedings of the Conference on Computer Vision and Pattern Recognition, pp.459-466, 2003.
S.F. Lin, J.Y. Chen, and H.X. Chao, "Estimation of number of people in crowded scenes using perspective transformation", IEEE Trans. System, Man, and Cybernetics, IEEE, vol.31, no.6, pp.645-654, 2001.
A. Mohan, C. Papageorgiou, and T. Poggio, "Example-Based Object Detection in images by Components", IEEE Trans on PAMI, IEEE, vol.23, no.4, pp.394-361, 2001.
K. Mikolajczyk, C. Schmid, and A. Zisserman, "Human Detection Based on a Probabilistic Assembly of Robust Part Detector", In Proceedings of the European Conference on Computer Vision, pp.69-82, 2004.
B. Wu and R. Nevatia, "Detection of multiple, partially occluded humans in a single image by bayesian combination of edgelet part detectors", In Proceedings of the International Conference on Computer Vision, pp.90-97, 2005.
V. Rabaud and S.J. Belongie, "Counting crowded moving objects", In Proceedings of the Conference on Computer Vision and Pattern Recognition, pp.705-711, 2006.
A.N. Marana, M.A. Cavenaghi, R.S. Ulson, and F.L. Drumond, "Real-Time Crowd Density Estimation Using Images", Lecture Notes in Computer Science, Springer, no.3804, pp.355-362, 2005.
A.N. Marana, L.F. Costa, R.A. Lotufo, and S.A. Velastin, "On the efficacy of texture analysis for crowd monitoring", In Proceedings of the Computer Graphics, Image Processing, and Vision, pp.354-361, 1998.
A.N. Marana, L. Da F. Costa, R.A. Lotufo, S.A. Velastin, "Estimating crowd density with Minkowski fractal dimension", In Proceedings of the Conference on Acoust., Speech, Signal Processing, pp.3521-3524, 1999.
S.Y. Cho, T.W.S. Chow, and C.T. Leung, "A neural-based crowd estimation by hybrid global learning algorithm", IEEE Trans. Syst, Man, Cybern, IEEE, vol.29, no.3, pp.535-541, 1999.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.