학교폭력 및 성폭력 등의 범죄가 증가되어감에 따라 범인 검거에 있어서 CCTV에 대한 의존도가 높아지고 있다. 그러나 항상 사람 노동력으로 감시하기에는 경제력 및 인력의 한계가 있어 최근에는 지능형 보안 시스템으로 관심이 높아지고 있다. 따라서 기존에 연구한 객체 행동 인식 기법을 확장하여 본 연구에서는 CCTV에 획득되는 영상으로부터 2~3 객체간의 폭력 행위를 감지하는 시스템을 제안한다. 배경영상과의 차연산 및 모폴로지를 통해 객체를 검출하고 인식하여 추적한다. 폭력행위의 특징을 이용하여 폭력행위 판단 근거를 제시하였다. 더욱이, 여러 폭력 상황에 대한 측정을 통해 보다 객관적인 판단 메트릭 임계값을 도출하였다. 이 값을 바탕으로 폭력 행위 인식 실험을 진행한 결과 80% 이상의 인식 성공률을 보였으며, 향후연구로 다수 군중이 있는 상황 등에서의 이상행위 감지 시스템에 대한 연구가 남아있다.
학교폭력 및 성폭력 등의 범죄가 증가되어감에 따라 범인 검거에 있어서 CCTV에 대한 의존도가 높아지고 있다. 그러나 항상 사람 노동력으로 감시하기에는 경제력 및 인력의 한계가 있어 최근에는 지능형 보안 시스템으로 관심이 높아지고 있다. 따라서 기존에 연구한 객체 행동 인식 기법을 확장하여 본 연구에서는 CCTV에 획득되는 영상으로부터 2~3 객체간의 폭력 행위를 감지하는 시스템을 제안한다. 배경영상과의 차연산 및 모폴로지를 통해 객체를 검출하고 인식하여 추적한다. 폭력행위의 특징을 이용하여 폭력행위 판단 근거를 제시하였다. 더욱이, 여러 폭력 상황에 대한 측정을 통해 보다 객관적인 판단 메트릭 임계값을 도출하였다. 이 값을 바탕으로 폭력 행위 인식 실험을 진행한 결과 80% 이상의 인식 성공률을 보였으며, 향후연구로 다수 군중이 있는 상황 등에서의 이상행위 감지 시스템에 대한 연구가 남아있다.
With the increased frequency of crime such as assaults and sexual violence, the reliance on CCTV in arresting criminals has increased as well. However, CCTV, which should be monitored by human labor force at all times, has limits in terms of budget and man-power. Thereby, the interest in intelligent...
With the increased frequency of crime such as assaults and sexual violence, the reliance on CCTV in arresting criminals has increased as well. However, CCTV, which should be monitored by human labor force at all times, has limits in terms of budget and man-power. Thereby, the interest in intelligent security system is growing nowadays. Expanding the techniques of an objects behavior recognition in previous studies, we propose a system to detect forms of violence between 2~3 objects from images obtained in CCTV. It perceives by detecting the object with the difference operation and the morphology of the background image. The determinant criteria to define violent behaviors are suggested. Moreover, provable decision metric values through measurements of the number of violent condition are derived. As a result of the experiments with the threshold values, showed more than 80% recognition success rate. A future research for abnormal behaviors recognition system in a crowded circumstance remains to be developed.
With the increased frequency of crime such as assaults and sexual violence, the reliance on CCTV in arresting criminals has increased as well. However, CCTV, which should be monitored by human labor force at all times, has limits in terms of budget and man-power. Thereby, the interest in intelligent security system is growing nowadays. Expanding the techniques of an objects behavior recognition in previous studies, we propose a system to detect forms of violence between 2~3 objects from images obtained in CCTV. It perceives by detecting the object with the difference operation and the morphology of the background image. The determinant criteria to define violent behaviors are suggested. Moreover, provable decision metric values through measurements of the number of violent condition are derived. As a result of the experiments with the threshold values, showed more than 80% recognition success rate. A future research for abnormal behaviors recognition system in a crowded circumstance remains to be developed.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
폭력 행위 인식 방법은 검출된 객체의 크기변화율이 측정된 판단 메트릭을 기준으로 폭력상황과 폭력이 아닌 상황을 정확히 판별해 내는 것이 관건이다. 그리하여 이러한 폭력행위의 측정을 위해 다양한 상황을 가정하고 폭력상황과 폭력이 아닌 상황들을 분류할 수 있는지에 대해 실험을 진행하였다.
본 연구는 이러한 지능형 통합 관제에 적용 가능한 위험 행위 중 2~3 객체 간의 폭력 행위를 감지할 수 있는 시스템을 연구해 보고자 한다. <표 1>은 주요대상 인원 수 별 발생 가능한 위험행동을 분류한 표이다[2].
이상상황을 미리 감지하여 사고를 예방하려는 시스템들이 경쟁적으로 개발 중에 있다. 본 연구에서는 이상행동 중에서 2인 이상이 연루된 폭력, 즉 성폭력, 싸움 등의 폭력상황을 감지하여 상황에 맞게 대처할 수 있도록 개발하였다. 기존 기술에서는 현실에서의 다양한 상황 특히 다수 객체나 중첩등과 같은 복잡한 상황이 아닌 극소수 객체의 상황을 인식하는 수준에 머무르고 있다.
기존 기술에서는 현실에서의 다양한 상황 특히 다수 객체나 중첩등과 같은 복잡한 상황이 아닌 극소수 객체의 상황을 인식하는 수준에 머무르고 있다. 본 연구에서는 인적이 드문 상황을 전제로 하지만 객체가 다수인 경우나 단순히 중첩이 되는 경우에도 폭력 행위 분별이 가능하여 인식하도록 하였으며 특히 시간 및 변화횟수에 따라 신속성과 정확성을 조절하는 유연성을 포함시켰다.
본 연구에서는 폭력행위 인식의 범위를 인적이 드문 환경에서 발생하는 상황을 감지하기 위한 시스템으로 1인을 제외한 2~3 인 사이에서 발생하는 것으로 제한하였다. 또한 인적이 드문 환경이므로 한 영상에서 검출되는 객체의 수량이 소수(<5)인 경우로 제한하였다.
제안 방법
객체를 검출하기 위해 배경장면과 차연산을 하였으며 검출된 객체를 추적하기 위해 이전 프레임과 차연산을 하였다.
폭력 행위를 판단하는 것은 폭력행위 발생 시에 객체의 형태가 심하게 변화하는 특징을 이용하여 판단한다. 객체의 크기 변화 즉 높이와 너비 값을 인식하여 높이와 너비의 변화율에 따라 변화율이 일정한 임계값 이상이면 그것을 변화 횟수로 세어 일정한 변화횟수 이상이면 이를 폭력으로 판단하여 경보 메시지로 알린다.
영상에서 객체를 인식하기 위해선 이해하고 구현해야 할 분야 즉, 검출, 추적등 관련연구가 많이 있으니 다음 자료를 참고하면 된다[4][7][8]. 다만 이 장에서는 지능형 감시 시스템 현황과 기존 연구인 투신 및 배회 이상행위 감시 방법에 대하여 알아보았다.
본 연구는 실제 CCTV제조사인 EGPIS사의 AHDB1324NIR 카메라로 촬영하였으며, AHVR-1304HS녹화기로 녹화된 영상을 바탕으로 영상크기를 SVGA(800*600)으로 설정하여 실험을 진행 하였다.
소수 객체간의 폭력발생 여부를 감지하기 위해 폭력인식을 위한 판단기준을 먼저 설정하였고 정확성과 신속성을 고려하여 객체 간의 여러 가지 폭력 상황에 대한 측정을 통해 폭력 행위 판단 임계값을 도출하여 검증하는 방법으로 연구를 진행하였다.
실험은 5가지의 폭력 상황 동영상을 바탕으로 진행 되었으며 (그림 4)는 폭력 상황 동영상 모습을 나타내고 있다. 이 실험을 통해 측정 데이터는 <표 2> 와 같은 결과를 얻었다.
이러한 객체의 너비와 높이, 즉 W, W', W''값과 H, H', H'' 값의 변화량을 인식하고 변화 횟수를 어떻게 주어야 하느냐에 따라 폭력상황을 인식하고 있는지에 대한 기준을 마련하기 위해 여러 경우의 폭력영상의 객체들을 측정하여 객관적인 측정값을 도출 하였다.
즉, 영상에서 객체의 크기 변화 즉 높이와 너비 값을 인식하여 미리 셋팅 된 높이와 너비의 변화율과 변화 횟수 값 이상일 때 폭력이 발생했다고 간주하고 이를 알린다. 이러한 객체의 변화율 및 횟수가 폭력으로 간주되기 위한 수치로 객관화되기 위해 여러 가지 상황의 폭력 동영상을 바탕으로 폭력 행위 실험을 통해 폭력행위 판단 메트릭이 측정되었다.
이렇게 구별된 객체의 색상과 너비 높이 정보들을 저장하고, 이전 프레임과 차연산을 통해 얻어진 객체의 정보를 비교하여 객체를 추적하게 된다.
폭력행위 판단을 객관화하기 위해 판단 메트릭 실험을 진행하였고 메트릭 실험을 통해 얻어진 메트릭을 토대로 폭력행위가 판단된다. 객체의 크기 즉, 높이와 너비 값을 인식하여 높이 변화율이 33%, 너비 변화율이 74% 이상이면 폭력 추측객체로 간주한다.
그리하여 객체의 높이와 너비에 일정 비율 이상 변화가 있을 시에 이를 폭력 추측객체로 정의 할 수 있는데, 폭력 추측객체로 변화량이 일정한 횟수 이상으로 측정이 된다면 이것은 폭력 확정객체로 폭력행위라고 판단할 수 있다. 확정객체로 판정하기 위한 일정횟수는 20초라는 시간의 제약을 두어 20초 내에 객체의 변위 횟수를 통해 판단 메트릭을 측정하였다. 20초의 의미는 신속성과 정확성을 모두 고려한 시간이고 더 신속하기 위해선 시간을 더 줄일 여지는 있다.
성능/효과
그 결과 에서 보는 봐와 같이 폭력 상황에서 폭력으로 인식한 사례는 90%의 인식 성공률을 보였으며, 폭력으로 인식하지 못한 경우가 10% 발생하였다.
후속연구
그 결과 객체의 크기에 따라 오차범위를 가지고 있지만 폭력행위에 대한 높은 인식력을 가지고 있다. 그러나 움직임이 크지 않은 경우의 폭력이나 순간적인 사건, 즉 강도나 소매치기같이 기습적으로 발생하는 사건은 미리 감지하기가 쉽지 않은 사건이므로 향후 보다 면밀한 연구가 필요하다. 또한 다수의 군중들 속에서의 폭력사건이나 5명이상의 그룹으로 형성된 객체들 속에서의 폭력 행위 인식은 향후 과제 중 하나이다.
질의응답
핵심어
질문
논문에서 추출한 답변
폭력 행위 인식 프로세스를 어떻게 분류할 수 있나?
폭력 행위 인식 프로세스를 크게 분류하면 객체검출 및 추적과 폭력행위 판단으로 정리할 수 있다.
폭력 행위 인식의 판단기준에 대해 고려해야 할 신속성과 정확성은 무엇인가?
신속성의 의미는 사태발생을 얼마나 빨리 감지해서 모니터 요원에게 경고신호를 보내는 가 이고 정확성은 폭력발생여부의 정확도를 의미한다. 즉 폭력발생으로 감지되어 경고신호를 보냈으나 육안으로 확인하여 폭력이 아닌 것으로 판명이 나는 경우엔 정확도가 떨어진다고 할 수 있다.
폭력의 일반적인 정의는?
폭력의 일반적인 정의는 2인 이상의 사람 관계에서 상대방에게 혐오스러운 자극을 고의적으로 하는 행동을 공격이라고 하는데 그 중에서 신체적인 공격행위 등, 직접적인 물리적 강제력이 폭력이다. 이러한 폭력행위를 영상에서 인식하기 위하여 본 연구에서는 다음과 같이 정의한다.
참고문헌 (14)
Informatization Strategy Office, "Detailed promotion plan for local CCTV Integrated Control Center building support project in 2011," National Information Society Agency, 2010.11
Y.B.Shim, H.J.Park,"A study on the surveillance of multiple object's dangerous behaviors," Journal of Digital Contents Society, vol.14, no.4, pp. 455-462, 2013.12
A. Saha, J.Mulherjee, and S.Sural, "New pixel-decimation patterns for block matching in motion estimation," Signal Processing Image Communication, vol.23, no.10,pp.725-738,2008
J. Shi and C. Tomasi, "Good features to track," IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.593-600, 1994.
Tao H. Sawhney, H. and Kumar, R. "Object tracking with bayesian estimation of dynamic layer representations," IEEE Trans. Patt. Analy. Mach. Intell, Vol.24 No1, pp.75-89, 2002.
M. Black and A. Jepson, "Eigentracking: Robust matching and tracking of articulated objects using a view-based representation," Int. J. Comput. Vision Vol.26 No.1, pp.63-84, 1998.
S. Avidan, "Support vector tracking," IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.184-191, 2001
M. Isard and A. Blake. "Condensation - conditional density propagation for visual tracking," Int. J. Comput. Vision, Vol.29 No.1, pp.5-28, 1998.
Huttenlocher. D, Noh. J, and Rucklidge. W.,"Tracking nonrigid objects in complex scenes," IEEE International Conference on Computer Vision (ICCV), pp. 93-101, 1993.
Kang. J, Cohen. I,and Medioni. G, "Object reacquisition using geometric invariant appearance model," In International Conference on Pattern Recongnition (ICPR), pp.759-762, 2004.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.