최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기Journal of Internet Computing and Services = 인터넷정보학회논문지, v.19 no.6, 2018년, pp.41 - 51
박서희 (Human Care System Research Center, Korea Electronics Technology Institute(KETI)) , 지명근 (Department of Computer Science, Kyonggi University) , 전준철 (Department of Computer Science, Kyonggi University)
Recently, in the field of video surveillance, deep learning based learning method is applied to intelligent video surveillance system, and various events such as crime, fire, and abnormal phenomenon can be robustly detected. However, since occlusion occurs due to the loss of 3d information generated...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
지능형 영상 분석은 무엇인가? | 지능형 영상 분석은 CCTV(Closed Circuit Television)를이용하여 영상 내 특성을 인식하고, 패턴을 추출함으로써 정보를 분석하는 분야이다. 최근 지능형 영상 분석 시스템은 효율적인 영상 감시(Video Surveillance)를 위해 딥러닝(Deep Learning) 기반 학습 방법이 적용되어 다양하게 사전 정의된 이벤트를 강건하게 탐지함으로써 감시자에게 객체 탐지, 보행자 행위 예측과 같은 유용한 정보를 제공할 수 있게 되었다. | |
영상에서 인간의 행위를 인식하기 위해서는 어떤 과정이 필요한가? | 최근 지능형 영상 분석 시스템은 효율적인 영상 감시(Video Surveillance)를 위해 딥러닝(Deep Learning) 기반 학습 방법이 적용되어 다양하게 사전 정의된 이벤트를 강건하게 탐지함으로써 감시자에게 객체 탐지, 보행자 행위 예측과 같은 유용한 정보를 제공할 수 있게 되었다. 영상에서 인간의 행위를 인식하기 위해서는 움직이는 객체를 탐지하는 과정과 탐지된 인간의 자세를 추정하는 과정이 필요하다. 그러나 일반적으로 CCTV 영상은 3차원 실세계를 2차원 영상으로 투영 시키면서 생기는 위상학적 정보의 손실 때문에 한 부분이 다른 부분에 의해 가려지는 폐색(Occlusion) 문제가 발생한다. | |
RGB-D 정보 기반 객체 탐지 방법은 폐색 문제를 해결하기 위해 어떻게 객체를 탐지하는가? | 지능형 영상 감시 시스템에서 인간의 행위를 인식하기 위해서는 객체 탐지 및 자세 추정 과정에서 나타나는 폐색 문제를 해결하여 객체를 강건하게 검출할 필요가 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 그림2와 같이 양안 영상(Binocular Images)을 이용하여 깊이 정보를 계산하고 RGB 정보와 병합하여 객체를 탐지한다. 그 다음 탐지된 경계 상자 영역을 컨볼루션 포즈머신의입력으로 설정하여 신뢰 지도(Belief Map)들을 반환함으로써 2차원 키포인트 탐지를 수행한다. |
Seohee Park, Myunggeun Ji, and Junchul Chun, "2D Human Pose Estimation based on Object Detection using RGB-D information", KSII Transactions on Internet & Information Systems, Vol. 12, No. 2, pp. 800-816, 2018. https://doi.org/10.3837/tiis.2018.02.015
Ramakrishna, Varun, Takeo Kanade, and Yaser Sheikh, "Reconstructing 3d human pose from 2d image landmarks", European conference on computer vision. Springer, Berlin, Heidelberg, pp. 573-586, 2012. https://doi.org/10.1007/978-3-642-33765-9_41
Parekh, Himani S., Darshak G. Thakore, and Udesang K. Jaliya, "A survey on object detection and tracking methods", International Journal of Innovative Research in Computer and Communication Engineering, Vol. 2, No. 2, pp. 2970-2978, 2014. http://www.ijircce.com/upload/2014/february/7J_A%20S urvey.pdf
Hirschmuller, Heiko, "Stereo processing by semiglobal matching and mutual information", IEEE Transactions on pattern analysis and machine intelligence, Vol. 30, No. 2, pp. 328-341, 2008. https://doi.org/10.1109/tpami.2007.1166
Ionescu, Catalin, et al, "Human3.6m: Large scale datasets and predictive methods for 3d human sensing in natural environments", IEEE transactions on pattern analysis and machine intelligence, Vol. 36, No. 7, pp. 1325-1339, 2014. https://doi.org/10.1109/tpami.2013.248
Tekin, Bugra, et al, "Direct prediction of 3d body poses from motion compensated sequences", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016. https://doi.org/10.1109/cvpr.2016.113
Chen, Ching-Hang, and Deva Ramanan, "3d human pose estimation 2d pose estimation + matching", CVPR, Vol. 2, No. 5, 2017. https://doi.org/10.1109/cvpr.2017.610
Zhou, Xiaowei, et al, "Sparseness meets deepness: 3D human pose estimation from monocular video", Proceedings of the IEEE conference on computer vision and pattern recognition, 2016. https://doi.org/10.1109/cvpr.2016.537
Du, Yu, et al, "Marker-less 3d human motion capture with monocular image sequence and height-maps", European Conference on Computer Vision. Springer, Cham, 2016. https://doi.org/10.1007/978-3-319-46493-0_2
Park, Sungheon, Jihye Hwang, and Nojun Kwak, "3D human pose estimation using convolutional neural networks with 2D pose information", European Conference on Computer Vision. Springer, Cham, 2016. https://arxiv.org/abs/1608.03075
Zhou, et al, "Deep kinematic pose regression", European Conference on Computer Vision. Springer, Cham, 2016. https://arxiv.org/abs/1609.05317
Tome, Denis, Christopher Russell, and Lourdes Agapito, "Lifting from the deep: Convolutional 3d pose estimation from a single image", CVPR 2017 Proceedings, pp. 2500-2509, 2017. https://doi.org/10.1109/cvpr.2017.603
Martinez, et al, "A simple yet effective baseline for 3d human pose estimation", International Conference on Computer Vision, Vol. 1, No. 2. 2017. https://doi.org/10.1109/iccv.2017.288
OpenPose: A Real-Time Multi-Person Keypoint Detection and Multi-Threading C++ Library, 2017.
Wei, Shih-En, et al, "Convolutional pose machines", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016. https://doi.org/10.1109/cvpr.2016.511
Ramakrishna, Varun, et al, "Pose machines: Articulated pose estimation via inference machines", European Conference on Computer Vision. Springer, Cham, 2014. https://doi.org/10.1007/978-3-319-10605-2_3
Newell, Alejandro, Kaiyu Yang, and Jia Deng, "Stacked hourglass networks for human pose estimation", European Conference on Computer Vision. Springer, Cham, 2016. https://doi.org/10.1007/978-3-319-46484-8_29
Sigal, Leonid, et al, "Humaneva: Synchronized video and motion capture dataset and baseline algorithm for evaluation of articulated human motion", International journal of computer vision, 2010. https://doi.org/10.1007/s11263-009-0273-6
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.