$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 딥러닝을 이용한 영상 수평 보정
Deep Learning based Photo Horizon Correction 원문보기

컴퓨터그래픽스학회논문지 = Journal of the Korea Computer Graphics Society, v.23 no.3, 2017년, pp.95 - 103  

홍은빈 (포항공과대학교) ,  전준호 (포항공과대학교) ,  조성현 (대구경북과학기술원) ,  이승용 (포항공과대학교)

초록
AI-Helper 아이콘AI-Helper

본 논문은 딥 러닝(deep learning)을 이용하여 입력 영상의 기울어진 정도를 측정하고 수평에 맞게 바로 세우는 방법을 제시한다. 기존 방법들은 일반적으로 영상 내에서 선분, 평면 등 하위 레벨의 특징들을 추출한 후 이를 이용해 영상의 기울어진 정도를 측정한다. 이러한 방법들은 영상 내에 선이나 평면이 존재하지 않는 경우에는 제대로 동작하지 않는다. 본 논문에서는 대규모 데이터 셋을 통해 영상의 다양한 특징들에 대해 학습 가능한 Convolutional Neural Network (CNN)를 이용하여 인물이나 복잡한 배경으로 구성된 기울어진 영상에 대해서도 강인하게 동작하는 프레임워크를 제시한다. 또한, 네트워크에 가변 공간적 (adaptive spatial) pooling 레이어를 추가하여 영상의 다중 스케일 특징을 동시에 고려할 수 있게 하여 영상의 기울어진 정도를 측정하는 성능을 높인다. 실험 결과를 통해 다양한 콘텐츠를 포함한 영상의 기울어짐을 높은 정확도로 바로 세울 수 있음을 확인할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

Horizon correction is a crucial stage for image composition enhancement. In this paper, we propose a deep learning based method for estimating the slanted angle of a photograph and correcting it. To estimate and correct the horizon direction, existing methods use hand-crafted low-level features such...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 다중 스케 일을 고려한 Convolutional neural network 를 학습하여 일반적인 영 상의 기 울어 진 각도를정확하게 측정하고 측정된 각도에 따라 영상을 바로 세우는방법을 제안한다. 기울임 측정 및 보정에 대한 기존 연구는텍스트나 얼굴 영역과 같이 주로 영상의 특성에 맞는 특징을추출[1, 2, 3] 하거 나 선분과 같은 구조적 특징을 분석해 [4] 기울임을 측정한다.
  • 본 논문에서는 딥러닝을 이용하여 영상의 기울어진 각도를측정하는 방법을 제시하였다. 기존 방법들은 영상으로부터추출한 주요 선과 같은 저 수준 특징을 바탕으로 각도를측정하는 반면 제안한 방법은 학습된 하나의 네트워크를 통해다양한 고수준의 특징 정보를 활용한 각도 측정 이 가능하며, 다양한 영상에 대해 높은 정확도를 보인다.
  • 본 논문에서는 선분과 같이 기울어짐을 판단하는데 도움이되는 정보가 부족한 영상에 대해서도 강건하게 동작하는기울어짐 보정을 목표로 하였기 때문에 학습 데이터 셋 내에주요 선이 존재하는 영상 (건물, 나무 등) 외에도 주요 선이존재하지 않는 영상 (인물, 자연 풍경 등)도 충분히 포함되도록각그룹의 비율을 조정하였다. 이를위해 영상에서 찾은 선분을클러스터링한 뒤 선분의 길이의 합이 가장 긴 클러스터의중심을 주요 선분으로 검출한 뒤, 만약 검출된 주요 선이영상의 높이, 너비 중 짧은 쪽의 1/3 보다 짧다면 이 영상에서주요 선은 존재하지 않는다고 가정 한다.
  • 본 논문에서는 최근 영상 인식 및 분석에 뛰어난 성능을보이는 residual network 구조에 다중 스케일특징을고려할수있게 해주는 가변 공간적 pooling 레이 어를 적용한 네트워크를학습해 영상 기울기를 측정하는 방법을 제시한다. 이를 통해 90。단위가 아닌 미세한 단위의 각도로 기울어진 다양한콘텐츠의 영상을 높은 정확도로 바로세울 수 있다.
  • 수 있다. 본 절에서는 학습 데이터 셋을 세 가지 경우로다르게 구성하여 네트워크를 학습했을 때 검증 데이터 셋에대한 기울임 측정 정확도가 어떻게 차이 나는지 비교한다. 이실험에 사용한 네트워크 구조는 3.

가설 설정

  • 본 논문에서는 이 중 1,000 장은 검증 데이터 셋, 나머지는학습 데 이 터 셋 으로 사용하였다. World Cities Dataset 의 영 상들중에는 기울어져 찍힌 영상들도 소수 포함되어 있으나대부분은 바로 세워져 있기 때문에 학습 시 전체적인 경향에 큰영향이 없을 것이라 가정하였고 실제로 실험결과를 통해동작이 잘 됨을 확인할 수 있었다. 검증 데이터 셋은 직접눈으로 확인하여 기울어져 있는 영상들은 제외시켰다(865 장).
  • 비율을 조정하였다. 이를위해 영상에서 찾은 선분을클러스터링한 뒤 선분의 길이의 합이 가장 긴 클러스터의중심을 주요 선분으로 검출한 뒤, 만약 검출된 주요 선이영상의 높이, 너비 중 짧은 쪽의 1/3 보다 짧다면 이 영상에서주요 선은 존재하지 않는다고 가정 한다. 이를 통해 최종 학습데이터 셋을 주요 선이 존재하는 영상과 주요 선이 존재하지않는 영상 각각 2:1 로 구성하였다 (Figure 3).
본문요약 정보가 도움이 되었나요?

참고문헌 (11)

  1. B.T. Avila and R.D. Lins, "A fast orientation and skew detection algorithm for monochromatic document images," in proc. ACM Symposium on Document Engineering, pp. 118-126, 2005. 

  2. N. Gourier, D. Hall and J.L. Crowley, "Estimating face orientation from robust detection of salient facial structures," in proc. FG Net Workshop on Visual Observation of Deictic Gestures, vol. 6, 2004. 

  3. M. Osadchy, Y.L. Cun and M.L. Miller, "Synergistic face detection and pose estimation with energy-based models," Journal of Machine Learning Research, pp. 1197-1215, 2007. 

  4. Y.M. Wang and H. Zhang, "Detecting image orientation based on low-level visual content," Computer Vision and Image Understanding, 93(3), pp. 328-346, 2004. 

  5. M. Datar and X. Qi, "Automatic image orientation detection using the supervised self-organizing map," in proc. 8th IASTED International Conference, 2006. 

  6. L. Wang, X. Liu, L. Xia, G. Xu and A. Bruckstein, "Image orientation detection with integrated human perception cues (or which way is up)," in proc. International Conference on Image Processing (ICIP), vol.3, 2003. 

  7. H. Lee, E. Shechtman, J. Wang and S. Lee, "Automatic upright adjustment of photographs," in proc. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 877-884, 2012. 

  8. K. He, X. Zhang, S. Ren and J. Sun, "Deep residual learning for image recognition," in proc. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 770-778, 2016. 

  9. L. Mai, H. Jin and F. Liu, "Composition-preserving deep photo aesthetics assessment," in proc. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 497-506, 2016. 

  10. U. Joshi and M. Guerzhoy, "Automatic photo orientation detection with convolution neural networks," in proc. Conference on Computer and Robot Vision (CRV), 2017. 

  11. G. Tolias and Y. Avrithis "Speeded-up, relaxed spatial matching," in proc. International Conference on Computer Vision(ICCV), 2011. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로