[논문]이미지를 사용한 가상의상착용을 위한 개선된 알고리즘

미나르 마드올 라흐만; 따이 트안 투안; 안희준

doi:10.9723/jksiis.2020.25.2.011

초록
AI-Helper

최근 이미지를 사용한 가상착용기술 (Virtual try-on: VTON)에 대한 일련의 연구들이 발표되었다. 이에 의상과 사용자 이미지를 사용한 대표적 방식 (SCMM 기반의 비-딥러닝 방식, 딥러닝 기반 VITON 과 CP-VITON)에 대해 인물의 자세 및 체형, 의상의 가려짐 정도, 의상의 특성 등에 따라 분석한 연구가 보고되었다. 본 논문에서는 이중 가장 좋은 성능을 보이는 CP-VTON의 문제점을 살펴보고 이에 따른 해결책을 제시한다. 구체적으로 대상인물의 분할 표현 문제, 교체 대상이 아닌 영역이 유지되지 못하는 문제, 합성 마스크 생성네트워크의 학습에 사용되는 비용함수 문제, 합성 네트워크의 마스크 문제를 지적하고 이를 개선하는 알고리즘을 제안하였다. 그 결과 SSIM 등에서 5%내외의 주관적으로는 상당한 개선을 보였다.

Abstract ▼ AI-Helper

Recently, a series of studies on virtual try-on (VTON) using images have been published. A comparison study analyzed representative methods, SCMM-based non-deep learning method, deep learning based VITON and CP-VITON, using costumes and user images according to the posture and body type of the perso...

Recently, a series of studies on virtual try-on (VTON) using images have been published. A comparison study analyzed representative methods, SCMM-based non-deep learning method, deep learning based VITON and CP-VITON, using costumes and user images according to the posture and body type of the person, the degree of occlusion of the clothes, and the characteristics of the clothes. In this paper, we tackle the problems observed in the best performing CP-VTON. The issues tackled are the problem of segmentation of the subject, pixel generation of un-intended area, missing warped cloth mask and the cost function used in the learning, and limited the algorithm to improve it. The results show some improvement in SSIM, and significantly in subjective evaluation.

주제어

표/그림 (7)

그림 Fig. 1 CP-VTON NN Pipeline (Wang et al., 2018)
그림 Fig. 2 Clear Improvement Cases
그림 Fig. 3 Key Issues in CP-VTON (Improvement in the Proposed System)
그림 Fig. 4 Enhanced Proposed Algorithm: CP-VTON+
그림 Fig. 5 Warped Cloths through GMM Network
그림 Fig. 6 Comparison and Analysis of IoU Result for Same Cloth and New Cloth
그림 Fig. 7 Comparison of Final Results with CP-VTON Results

AI 본문요약
AI-Helper

문제 정의

본 논문에서는 최근 발표된 이미지 기반 딥러닝 기반 가상착용기술 중 가장 좋은 성능을 보이는 CP-VTON의 성능을 세부적으로 분석하고 이들의 문제점 5가지를 도출하였다. 이 5개의 문제들 중 문제 5 ‘3차원 변형’을 제외한 4가지 경우의 해결방안을 제시하고 이를 네트워크에 적용하였다.

가설 설정

CP-VTON 네트워크를 사용한 가상착용 알고리즘들은 사용자 사진과 의상사진을 입력으로 하지만, 우선 사전에 사람의 2차원 (골격) 자세와의 상분할이 되어 있다고 가정한다. 본 연구에 사용한 데이터는 VITON 논문에서 저자들이 처음 사용하였고 이후 CP-VTON을 비롯한 많은 논문 들에서 사용하고 있는 VITON 데이터셋을 사용하였다.

제안 방법

• 수정 1: 사람 표현을 수정하기 위하여 목 부 분의 Label인 Skin을 추가하였고, 또한 머리카락 등을 제외하고 사용자 실루엣을 구성하였다 (Fig. 3. (a) 우측)
• 수정 2: TON 적용시 교체되는 의상을 제외한 영역의 입력을 추가하였다 (Fig. 3. (b) 우측).
CP-VTON 네트워크를 사용한 가상착용 알고리즘들은 사용자 사진과 의상사진을 입력으로 하지만, 우선 사전에 사람의 2차원 (골격) 자세와의 상분할이 되어 있다고 가정한다. 본 연구에 사용한 데이터는 VITON 논문에서 저자들이 처음 사용하였고 이후 CP-VTON을 비롯한 많은 논문 들에서 사용하고 있는 VITON 데이터셋을 사용하였다. 이 데이터 셋은 자세예측에는 OpenPose(Cao et al.

대상 데이터

실험에 사용한 이미지는 VITON과 CP-VTON에서 사용한 데이터셋을 기반으로 사용하였다. 성능비교는 의상 변형 결과와 최종 블렌딩 결과를 따로 평가하였다.

데이터처리

다음으로 가상 착용의 최종결과를 SSIM (Structural similarity)과 LPIPS (Learned perceptual image patch similarity, Zhang et al., 2018), IS (Inception score)을 기준으로 확인하였다. SSIM은 사람 시각 시스템이 이미지에서 구조 정보에 민감한 점을 이용하여 PSNR (Peak Signal to Noise Ratio)보다 주관적인 화질을 잘 평가하는 것으로 알려진 객관적 평가기준으로 원본 이미지 x와 왜곡 이미지 y의 밝기, 콘트라스트, 구조를 비교한다.

성능/효과

이 5개의 문제들 중 문제 5 ‘3차원 변형’을 제외한 4가지 경우의 해결방안을 제시하고 이를 네트워크에 적용하였다. 앞선 논문 (Tuan et al., 2019)에서 지적한 바와 같이 CP-VTON 논문에서 저자들 이 주장하는 바와 달리, 의상의 가려짐이 거의 없고, 자세가 변형이 거의 없는 경우에 한해서만 실용적인 의미가 있을 것으로 보인다. 그렇지 않은 범위의 경우에는 3D 방식 등의 새로운 알고리즘이 필요할 것으로 보인다.

후속연구

그렇지 않은 범위의 경우에는 3D 방식 등의 새로운 알고리즘이 필요할 것으로 보인다. 하지만, 대부분의 실용화에서 사용된 알고리즘이 모든 경우를 해결하는 것은 아니듯, 제안된 방식의 한계점을 정확히 인식하고 입력을 제한할 수 있다면 이 논문에서 제안하는 방식으로 향상된 결과를 얻을 수 있을 것으로 판단된다.

질의응답

핵심어	질문	논문에서 추출한 답변
	LPIPS란?	SSIM은 사람 시각 시스템이 이미지에서 구조 정보에 민감한 점을 이용하여 PSNR (Peak Signal to Noise Ratio)보다 주관적인 화질을 잘 평가하는 것으로 알려진 객관적 평가기준으로 원본 이미지 x와 왜곡 이미지 y의 밝기, 콘트라스트, 구조를 비교한다. LPIPS는 신경망 모델에서 추출되는 특성을 이용하여 학습에 의하여 사람의 인지적 특성에 맞도록 유사도를 평가하는 새로운 모델이다.
	이 미지 기반 가상 착용기술이 사용하는 요소들은?	2018) 등이 있다. 이들은 이차원 이 미지를 입력으로 사용하고 2차원 영상처리 알고리즘을 사용한다. 알고리즘 세부적으로는 이미 지에서의 사람의 2차원 자세 예측, 이미지 분할 기술, 2차원 기하변환, 2차원 이미지 블렌딩 기술을 사용하며, 전통적인 규칙기반 방식과 딥러닝에 의한 학습기법이 같이 사용되고 있다.
	알고리즘을 세부적으로 나누었을 때, 어떤 기술들이 존재하는가?	이들은 이차원 이 미지를 입력으로 사용하고 2차원 영상처리 알고리즘을 사용한다. 알고리즘 세부적으로는 이미 지에서의 사람의 2차원 자세 예측, 이미지 분할 기술, 2차원 기하변환, 2차원 이미지 블렌딩 기술을 사용하며, 전통적인 규칙기반 방식과 딥러닝에 의한 학습기법이 같이 사용되고 있다.

참고문헌 (11)

Ahn H. (2018a). Online Virtual Try On using Mannequin Cloth Pictures, Journal of the Korea Industrial Information Systems Research, 23(6), 29-38.

원문보기 상세보기
Ahn H. (2018b). Image-based Virtual Try-On System, Journal of Korean Computer Game Society, 31(3), 37-45.
Barratt, S., and Sharma, R. (2018). A Note on the Inception Score, arXiv preprint arXiv:1801.01973.
Cao, Z., Simon, T., Wei, S. E., and Sheikh, Y. (2017). Realtime Multi-person 2d Pose Estimation using Part Affinity Fields, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 7291-7299.
Han, X., Wu, Z., Wu, Z., Yu, R., and Davis, L. S. (2018). Viton: An Image-based Virtual Try-on Network. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 7543-7552.
Jaderberg, M., Simonyan, K., and Zisserman, A. (2015). Spatial Transformer Networks. Proceedings of Advances in Neural Information Processing Systems, pp. 2017-2025.
Liang, X., Gong, K., Shen, X., and Lin, L. (2018). Look into Person: Joint Body Parsing & Pose Estimation Network and a New Benchmark. IEEE Transactions on PAMI , 41(4), 871-885.
Raj, A., Sangkloy, P., Chang, H., Lu, J., Ceylan, D., and Hays, J. (2018). Swapnet: Garment Transfer in Single View Images. Proceedings of the European Conference on Computer Vision, pp. 666-682.
Tuan, T., Rahman, M., and Ahn, H. (2019). Performance Evaluation of VTON Algorithms using a Pair of Cloth and Human Image, Journal of the Korea Industrial Information Systems Research, 24(6), 24-30.
Wang, B., Zheng, H., Liang, X., Chen, Y., Lin, L., and Yang, M. (2018). Toward Characteristic-preserving Image-based Virtual Try-on Network. Proceedings of the European Conference on Computer Vision, pp. 589-604.
Zhang, R., Isola, P., Efros, A. A., Shechtman, E., and Wang, O. (2018). The Unreasonable Effectiveness of Deep Features as a Perceptual Metric, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp. 586-595.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

이미지를 사용한 가상의상착용을 위한 개선된 알고리즘
An Improved VTON (Virtual-Try-On) Algorithm using a Pair of Cloth and Human Image 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

표/그림 (7)

표/그림 (7)

AI 본문요약
AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

데이터처리

성능/효과

후속연구

질의응답

참고문헌 (11)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

이미지를 사용한 가상의상착용을 위한 개선된 알고리즘 An Improved VTON (Virtual-Try-On) Algorithm using a Pair of Cloth and Human Image 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

표/그림 (7) 모든 표/그림 보기

표/그림 (7) 슬라이드로 보기

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

데이터처리

성능/효과

후속연구

질의응답

참고문헌 (11)

이 논문을 인용한 문헌

저자의 다른 논문 :

안희준 (25)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

이미지를 사용한 가상의상착용을 위한 개선된 알고리즘
An Improved VTON (Virtual-Try-On) Algorithm using a Pair of Cloth and Human Image 원문보기

초록
AI-Helper

표/그림 (7)

표/그림 (7)

AI 본문요약
AI-Helper