$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

자동-레이블링 기반 영상 학습데이터 제작 시스템
An Auto-Labeling based Smart Image Annotation System 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.21 no.6, 2021년, pp.701 - 715  

이용 (한국과학기술정보연구원 연구데이터공유센터) ,  장래영 (한국과학기술정보연구원 연구데이터공유센터) ,  박민우 (한국과학기술정보연구원 연구데이터공유센터) ,  이건우 (한국과학기술정보연구원 연구데이터공유센터) ,  최명석 (한국과학기술정보연구원 연구데이터공유센터)

초록
AI-Helper 아이콘AI-Helper

최근 딥러닝 기술의 급속한 발전과 함께 학습데이터가 크게 주목을 받고 있다. 일반적으로 딥러닝 방식에서는 모델을 훈련시키기 위해 충분한 학습데이터가 준비되어 있어야 한다. 하지만, 딥러닝 모델 설계 작업과 달리 데이터셋을 제작하는 데 상당한 시간과 노력이 필요하다. 영상 데이터를 주로 다루는 시각지능 분야에서도 학습데이터 제작자들은 전문적인 학습데이터 제작 도구를 사용해 이미지 단위로 레이블링을 수작업으로 하고 있어 여전히 많은 시간과 노력이 필요한 상황이다. 따라서, 다양한 분야에서 필요한 충분한 영상 학습데이터셋을 확보하기 위해 기존의 수작업 방식을 대체할 수 있는 레이블링 기술이 필요하다. 본 논문에서는, 영상 학습데이터셋 동향을 소개하고, 학습데이터 제작 환경에 대해 분석한다 특히, 수작업으로 이루어지는 반복적이고 수고스러운 레이블링 과정을 자동화하여, '확인과 수정'의 단계를 비약적으로 단축시킬 수 있는 '스마트 영상학습데이터 제작 시스템'을 제안한다. 그리고, 실험을 통해 영상 학습데이터 제작 과정에서 이미지에 박스형 및 폴리곤형 객체영역을 지정하여 레이블링하는 데 소요되는 시간을 크게 줄이기 위한 자동레이블링 방식의 효과를 검증한다. 마지막으로, 제안하는 시스템의 실험에서 추가적으로 검증되어야 하는 부분과 함께 이를 개선하기 위한 향후 연구 계획에 대해 논의한다.

Abstract AI-Helper 아이콘AI-Helper

The drastic advance of recent deep learning technologies is heavily dependent on training datasets which are essential to train models by themselves with less human efforts. In comparison with the work to design deep learning models, preparing datasets is a long haul; at the moment, in the domain of...

주제어

표/그림 (8)

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 본 논문에서는 시각지능 개발에 필요한 학습데이터 제작을 효과적으로 지원하기 위한 시스템을 소개한다. 제안하는 시스템에서는 자동 레이블링으로 도출되는 결과에 대한 확인과 수정에만 작업자가 관여하여, 효과적이고 빠른 학습데이터 양산이 가능하게 된다.
  • 자동 레이블링은 학습데이터 제작 시간을 크게 단축 시킬 수 있는 기술로서, 다양한 레이블링 전문 기업에서 경쟁적으로 기술 개발 및 적용을 위한 노력을 진행하고 있다. 본 연구에서는 기존의 학습데이터 제작 서비스들이 일반적으로 한정된 사전학습 모델에 의존하는 자동레이블을 적용하는 것과 달리 백-엔드 온라인 인공지능 서비스와 연동하여 보다 다양한 사전학습 모델을 적용할 수 있는 기술을 제안한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (48)

  1. Cognilytica, "Data Engineering, Preparation, and Labeling for AI 2019," https://www.cognilytica. com/2019/03/06/report-data-engineering-preparation-and-labeling-for-ai-2019/. 

  2. Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner, "Gradient-based learning applied to document recognition," IEEE, Vol.86, No.11, pp.2278-2324, 1998. 

  3. Alex Krizhevsky, Learning Multiple Layers of Feat ures from Tiny Images, https://www.cs.toronto.edu/~kriz/cifar.html, 2009. 

  4. Mykhaylo Andriluka, Leonid Pishchulin, Peter Gehler, Schiele, and Bernt, "2D Human Pose Estimation: New Benchmark and State of the Art Analysis," IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Jun. 2014. http://human-pose.mpi-inf.mpg.de/ 

  5. M. Everingham, L. Van Gool, C. K. I. Williams, J. Winn, and A. Zisserman, "The PASCAL Visual Object Classes (VOC) Challenge," International Journal of Computer Vision 88, pp.303-338, 2010. 

  6. Tsung-Yi Lin, Michael Maire, Serge J. Belongie, Lubomir D. Bourdev, Ross B. Girshick, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollar, and C. Lawrence Zitnick, "Microsoft COCO: Common Objects in Context," https://cocodataset.org, 2014. 

  7. J. Deng, W. Dong, R. Socher, L. J. Li, K. Li, and L. Fei-Fe, "Imagenet: A large-scale hierarchical image database," In: 2009 IEEE conference on computer vision and pattern recognition, pp. 248-55, 2009, http://www.image-net.org/ 

  8. Andreas Geiger, Philip Lenz, Christoph Stiller, and Raquel Urtasun, "Vision meets robotics: The KITTI dataset," Int. J. Robotics Res, Vol.32, No.11, pp.1231-1237, 2013, http://www.cvlibs.net/datasets/kitti/ 

  9. M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele, "The Cityscapes Dataset for Semantic Urban Scene Understanding," in Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, https://www.cityscapes-dataset.com/ 

  10. IMDb Datasets, https://www.imdb.com/interfaces 

  11. Google's Open Images V6 + Extentions, https://storage.googleapis.com/openimages/web/index.html 

  12. Lucas Smaira, Joao Carreira, Eric Noland, Ellen Clancy, Amy Wu, and Andrew Zisserman, A Short Note on the Kinetics-700-2020, Human Action Dataset, CoRR abs/2010.10864, 2020, https://deepmind.com/research/open-source/kinetics 

  13. The 20BN-jester Dataset V1, https://20bn.com/datasets/jester 

  14. Kaggle: Your Machine Learning and Data Science Community, https://www.kaggle.com/ 

  15. AI Hub, https://aihub.or.kr/ 

  16. H. Emammi, M.M. Aliabadi, M. Dong, and R.Chinnam, "SPA-GAN: Spatial Attention GAN for Image-to-Image Translation," IEEE Trans. on Multimedis, Vol.23, pp.391-401, 2021. 

  17. H. Ko, D. Y. Lee, S. Cho, and A. C. Bovik, "Quality Prediction on Deep Generative Images," IEEE Trans. on Image Processing, Vol.29, pp.5964-5979, 2020. 

  18. Gregory Griffin, Alex Holub, and Pietro Perona, Caltech-256 Object Category Dataset, California Institute of Technology, 2007, https://www.kaggle.com/jessicali9530/caltech256 

  19. Google's Conceptual Captions, https://ai.google.com/research/ConceptualCaptions/ 

  20. LabelMe, https://github.com/wkentaro/labelme 

  21. MS VoTT, https://github.com/microsoft/VoTT 

  22. Make-Sense, https://www.makesense.ai/ 

  23. SuperAnnotate, https://superannotate.com/ 

  24. VIA(VGG), https://www.robots.ox.ac.uk/~vgg/software/via/ 

  25. Supervise.ly, https://supervise.ly/ 

  26. Labelbox, https://labelbox.com/ 

  27. Hasty.ai, https://hasty.ai/ 

  28. CVAT, https://github.com/openvinotoolkit/cvat 

  29. Darwin, https://www.v7labs.com/darwin 

  30. Heartex, https://heartex.com/ 

  31. Scalabel, https://www.scalabel.ai/ 

  32. Segments.ai, https://segments.ai/ 

  33. LabelIMG, https://github.com/tzutalin/labelImg 

  34. ImageTagger, https://github.com/bit-bots/imagetagger 

  35. DarkLabel, https://github.com/darkpgmr/DarkLabel 

  36. EVA, https://github.com/Ericsson/eva 

  37. LOST, https://github.com/l3p-cv/lost 

  38. Ybat, https://github.com/drainingsun/ybat 

  39. MuViLab, https://github.com/ale152/muvilab 

  40. Turkey, https://github.com/yanfengliu/turkey 

  41. Point Cloud Annotation Tool, https://github.com/springzfx/point-cloud-annotation-tool 

  42. DeepLabel, https://github.com/jveitchmichaelis/deeplabel 

  43. 이용 외, "인공지능 서비스(AIaaS) 기술 동향과 활성화 방안," 정보과학회지, 제38권, 제8호, pp.49-57, 2020. 

  44. YOLO: Real-Time Object Detection, https://pjreddie.com/darknet/yolo/ 

  45. K. He, G. Gkioxari, P. Dollar, and R. Girshick, "Mask R-CNN," 2017 IEEE International Conference on Computer Vision (ICCV), pp.2980-2988, 2017. 

  46. 장래영, 이용, 박민우, 이상환, "OpenFaaS 기반 AI 분석 서비스 시스템 구축," 한국콘텐츠학회논문지, 제20권, 제7호, pp.97-106, 2020. 

  47. B. Settles, Active Learning Literature Survey, University of Wisconsin-Madison, 2009. 

  48. R. Nowak and S. Hanneke, "Active Learning: From Theory to Practice," ICML2019 Tutorial, 2019. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로