최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기방송공학회논문지 = Journal of broadcast engineering, v.24 no.6, 2019년, pp.1076 - 1084
조성만 (서울과학기술대학교 일반대학원 미디어IT공학과) , 이승주 (서울과학기술대학교 일반대학원 미디어IT공학과) , 이재현 (서울과학기술대학교 일반대학원 미디어IT공학과) , 박구만 (서울과학기술대학교 일반대학원 미디어IT공학과)
In this paper, we introduced a system that extracts metadata by recognizing characters and objects in media using deep learning technology. In the field of broadcasting, multimedia contents such as video, audio, image, and text have been converted to digital contents for a long time, but the unconve...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
딥러닝 기반의 서비스를 위해서는 무엇이 필요한가? | 최근 빅데이터와 딥러닝의 발달로 인하여 방송, 통신, 보안 등의 다양한 영역에서 딥러닝 기반의 솔루션을 구축하기 위한 다양한 연구를 진행하고 있다[1]. 딥러닝 기반의 서비스를 위해서는 빅데이터의 구축이 필요하다. 방송 분야에서도 마찬가지로 디지털 컨텐츠를 활용하여미디어 아카이브를 구성하고 이를 사용한 딥러닝 기반의 서비스를 연구하고 있다. | |
딥러닝 기반의 메타데이터 생성 시스템은 무엇으로 구성되어 있는가? | 이에 본 논문에서는 미디어 아카이브를 만들기 위한딥러닝 기반의 메타데이터 생성 시스템을 구현하였다. 전체 시스템은 학습용 데이터 생성 모듈, 사물 인식 모듈, 얼굴 인식 모듈, API 서버의 네 가지 요소로 구성되어 있다. 얼굴 인식 모듈에서는 Facenet[3]을 사용하였고, 사물 인식 모듈에서는 SSD[4]를 사용하였다. | |
성능 좋은 신경망을 만들기 위해서는 무엇이 필요한가? | 딥러닝 기반의 서비스를 위해서는 성능 좋은 딥러닝 신경망이 필요하다. 그리고 성능 좋은 신경망을 만들기위해서는 양질의 학습 데이터가 필요하다[3]. 양질의 학습데이터를 수집하고 가공하기 위하여 학습용 데이터 생성모듈을 별도로 구현하였으며, MTCNN[4], k-means clustering[5], SSD[6]을 활용하였다. |
I.Choi, H.Song, S.Lee, J.Yoo, "Facial Expression Classification Using Deep Convolutional Neural Network", Journal of Broadcast Engineering, Vol.22, No.2, March 2017.
F Schroff, D Kalenichenko, J Philbin, "FaceNet: A Unified Embedding for Face Recognition and Clustering", The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 815-823, 2015.
W.Liu, D.Anguelov, D.Erhan, C.Szegedy, S.Reed, "SSD: Single shot multibox detector", arxiv:1512.02325, 2015.
Y.Wen, K.Zhang, Z.Li, Y.Qiao, "A discriminative feature learning approach for deep face recognition", In European Conference on Computer Vision (ECCV), pages 499-515, 2016.
W.Liu, Y.Wen, Z.Yu, M.Li, B.Raj, L.Song, "SphereFace: Deep Hypersphere Embedding for Face Recognition", The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017
J.Redmon and A.Farhadi, "You only look once: Unified, real-time object detection", In CVPR, 2016.
R.Girshick, J.Donahue, T.darrell, J.malik, "Rich feature hierarchies for accurate object detection and semantic segmentation", In CVPR, 2014.
Y.Kim, J.Woo, J.Lee, J.Shin, "High-quality data collection for machine learning using block chain", Journal of the Korea Institute of Information and Communication Engineering, Vol.23, No.1, pp.13-19, Jan 2019.
K.Zhang, Z.Zhang, Z.Li, Y.Qiao, "Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks", IEEE SIGANL PROCESSING LETTERS, Vol.23, No.10, October 2016
W.Kiri, C.Claire, R.Seth, S.Stefan, "Constrained K-means Clustering with Backgroud Knowledge", Proceedings of the Eighteenth International Conference on Machine Learning, pp.574-584, 2001
Szegedy C, Ioffe S, Vanhoucke V, "Alemi, A.A.: Inception-v4, inception-resnet and the impact of residual connections on learning". In: AAAI. vol. 4, pp. 12, 2017.
Chris Biemann, "Chinese Whispers - an Efficient Graph Clustering Algorithm and its Application to Natural Language Processing Problems", TextGraphs-1 Proceedings of the First Workshop on Graph Based Methods for Natural Language Processing, pp.73-80, 2006.
Tsung-Yi Lin, Michael Maire, Serge Belongie, Lubomir Bourdev, Ross Girshick, James Hays, Pietro Perona, Deva Ramanan, C. Lawrence Zitnick, Piotr Dollar, "Microsoft COCO: Common Objects in Context", arxiv : 1405.0312, 2015.
Everingham, M., Van Gool, L., Williams, C. K. I., Winn, J. and Zisserman, A., "The PASCAL Visual Object Classes (VOC) Challenge", International Journal of Computer Vision, 88(2), 303-338, 2010
C. J. C. Burges, "A tutorial on Support vector machines for pattern recognition", Data mining and knowledge discovery 2, pp. 121-167, 1998.
B. Moore, "Principal component analysis in linear systems: Controllability, observability, and model reduction", IEEE Transactions on Automatic Control, pp. 17-32, Feb 1981.
L Maaten, G Hinton, "Visualizing data using t-SNE", Journal of Machine Learning Research 9, pp. 2579-2605, Nov 2008.
Andrew G.Howard, M.Zhu, Bo Chen, D.Kalenichnko, W.Wang, T.Weyand, M.Andreetto, H.Adam, "Mobilenets: Efficient convolutional neural networks for mobile vision applications", CoRR, abs/1704.04861, 2017.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.