$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

SNS감성 분석을 이용한 주가 방향성 예측: 네이버 주식토론방 데이터를 이용하여
Stock Price Prediction Using Sentiment Analysis: from "Stock Discussion Room" in Naver 원문보기

한국전자거래학회지 = The Journal of Society for e-Business Studies, v.25 no.4, 2020년, pp.61 - 75  

김명진 (Department of Industrial Engineering(ITM program), Seoul National University of Science and Technology) ,  류지혜 (Department of Industrial Engineering(ITM program), Seoul National University of Science and Technology) ,  차동호 (Headquarter of Multi-Solution, KB Asset Management) ,  심민규 (Department of Industrial Engineering, Seoul National University of Science and Technology)

초록
AI-Helper 아이콘AI-Helper

주식의 가격을 이해하고 예측하기 위해서 활용되는 데이터의 범위는 기존의 정형화된 데이터에서 비정형화된 다양한 종류의 데이터로 확대되고 있다. 본 연구는 SNS에서 수집된 댓글 데이터가 주식의 미래 가격의 변동에 영향을 미치는지를 조사한다. 가장 많은 주식투자자가 참여하는 커뮤니티인 네이버 주식토론방에서 20개 종목에 대한 6개월 간의 댓글 데이터를 수집하여, 이들 데이터가 1시간 후의 가격 변동의 방향과 가격 변동의 폭에 대한 예측력을 가지는지 조사한다. 예측 관계는 LSTM과 CNN등의 딥뉴럴네트워크 기법을 활용하여 모델링하였다. 20개 종목에 대해 조사하여 13개 종목에서 미래의 주가 이동 방향을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었고, 16개 종목에서 미래의 주가 변동폭을 50% 이상의 정확도로 예측할 수 있다는 결과를 얻었다. 본 연구는 네이버 주식토론방과 같은 SNS에서 형성된 여론이 주식 종목의 수급에 영향을 주어 가격의 변동 요인으로도 작용할 수 있다는 점을 확인한다.

Abstract AI-Helper 아이콘AI-Helper

The scope of data for understanding or predicting stock prices has been continuously widened from traditional structured format data to unstructured data. This study investigates whether commentary data collected from SNS may affect future stock prices. From "Stock Discussion Room" in Naver, we coll...

주제어

표/그림 (11)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이는 텍스트 데이터가 주가에 관한 논의라는 점을 배재하고 범용적인 처리를 행하기에, 때로는 비속어를 섞어 정제되지 않은 형태의 댓글을 활용하는 본 연구의 데이터 셋에는 적합하지 않을 수 있다. 따라서 본 연구에서는 텍스트 데이터에서는 형태소 분리 작업만 한 이후에 이를 직접 미래의 주가 변동과 연관시키는 방식으로 실험을 설계하였다.
  • 금융 시장 데이터를 이용한 정확한 예측은 실험적으로 매우 어렵다는 것이 잘 알려져 있다. 따라서 예측의 정확도가 통계적으로 유의미하게 50%를 넘을 수 있는지가 본 연구의 관심이다.
  • 대한민국에서 가장 많이 사용되는 검색 포탈이자 온라인 커뮤니티인 네이버의 “주식토론방”에서 KOSPI 200의 20개 종목에 대해 약50만개의 댓글 데이터를 9개월의 기간(2019년 11월~2020년 07월)에 대해 수집하였다. 미래 자산 가격의 움직임 중에 가격움직임의 방향성과 가격변동 폭의 크기에 대해 조사한다.
  • 본 연구는 개인 투자자가 주를 이루는 커뮤니티의 텍스트 데이터를 이용하여 주식 가격 예측력을 조사한다. 본 연구는 다음과 같은 의의를 가진다.
  • 본 연구에서는 SNS에서 일반 주식투자자들이 생성한 텍스트 데이터를 수집하여 데이터에 드러난 투자자의 감성이 과연 미래의 자산 가격 움직임에 대한 예측력을 가지고 있는지를 조사한다. 대한민국에서 가장 많이 사용되는 검색 포탈이자 온라인 커뮤니티인 네이버의 “주식토론방”에서 KOSPI 200의 20개 종목에 대해 약50만개의 댓글 데이터를 9개월의 기간(2019년 11월~2020년 07월)에 대해 수집하였다.
  • 본 연구에서는 우리나라의 주식 투자자들이 가장 많이 참여하는 온라인 커뮤니티인 “네이버 주식토론방”에서 수집된 댓글을 활용하여 고빈도의 시간 축(High-Frequency Time Horizon)에서 주가의 이동 방향과 변동폭을 예측할 수 있는지를 조사하였다.
  • 가장 다수를 이루는 관련 연구는 정제된 정보인 뉴스기사가 주가의 흐름에 영향을 끼칠 것이라는 가설을 바탕으로 뉴스기사를 활용하였다[11, 12]. 본 연구에서는 직접적인 시장 참여자, 혹은 시장에 높은 관심을 가지고 있는 참여자들이 생산한 데이터를 활용하기에, 데이터의 투자자에 대한 대표성이 높다. 또한, 일반인들의 소셜미디어 활동의 기록이기 때문에 상대적으로 비속어나 은어들이 많이 포함된 구어체로 되어있다.

가설 설정

  • 많은 연구들이 트위터, 페이스북과 같은 소셜 미디어 데이터나 뉴스기사를 활용하였다. 가장 다수를 이루는 관련 연구는 정제된 정보인 뉴스기사가 주가의 흐름에 영향을 끼칠 것이라는 가설을 바탕으로 뉴스기사를 활용하였다[11, 12]. 본 연구에서는 직접적인 시장 참여자, 혹은 시장에 높은 관심을 가지고 있는 참여자들이 생산한 데이터를 활용하기에, 데이터의 투자자에 대한 대표성이 높다.
본문요약 정보가 도움이 되었나요?

참고문헌 (19)

  1. Hochreiter, S. and Schmidhuber, J., "Long short-term memory," Neural computation, Vol. 9, No. 8, pp. 1735-1780, 1997. 

  2. Hong, S. H., "A study on stock price prediction system based on text mining method using LSTM and stock market news, Journal of Digital Convergence, Vol. 18, No. 7, pp. 223-228, 2020. 

  3. Jeong, J. S., Kim, D. S., and Kim, J. W., "Influence analysis of Internet buzz to corporate performance: Individual stock price prediction using sentiment analysis of online news," Korea intelligent information Systems Society, Vol. 21, No. 4, pp. 37-51, 2015. 

  4. Kang, Y. J. and Jang, W. W., "The FiveFactor Asset Pricing Model: Applications to the Korean Stock Market," Eurasian Studies, Vol. 13, No. 2, pp. 155-180, 2016. 

  5. Kim, D. H., "Asset Pricing Model in Korean Stock Market," Association of financial engineering, Vol. 13, No. 2, pp. 87-119, 2014. 

  6. Kim, D. S., Kim, K. T., and Kim, J. W., "Character-based multi-category sentiment analysis on social media using deep learning algorithms," Korean Institute Of Industrial Engineers, Vol. 2017, No. 4, pp. 5082-5084, 2017. 

  7. Kim, D. Y. and Lee, Y. I., "News based Stock Market Sentiment Lexicon Acquisition Using Word2Vec," The Korea Journal of BigData, Vol. 3, No. 1, pp. 13-20, 2018. 

  8. Kim, D. Y., Park, J. W., and Choi, J. H., "A Comparative Study between Stock Price Prediction Models Using Sentiment Analysis and Machine Learning Based on SNS and News Articles," Journal of Information Technology Services, Vol. 13, No. 3, pp. 221-233, 2014 

  9. Kim, H, G., Kim, S. D., and Kim, H. W., "A Case Study on the Establishment of an Equity Investment Optimization Model based on FinTech: For Institutional Investors," Korea Knowledge Management Society, Vo. 19, No.1, pp. 97-118, 2018. 

  10. Kim, J. Y. and Kim, C. S., "An Analysis on Mediating Effect of Participant Activity in Investment Crowdfunding," The Journal of Society for e-Business Studies, Vol. 25, No. 1, pp. 65-82, 2020. 

  11. Kim, Y. S., Kim, N. G., and Jeong, S. R., "Stock-Index Invest Model Using News Big Data Opinion Mining," Journal of Intelligence and Information Systems, Vol. 18, No. 2, pp. 143-156, 2012. 

  12. Lee, H. J., "Analysis of News Big Data for Deriving Social Issues in Korea," The Journal of Society for e-Business Studies, Vol. 24, No. 3, pp. 163-182, 2019. 

  13. Lee, M. S. and Ahn, H. C., "A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning: Application to the Prediction of Stock Market," Korea intelligent information Systems Society, Vol. 24, No. 1, pp. 167-181, 2018. 

  14. Park, H. J., Song, M. C., and Sim, K. S., "Sentiment Analysis of Korean Reviews Using CNN-Focusing on Morpheme Embedding," Korea intelligent information Systems Society, Vol. 24, No. 2, pp. 59-83, 2018. 

  15. Seo, I. S., Yeo, S. S., and Kang, H. J., "A Study on the Suggestion of Domestic Stock Market Analysis Scheme using Big Data," Korean Institute of information technology, Vol. 2014, No. 5, pp. 550-554, 2014. 

  16. Son, S. H., Kim, T. H., and Yoon, B. H., "Testing the Linear Asset Pricing Models in the Korean Stock Market," Korean Journal of Financial Studies, Vol. 38, No. 4, pp. 547-568, 2009. 

  17. Song, S. H., Kim, J. H., Kim, H. S., Park, J. S., and Kang, P. S., "Development of Early Warning Model for Financial Firms Using Financial and Text Data: A Case Study on Insolvent Bank Prediction," Journal of the Korean Institute of Industrial Engineers, Vol. 45, No. 3, pp. 248-259, 2019. 

  18. Suh, M. S. and Kim, D. H., "A Study on the Changing Direction of FinTech Service Model based on Big Data," The ebusiness studies, Vol. 20, No. 2, pp. 195-213, 2019. 

  19. Yoo, H. S., "What are the core competitiveness and alternative data in the digital age?," Available at: https://2e.co.kr/news/articleView.html?idxno209967, 2019. 

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로