$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

SNS와 뉴스기사의 감성분석과 기계학습을 이용한 주가예측 모형 비교 연구
A Comparative Study between Stock Price Prediction Models Using Sentiment Analysis and Machine Learning Based on SNS and News Articles 원문보기

한국IT서비스학회지 = Journal of Information Technology Services, v.13 no.3, 2014년, pp.221 - 233  

김동영 (숭실대학교 SW특성화대학원) ,  박제원 (숭실대학교 SW특성화대학원) ,  최재현 (숭실대학교 SW특성화대학원)

Abstract AI-Helper 아이콘AI-Helper

Because people's interest of the stock market has been increased with the development of economy, a lot of studies have been going to predict fluctuation of stock prices. Latterly many studies have been made using scientific and technological method among the various forecasting method, and also dat...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 개별 기업 주가의 등락을 예측하기 위해 뉴스기사와 SNS 데이터를 바탕으로 감성 분석과 기계학습기법을 사용한 예측 모형을 제시하였다. 데이터의 수집은 자체적으로 개발한 프로그램으로 수행하였으며, 수집한 데이터 중 뉴스기사를 이용해 주식도메인에 맞는 감성사전을 구축하였다.
  • 본 연구를 통해 최근 빅데이터의 대두로 주목받고 있는 SNS 데이터를 주가예측 분야에서 활용할 수 있는 한 가지 방안을 제시하였다. 또한 기계학습이론을 바탕으로 하는 예측기법에 필요한 데이터를 정제하는 과정에서 감성분석 기법을 이용할 수 있음을 나타내었다.
  • 본 논문에서 필요한 데이터를 추출하기 위해서는 수집한 뉴스기사와 SNS 데이터를 형태소 단위로 분석하는 과정을 수행해야한다. 본 연구에서는 서울대학교 IDS 연구실에서 개발한 꼬꼬마형태소 분석기를 사용하여 수집한 데이터들의 형태소 분석을 진행하였다.
  • 이에 본 논문에서는 뉴스기사와 SNS 사용자들의 데이터 모두를 주가예측을 위한 데이터로 사용하여 예측의 정확도를 높이고자 한다. 또한 오피니언 마이닝을 통해 뉴스나 SNS에 담겨있는 의미를 파악하여 주가예측을 하는 방법(Kim, Kim, and Jung, 2012; Kim, 2013)이 아닌, 오피니언 마이닝의 과정 중에 발생하는 데이터를 이용해 기계학습의 과정을 거쳐 주가를 예측하고자 한다.
  • 이에 본 논문에서는 주가 예측의 정확도를 높이기 위해 SNS와 뉴스기사 데이터를 동시에 이용한 다수의 주가예측 모형을 생성한 후 정확성을 비교하는 연구를 진행하였다. 우선 주가예측에 사용될 표본 회사를 추출한 후 일정 기간 동안 표본 회사가 언급된 SNS 데이터와 뉴스기사를 수집한다.
  • 감성분석의 기본 작업은 텍스트의 극성을 긍정, 부정, 중립 등으로 분류하는 것이다. 하지만 본 논문에서는 감성분석을 주가예측에 직접적으로 이용하지 않고 데이터 마이닝의 예측기법들을 기계학습 시키기 위한 데이터를 생성하기 위해 사용하고자 한다. 때문에 감성분석의 과정 중 형태소 분석기를 사용해 텍스트를 분해한 후 감성사전과의 비교를 통해 텍스트의 긍정지수를 도출하는 과정까지만 진행하였고 전체 텍스트의 극성을 분류하는 과정은 생략하였다.

가설 설정

  • 예를 들어 금요일에 게재된 뉴스기사의 경우 다음날인 토요일의 주가에 영향을 미친다고 가정했지만 토요일엔 주식시장이 개장되지 않는다. 때문에 금요일에 게재된 뉴스기사는 토요일과 일요일의 기사들과 같이 월요일 주가에 영향을 미친다고 가정하고 이들 데이터를 합산하여 하나의 데이터로 구성하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
기술적 분석에 활용되는 통계적 기법에는 무엇이 있는가? 기본적 분석은 재무 정보나 수익률과 같은 기업의 과거 성과를 평가하여 주가를 예측하는 방법으로 펀드 매니저나 주식 투자자 등이 주로 사용하는 방식이다. 기술적 분석은 과거주식가격의 동향을 파악해 미래주식가격을 예측하는 방식으로 EMA(exponential moving average) 등과 같은 통계적인 기법을 활용한다. 과학기술적 방법은 수많은 연산을 짧은 시간에 처리할 수 있는 컴퓨터 기술과 이와 관련된 이론들의 발전으로 인해 가능하게 된 방법이다.
과학기술적 방법 중 대표적인 기법에는 무엇이 있는가? 과학기술적 방법은 수많은 연산을 짧은 시간에 처리할 수 있는 컴퓨터 기술과 이와 관련된 이론들의 발전으로 인해 가능하게 된 방법이다. 대표적인 기법으로는 기계학습을 바탕으로 하는 인공신경망, 유전자 알고리즘 등이 있다. 여러 예측방법들 가운데 최근 과학기술적 방법을 이용한 많은 연구들이 활발하게 이루어지고 있다(Bollen et al.
주가를 예측하는 방법에는 무엇이 있는가? 경제의 발전과 더불어 사람들의 주식시장에 대한 관심이 증가함에 따라 수시로 변하는 주가를 예측하기 위한 많은 연구들이 진행되고 있다. 주가를 예측하기 위한 방법론은 크게 3가지로, 기본적 분석(fundamental analysis)과 기술적 분석(technical analysis) 그리고 과학기술적 방법(technological methods)이 있다. 기본적 분석은 재무 정보나 수익률과 같은 기업의 과거 성과를 평가하여 주가를 예측하는 방법으로 펀드 매니저나 주식 투자자 등이 주로 사용하는 방식이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. Ahn, S., "Stock Prediction Using News Text Mining and Time Series Analysis", M.S. thesis, The Graduate School of Engineering, Yonsei Univ., Seoul, Korea, 2010. 

  2. Bollen, J., H. Mao, and X., Zeng, "Twitter mood predicts the stock market", Journal of Computational Science, Vol.2, No.1, 2011, 1-8. 

  3. Ian, H., F. Eibe, and A. Mark, Data Mining, Morgan Kaufmann, Burlington, 2011. 

  4. Kim, K., G. Lee, and S., Lee, "A Comparative Analysis of Artificial Intelligence System and Ohlson model for IPO firm's Stock Price Evaluation", The Journal of Digital Policy and Management, Vol.11, No.5, 2013, 145-158. 

  5. Kim, S., D. Nam, H. Jo, and S. Kim, "A Study on the Relation of Web News and Stock Price", Korea Society of IT Services, Vol. 11, No.3, 2012, 191-203. 

  6. Kim, T., W. Jung, and S. Lee, "The Analysis on the Relationship between Firms' Exposures to SNS and Stock Prices in Korea", Asia Pacific Journal of Information Systems, Vol. 24, No.2, 2014, 233-253. 

  7. Kim, Y., "News Big Data Opinion Mining Model for Predicting KOSPI Movement", Ph.D. thesis, Graduate School of Business IT, Kookmin Univ., Seoul, Korea, 2013. 

  8. Kim, Y., N. Kim, and S. Jung, "Stock-Index Invest Model Using News Big Data Opinion Mining", Journal of Intelligence and Information Systems, Vol.18, No.2, 2012, 143-156. 

  9. Park, K. and H. Shin, "Stock Price Prediction Based on Time Series Network", Journal of the Korean Operations Research and Management Science Society, Vol.28, No.1, 2011, 53-60. 

  10. Sagong, J., "A Study on Predicting Stock Price Based on Data Mining Techniques", M.S. thesis, Dept. Data Science, Inje Univ., Gimhae, Korea, 2012. 

  11. Shim, K. and J. Yang, "High Speed Korean Morphological Analysis based on Adjacency Condition Check", Korean Institute of Information Scientists and Engineers, Vol.31, No.1, 2004, 89-99. 

  12. Song, C., "News and Financial Prices", International Economic Journal, Vol.8, No.3, 2002, 1-34. 

  13. Song, J. and S. Lee, "Automatic Construction of Positive/Negative Feature-Predicate Dictionary for Polarity Classification of Product Reviews", Korean Institute of Information Scientists and Engineers, Vol.38, No.3, 2011, 157-168. 

  14. Yu, E., Y. Kim, N. Kim, and S., Jeong, "Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary", Journal of Intelligence and Information Systems, Vol.19, No.1, 2013, 95-110. 

  15. Chun, S., "뉴스 콘텐츠의 오피니언 마이닝을 통한 매체별 주가상승 예측정확도 비교 연구", M. S. thesis, Graduate School of Business IT, Kookmin Univ., Seoul, Korea, 2013. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로