주가는 거래량, 종가 등과 같은 숫자 기반의 내부적인 요인뿐만 아니라 법, 유행 등 여러 외부요인에 의해 영향을 받는다. 수많은 요인이 주가에 영향을 미치기 때문에 단편적인 주식 데이터만을 이용한 정확한 주가 예측은 매우 어려운 일이다. 특히 기업의 가치는 실제 주식을 거래하는 사람들의 인식에 영향을 많이 받기 때문에 특정 기업에 대한 감성 정보가 중요한 요인으로 여겨진다. 본 논문에서는 시간적 특성을 고려한 뉴스 데이터의 감성 분석을 이용한 딥러닝 기반 주가 예측 모델을 제안하고자 한다. 주식과 뉴스 데이터, 서로 다른 특성을 가진 2개의 이종 데이터를 시간 크기에 따라 통합하여 모델의 입력으로 사용하며, 시간 크기와 감성 지표가 주가 예측에 미치는 영향에 대해 최종적으로 비교 및 분석한다. 또한 우리는 기존 모델과의 비교 실험을 통해 제안 모델의 정확성이 개선되었음을 검증한다.
주가는 거래량, 종가 등과 같은 숫자 기반의 내부적인 요인뿐만 아니라 법, 유행 등 여러 외부요인에 의해 영향을 받는다. 수많은 요인이 주가에 영향을 미치기 때문에 단편적인 주식 데이터만을 이용한 정확한 주가 예측은 매우 어려운 일이다. 특히 기업의 가치는 실제 주식을 거래하는 사람들의 인식에 영향을 많이 받기 때문에 특정 기업에 대한 감성 정보가 중요한 요인으로 여겨진다. 본 논문에서는 시간적 특성을 고려한 뉴스 데이터의 감성 분석을 이용한 딥러닝 기반 주가 예측 모델을 제안하고자 한다. 주식과 뉴스 데이터, 서로 다른 특성을 가진 2개의 이종 데이터를 시간 크기에 따라 통합하여 모델의 입력으로 사용하며, 시간 크기와 감성 지표가 주가 예측에 미치는 영향에 대해 최종적으로 비교 및 분석한다. 또한 우리는 기존 모델과의 비교 실험을 통해 제안 모델의 정확성이 개선되었음을 검증한다.
Stock prices are influenced by a number of external factors, such as laws and trends, as well as number-based internal factors such as trading volume and closing prices. Since many factors affect stock prices, it is very difficult to accurately predict stock prices using only fragmentary stock data....
Stock prices are influenced by a number of external factors, such as laws and trends, as well as number-based internal factors such as trading volume and closing prices. Since many factors affect stock prices, it is very difficult to accurately predict stock prices using only fragmentary stock data. In particular, since the value of a company is greatly affected by the perception of people who actually trade stocks, emotional information about a specific company is considered an important factor. In this paper, we propose a deep learning-based stock price prediction model using sentiment analysis with news data considering temporal characteristics. Stock and news data, two heterogeneous data with different characteristics, are integrated according to time scale and used as input to the model, and the effect of time scale and sentiment index on stock price prediction is finally compared and analyzed. Also, we verify that the accuracy of the proposed model is improved through comparative experiments with existing models.
Stock prices are influenced by a number of external factors, such as laws and trends, as well as number-based internal factors such as trading volume and closing prices. Since many factors affect stock prices, it is very difficult to accurately predict stock prices using only fragmentary stock data. In particular, since the value of a company is greatly affected by the perception of people who actually trade stocks, emotional information about a specific company is considered an important factor. In this paper, we propose a deep learning-based stock price prediction model using sentiment analysis with news data considering temporal characteristics. Stock and news data, two heterogeneous data with different characteristics, are integrated according to time scale and used as input to the model, and the effect of time scale and sentiment index on stock price prediction is finally compared and analyzed. Also, we verify that the accuracy of the proposed model is improved through comparative experiments with existing models.
시간의 흐름에 따라 구성된 주식 데이터와 감성 분석을 위해 사용된 뉴스 데이터는 서로 다른 형태의 데이터이기 때문에 딥러닝 주가 예측 모델을 학습시키기 위한 입력으로 넣기 위해서는 반드시 2개의 데이터를 통합하는 과정이 필요하다. 본 논문에서는 감성 지표를 이용하여 타임 스탬프 t에 대한 주가를 예측하기 위하여 활용할 이전 데이터의 양에 따라 예측 모델의 성능이 어떻게 달라지는지에 대해 연구한다.
본 연구의 제안하는 영향력 예측 모델은 웹 크롤링으로 온라인상에서 소비자들의 기업에 대한 인식에 대한 데이터를 수집하여 감성 분석을 진행한다. 최근 크게 발전한 딥러닝 기술을 활용하여 분석하고, 이를 기존의 정형화된 수치만을 사용한 예측 모델과 비교함으로써 소비자들의 기업 활동에 대한 인식률에 따라 기업의 주가가 어떻게 변화하는지 예상하고자 한다.
제안 방법
KOSPI 상위 50개 기업 중 네이버 경제 뉴스 기사 수가 가장 많았던 4개 기업을 대상으로 모델을 제작하였으며, 주가 지표는 일일 종가와 거래량을 사용하였다. 감성 지표는 4개 기업을 키워드로 네이버 뉴스 본문을 크롤링한 뒤 한국어 BERT 모델인 Pororo 를 사용하여 Summarization 작업을 수행함으로써 본문을 정제해주고, 이어서 Pororo의 감성 분석 작업을 통해 감성 정보를 추출하였다. 그리고 추출한 감성 정보와 크롤링한 뉴스 기사 수를 사용하여 감성 지표를 계산하였다.
감성 지표는 4개 기업을 키워드로 네이버 뉴스 본문을 크롤링한 뒤 한국어 BERT 모델인 Pororo 를 사용하여 Summarization 작업을 수행함으로써 본문을 정제해주고, 이어서 Pororo의 감성 분석 작업을 통해 감성 정보를 추출하였다. 그리고 추출한 감성 정보와 크롤링한 뉴스 기사 수를 사용하여 감성 지표를 계산하였다. 최종적으로 감성 지표를 변수로 추가하였을 경우 LSTM의 sequence size가 10일 때, 그리고 ResNet의 sequence size가 20일 때, 가장 큰 정확도 상승률을 보였다.
본 논문에서는 LSTM과 ResNet 모델을 이용해 감성 지표가 주가에 미치는 영향에 대해 분석한다. LSTM(Long Short-Term Memory) 모델은 은닉 계층에 과거 데이터에 대한 정보를 담고 있어 시계열 데이터의 학습에 적합한모델인 RNN 모델의 한 종류로 주가 예측에 많이 활용된다.
본 논문에서는 감성 분석을 활용하여 주가의 변화를 예측하는 딥러닝 모델을 구축하고 감성 지표의 영향을 비교 및 분석한다. 주가 예측을 위해서는 반드시 주가를 예측하고자 하는 기업에 대한 주가 정보가 필요할 뿐만 아니라 관련된 다양한 정보들이 필요하다.
하지만 부가적인 정보를 많이 포함하고 있어 핵심이 되는 내용만 찾아 감성 정보를 파악하기에는 어려움이 존재한다. 본 논문에서는 이러한 문제점을 해결하고 적절한 감성 지표를 추출하기 위해 기사의 본문을 요약하고, 요약된 핵심 문장들로부터 감성을 추출한다.
본 논문에서는 정형 데이터인 주가 정보 데이터와 비정형 데이터인 뉴스 데이터를 활용하여 딥러닝 모델 기반 주가 예측 모델에 감성 지표가 미치는 영향을 비교하고 그 결과를 분석하고자 한다. 주가 데이터와 뉴스 데이터를 수집하고, 수집된 데이터를 각각 전처리하여 감성 지표를 계산함으로써 주가 정보 예측이 가능한 모델을 구현한다.
특히 주식 거래는 사람이 관여하기 때문에 특정 기업에 대한 사람들의 인식과 같은 외부 요인들이 존재할 수 있다. 본 논문에서는 주식 데이터의 내부 요소들뿐만 아니라 외부 요소로 감성 지표를 주가 예측에 활용하고자 한다.
본 논문은 주가 등락률 예측 향상을 위해 딥러닝의 대표적인 모델인 RNN과 CNN계열 모델을 사용하여 주가 지표와 뉴스 감성 지표와의 효용성과 함께 효율적인 sequence size를 제시하였다. KOSPI 상위 50개 기업 중 네이버 경제 뉴스 기사 수가 가장 많았던 4개 기업을 대상으로 모델을 제작하였으며, 주가 지표는 일일 종가와 거래량을 사용하였다.
본 연구의 제안하는 영향력 예측 모델은 웹 크롤링으로 온라인상에서 소비자들의 기업에 대한 인식에 대한 데이터를 수집하여 감성 분석을 진행한다. 최근 크게 발전한 딥러닝 기술을 활용하여 분석하고, 이를 기존의 정형화된 수치만을 사용한 예측 모델과 비교함으로써 소비자들의 기업 활동에 대한 인식률에 따라 기업의 주가가 어떻게 변화하는지 예상하고자 한다.
본 논문에서는 정형 데이터인 주가 정보 데이터와 비정형 데이터인 뉴스 데이터를 활용하여 딥러닝 모델 기반 주가 예측 모델에 감성 지표가 미치는 영향을 비교하고 그 결과를 분석하고자 한다. 주가 데이터와 뉴스 데이터를 수집하고, 수집된 데이터를 각각 전처리하여 감성 지표를 계산함으로써 주가 정보 예측이 가능한 모델을 구현한다.
그림 1은 제안하는 모델의 전체적인 구조를 보여준다. 주가 데이터와 뉴스 데이터를 수집하는 데이터 크롤링, 모델에 학습시키기 위한 데이터 전처리, 그리고 감성 지표 분석과 이를 활용해 주가를 예측하는 딥러닝 모델로 구성된다. 다음에서는 각 구성요소에 대해 자세하게 설명하고자 한다.
대상 데이터
본 논문에서는 2021년 네이버 경제 뉴스에 가장 많이 언급된 상위 4개 기업인 SK 하이닉스, 삼성전자, 카카오, LG전자를 연구 대상으로 선정한다. 4개의 기업에 대해 2021년 1월 1일부터 2022년 4월 30일까지 뉴스 데이터와 주가 데이터를 크롤링하여 연구에 활용한다. 뉴스 데이터는 네이버 경제 뉴스에 게재된 본문을 Scrapy와 Newspaper 라이브러리를 사용하여 크롤링한다.
본 논문은 주가 등락률 예측 향상을 위해 딥러닝의 대표적인 모델인 RNN과 CNN계열 모델을 사용하여 주가 지표와 뉴스 감성 지표와의 효용성과 함께 효율적인 sequence size를 제시하였다. KOSPI 상위 50개 기업 중 네이버 경제 뉴스 기사 수가 가장 많았던 4개 기업을 대상으로 모델을 제작하였으며, 주가 지표는 일일 종가와 거래량을 사용하였다. 감성 지표는 4개 기업을 키워드로 네이버 뉴스 본문을 크롤링한 뒤 한국어 BERT 모델인 Pororo 를 사용하여 Summarization 작업을 수행함으로써 본문을 정제해주고, 이어서 Pororo의 감성 분석 작업을 통해 감성 정보를 추출하였다.
감성 지표를 이용한 딥러닝 주가 예측 분석 모델에 대한 연구를 위해 뉴스 데이터와 주가 데이터를 모두 사용하였다. 뉴스 데이터와 주가 데이터 모두 2021년 1월 1일부터 2022년 4월 30일까지 총 327일에 해당하는 데이터를 수집하였으며, 뉴스 데이터는 네이버 경제 뉴스에서 KOSPI 상위 50개 기업들에 대한 기사들을 수집하였다.
국내에 존재하는 수많은 기업 중, 주가 데이터와 뉴스 데이터의 충분한 연관성을 포함하기 위해 2021년 한 해 동안가장 언급이 많이 된 회사들을 선정하여 주가 예측 모델의 학습을 진행한다. 회사 선정을 위해 Requests와 BeautifulSoup 라이브러리와 함께 오픈소스인KoreanNewsCrawler[17]를 활용하여 2021년 1년 동안의 네이버 경제 뉴스[18]에서 KOSPI 상위 50개 기업들이 젝목에 언급된 뉴스를 모두 수집하였다.
우리는 소비자들의 기업에 대한 인식과 같은 기업에 대한 감성을 분석하고 주가예측 모델에 적용하고자 한다. 기업에 대한 주가 정보를알 수 있는 주가 데이터와 기업에 대한 감성 지표를 알 수있는 뉴스 데이터를 수집하고 활용한다.
4개의 기업에 대해 2021년 1월 1일부터 2022년 4월 30일까지 뉴스 데이터와 주가 데이터를 크롤링하여 연구에 활용한다. 뉴스 데이터는 네이버 경제 뉴스에 게재된 본문을 Scrapy와 Newspaper 라이브러리를 사용하여 크롤링한다. 뉴스 크롤링의 제한에 의해 각 기업별 1일 최대 120개의 뉴스 기사를 수집하도록 한정하여 최종적으로 총 134,036개의 뉴스 기사를 수집하였다.
주식에 영향을 미치는 여러 정보 중 당일 거래의 가장 마지막에 체결된 거래 가격인 종가와, 주식 시장에서 당일 주식이 거래된 총량을 의미하며 주가에 선행되는 특징이 있는 거래량 데이터를 주식 데이터로 활용하고자 한다. 뉴스 데이터를 수집한 기간과 동일한 총 327일 동안의 종가와 거래량 일별 데이터를 야후 파이낸스[19]에서 수집하고 모델 학습에 활용한다.
감성 지표를 이용한 딥러닝 주가 예측 분석 모델에 대한 연구를 위해 뉴스 데이터와 주가 데이터를 모두 사용하였다. 뉴스 데이터와 주가 데이터 모두 2021년 1월 1일부터 2022년 4월 30일까지 총 327일에 해당하는 데이터를 수집하였으며, 뉴스 데이터는 네이버 경제 뉴스에서 KOSPI 상위 50개 기업들에 대한 기사들을 수집하였다. 이 중 가장 많이 언급된 카카오, 삼성전자, LG전자, SK하이닉스를 선정하였다.
뉴스 데이터는 네이버 경제 뉴스에 게재된 본문을 Scrapy와 Newspaper 라이브러리를 사용하여 크롤링한다. 뉴스 크롤링의 제한에 의해 각 기업별 1일 최대 120개의 뉴스 기사를 수집하도록 한정하여 최종적으로 총 134,036개의 뉴스 기사를 수집하였다.
데이터의 수집 기간은 2021년 1월 1일부터 2022년 4월 30일까지 총 327일의 거래일을 기준으로 한다. 그림 2와 같이 2020년 코로나 팬데믹 이후 코스피 지수는 약 3개월간 폭락 기간을 거친 뒤 약 1년 동안 꾸준한 상승세를 보였다[15].
본 논문에서는 2021년 네이버 경제 뉴스에 가장 많이 언급된 상위 4개 기업인 SK 하이닉스, 삼성전자, 카카오, LG전자를 연구 대상으로 선정한다. 4개의 기업에 대해 2021년 1월 1일부터 2022년 4월 30일까지 뉴스 데이터와 주가 데이터를 크롤링하여 연구에 활용한다.
표 1은 기업별로 수집된 데이터에 대한 통계를 보여준다. 실험을 위해 총 128,311개의 뉴스 데이터와 1,308개의 주가 데이터를 활용한다. 실험에 사용되는 데이터의 수가 한정되어 있기 때문에 K-fold 교차검증을 사용하며, 이때 k 값은 4로 결정하여 진행한다.
뉴스 데이터와 주가 데이터 모두 2021년 1월 1일부터 2022년 4월 30일까지 총 327일에 해당하는 데이터를 수집하였으며, 뉴스 데이터는 네이버 경제 뉴스에서 KOSPI 상위 50개 기업들에 대한 기사들을 수집하였다. 이 중 가장 많이 언급된 카카오, 삼성전자, LG전자, SK하이닉스를 선정하였다. 주가 데이터는 야후 파이낸스에서 동일한 기간에 대한 일별 데이터를 수집하였다.
실험에 사용되는 데이터의 수가 한정되어 있기 때문에 K-fold 교차검증을 사용하며, 이때 k 값은 4로 결정하여 진행한다. 전체 데이터를 k개, 즉 4개로 나누어 한 번씩 검증 데이터로 사용하고 검증 데이터에 사용되지 않는 나머지 데이터를 훈련 데이터로 사용하여 모델을 검증한다.
이 중 가장 많이 언급된 카카오, 삼성전자, LG전자, SK하이닉스를 선정하였다. 주가 데이터는 야후 파이낸스에서 동일한 기간에 대한 일별 데이터를 수집하였다.
주식 시장은 변동이 크고 다양한 요소들이 주식 가격 결정에 많은 영향을 미치기 때문에 정확한 예측이 어렵다. 주식에 영향을 미치는 여러 정보 중 당일 거래의 가장 마지막에 체결된 거래 가격인 종가와, 주식 시장에서 당일 주식이 거래된 총량을 의미하며 주가에 선행되는 특징이 있는 거래량 데이터를 주식 데이터로 활용하고자 한다. 뉴스 데이터를 수집한 기간과 동일한 총 327일 동안의 종가와 거래량 일별 데이터를 야후 파이낸스[19]에서 수집하고 모델 학습에 활용한다.
국내에 존재하는 수많은 기업 중, 주가 데이터와 뉴스 데이터의 충분한 연관성을 포함하기 위해 2021년 한 해 동안가장 언급이 많이 된 회사들을 선정하여 주가 예측 모델의 학습을 진행한다. 회사 선정을 위해 Requests와 BeautifulSoup 라이브러리와 함께 오픈소스인KoreanNewsCrawler[17]를 활용하여 2021년 1년 동안의 네이버 경제 뉴스[18]에서 KOSPI 상위 50개 기업들이 젝목에 언급된 뉴스를 모두 수집하였다. 그림 3은 제목에 기업이 언급된 뉴스의 수를 통계 낸 결과를 보여준다.
데이터처리
실험을 위해 총 128,311개의 뉴스 데이터와 1,308개의 주가 데이터를 활용한다. 실험에 사용되는 데이터의 수가 한정되어 있기 때문에 K-fold 교차검증을 사용하며, 이때 k 값은 4로 결정하여 진행한다. 전체 데이터를 k개, 즉 4개로 나누어 한 번씩 검증 데이터로 사용하고 검증 데이터에 사용되지 않는 나머지 데이터를 훈련 데이터로 사용하여 모델을 검증한다.
이론/모형
2로, 1000 epoch을 통해 훈련을 진행 하며, ResNet 모델은 500epoch를 사용하였다. 2개의 모델을 사용한 주가 예측 모델은 모두 평균 제곱근 편차 (RMSE: Root Mean Square Error)를 손실 함수로 사용하였으며, 정규화를 위해 1e-5의 L2 정규화를 적용한다. 또한 learning rate scheduler를 사용하여 매 epoch마다 0.
감성 지표를 이용한 딥러닝 기반 주가 예측 모델을 연구하기 위해 LSTM과 ResNet을 사용한다. 모델의 입력 변수로는 종가, 거래량의 주가 지표 2개와 감성 지표 1개가 사용된다.
뉴스 데이터의 제목과 본문 내용을 요약하고 감성을 추출하기 위해 KakaoBrain의 Pororo[20] 모델을 사용한다. Pororo는 Platform Of neuRal mOdels for natuRal language prOcessing의 약자로 자연어처리 오픈 소스이 며, 자연어 처리와 음성에 관련된 여러 태스크를 수행한다.
기술적 분석의 전략은 차트를 통해 대중의 매수, 매도 심리를 역이용하여 주식시장에서 수익을 얻는 것이다[21]. 본 논문에서는 CNN계열 모델을 사용하여 차트를 통해 주가의 변동 패턴을 찾아내고자 하였고 CNN 계열 모델로는ResNet을 사용한다.
성능/효과
이어서 표 3은 감정 지표를 사용했을 때의 loss와 정확도 증가율을 비교한 표이다. 감성 지표를 변수로 포함하여 모델을 훈련시켰을 경우, LSTM의 평균 loss는 약 0.7% 감소하였으며 평균 정확도는 약 0.06% 증가하였다. ResNet의 경우 평균 loss가 약 5% 증가하였지만, 평균 정확도는 약 2.
9%만큼 더 높게 나타났다. 감정 지표를 사용한 모델의 정확도 또한 LSTM이 평균 약 49.6%, ResNet이 약 51.7%로 ResNet의 정확도가 더 높게 나타났다. 반면 loss 값의 경우 LSTM이 감정 지표를 사용하지않았을 때와 감정 지표를 사용하였을 때를 비교해보면 각각 2.
또한 LSTM의 경우 sequence size가 10일 때 약 1.56%, ResNet의 경우 sequence size가 20일 때 약 5% 로 정확도 상승률이 가장 크게 나타났음을 확인할 수 있 다. 이는 모델의 구조에 따라 알맞은 sequence size가 다름을 확인할 수 있다.
본 논문에서 진행한 연구를 통해 포괄적으로 대중의 인식을 반영하는 감정 지표를 제시하였다는 점과 주가 지표와 감정 지표에서 가장 효과적으로 패턴을 추출할 수 있는 sequence size를 제시했다는 것이다. 하지만, 실험에서 4 개 기업만을 사용하여 상관관계를 추종하였기 때문에 통계적 신뢰도가 떨어진다는 점이 있으며, 다양한 주가 지표 중 종가와 거래량만을 사용하였기 때문에 국제 금값, 유가, 환율 등과 같은 다른 거시적 지표는 고려하지 못하였다는 한계점이 존재한다.
7% 증가하였음을 확인할 수 있다. 이는 주가와 감정 지표 사이의 복잡한 비선형적 패턴을 LSTM이 충분히 추출하지 못했고, ResNet이 금융 시장의 패턴 추출에 더 뛰어난 성능을 가진다고 생각된다.
표 2는 sequence size에 따른 모델별 loss와 정확도를 비교한 결과이다. 주가 지표만을 사용한 모델의 정확도는 LSTM이 평균 약 49.6%, ResNet이 약 50.5%로 ResNet 의 정확도가 약 0.9%만큼 더 높게 나타났다. 감정 지표를 사용한 모델의 정확도 또한 LSTM이 평균 약 49.
그리고 추출한 감성 정보와 크롤링한 뉴스 기사 수를 사용하여 감성 지표를 계산하였다. 최종적으로 감성 지표를 변수로 추가하였을 경우 LSTM의 sequence size가 10일 때, 그리고 ResNet의 sequence size가 20일 때, 가장 큰 정확도 상승률을 보였다.
후속연구
따라서 향후 연구로 더 다양한 기업들과 지표들을 추가한 모델을 분석함으로써 본 논문의 한계점을 보완해 나갈 예정이다.
본 논문에서 진행한 연구를 통해 포괄적으로 대중의 인식을 반영하는 감정 지표를 제시하였다는 점과 주가 지표와 감정 지표에서 가장 효과적으로 패턴을 추출할 수 있는 sequence size를 제시했다는 것이다. 하지만, 실험에서 4 개 기업만을 사용하여 상관관계를 추종하였기 때문에 통계적 신뢰도가 떨어진다는 점이 있으며, 다양한 주가 지표 중 종가와 거래량만을 사용하였기 때문에 국제 금값, 유가, 환율 등과 같은 다른 거시적 지표는 고려하지 못하였다는 한계점이 존재한다.
참고문헌 (21)
B. G. Malkiel, "Efficient market hypothesis," The New Palgrave: Finance. Norton, New York, pp. 127-134, 1989.
S. Mohan, S. Mullapudi, S. Sammeta, P. Vijayvergia and D. C. Anastasiu, "Stock Price Prediction Using News Sentiment Analysis," 2019 IEEE Fifth International Conference on Big Data Computing Service and Applications (BigDataService), pp. 205-208, 2019.
Gite S, Khatavkar H, Kotecha K, Srivastava S, Maheshwari P, Pandey N. "Explainable stock prices prediction from financial news articles using sentiment analysis," PeerJ Computer Science 7:e340, 2021.
X. Li, H. Xie, Y. Song, S. Zhu, Q. Li and F. L. Wang, "Does summarization help stock prediction? a news impact analysis," IEEE Intelligent Systems, Vol. 30, No. 3, pp. 26-34, 2015.
D. Duong, T. Nguyen and M. Dang, "Stock market prediction using financial news articles on ho chi minh stock exchange," Proceedings of the 10th International Conference on Ubiquitous Information Management and Communication ser. IMCOM '16, pp. 71:1-71:6, 2016.
Y. Wang, D. Seyler, S. K. K. Santu and C. Zhai, "A study of feature construction for text-based forecasting of time series variables," Proceedings of the 2017 ACM on Conference on Information and Knowledge Management ser. CIKM '17, pp. 2347-2350, 2017.
H. White, "Economic Prediction Using Neural Networks: The Case of IBM Daily Stock Returns, ser. Discussion paper-" Department of Economics University of California San Diego. Department of Economics, University of California, 1988.
E. Hoseinzade and S. Haratizadeh, "CNNpred: CNN-based stock market prediction using a diverse set of variables," Expert Systems with Applications, Vol. 129, pp. 273-285, 2019.
Guo, Baicun. "Research on Stock Price Forecast based on Resnet and LSTM," Frontiers in Economics and Management, Vol. 3, No. 5, pp. 161-167, 2022.
K. A. Althelaya, E.-S. M. El-Alfy, and S. Mohammed, "Evaluation of Bidirectional LSTM for Short and Long-Term Stock Market Prediction," Proc. of the 9th International Conference on Information and Communication Systems, pp. 151-156, 2018.
Yao, Yifan, and Lina Wang. "Combination of window-sliding and prediction range method based on LSTM model for predicting cryptocurrency," arXiv preprint arXiv:2102.05448, 2021.
Schumaker, Robert P., and Hsinchun Chen. "Textual analysis of stock market prediction using breaking financial news: The AZFin text system," ACM Transactions on Information Systems (TOIS), Vol.27, No. 2, pp. 1-19, 2009.
Tetlock, Paul C., Maytal Saar-Tsechansky, and Sofus Macskassy. "More than words: Quantifying language to measure firms' fundamentals," The journal of finance Vol. 63, No. 3, pp. 1437-1467. 2008.
Google Finance, https://www.google.com/finance/quote/KOSPI:KRX?hlko
N. V. Chawla, N. Japkowicz and A. Kolcz, "Editorial: Special issue on learning from imbalanced data sets," ACM SIGKDD Explor. Newslett., Vol. 6, No. 1, pp. 1-6, 2004.
Seungwoo Kim, "Can You Beat the Market? Characterizing the Market and a History of Investment Methods in the 20th Century," Critical Review of History, No. 138, pp. 8-35, 2022.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.