투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.
투자자들은 기업의 내재가치 분석, 기술적 보조지표 분석 등 복잡한 분석보다 차트(chart)에 나타난 그래프(graph)의 모양으로 매매 시점을 찾는 직관적인 방법을 더 선호하는 편이다. 하지만 패턴(pattern) 분석 기법은 IT 구현의 난이도 때문에 사용자들의 요구에 비해 전산화가 덜 된 분야로 여겨진다. 최근에는 인공지능(artificial intelligence, AI) 분야에서 신경망을 비롯한 다양한 기계학습(machine learning) 기법을 사용하여 주가의 패턴을 연구하는 사례가 많아졌다. 특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다. 본 연구는 주가 예측력이 있는 패턴을 찾으려는 기존 연구 방법과 달리 패턴들을 먼저 정의해 놓고 확률기반으로 선택해서 매매하는 방법을 제안한다. 5개의 전환점으로 정의한 Merrill(1980)의 M&W 파동 패턴은 32가지의 패턴으로 시장 국면 대부분을 설명할 수 있다. 전환점만으로 패턴을 분류하기 때문에 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있다. 32개 패턴으로 만들 수 있는 조합의 수는 전수 테스트가 불가능한 수준이다. 그래서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘(algorithm) 중 하나인 유전자 알고리즘(genetic algorithm, GA)을 이용하였다. 그리고 미래의 주가가 과거를 반영한다 해도 같게 움직이지 않기 때문에 전진 분석(walk-forward analysis, WFA)방법을 적용하여 과최적화(overfitting)의 실수를 줄이도록 하였다. 20종목씩 6개의 포트폴리오(portfolio)를 구성하여 테스트해 본 결과에 따르면 패턴 매매에서 가격 변동성이 어느 정도 수반되어야 하며 패턴이 진행 중일 때보다 패턴이 완성된 후에 진입, 청산하는 것이 효과적임을 확인하였다.
Investors prefer to look for trading points based on the graph shown in the chart rather than complex analysis, such as corporate intrinsic value analysis and technical auxiliary index analysis. However, the pattern analysis technique is difficult and computerized less than the needs of users. In re...
Investors prefer to look for trading points based on the graph shown in the chart rather than complex analysis, such as corporate intrinsic value analysis and technical auxiliary index analysis. However, the pattern analysis technique is difficult and computerized less than the needs of users. In recent years, there have been many cases of studying stock price patterns using various machine learning techniques including neural networks in the field of artificial intelligence(AI). In particular, the development of IT technology has made it easier to analyze a huge number of chart data to find patterns that can predict stock prices. Although short-term forecasting power of prices has increased in terms of performance so far, long-term forecasting power is limited and is used in short-term trading rather than long-term investment. Other studies have focused on mechanically and accurately identifying patterns that were not recognized by past technology, but it can be vulnerable in practical areas because it is a separate matter whether the patterns found are suitable for trading. When they find a meaningful pattern, they find a point that matches the pattern. They then measure their performance after n days, assuming that they have bought at that point in time. Since this approach is to calculate virtual revenues, there can be many disparities with reality. The existing research method tries to find a pattern with stock price prediction power, but this study proposes to define the patterns first and to trade when the pattern with high success probability appears. The M & W wave pattern published by Merrill(1980) is simple because we can distinguish it by five turning points. Despite the report that some patterns have price predictability, there were no performance reports used in the actual market. The simplicity of a pattern consisting of five turning points has the advantage of reducing the cost of increasing pattern recognition accuracy. In this study, 16 patterns of up conversion and 16 patterns of down conversion are reclassified into ten groups so that they can be easily implemented by the system. Only one pattern with high success rate per group is selected for trading. Patterns that had a high probability of success in the past are likely to succeed in the future. So we trade when such a pattern occurs. It is a real situation because it is measured assuming that both the buy and sell have been executed. We tested three ways to calculate the turning point. The first method, the minimum change rate zig-zag method, removes price movements below a certain percentage and calculates the vertex. In the second method, high-low line zig-zag, the high price that meets the n-day high price line is calculated at the peak price, and the low price that meets the n-day low price line is calculated at the valley price. In the third method, the swing wave method, the high price in the center higher than n high prices on the left and right is calculated as the peak price. If the central low price is lower than the n low price on the left and right, it is calculated as valley price. The swing wave method was superior to the other methods in the test results. It is interpreted that the transaction after checking the completion of the pattern is more effective than the transaction in the unfinished state of the pattern. Genetic algorithms(GA) were the most suitable solution, although it was virtually impossible to find patterns with high success rates because the number of cases was too large in this simulation. We also performed the simulation using the Walk-forward Analysis(WFA) method, which tests the test section and the application section separately. So we were able to respond appropriately to market changes. In this study, we optimize the stock portfolio because there is a risk of over-optimized if we implement the variable optimality for each individual stock. Therefore, we selected the number of constituent stocks as 20 to increase th
Investors prefer to look for trading points based on the graph shown in the chart rather than complex analysis, such as corporate intrinsic value analysis and technical auxiliary index analysis. However, the pattern analysis technique is difficult and computerized less than the needs of users. In recent years, there have been many cases of studying stock price patterns using various machine learning techniques including neural networks in the field of artificial intelligence(AI). In particular, the development of IT technology has made it easier to analyze a huge number of chart data to find patterns that can predict stock prices. Although short-term forecasting power of prices has increased in terms of performance so far, long-term forecasting power is limited and is used in short-term trading rather than long-term investment. Other studies have focused on mechanically and accurately identifying patterns that were not recognized by past technology, but it can be vulnerable in practical areas because it is a separate matter whether the patterns found are suitable for trading. When they find a meaningful pattern, they find a point that matches the pattern. They then measure their performance after n days, assuming that they have bought at that point in time. Since this approach is to calculate virtual revenues, there can be many disparities with reality. The existing research method tries to find a pattern with stock price prediction power, but this study proposes to define the patterns first and to trade when the pattern with high success probability appears. The M & W wave pattern published by Merrill(1980) is simple because we can distinguish it by five turning points. Despite the report that some patterns have price predictability, there were no performance reports used in the actual market. The simplicity of a pattern consisting of five turning points has the advantage of reducing the cost of increasing pattern recognition accuracy. In this study, 16 patterns of up conversion and 16 patterns of down conversion are reclassified into ten groups so that they can be easily implemented by the system. Only one pattern with high success rate per group is selected for trading. Patterns that had a high probability of success in the past are likely to succeed in the future. So we trade when such a pattern occurs. It is a real situation because it is measured assuming that both the buy and sell have been executed. We tested three ways to calculate the turning point. The first method, the minimum change rate zig-zag method, removes price movements below a certain percentage and calculates the vertex. In the second method, high-low line zig-zag, the high price that meets the n-day high price line is calculated at the peak price, and the low price that meets the n-day low price line is calculated at the valley price. In the third method, the swing wave method, the high price in the center higher than n high prices on the left and right is calculated as the peak price. If the central low price is lower than the n low price on the left and right, it is calculated as valley price. The swing wave method was superior to the other methods in the test results. It is interpreted that the transaction after checking the completion of the pattern is more effective than the transaction in the unfinished state of the pattern. Genetic algorithms(GA) were the most suitable solution, although it was virtually impossible to find patterns with high success rates because the number of cases was too large in this simulation. We also performed the simulation using the Walk-forward Analysis(WFA) method, which tests the test section and the application section separately. So we were able to respond appropriately to market changes. In this study, we optimize the stock portfolio because there is a risk of over-optimized if we implement the variable optimality for each individual stock. Therefore, we selected the number of constituent stocks as 20 to increase th
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 상승전환과 하락전환으로 정의된 32개 패턴을 10개 그룹으로 나누고 확률기반으로 선택하여 매매하는 방법을 실험하였다. 과거 성공률이 높았던 패턴이 미래에도 성공 확률이 높을 것이라 보고 해당 패턴이 발생했을 때 진입과 청산이 이루어지도록 한 것이다. 진입과 청산을 모두 반영해서 측정했기 때문에 실제 상황에 가깝다.
이러한 경우가 과최적화이며 다음 OOS 구간에 거래가 발생하지 않을 수 있다. 그러므로 일부 종목의 매매 결과에 편중되지 않도록 포트폴리오 구성 종목 수의 2/3에서 매매가 발생하는지 확인하는 로직을 반영하였다.
본 논문에서는 패턴을 이용한 전략의 유용성을 검증하기 위해 M&W 파동 패턴을 근간으로 20종목으로 구성된 포트폴리오를 운용했을 때의 성과 분석을 제시하였다.
본 연구는 주식 포트폴리오 시스템에 적용하고자 최소 20종목에 대해 최적화를 실시하였다. 개별 종목마다 따로 변수 최적화를 하면 과최적화의 우려가 크므로 과최적화를 피하면서 분산투자의 효과를 높이기 위해 구성 종목 수를 20으로 선정하였다.
본 연구에서 인용하고 있는 Merrill의 M&W파동 패턴 분류방법도 패턴별로 발생빈도와 성공 확률, 그리고 상승률과 하락률을 조사해서 가격 예측력이 높은 패턴을 찾는 게 목적이다.
가설 설정
이렇게 의미 있는 패턴이 찾아지면 해당 패턴과 일치하는 시점을 또 찾는다. 그리고 해당 시점에 진입했다고 가정하고 n 일이 지났을 때의 성과를 측정한다. 이러한 접근법은 가상의 수익을 계산하는 것이기 때문에 현실과 많은 괴리가 발생할 수 있다.
제안 방법
강세장에서 M자 패턴이 나오면 하락의 시작으로 볼 수 있다고 하였다. 1898년부터 다우존스 산업에서 5% 필터를 적용한 전환점을 모두 찾아 분석했으며 패턴마다 발생빈도와 패턴 발생 후 평균 상승률, 평균 하락률을 측정하여 패턴의 유용성을 보여주었다. 1984년에 추가로 발표한 자료에서는 상승 확률과 하락 확률을 다루었다.
2장에서는 본 연구의 주제인 M&W 파동 패턴과 최적화 방법으로 유전자 알고리즘 및 전진 분석에 관한 기존 연구를 검토하고자 한다.
8개의 유전자 개체를 순서대로 10진수로 환원하여 입력변수 목록을 만든 다음 앞서 설명한 매매전략으로 시뮬레이션을 수행한다. 20종목의 시뮬레이션이 완료되면 총손익을 합산하여 번호대로 저장하고 순위를 매긴다.
IS 구간에 GA로 찾은 최적 변수를 OOS 구간에 적용하여 나온 매매 결과들을 연결하여 최종수익률과 최대손실률 등을 계산하였다. OOS 구간의 예상 수익을 정확히 계산하기 위해 매 OOS 구간 종료일 다음 날의 시가에 청산하도록 처리하였다.
IS 구간에 GA로 찾은 최적 변수를 OOS 구간에 적용하여 나온 매매 결과들을 연결하여 최종수익률과 최대손실률 등을 계산하였다. OOS 구간의 예상 수익을 정확히 계산하기 위해 매 OOS 구간 종료일 다음 날의 시가에 청산하도록 처리하였다.
WFA가 반영된 결과를 측정하기 전에 2015년부터 2017년까지 GA에 의한 백테스트 결과와 보유 수익률을 먼저 비교해 보았다. 논리적으로 WFA의 수익률은 백테스트의 수익률보다 높게 나올 수 없다.
종목 선정 기준은 시가총액, 일간 변동성, KOSPI200 지수와의 베타(Beta) 3가지로 하였다. 각 기준에 따라 상위 20종목, 하위 20종목을 추출하여 총 6개 포트폴리오로 나누어 테스트하였으며 포트폴리오 간에 종목이 겹치는 것은 인정하였다. 우선주는 제외하고 보통주만을 대상으로 순위를 매겼으며 시가총액은 한국거래소 홈페이지의 2014년 12월 29일 자 자료를 참조하였다.
본 연구는 주식 포트폴리오 시스템에 적용하고자 최소 20종목에 대해 최적화를 실시하였다. 개별 종목마다 따로 변수 최적화를 하면 과최적화의 우려가 크므로 과최적화를 피하면서 분산투자의 효과를 높이기 위해 구성 종목 수를 20으로 선정하였다. 종목 수를 늘리면 GA와 WFA 테스트에 걸리는 시간도 따라서 증가하기 때문에 성능적인 측면도 고려하였다.
비용 대비 효과를 고려하여 1종목씩 고정금액의 수익을 계산한 다음 마지막에 전체 수익으로 비교하는 방법을 택하였다. 고정금액 방식으로 계산된 매매 결과는 시뮬레이션이 끝나면 별도의 모듈을 통해 누적금액 방식으로 재계산하였다. 이렇게 누적금액 방식으로 평가하여야 선택의 오류를 줄일 수 있다.
IS 구간에서 매수신호가 발생해서 그대로 매수 포지션을 유지했으면 수익이 발생했을 상황인데 구간을 잘라서 테스트하는 바람에 기회를 놓치고 있다. 그래서 IS 구간 종료일까지 매수 포지션을 유지하고 있으면 그다음 이어지는 OOS 구간 시작일의 시가에 재진입하도록 처리하였다.
GA를 사용하여 최적화할 경우 난수를 이용하기 때문에 실행할 때마다 결괏값이 달라진다는 단점이 있다. 그래서 포트폴리오별로 지그재그 방식 3개에 대해 5회씩 반복해서 실험해 보았다. 최적 매개변수의 값이 다르게 나오더라도 전반적으로 최종 수익이 단순 보유 전략의 수익보다 높게 나오고 있어 GA를 이용한 최적화 과정이 유효했다고 볼 수 있다.
1순위 유전자의 형질이 더 많이 살아남도록 1순위 유전자를 꼴찌 유전자에 복제하여 1순위 유전자 개체를 두 개로 만든다. 높은 순위 유전자와 낮은 순위 유전자 2개씩 조합하여 부모 쌍을 4개 만들고, 부모 쌍으로 유전자 교환을 수행한다.
방법은 매매 전략을 표본 내 데이터(in-sample data, IS)로 최적화한 다음 그 매개변수를 그대로 표본 외 데이터(out-of-sample data, OOS)에 적용해 봄으로써 미래에도 여전히 신뢰할 만한 성과를 낼 수 있는지 검증한다.
정보비율은 주로 펀드 평가에서 사용되며 초과 수익률은 펀드 수익률에서 벤치마크 수익률(benchmark rate)을 뺀 값이다. 본 실험 분석에서 벤치마크 수익률을 단순 보유 전략의 수익률로 보았다.
32개 패턴이 모두 유효한 것이 아니므로 매매에 이용하려면 수익이 나는 패턴을 선별해야 한다. 본 연구에서는 Merrill의 패턴 분류를 재해석하여 비슷한 패턴끼리 묶은 후 매매 알고리즘을 설계하였다. 먼저, 4개의 전환점으로 표현할 수 있는 패턴을 찾아보면 총 10개이다[Figure 6].
본 연구에서는 상승전환과 하락전환으로 정의된 32개 패턴을 10개 그룹으로 나누고 확률기반으로 선택하여 매매하는 방법을 실험하였다. 과거 성공률이 높았던 패턴이 미래에도 성공 확률이 높을 것이라 보고 해당 패턴이 발생했을 때 진입과 청산이 이루어지도록 한 것이다.
본 연구에서는 종목별로 시가, 고가, 저가, 종가 가격 데이터를 날짜순으로 읽어 가면서 M자 패턴이 나오면 사고, W자 패턴이 나오면 파는 것을 기본 전략으로 한다. 적용할 패턴과 버릴 패턴의 조합을 GA 최적화로 찾았으며 WFA를 통해 시장이 변해도 최적화를 통해 지속해서 수익을 내는지 점검하였다.
그러나 연산이 복잡해져 처리시간이 길어지는 단점이 있다. 비용 대비 효과를 고려하여 1종목씩 고정금액의 수익을 계산한 다음 마지막에 전체 수익으로 비교하는 방법을 택하였다. 고정금액 방식으로 계산된 매매 결과는 시뮬레이션이 끝나면 별도의 모듈을 통해 누적금액 방식으로 재계산하였다.
, 2004). 샤프 비율은 펀드 평가에서도 사용되는데 포트폴리오의 평균 수익률에서 무위험 자산의 평균 수익률을 뺀 초과 수익률을 포트폴리오의 표준편차로 나눠서 구한다. 여기서는 수익 곡선의 선형성을 비교하기 위함이므로 무위험 자산의 평균 수익률은 고려치 않고 계산했으며 샤프 비율로 비교하면 시가총액 하위 종목 포트폴리오의 수익이 더 안정적이었다[Table 3].
유전자 교차 방식은 여러 방식이 있는데 본 연구에서는 여러 개의 유전자를 일제히 교환하는 다점 교차 방식을 사용하였으며 교차점은 3개로 하였다. 교차 후 각 변수는 새로운 값을 가지는데 2진수로 구성되어 있으므로 일부는 변수의 범위를 벗어나는 경우가 있다.
모든 패턴을 전고점, 전저점이라 불리는 5개의 전환점으로 구분하는 단순함과 특정 패턴들에서 가격 예측력을 발견했다는 결과 보고가 있음에도 불구하고 실제 시장에서 활용한 성과 보고가 없었다. 이에 본 연구에서는 Merrill의 상승전환, 하락전환 32가지 패턴 분류를 시스템으로 구현하기 쉽게 10개 그룹으로 재해석하였으며 그룹마다 확률기반으로 1개 패턴만 선택해서 매매하는 방법을 제안한다. 특히 5점 패턴의 단순함은 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있는 장점이 있다.
본 연구에서는 종목별로 시가, 고가, 저가, 종가 가격 데이터를 날짜순으로 읽어 가면서 M자 패턴이 나오면 사고, W자 패턴이 나오면 파는 것을 기본 전략으로 한다. 적용할 패턴과 버릴 패턴의 조합을 GA 최적화로 찾았으며 WFA를 통해 시장이 변해도 최적화를 통해 지속해서 수익을 내는지 점검하였다. 파이썬(Python)으로 개발하였으며, 시뮬레이터의 처리순서는 WFA 모듈(module)에서 GA 모듈을 실행시키고 GA 모듈 중 적응도 평가 단계에서 매매전략에 해당하는 모듈을 실행시키게 되어 있다[Figure 4].
본 논문에서는 패턴을 이용한 전략의 유용성을 검증하기 위해 M&W 파동 패턴을 근간으로 20종목으로 구성된 포트폴리오를 운용했을 때의 성과 분석을 제시하였다. 전환점의 배열을 인지하기 위해 3가지 지그재그 방식으로 테스트했으며 매개 변수 최적화는 GA를 이용하였고 매매전략의 견고함을 측정하기 위해 WFA를 사용하였다.
종목 선정 기준은 시가총액, 일간 변동성, KOSPI200 지수와의 베타(Beta) 3가지로 하였다. 각 기준에 따라 상위 20종목, 하위 20종목을 추출하여 총 6개 포트폴리오로 나누어 테스트하였으며 포트폴리오 간에 종목이 겹치는 것은 인정하였다.
적용할 패턴과 버릴 패턴의 조합을 GA 최적화로 찾았으며 WFA를 통해 시장이 변해도 최적화를 통해 지속해서 수익을 내는지 점검하였다. 파이썬(Python)으로 개발하였으며, 시뮬레이터의 처리순서는 WFA 모듈(module)에서 GA 모듈을 실행시키고 GA 모듈 중 적응도 평가 단계에서 매매전략에 해당하는 모듈을 실행시키게 되어 있다[Figure 4].
WFA에서 IS와 OOS의 기간을 어떻게 설정하느냐에 따라 전체 수익의 결과도 많은 차이를 보인다. 현실적으로 테스트를 무한정 할 수 없으므로 전체 수행 시간을 고려하여 [Table 1]처럼 12가지로 테스트해 보았다.
특히 5점 패턴의 단순함은 패턴 인식의 정확도를 높이기 위해 드는 비용을 줄일 수 있는 장점이 있다. 확률기반의 선택 방법은 유전자 알고리즘을 이용하며 미래 수익에 대한 확신을 높이기 위해 다양한 기간의 전진 분석을 수행하였다.
대상 데이터
이미 성과가 좋은 종목들이기 때문에 웬만한 전략으로 백테스팅을 하더라도 어느 정도 수익이 발생하게 되어 있다. 그래서 매매 시작을 2015년 1월 2일부터로 정하고 그 전날 기준으로 종목들을 선택하였다. 변동성과 베타 역시 2012년부터 2014년까지 3년 동안의 값을 기준으로 삼았다.
본 연구에서 유전자 개체는 8개로 하였으며 M&W 파동 패턴 전략에 사용되는 변수와 강제 청산 전략에 사용되는 변수까지 최적화 대상으로 하였다. 변수마다 값의 범위가 넓지 않기 때문에 8바이트(byte)의 2진수로 변환하여 사용하였다.
본 연구에서 유전자 개체는 8개로 하였으며 M&W 파동 패턴 전략에 사용되는 변수와 강제 청산 전략에 사용되는 변수까지 최적화 대상으로 하였다.
각 기준에 따라 상위 20종목, 하위 20종목을 추출하여 총 6개 포트폴리오로 나누어 테스트하였으며 포트폴리오 간에 종목이 겹치는 것은 인정하였다. 우선주는 제외하고 보통주만을 대상으로 순위를 매겼으며 시가총액은 한국거래소 홈페이지의 2014년 12월 29일 자 자료를 참조하였다.
데이터처리
전략의 우수성보다 종목 선정의 운이 좋았던 것으로 해석될 수 있으므로 결과에 대해 정보비율(information ratio, IR)3)을 비교해 보았다. 정보비율은 주로 펀드 평가에서 사용되며 초과 수익률은 펀드 수익률에서 벤치마크 수익률(benchmark rate)을 뺀 값이다.
이론/모형
Merrill은 1980년 자료에서 5% 변동률 필터를 사용하였고 1984년 자료에서 10% 필터를 사용하였다. [Figure 5]에서 (a) 최소변동률 지그재그(minimum change rate zig-zag) 파동이 이 방법이며 엘리엇 파동 이론(Elliott Wave Principle)에서 파동을 셀 때도 이 방법이 사용되었다(Hill, 2010). 전환점을 판별하는 방법은 이외에도 몇 가지 더 있는데 계산방식에 따라서도 매매 결과가 많이 달라진다.
세대교체에서 유전자 선택법은 엘리트(elite) 보존 방식을 적용하였다. 1순위 유전자의 형질이 더 많이 살아남도록 1순위 유전자를 꼴찌 유전자에 복제하여 1순위 유전자 개체를 두 개로 만든다.
성능/효과
(2002)는 지식공학(knowledge engineering)과 데이터 마이닝(data mining)을 이용하여 강세 깃발(bull flags) 패턴을 찾으려 하였다. 10 X 10 격자에 120일(다른 연구자료에서는 60일)간의 데이터를 10%씩 잘라서 배치하는 방법으로 Bull Flags Pattern을 인식하도록 하였으며 NYSE Composite Index에 적용하여 효과가 있음을 입증하였다. 국내에서는 Lee and Han(2003)이 같은 방법으로 60일 데이터를 한 단위로 하여 5가지의 변형된 매수 패턴과 역시 5개의 매도 패턴을 정의했으며 KOSPI200 지수에 적용하여 매수 패턴 발생 후 20일 후 청산, 매도 패턴 발생 후 20일 후 청산하는 방식으로 기대 수익률을 계산하였다.
이는 패턴이 진행 중일 때 진입, 청산하는 것보다 패턴 완성을 확인하고 진입, 청산하는 것이 효과적이라 보인다. 6개의 종목군으로 나눠서 실험한 결과에서 시가총액 하위 종목의 포트폴리오가 가장 성과가 좋았으며 변동성 상위 종목의 포트폴리오가 두 번째로 좋았다. 이는 차트상 패턴이 만들어지려면 어느 정도의 가격 움직임이 있어야 하지만 변동성이 클수록 더 좋은 것은 아니라는 것을 보여준다.
Merrill의 M&W 파동 패턴 분류 방법을 사용한 이유는 5개의 전환점으로 거의 모든 패턴을 설명할 수 있는 단순함 때문이며 결과적으로 패턴을 정교하게 찾지 않아도 됨을 확인하였다.
성공률이 높은 패턴을 찾기 위해 현실적으로 전수 테스트가 불가능했으나 GA는 가장 적합한 해결 방법이었다. 또한, 테스트 구간과 적용 구간을 달리하는 WFA 기법을 적용하였기 때문에 시장 변화에 적절히 대응할 수 있었다.
Merrill의 M&W 파동 패턴 분류 방법을 사용한 이유는 5개의 전환점으로 거의 모든 패턴을 설명할 수 있는 단순함 때문이며 결과적으로 패턴을 정교하게 찾지 않아도 됨을 확인하였다. 성공률이 높은 패턴을 찾기 위해 현실적으로 전수 테스트가 불가능했으나 GA는 가장 적합한 해결 방법이었다. 또한, 테스트 구간과 적용 구간을 달리하는 WFA 기법을 적용하였기 때문에 시장 변화에 적절히 대응할 수 있었다.
샤프 비율은 펀드 평가에서도 사용되는데 포트폴리오의 평균 수익률에서 무위험 자산의 평균 수익률을 뺀 초과 수익률을 포트폴리오의 표준편차로 나눠서 구한다. 여기서는 수익 곡선의 선형성을 비교하기 위함이므로 무위험 자산의 평균 수익률은 고려치 않고 계산했으며 샤프 비율로 비교하면 시가총액 하위 종목 포트폴리오의 수익이 더 안정적이었다[Table 3].
전환점 계산 방법은 최소변동률 지그재그, 고저라인 지그재그, 스윙 파동의 3가지 방법을 실험했으며 스윙 파동 방식의 성과가 다른 방식에 비해 더 좋게 나왔다. 이는 패턴이 진행 중일 때 진입, 청산하는 것보다 패턴 완성을 확인하고 진입, 청산하는 것이 효과적이라 보인다.
후속연구
유의미한 패턴들이 이미 보고되어 있으나 수치 데이터가 사용되고 있어 M&W 파동 패턴보다 복잡하며 해석이 다양해서 프로그램 구현도 제각각이다. 본 연구에서 제시했던 방법들을 좀 더 발전시키면 하모닉 패턴 연구에 활용할 만하다.
질의응답
핵심어
질문
논문에서 추출한 답변
GA의 활용분야는 어떻게 되는가?
GA는 최적화, 자동 프로그래밍, 기계학습, 경제학 등 다양한 분야에서 응용되고 있으며 매개변수를 많이 사용하는 시스템 매매에서도 전수 테스트를 못 하고 근사치로 최적화할 때 사용되는 기법이다. Kim(2009)은 Support Vector Machines(SVM) 앙상블 학습의 최적화 문제를 해결하기 위해 GA를 사용했으며, Kim and Ahn(2010)은 주가지수 등락의 예측 모형으로 SVM을 사용하는 지능형 시스템 연구에서 이중 임계치(two-threshold)를 최적화하기 위해 GA를 사용하였다.
현재 패턴(pattern) 분석 기법의 활용도는 어느 수준인가?
특히 IT 기술의 발전으로 방대한 차트 데이터를 분석하여 주가 예측력이 높은 패턴을 발굴하는 것이 예전보다 쉬워졌다. 지금까지의 성과로 볼 때 가격의 단기 예측력은 높아졌지만, 장기 예측력은 한계가 있어서 장기 투자보다 단타 매매에서 활용되는 수준이다. 이외에 과거 기술력으로 인식하지 못했던 패턴을 기계적으로 정확하게 찾아내는 데 초점을 맞춘 연구도 있지만 찾아진 패턴이 매매에 적합한지 아닌지는 별개의 문제이기 때문에 실용적인 부분에서 취약할 수 있다.
GA는 무엇인가?
GA는 자연계의 진화과정을 모사한 확률기반 계산 알고리즘으로서 최적화 문제와 관련한 연구들에서 가장 많이 사용되고 있는 인공지능 알고리즘 중 하나다. GA는 John Holland에 의해 창안되었으며, 교차(crossover), 돌연변이(mutation), 그리고 역치(inversion)와 같이 유전학에 따라 고안된 연산자들과 함께 일종의 “자연의 선택”을 사용하여 “염색체”(예를 들어 비트(bit), 즉 1과 0의 문자열)의 한 개체집단에서 새로운 집단으로 이동시키는 방법이다(Mitchell, 1996).
※ AI-Helper는 부적절한 답변을 할 수 있습니다.