감독이 작전을 구사하는 상황이나 타자의 타격 가치를 평가하는데 유용하게 사용될 수 있는 지표로서 미국프로야구에 대해서는 기대득점과 기대승리확률, 타격의 득점가치, 타격의 승리가치 등이 제시되었다. 기대득점은 각각의 아웃카운트와 주자 상황에서 그 이닝이 끝날 때까지 얻는 점수의 기댓값이다. 기대승리확률은 이닝, 점수차, 아웃카운트, 주자상태가 주어진 상태에서 경기를 계속 한다고 할 때, 공격하고 있는 팀이 승리할 확률이다. 타격의 득점가치는 타격전 상황의 기대득점과 타격결과에 의하여 변화된 상황의 기대득점 사이의 차이를 말한다. 타격의 승리가치는 타격 전후 상황의 기대승리확률간의 차이로서 타격 결과가 승리에 미치는 영향을 나타낸다. 한국프로야구에서는 장기간 축적된 자료의 부족으로 총 발생횟수에 대한 특정 상황의 상대돗수를 이용하여 구한 이들 지표가 통계적인 의미를 갖지 못하는 경우가 종종 나타난다. 이와 같은 문제점을 극복하기 위하여 본 논문에서는 마르코프연쇄를 이용하여 한국프로야구에서 기대득점, 기대승리확률, 득점가치와 승리가치를 구하는 방법을 제시한다.
감독이 작전을 구사하는 상황이나 타자의 타격 가치를 평가하는데 유용하게 사용될 수 있는 지표로서 미국프로야구에 대해서는 기대득점과 기대승리확률, 타격의 득점가치, 타격의 승리가치 등이 제시되었다. 기대득점은 각각의 아웃카운트와 주자 상황에서 그 이닝이 끝날 때까지 얻는 점수의 기댓값이다. 기대승리확률은 이닝, 점수차, 아웃카운트, 주자상태가 주어진 상태에서 경기를 계속 한다고 할 때, 공격하고 있는 팀이 승리할 확률이다. 타격의 득점가치는 타격전 상황의 기대득점과 타격결과에 의하여 변화된 상황의 기대득점 사이의 차이를 말한다. 타격의 승리가치는 타격 전후 상황의 기대승리확률간의 차이로서 타격 결과가 승리에 미치는 영향을 나타낸다. 한국프로야구에서는 장기간 축적된 자료의 부족으로 총 발생횟수에 대한 특정 상황의 상대돗수를 이용하여 구한 이들 지표가 통계적인 의미를 갖지 못하는 경우가 종종 나타난다. 이와 같은 문제점을 극복하기 위하여 본 논문에서는 마르코프연쇄를 이용하여 한국프로야구에서 기대득점, 기대승리확률, 득점가치와 승리가치를 구하는 방법을 제시한다.
Run expectancy (RE) is the mean number of runs scored from a specific base runner/outs situation of an inning to the end of the inning. Win expectancy (WE) is the probability that a particular team will win the game at a specific game state such as half-inning, score difference, outs, and/or runners...
Run expectancy (RE) is the mean number of runs scored from a specific base runner/outs situation of an inning to the end of the inning. Win expectancy (WE) is the probability that a particular team will win the game at a specific game state such as half-inning, score difference, outs, and/or runners on base. In this paper, we derive RE and WE for the Korea Baseball Organization (KBO) League based on six-year data from 2007 to 2012 using a Markov chain model.
Run expectancy (RE) is the mean number of runs scored from a specific base runner/outs situation of an inning to the end of the inning. Win expectancy (WE) is the probability that a particular team will win the game at a specific game state such as half-inning, score difference, outs, and/or runners on base. In this paper, we derive RE and WE for the Korea Baseball Organization (KBO) League based on six-year data from 2007 to 2012 using a Markov chain model.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 마르코프연쇄를 이용하여 한국프로야구에서의 기대득점, 기대승리확률, 타격의 득점가치와 승리가치를 구하는 방법을 제시하였다. 이 논문에서 제안한 방법에 의한 결과와 실제 데이터로부터 구한 것과 비교하였다.
이와 같은 현상은 표본 수가 적은 경우에 나타나는 것으로 여겨진다. 이와 같은 문제점을 극복하기 위하여 본 논문에서는 마르코프연쇄를 이용하여 한국프로야구에서 기대득점(RE), 기대승리확률(WE), 득점가치(RV)와 승리가치(WV)를 구하는 방법을 제시한다.
가설 설정
따라서 타자의 평균타격확률은 2루타와 3루타, 홈런은 아웃된 타자 수에 의존하지 않으나 주자상태에의 의존하고 기타 타격에 대한 확률은 아웃 수나 주자상태에 의존하도록 정하였다. 모든 타자는 평균타격확률을 따라서 타격하는 것으로 가정하였다. 즉, 식 (2.
제안 방법
또한 1루타, 2루타 등 여기서 고려한 6가지 타격결과 각각에 대하여 8가지 주자상태에는 의존하는지 동질성 검정을 실시한 결과 모든 경우에 유의확률이 10−5보다 작은것으로 나타났다. 따라서 타자의 평균타격확률은 2루타와 3루타, 홈런은 아웃된 타자 수에 의존하지 않으나 주자상태에의 의존하고 기타 타격에 대한 확률은 아웃 수나 주자상태에 의존하도록 정하였다. 모든 타자는 평균타격확률을 따라서 타격하는 것으로 가정하였다.
또한 타자의 타격확률 #을 구하기 위하여 각 (아웃, 주자) 상황에서 타격의 발생횟수를 바탕으로 타격 결과가 아웃 상태에 의존하는지, 주자상태에 의존하는지에 대하여 동질성 검정을 하였다.
본 논문에서 제안한 마르코프연쇄를 이용하여 타격의 RV와 WV를 구하는 방법은 다음과 같다. 먼저, 경기 데이터로부터 상태변화를 나타내는 진루확률과 타자들의 평균 타격확률을 구하고 Moon 등(2013) 등이 제안한 마르코프연쇄 모형을 이용하여 평균 타격확률을 갖는 가상선수로 구성된 팀이 특정상황에서 한 이닝동안 얻는 득점분포를 구한다. 이 득점분포로부터 RE, WE, RV, WV를 구한다.
본 논문에서 제안한 마르코프연쇄를 이용하여 타격의 RV와 WV를 구하는 방법은 다음과 같다. 먼저, 경기 데이터로부터 상태변화를 나타내는 진루확률과 타자들의 평균 타격확률을 구하고 Moon 등(2013) 등이 제안한 마르코프연쇄 모형을 이용하여 평균 타격확률을 갖는 가상선수로 구성된 팀이 특정상황에서 한 이닝동안 얻는 득점분포를 구한다.
1)과 같이 구한 기대승리확률은 조건 W1–W3를 모두 만족하였다. 실제 자료에서 발생횟수가 충분히 큰 (6년간 150회 이상) 주자 없는 상황에 대하여 마르코프연쇄 방법과 경험분포를 이용하여 구한 WE를 Table 3.1에서 비교하였다. Table 3.
대상 데이터
본 연구에서는 장기간에 걸친 자료 확보의 어려움으로 인하여 야구동호인 사이트인 아이스텟(www. istat.co.kr)의 2007년부터 2012년까지 6년간의 한국프로야구자료를 이용하였다. 먼저 자료로부터 Moon 등 (2003)과 같이 P(r)(h)을 구하였다.
데이터처리
본 논문에서는 마르코프연쇄를 이용하여 한국프로야구에서의 기대득점, 기대승리확률, 타격의 득점가치와 승리가치를 구하는 방법을 제시하였다. 이 논문에서 제안한 방법에 의한 결과와 실제 데이터로부터 구한 것과 비교하였다. 그 결과 발생횟수가 충분히 커서 통계적으로 유의미한 경우에는 본 논문에서 제시한 방법이 매우 효과적임을 알 수 있었다.
성능/효과
그 결과 2루타와 3루타, 홈런에 대해서는 유의확률이 각각 0.130, 0.378, 0.232이고 1루타와 볼넷 또는 사구, 아웃의 경우에는 유의확률이 모두 10−5보다 작은것으로 나타났다.
이 논문에서 제안한 방법에 의한 결과와 실제 데이터로부터 구한 것과 비교하였다. 그 결과 발생횟수가 충분히 커서 통계적으로 유의미한 경우에는 본 논문에서 제시한 방법이 매우 효과적임을 알 수 있었다.
또한 1루타, 2루타 등 여기서 고려한 6가지 타격결과 각각에 대하여 8가지 주자상태에는 의존하는지 동질성 검정을 실시한 결과 모든 경우에 유의확률이 10−5보다 작은것으로 나타났다.
후속연구
본 논문에서 제시한 방법은 각 팀별 타자 혹은 투수에 대한 자료가 통계적으로 의미가 있을 만큼 충분하다면 타자의 타격확률과 투수진 등을 고려하여 각 팀별 특성에 맞는 RE, WE 등을 구하는데 적용할 수 있을 것이다. 또한 RE, WE를 바탕으로한 선수평가 모형을 개발한다면 한국프로야구에서 경기 상황을 반영한 타자의 능력이 득점이나 경기의 승패에 미친 기여도를 효과적으로 평가할 수 있는 새로운 형태의 평가 지표로 사용될 수 있을 것이다. 또한 이를 이용하여 선수들의 기량을 효과적으로 평가하여 타순 결정이나 선수의 연봉 협상을 위한 객관적인 평가지표로 사용할 수 있으리라 기대한다.
또한 RE, WE를 바탕으로한 선수평가 모형을 개발한다면 한국프로야구에서 경기 상황을 반영한 타자의 능력이 득점이나 경기의 승패에 미친 기여도를 효과적으로 평가할 수 있는 새로운 형태의 평가 지표로 사용될 수 있을 것이다. 또한 이를 이용하여 선수들의 기량을 효과적으로 평가하여 타순 결정이나 선수의 연봉 협상을 위한 객관적인 평가지표로 사용할 수 있으리라 기대한다. 마지막으로 특정 상황에서 팀이 승리할 확률 등을 기반으로 승패를 예측하는 모델 개발에도 사용할 수 있으리라 기대한다.
또한 이를 이용하여 선수들의 기량을 효과적으로 평가하여 타순 결정이나 선수의 연봉 협상을 위한 객관적인 평가지표로 사용할 수 있으리라 기대한다. 마지막으로 특정 상황에서 팀이 승리할 확률 등을 기반으로 승패를 예측하는 모델 개발에도 사용할 수 있으리라 기대한다.
본 논문에서 제시한 방법은 각 팀별 타자 혹은 투수에 대한 자료가 통계적으로 의미가 있을 만큼 충분하다면 타자의 타격확률과 투수진 등을 고려하여 각 팀별 특성에 맞는 RE, WE 등을 구하는데 적용할 수 있을 것이다. 또한 RE, WE를 바탕으로한 선수평가 모형을 개발한다면 한국프로야구에서 경기 상황을 반영한 타자의 능력이 득점이나 경기의 승패에 미친 기여도를 효과적으로 평가할 수 있는 새로운 형태의 평가 지표로 사용될 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
본 논문에서 제안한 마르코프연쇄를 이용하여 타격의 RV와 WV를 구하는 방법은?
본 논문에서 제안한 마르코프연쇄를 이용하여 타격의 RV와 WV를 구하는 방법은 다음과 같다. 먼저, 경기 데이터로부터 상태변화를 나타내는 진루확률과 타자들의 평균 타격확률을 구하고 Moon 등 (2013) 등이 제안한 마르코프연쇄 모형을 이용하여 평균 타격확률을 갖는 가상선수로 구성된 팀이 특정상황에서 한 이닝동안 얻는 득점분포를 구한다. 이 득점분포로부터 RE, WE, RV, WV를 구한다.
기대득점이란 무엇인가?
이와같이 감독이 작전을 구사하는 상황이나 타자의 타격 가치를 평가하는데 유용하게 사용될 수 있는 지표로서 미국프로야구에 대해서는 기대득점(run expectancy; RE)과 기대승리확률(win expectancy, WE), 기대승리확률을 바탕으로 타격의 득점가치(run value; RV), 타격의 승리가치(win value; WV) 등이 제시되었다 (Tango 등, 2006). 기대득점은 각각의 아웃카운트와 주자 상황에서 그 이닝이 끝날 때 까지 얻는 점수의 기댓값이다. 예를 들어 2007년부터 2012년 6년 동안 한국프로야구경기에서 1사 주자 2루인 상황은 12,903건이 있었으며 그 상황에서 이닝이 끝날 때까지 얻은 점수의 총합은 8779점이었다.
미국프로야구에서 감독이 작전을 구사하는 상황이나 타자의 타격 가치를 평가하는 지표로 제시된 것은?
이와같이 감독이 작전을 구사하는 상황이나 타자의 타격 가치를 평가하는데 유용하게 사용될 수 있는 지표로서 미국프로야구에 대해서는 기대득점(run expectancy; RE)과 기대승리확률(win expectancy, WE), 기대승리확률을 바탕으로 타격의 득점가치(run value; RV), 타격의 승리가치(win value; WV) 등이 제시되었다 (Tango 등, 2006). 기대득점은 각각의 아웃카운트와 주자 상황에서 그 이닝이 끝날 때 까지 얻는 점수의 기댓값이다.
참고문헌 (7)
Bukiet, B., Harold, E. R., and Palacios, J. L. (1997). A Markov chain approach to baseball, Operations Research, 45, 14-23.
Hirotsu, N. and Wright, M. (2003). A Markov chain approach to optimal pinch hitting strategies in a designated hitter rule baseball game, Journal of the Operations Research Society of Japan, 46, 353-371.
Hirotsu, N. and Wright, M. (2005). Modelling a baseball game to optimise pitcher substitution strategies incorporating handedness of players, IMA Journal of Management Mathematics, 16, 179-194.
Jeong, J. S. (2014). Efficient Estimation Model of Hitter using Big Data Analysis in Korean Baseball League, Master Thesis, Changwon National University (in Korean).
Moon, H. W., Woo, Y. T., and Shin, Y. W. (2013). Analysis of the Korean baseball league using a Markov chain model, The Korean Journal of Applied Statistics, 26, 649-659.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.