본 연구는 야구 경기에서 선발 투수를 위기 상황 이전에 교체하기 위한 의사결정을 지원하는 예측 모델 구현을 목적으로 한다. 이를 위해 베이스볼 서번트(Baseball Savant)에서 제공하는 메이저리그 스탯캐스트 데이터를 활용하여, 선발 투수를 위기 상황 이전에 선제적으로 교체하는 예측 모델을 구현한다. 이를 위해 첫째, 데이터 탐색을 통해 선발 투수가 경기에서 직면하는 위기 상황을 도출하였다. 둘째, 선발 투수가 이닝 종료 전에 교체된 경우, 이전 이닝에서 교체하는 것으로 레이블을 구성하여 학습을 진행하였다. 학습된 모델을 비교한 결과 앙상블 기법을 기반으로 한 모델이 F1-Score가 65%로 가장 높은 예측 성능을 보였다. 본 연구의 실무적 의의는 제안하는 모델을 통해 선발 투수를 위기 상황 이전에 교체하여 팀의 승리 확률을 높이는 데 기여할 수 있으며, 경기 중 감독은 데이터 기반의 전략적 의사결정 지원을 받을 수 있을 것이다.
본 연구는 야구 경기에서 선발 투수를 위기 상황 이전에 교체하기 위한 의사결정을 지원하는 예측 모델 구현을 목적으로 한다. 이를 위해 베이스볼 서번트(Baseball Savant)에서 제공하는 메이저리그 스탯캐스트 데이터를 활용하여, 선발 투수를 위기 상황 이전에 선제적으로 교체하는 예측 모델을 구현한다. 이를 위해 첫째, 데이터 탐색을 통해 선발 투수가 경기에서 직면하는 위기 상황을 도출하였다. 둘째, 선발 투수가 이닝 종료 전에 교체된 경우, 이전 이닝에서 교체하는 것으로 레이블을 구성하여 학습을 진행하였다. 학습된 모델을 비교한 결과 앙상블 기법을 기반으로 한 모델이 F1-Score가 65%로 가장 높은 예측 성능을 보였다. 본 연구의 실무적 의의는 제안하는 모델을 통해 선발 투수를 위기 상황 이전에 교체하여 팀의 승리 확률을 높이는 데 기여할 수 있으며, 경기 중 감독은 데이터 기반의 전략적 의사결정 지원을 받을 수 있을 것이다.
The purpose of this study is to implement a predictive model to support decision-making to replace a starting pitcher before a crisis situation in a baseball game. To this end, using the Major League Statcast data provided by Baseball Savant, we implement a predictive model that preemptively replace...
The purpose of this study is to implement a predictive model to support decision-making to replace a starting pitcher before a crisis situation in a baseball game. To this end, using the Major League Statcast data provided by Baseball Savant, we implement a predictive model that preemptively replaces starting pitchers before a crisis situation. To this end, first, the crisis situation that the starting pitcher faces in the game was derived through data exploration. Second, if the starting pitcher was replaced before the end of the inning, learning was carried out by composing a label with a replacement in the previous inning. As a result of comparing the trained models, the model based on the ensemble method showed the highest predictive performance with an F1-Score of 65%. The practical significance of this study is that the proposed model can contribute to increasing the team's winning probability by replacing the starting pitcher before a crisis situation, and the coach will be able to receive data-based strategic decision-making support during the game.
The purpose of this study is to implement a predictive model to support decision-making to replace a starting pitcher before a crisis situation in a baseball game. To this end, using the Major League Statcast data provided by Baseball Savant, we implement a predictive model that preemptively replaces starting pitchers before a crisis situation. To this end, first, the crisis situation that the starting pitcher faces in the game was derived through data exploration. Second, if the starting pitcher was replaced before the end of the inning, learning was carried out by composing a label with a replacement in the previous inning. As a result of comparing the trained models, the model based on the ensemble method showed the highest predictive performance with an F1-Score of 65%. The practical significance of this study is that the proposed model can contribute to increasing the team's winning probability by replacing the starting pitcher before a crisis situation, and the coach will be able to receive data-based strategic decision-making support during the game.
김원종, 최연식, 유동희, "데이터 마이닝을 활용한 한국 프로야구 구단의 승패예측과 승률 향상을 위한 전략 도출 연구," 한국스포츠산업경영학회지, 제23권, 제3호, 88-104쪽, 2018년 6월
C.S. Valero, "Predicting Win-Loss outcomes in MLB regular season games-A comparative study using data mining methods," International Journal of Computer Science in Sport, vol. 15, no. 2, pp. 291-112, 2016.
B. Tolbert, T. Trafalis, "Predicting major league baseball championship winners through data mining," Athens Journal of Sports, vol. 3, no. 4, pp. 239-252, 2016.
B. Everman, "Analyzing baseball statistics using data mining," Jan. 2015.
오윤학, 김한, 윤재섭, 이종석, "데이터마이닝을 활용한 한국프로야구 승패예측모형 수립에 관한 연구," 대한산업공학회지, 제40권, 제1호, 8-17쪽, 2014년 2월
P. Yifan, "Predict Next Baseball Pitch Type with RNN"
G,D, Sidle, "Using multi-class machine learning methods to predict major league baseball pitches," North Carolina State University, 2017.
P. Hoang, M. Hamilton, J. Murray, C. Stafford and H. Tran, "A dynamic feature selection based LDA approach to baseball pitch prediction," Springer, pp. 125-137, 2015.
M. Woodham, J. Hawkins, A. Singh, S. Chakraborty, "When to Pull Starting Pitchers in Major League Baseball? A Data Mining Approach," 2019 18th IEEE International Conference On Machine Learning And Applications (ICMLA), FL, USA, pp. 426-431, 2019.
김강민, 김판구, 전찬준, "Deep Metric Learning을 활용한 합성곱 신경망 기반의 피부질환 분류 기술," 스마트미디어저널, 제10권 제4호, 45-53쪽, 2021년 12월
※ AI-Helper는 부적절한 답변을 할 수 있습니다.