$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

한국프로야구에서 선발투수의 투수능력지수 제안 - 대체선수대비승수 (WAR)을 중심으로
Suggestion of starting pitcher ability index in Korea baseball - Focusing on the sabermetrics statistics WAR 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.28 no.4, 2017년, pp.863 - 874  

김현규 (영남대학교 통계학과) ,  이제영 (영남대학교 통계학과)

초록

야구선수들의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수 (WAR)은 가장 많이 사용되는 통계량이다. WAR의 장점은 투수와 타자처럼 서로 다른 포지션임에도 불구하고 선수들의 WAR을 비교할 수 있다는 점이다. 하지만 WAR은 복잡한 형태로 일반적으로 제공되는 기록만으로 구하기 어렵다. 따라서 본 논문에서는 지난 3년간 (2014-2016년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수를 계산한 뒤, 이를 이용하여 WAR을 대체할 수 있는 선발투수능력지수를 제안한다. 선발투수능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출한 뒤, WAR과 비교하여 가장 관계가 높은 방법을 선택하였다. 이는 선발투수의 능력을 파악하는데 유용하게 사용될 것이다.

Abstract AI-Helper 아이콘AI-Helper

Wins above replacement (WAR) is the most commonly used statistics of the many sabermetrics that measure baseball players' abilities. The advantage of a WAR is that it enables to compare performances of players even though they have different roles such as pitcher and hitter. However, WAR is difficul...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 2. 연구방법

  • 2절에서는 분석된 결과를 가지고 WAR과 비교하여 가장 근접한 방법을 찾는다. 3.3절에서는 WAR과 가장 근접한 지수를 선발투수능력지수로 제안한다.
  • FIP (수비 무관 평균자책점) 투수가 전적으로 책임지는 지표만을 대상으로 고안한 스탯으로, ERA보다 연도별 변동성도 적고 따라서 예측력도 높은 편이다. cFIP는 FIP값이 ERA와 유사한 범위를 갖도록 고안된 상수값이다.
  • GO/AO (땅볼-뜬공 비율) 땅볼과 뜬공의 비율을 말한다. GO는 땅볼 AO는 뜬공이다.
  • PFR (파워-기교 비율) 스트라이크와 볼넷의 합을 이닝수로 나눈 값이다. 이 값이 높을수록 투수가 던진 공이 페어그라운드 안으로 떨어져서 안타나 땅볼 혹은 뜬공이 되는 경우가 적음을 알 수 있다.
  • FIP (수비 무관 평균자책점) 투수가 전적으로 책임지는 지표만을 대상으로 고안한 스탯으로, ERA보다 연도별 변동성도 적고 따라서 예측력도 높은 편이다. cFIP는 FIP값이 ERA와 유사한 범위를 갖도록 고안된 상수값이다.
  • oAVG (피안타율) 상대한 모든 타자들과의 대결에서 안타를 허용한 비율을 의미한다.
  • oSLG (피장타율) 본래는 타자에게 적용하는 지표인 장타율을 투수를 기준으로 적용한 지표이다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 먼저 산술평균의 상위 10명과 WAR의 상위 10명을 비교했을 때 8명이 동일한 상위권으로 나타났다. 가중평균의 상위 10명과 WAR의 상위 10명을 비교했을 때는 5명의 선수가 상위권으로 나타났다. 마지막 주성분회귀분석의 경우 상위 10명이 WAR의 상위 10명과 비교했을 때 8명의 선수가 상위권으로 나왔으며 1등이 산술평균과 가중평균 결과와 동일하게 벤덴헐크 (Rick VandenHurk)으로 나타났다.
  • 이 과정을 통해 산출한 1승당 점수를 바탕으로 투수의 기대 승률 (Expected%)이 정의된다. 따라서 WAR은 기대 승률과 투수의 시즌 투구이닝 (IP)을 종합하여 정의된다. 이와 같이 WAR (1.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 본 연구에서는 KBO 자료로부터 구한 세이버메트릭스 통계량들을 산술평균, 가중평균, 주성분회귀분석 방법을 적용한 뒤 WAR과 비교하여 상관계수가 가장 높은 방법을 채택하고, 최종적으로 선발투수능력지수 (Starting pitcher ability index; SPAI)로 제안한다. 데이터는 케이비레포트 (www.
  • 세이버메트릭스 변수들 간에 값의 차이가 크기 때문에 표준화를 시킨 후, 작을수록 뛰어난 능력을 나타내는 변수 (ERA, FIP, WHIP, BB/9, HR/9, BABIP, oAVG, oOBP, oSLG, H/9, Ground%, Fly%)들의 경우 -1을 곱해 분석 하였다. 따라서 산술평균에 의해 얻어진 선발투수능력지수 (AV GP 1)는 다음과 같다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 000)로 가장 근접하고 효율적인 분석방법으로 나타났다. 따라서 주성분분석을 이용하여 총 17개의 변수를 4개의 주성분 변수 (HSA, CA, LSA, QP)로 축약하고 이를 통해 최종 선발투수능력지수를 제안한다. 식 (3.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 가중평균의 상위 10명과 WAR의 상위 10명을 비교했을 때는 5명의 선수가 상위권으로 나타났다. 마지막 주성분회귀분석의 경우 상위 10명이 WAR의 상위 10명과 비교했을 때 8명의 선수가 상위권으로 나왔으며 1등이 산술평균과 가중평균 결과와 동일하게 벤덴헐크 (Rick VandenHurk)으로 나타났다. 정확한 비교를 위해 상관분석을 실시한 결과 WAR과 산술평균 사이에는 상관계수 값이 0.
  • 제1주성분의 고유치는 6.809이고 제2주성분은 4.404, 제3주성분은 2.
  • Expected% = (Adjusted RA − RA/9)/Runs per Win + 0.5.      (1.
  • 4를 보면 WAR과 다소 차이를 보인다. 먼저 산술평균의 상위 10명과 WAR의 상위 10명을 비교했을 때 8명이 동일한 상위권으로 나타났다. 가중평균의 상위 10명과 WAR의 상위 10명을 비교했을 때는 5명의 선수가 상위권으로 나타났다.
  • 세이버메트릭스는 야구에 대한 실증적인 분석을 하는 것을 말한다. 야구의 통계적인 분석, 수학적 분석 또한 세이버메트릭스라고 볼 수 있다. 이와 같은 방법으로 자료 분석하는 사람을 세이버메트릭션 (Sabermatrician)이라고 부른다 (Hong 등, 2016).
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • I인 확률오차벡터이다 (Bae 등, 2012). 식 (2.1)에서 추정된 y값을 선발투수능력지수로 두고 WAR과 비교한다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 세이버메트릭스는 야구에 대한 실증적인 분석을 하는 것을 말한다. 야구의 통계적인 분석, 수학적 분석 또한 세이버메트릭스라고 볼 수 있다. 이와 같은 방법으로 자료 분석하는 사람을 세이버메트릭션 (Sabermatrician)이라고 부른다 (Hong 등, 2016).
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 본 연구에서는 한국프로야구 선발투수의 능력을 파악하는 지수를 개발 및 제안하기 위해 17개의 세이버메트릭스 통계량을 이용해서 산술평균방법과 가중평균방법, 주성분 분석방법을 적용하였다. 
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 세이버메트릭스는 야구에 대한 실증적인 분석을 하는 것을 말한다. 야구의 통계적인 분석, 수학적 분석 또한 세이버메트릭스라고 볼 수 있다. 이와 같은 방법으로 자료 분석하는 사람을 세이버메트릭션 (Sabermatrician)이라고 부른다 (Hong 등, 2016).
  • com) 기록실에 게시되어있는 데이터를 이용하였다. 변수는 자주 사용되고 있는 경기력 지수들에 활용되고 있는 개인기록들을 참고하고 (Lee, 2014), 기록 수집 가능 여부를 고려하여 선정하였다 (Lee, 2014). 분석에 사용된 세이버메트릭스 변수는 다음과 같다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 000)로 가장 근접하고 효율적인 분석방법으로 나타났다. 따라서 주성분분석을 이용하여 총 17개의 변수를 4개의 주성분 변수 (HSA, CA, LSA, QP)로 축약하고 이를 통해 최종 선발투수능력지수를 제안한다. 식 (3.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다. 지난해에는 한국프로야구 역사상 가장 최대인 800만 관중을 넘어섰다. 프로야구에 대한 관심이 높아지면서 야구기록에 대한 중요성과 세이버메트릭스 (Sabermatrics)에 대한 관심도 점점 더 커지고 있다.
  • 케이비레포트에서 조정 실점 값은 수비무관 평균자책점 (fielding independent pitching; FIP)에 기반을 두고 있다. Runs per win은 특정 투수가 등판했을 때 1승당 필요한 점수로 아래의 식과 같다.
  • p>한국프로야구 (Korea baseball organization; KBO)의 연 관중 수는 꾸준히 증가 추세를 보이고 있다.
  • 본 연구에서는 한국프로야구 선발투수의 능력을 파악하는 지수를 개발 및 제안하기 위해 17개의 세이버메트릭스 통계량을 이용해서 산술평균방법과 가중평균방법, 주성분 분석방법을 적용하였다. 
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
세이버메트릭스 통계량에서 가장 많이 사용되는 통계량은 무엇인가? 야구선수들의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수 (WAR)은 가장 많이 사용되는 통계량이다. WAR의 장점은 투수와 타자처럼 서로 다른 포지션임에도 불구하고 선수들의 WAR을 비교할 수 있다는 점이다.
WAR의 가장 큰 장점은 무엇인가? 실제로 야구 경기 중계 방송 중에도 포지션 별 WAR 수치를 보여주고 있으며, WAR을 포함한 세이버메트릭스 통계량을 활용하여 선수들의 연봉추정 모형을 제시한 연구도 진행된 바 있다 (Chang과 Zenilman; 2013). 이러한 WAR의 가장 큰 장점은 투수와 타자 등 모 든 포지션의 선수의 어떤 행위도 철저하게 득점과 승리를 위한 수단으로 바라보아 승리기여도라는 단 하나의 숫자로 표현해 주는 것으로 서로 다른 구단, 다른 포지션의 선수들과 비교가 가능하다.
본 논문에서 주성분분석은 어떠한 문제를 해결하기 위해 사용되었나? 상관계수가 높은 세이버 메트릭스 통계량끼리 그룹으로 묶은 후, 각 다른 가중치를 부여함으로써 투수의 능력을 살펴 볼 수 있 다. 그러나 17개의 변수를 모두 사용하여 다중회귀 분석을 하는 경우 설명변수들 사이의 높은 상관관계 에 의해 다중공선성 (multicollinearty) 문제를 야기 시킬 수 있다 (Kwon, 2008).
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. Bae, J. Y., Lee, J. M. and Lee, J. Y. (2012). Predicting Korea pro-baseball rankings by principal component regresstion analysis. The Journal of Korean Statistical Society, 19, 367-379. 

  2. Chang, J. and Zenilman, J. (2013). A study of sabermetrics in major league baseball: The impact of moneyball on free agent salaries, Washington University, Saint Louis. 

  3. Hong, J. S., Kim, J. Y. and Sin, D. S. (2016). Alternative hitting ability index for KBO. Journal of the Korean Data & Information Science Society, 27, 677-687. 

  4. KBO (2017). http://osen.mt.co.kr/article/G1110627260 

  5. Kim, H. J. (2012). Effects of on-base and slugging ability on run productivity in Korean professional baseball. Journal of the Korean Data & Information Science Society, 23, 1065-1174. 

  6. KBreport (2013-2016), http://www.kbreport.com 

  7. Kwon, S. H. (2008). Utilizing and analysis of multivariate data, Freeacademy, Seoul. 

  8. Lee, J. T. and Cho, H. S. (2009). Estimation of OBP coefficient in Korean professional baseball. Journal of the Korean Data & Information Science Society, 25, 357-363. 

  9. Lee, J. T. (2014). Measurements for hitting ability in the Korean pro-baseball. Journal of the Korean Data & Information Science Society, 25, 349-356. 

  10. Lee, S. I. (2014). Development of pitcher's performance index in the Korean professional baseball games, Master's Thesis, Myoungji University, Seoul. 

  11. MLB (2017). http://m.mlb.com/news/article/182980276/best-late-round-picks-in-draft-history/ 

  12. Oh, G. J., An, J. J. and Sim, G. S. (2012). Multicurrencies portfolio strategy using principal component analysis and logistic regression. Journal of the Korean Data & Information Science Society, 23, 151-159. 

  13. Seung, H. B. and Kang, G. H. (2012). A study on relationship between the performance of professional baseball players and annual salary. Journal of the Korean Data & Information Science Society, 23, 285-298. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로