본 연구에서는 한국 프로야구의 야구선수들에 대한 타격 관련 요인들과 투수 관련 요인들을 가지고 득점과 실점에 영향을 미치는 요인을 분석하고자 한다. 본 논문에서 사용된 자료는 7년(2007년~2013년)에 걸친 한국 프로야구의 정규리그 전 경기 자료이며, 이 자료는 Korea Baseball Organization (2008, 2009, 2010, 2011, 2012, 2013, 2014)의 2008, 2009, 2010, 2011, 2012, 2013, 2014 Official Baseball Guide에서 구한 것이다. 총 57팀으로 타격 관련 요인인 득점(rs), 타석(pa), 타수(ab), 안타(hit), 홈런(hr), 루타(tb), 도루(sb), 도실(cs), 희타(sh), 희비(sf), 4사구(bh), 삼진(so), 병살타(dp), 잔루(...
본 연구에서는 한국 프로야구의 야구선수들에 대한 타격 관련 요인들과 투수 관련 요인들을 가지고 득점과 실점에 영향을 미치는 요인을 분석하고자 한다. 본 논문에서 사용된 자료는 7년(2007년~2013년)에 걸친 한국 프로야구의 정규리그 전 경기 자료이며, 이 자료는 Korea Baseball Organization (2008, 2009, 2010, 2011, 2012, 2013, 2014)의 2008, 2009, 2010, 2011, 2012, 2013, 2014 Official Baseball Guide에서 구한 것이다. 총 57팀으로 타격 관련 요인인 득점(rs), 타석(pa), 타수(ab), 안타(hit), 홈런(hr), 루타(tb), 도루(sb), 도실(cs), 희타(sh), 희비(sf), 4사구(bh), 삼진(so), 병살타(dp), 잔루(lb)와 투수 관련 요인인 실점(rl), 투구이닝(ip), 투구수(pt), 타자(bt), 타수(ab), 피안타(hit), 피홈런(hr), 희타(sh), 희비(sf), 볼넷(bb), 사구(hp), 탈삼진(k), 폭투(wp), 보크(bk), 실책(er)을 가지고 연구하였다. 통계분석은 미니탭 14.12.1과 SAS 9.3을 이용하여 수행하였고, 이 자료들을 가지고 팀과 개인의 득점력, 실점을 설명하는 지표를 찾아 다음과 같은 결과를 얻었다. 첫째, 팀의 득점력을 가장 잘 설명해 주는 타격지표는 가중수정OPS(0.57)인 것으로 나타났고, 이 지표를 사용할 때 팀의 경기당 평균득점과의 상관계수는 0.95059, 순위상관계수는 0.95259로 매우 높았다. 둘째, 타격지표들 중 득점력을 설명해주는 모형은 전방선택(Forward selection)과 단계별회귀(Stepwise regression)에서 나온 모형으로 출루율(obp), 장타율(slg), 경기당타석(pag), 경기당도루(sbg), 경기당도실(csg), 경기당희생타(sag), 경기당삼진(sog), 경기당병살타(dpg), 경기당잔루(lbg)로 나타났고, R-square 값은 0.9862, C(p)값은 8.1748로 나타났다. 셋째, 팀의 실점을 가장 잘 설명해 주는 투수지표는 가중WPH(0.85)인 것으로 나타났고, 이 지표를 사용할 때 팀의 경기당 평균실점과의 상관계수는 0.93548, 순위상관계수는 0.93173으로 매우 높았다. 넷째, 투수지표들 중 실점을 설명해주는 모형은 전방선택(Forward selection)에서 나온 WHIP(whip), 경기당투구수(ptg), 경기당타수(abg), 경기당피홈런(hrg), 경기당희생타(sag), 경기당폭투(wpg), 경기당보크(bkg)로 나타났고, R-square 값은 0.9201, C(p)값은 4.1966으로 나타났다. 단계별회귀(Stepwise regression)에서 나온 모형은 WHIP(whip), 경기당타수(abg), 경기당피홈런(hrg), 경기당폭투(wpg), 경기당보크(bkg)로 나타났고, R-square 값은 0.9155, C(p)값은 2.7945로 나타났다.
본 연구에서는 한국 프로야구의 야구선수들에 대한 타격 관련 요인들과 투수 관련 요인들을 가지고 득점과 실점에 영향을 미치는 요인을 분석하고자 한다. 본 논문에서 사용된 자료는 7년(2007년~2013년)에 걸친 한국 프로야구의 정규리그 전 경기 자료이며, 이 자료는 Korea Baseball Organization (2008, 2009, 2010, 2011, 2012, 2013, 2014)의 2008, 2009, 2010, 2011, 2012, 2013, 2014 Official Baseball Guide에서 구한 것이다. 총 57팀으로 타격 관련 요인인 득점(rs), 타석(pa), 타수(ab), 안타(hit), 홈런(hr), 루타(tb), 도루(sb), 도실(cs), 희타(sh), 희비(sf), 4사구(bh), 삼진(so), 병살타(dp), 잔루(lb)와 투수 관련 요인인 실점(rl), 투구이닝(ip), 투구수(pt), 타자(bt), 타수(ab), 피안타(hit), 피홈런(hr), 희타(sh), 희비(sf), 볼넷(bb), 사구(hp), 탈삼진(k), 폭투(wp), 보크(bk), 실책(er)을 가지고 연구하였다. 통계분석은 미니탭 14.12.1과 SAS 9.3을 이용하여 수행하였고, 이 자료들을 가지고 팀과 개인의 득점력, 실점을 설명하는 지표를 찾아 다음과 같은 결과를 얻었다. 첫째, 팀의 득점력을 가장 잘 설명해 주는 타격지표는 가중수정OPS(0.57)인 것으로 나타났고, 이 지표를 사용할 때 팀의 경기당 평균득점과의 상관계수는 0.95059, 순위상관계수는 0.95259로 매우 높았다. 둘째, 타격지표들 중 득점력을 설명해주는 모형은 전방선택(Forward selection)과 단계별회귀(Stepwise regression)에서 나온 모형으로 출루율(obp), 장타율(slg), 경기당타석(pag), 경기당도루(sbg), 경기당도실(csg), 경기당희생타(sag), 경기당삼진(sog), 경기당병살타(dpg), 경기당잔루(lbg)로 나타났고, R-square 값은 0.9862, C(p)값은 8.1748로 나타났다. 셋째, 팀의 실점을 가장 잘 설명해 주는 투수지표는 가중WPH(0.85)인 것으로 나타났고, 이 지표를 사용할 때 팀의 경기당 평균실점과의 상관계수는 0.93548, 순위상관계수는 0.93173으로 매우 높았다. 넷째, 투수지표들 중 실점을 설명해주는 모형은 전방선택(Forward selection)에서 나온 WHIP(whip), 경기당투구수(ptg), 경기당타수(abg), 경기당피홈런(hrg), 경기당희생타(sag), 경기당폭투(wpg), 경기당보크(bkg)로 나타났고, R-square 값은 0.9201, C(p)값은 4.1966으로 나타났다. 단계별회귀(Stepwise regression)에서 나온 모형은 WHIP(whip), 경기당타수(abg), 경기당피홈런(hrg), 경기당폭투(wpg), 경기당보크(bkg)로 나타났고, R-square 값은 0.9155, C(p)값은 2.7945로 나타났다.
The purpose of this research is to analyze factors that affect runs gained and runs lost in Korean Professional Baseball League. The factors were classified into those related to batting and those related to pitching. The data used in the research is game materials of Korean Professional Baseball Le...
The purpose of this research is to analyze factors that affect runs gained and runs lost in Korean Professional Baseball League. The factors were classified into those related to batting and those related to pitching. The data used in the research is game materials of Korean Professional Baseball League for 7 years, from 2007 to 2013, provided by Korea Baseball Organization (2008, 2009, 2010, 2011, 2012, 2013, 2014 Official Baseball Guide). Factors related to batting such as rs, pa, ab, hit, hr, tb, sb, cs, sh, sf, bh, so, dp and lb, and factors related pitching such as rl, ip, pt, bt, ab, hit, hr, sh, sf, bb, hp, k, wp, bk and er of a total of 57 teams, were studied. Minitab 14.12.1 and SAS 9.3 were used to analyze the data. We found indices which explain runs gained and runs lost of the baseball teams, and obtained the following results. First, an optimal index which explains run productivity of the teams was found to be W_AOPS(0.57). When this index is used, the correlation coefficient and rank correlation coefficient with average runs gained per game of the teams are as high as 0.95059 and 0.95259, respectively. Second, for explaining average runs gained per game the variable selection technique gave a model that includes obp, slg, pag, sbg, csg, sag, sog, dpg and lbg as explanatory variables by the forward selection and the stepwise regression methods. The R-square value was 0.9862, and the C(p) value was 8.1748. Third, an optimal index which explains runs lost of the teams was found to be W_WPH(0.85). When this index is used, the correlation coefficient and rank correlation coefficient with average runs lost per game of the teams are as high as 0.93548 and 0.93173, respectively. Fourth, for explaining average runs lost per game the variable selection technique gave a model that includes whip, ptg, abg, hrg, sag, wpg and bkg as explanatory variables by the forward selection method. The R-square value was 0.9201, and the C(p) value was 4.1966. By the stepwise regression method, a model including whip, abg, hrg, wpg and bkg as explanatory variables was obtained. The R-square value was 0.9155, and the C(p) value was 2.7945.
The purpose of this research is to analyze factors that affect runs gained and runs lost in Korean Professional Baseball League. The factors were classified into those related to batting and those related to pitching. The data used in the research is game materials of Korean Professional Baseball League for 7 years, from 2007 to 2013, provided by Korea Baseball Organization (2008, 2009, 2010, 2011, 2012, 2013, 2014 Official Baseball Guide). Factors related to batting such as rs, pa, ab, hit, hr, tb, sb, cs, sh, sf, bh, so, dp and lb, and factors related pitching such as rl, ip, pt, bt, ab, hit, hr, sh, sf, bb, hp, k, wp, bk and er of a total of 57 teams, were studied. Minitab 14.12.1 and SAS 9.3 were used to analyze the data. We found indices which explain runs gained and runs lost of the baseball teams, and obtained the following results. First, an optimal index which explains run productivity of the teams was found to be W_AOPS(0.57). When this index is used, the correlation coefficient and rank correlation coefficient with average runs gained per game of the teams are as high as 0.95059 and 0.95259, respectively. Second, for explaining average runs gained per game the variable selection technique gave a model that includes obp, slg, pag, sbg, csg, sag, sog, dpg and lbg as explanatory variables by the forward selection and the stepwise regression methods. The R-square value was 0.9862, and the C(p) value was 8.1748. Third, an optimal index which explains runs lost of the teams was found to be W_WPH(0.85). When this index is used, the correlation coefficient and rank correlation coefficient with average runs lost per game of the teams are as high as 0.93548 and 0.93173, respectively. Fourth, for explaining average runs lost per game the variable selection technique gave a model that includes whip, ptg, abg, hrg, sag, wpg and bkg as explanatory variables by the forward selection method. The R-square value was 0.9201, and the C(p) value was 4.1966. By the stepwise regression method, a model including whip, abg, hrg, wpg and bkg as explanatory variables was obtained. The R-square value was 0.9155, and the C(p) value was 2.7945.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.