최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기응용통계연구 = The Korean journal of applied statistics, v.30 no.1, 2017년, pp.25 - 39
박가희 (이화여자대학교 통계학과) , 박리라 (이화여자대학교 통계학과) , 송종우 (이화여자대학교 통계학과)
Over 5 million people participate in cycle racing betting and its revenue is more than 2 trillion won. This study predicts the ranking of cycle racing using various statistical analyses and identifies important variables which have influence on ranking. We propose competitive ranking prediction mode...
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
금액을 베팅한 결과 손해가 발생한 이유는? | 보통 최종 배당금이 높은 경기는 베팅을 적게 받은 선수가 승리하는 경우이다. 따라서 실제 베팅에서 손해가 발생한 이유는 우리가 모형을 만들 때 배당률은 고려하지 않고, 경기 오분류율을 줄이는 방향으로 모형들을 적합시켰고 만들어진 모형의 유의한 변수들이 대부분 선수들의 이전 경기 성적 관련된 변수들이기 때문에 배당률이 큰 경기를 잘 예측하기는 힘들기 때문이다. 나아가서 사람들의 실제 관심이 경기 순위를 잘 예측하는 것이 아니라 배당금이 높은 경기를 잘 예측하는 것이라면 배당률을 모형에 반영하여 배당금을 높이는 방향으로 분석을 진행해 보는것도 좋을 것이라고 생각된다. | |
우리나라의 경우 경륜이란? | 경륜은 우리나라의 경우 7명의 선수가 직선주로가 아닌 333.33m의 경사진 타원형의 경주로(벨로드롬 사이클 트랙, Figure 1.1)를 총 5바퀴(1,691m) 돌면서 기록이 아닌 순위를 겨루는 자전거 경주이다. 경기는 선두고정경주 방식으로 진행된다. | |
본 논문에서 로지스틱 회귀를 사용하여 순위권에 진입할 확률에 영향을 주는 변수를 알아본 결과는? | 순위를 2-class로 변환하여 사용한 Classification 방법에서는 모든 변수를 사용한 로지스틱 회귀와AIC, BIC 기준 단계별 변수선택법을 이용한 로지스틱 회귀, 일반화가법모형, 랜덤 포레스트, 그래디언트 부스팅 모형을 사용하였다. BIC 기준 단계별 변수선택법을 이용한 로지스틱 회귀를 통해 1) 등급이강급될수록 2) 종합득점이 높을수록 3) 상대전적이 높을수록 순위권에 진입할 확률이 높아지고, 1) 승급될수록 2) 나이가 많을수록 3) 최근 1회전 경기를 한지 오래 될수록 4) 번호 4번을 부여받아 선행할수록5) 최근성적이 나쁠수록 순위권에 진입할 확률이 낮아짐을 확인할 수 있었다. 또한 랜덤 포레스트와 그래디언트 부스팅 모형에서 원자료를 사용했을 때 중요 변수는 등급 간의 차이를 조정할 필요가 없는 현재등급과 등급 별로 경기가 이루어진 최근성적 등수이고, 보정된 자료를 사용했을 때 중요 변수는 등급별로 값의 범위가 달라지는 종합득점과 성적순위라는 사실을 확인할 수 있었다. |
Cho, H. C., Kang, S. K., and Kim, J. K. (2008). Relationship of lower extremity factors, 200m record and Wingate anaerobic power in racing and competitive cyclists, Korean Journal of Sport Science, 19, 9-20.
Hastie, T., Tibshirani, R., and Friedman, J. (2001). The Elements of Statistical Learning; Data Mining, Inference and Prediction, Springer, New York.
Hoerl, A. E. and Kennard, R. W. (1970). Ridge regression: biased estimation for nonorthogonal problems, Technometrics, 12, 55-67.
Kim, B. S. and Kim, J. S. (2007). Relationship between customer satisfaction and patterns of ticket purchase of cycle racing customers, Journal of Sport and Leisure Studies, 30, 203-211.
Park, C., Kim, Y., Kim, J., Song, J., and Choi, H. (2011). Datamining using R, Kyowoo, Seoul.
Ridgeway, G. (2006). Generalized boosted models: a guide to the gbm package, Available from: http://cran.r-project.org/web/packages/gbm
Tibshirani, R. (1996). Regression shrinkage and selection via the LASSO, Journal of the Royal Statistical Society Series B (Methodological), 58, 267-288.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.