$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

통계적 예측모형을 활용한 경륜 경기 순위 분석
Analysis of cycle racing ranking using statistical prediction models 원문보기

응용통계연구 = The Korean journal of applied statistics, v.30 no.1, 2017년, pp.25 - 39  

박가희 (이화여자대학교 통계학과) ,  박리라 (이화여자대학교 통계학과) ,  송종우 (이화여자대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

최근 경륜은 2015년도 기준, 5백만 명 이상의 많은 사람들이 참여하고 2조를 넘어선 매출을 발생시키는 대중적인 레저스포츠로서 자리 잡고 있다. 본 연구의 목적은 다양한 통계적 분석기법을 사용하여 경륜경기의 순위를 예측하고, 순위에 유의한 영향을 미치는 변수들을 파악하는 데에 있다. 다양한 Classification 방법과 Regression 방법들을 적용하여 순위예측모형을 만들고 비교분석하였다. 대부분의 모형에서 공통적으로 선택된 변수들을 살펴보면, 등급이 강급될수록, 종합득점이 높을수록 순위가 높아지며 반대로 등급이 승급될수록, 번호 4번을 부여받을수록 그리고 최근성적의 순위가 낮을수록 순위가 낮아지는 것을 알 수 있었다. 또한, 선수의 실력과 관련된 연속형 변수들을 각 경기별로 평균값을 빼서 보정한 자료와 원자료를 사용하여 모형을 적합시킨 결과 모든 모형에서 보정된 자료를 사용하였을 때 더 낮은 오분류율을 보였다. 마지막으로 분석에 사용하지 않은 최근 한 달 경기결과를 예측해서 베팅했을 때 모든 경우에 예측률은 높았지만 큰 이익을 거두지 못했는데 그 이유는 낮은 배당률을 가진 경기의 결과만을 잘 예측했기 때문이다.

Abstract AI-Helper 아이콘AI-Helper

Over 5 million people participate in cycle racing betting and its revenue is more than 2 trillion won. This study predicts the ranking of cycle racing using various statistical analyses and identifies important variables which have influence on ranking. We propose competitive ranking prediction mode...

주제어

질의응답

핵심어 질문 논문에서 추출한 답변
금액을 베팅한 결과 손해가 발생한 이유는? 보통 최종 배당금이 높은 경기는 베팅을 적게 받은 선수가 승리하는 경우이다. 따라서 실제 베팅에서 손해가 발생한 이유는 우리가 모형을 만들 때 배당률은 고려하지 않고, 경기 오분류율을 줄이는 방향으로 모형들을 적합시켰고 만들어진 모형의 유의한 변수들이 대부분 선수들의 이전 경기 성적 관련된 변수들이기 때문에 배당률이 큰 경기를 잘 예측하기는 힘들기 때문이다. 나아가서 사람들의 실제 관심이 경기 순위를 잘 예측하는 것이 아니라 배당금이 높은 경기를 잘 예측하는 것이라면 배당률을 모형에 반영하여 배당금을 높이는 방향으로 분석을 진행해 보는것도 좋을 것이라고 생각된다.
우리나라의 경우 경륜이란? 경륜은 우리나라의 경우 7명의 선수가 직선주로가 아닌 333.33m의 경사진 타원형의 경주로(벨로드롬 사이클 트랙, Figure 1.1)를 총 5바퀴(1,691m) 돌면서 기록이 아닌 순위를 겨루는 자전거 경주이다. 경기는 선두고정경주 방식으로 진행된다.
본 논문에서 로지스틱 회귀를 사용하여 순위권에 진입할 확률에 영향을 주는 변수를 알아본 결과는? 순위를 2-class로 변환하여 사용한 Classification 방법에서는 모든 변수를 사용한 로지스틱 회귀와AIC, BIC 기준 단계별 변수선택법을 이용한 로지스틱 회귀, 일반화가법모형, 랜덤 포레스트, 그래디언트 부스팅 모형을 사용하였다. BIC 기준 단계별 변수선택법을 이용한 로지스틱 회귀를 통해 1) 등급이강급될수록 2) 종합득점이 높을수록 3) 상대전적이 높을수록 순위권에 진입할 확률이 높아지고, 1) 승급될수록 2) 나이가 많을수록 3) 최근 1회전 경기를 한지 오래 될수록 4) 번호 4번을 부여받아 선행할수록5) 최근성적이 나쁠수록 순위권에 진입할 확률이 낮아짐을 확인할 수 있었다. 또한 랜덤 포레스트와 그래디언트 부스팅 모형에서 원자료를 사용했을 때 중요 변수는 등급 간의 차이를 조정할 필요가 없는 현재등급과 등급 별로 경기가 이루어진 최근성적 등수이고, 보정된 자료를 사용했을 때 중요 변수는 등급별로 값의 범위가 달라지는 종합득점과 성적순위라는 사실을 확인할 수 있었다.
질의응답 정보가 도움이 되었나요?

참고문헌 (9)

  1. Breiman, L. (2001). Random forests, Machine Learning, 45, 5-32. 

  2. Cho, H. C., Kang, S. K., and Kim, J. K. (2008). Relationship of lower extremity factors, 200m record and Wingate anaerobic power in racing and competitive cyclists, Korean Journal of Sport Science, 19, 9-20. 

  3. Choe, H., Hwang, N., Hwang, C., and Song, J. (2015). Analysis of horse races : prediction of winning horses in horse races using statistical models, Korean Journal of Applied Statistics, 28, 1133-1146. 

  4. Hastie, T., Tibshirani, R., and Friedman, J. (2001). The Elements of Statistical Learning; Data Mining, Inference and Prediction, Springer, New York. 

  5. Hoerl, A. E. and Kennard, R. W. (1970). Ridge regression: biased estimation for nonorthogonal problems, Technometrics, 12, 55-67. 

  6. Kim, B. S. and Kim, J. S. (2007). Relationship between customer satisfaction and patterns of ticket purchase of cycle racing customers, Journal of Sport and Leisure Studies, 30, 203-211. 

  7. Park, C., Kim, Y., Kim, J., Song, J., and Choi, H. (2011). Datamining using R, Kyowoo, Seoul. 

  8. Ridgeway, G. (2006). Generalized boosted models: a guide to the gbm package, Available from: http://cran.r-project.org/web/packages/gbm 

  9. Tibshirani, R. (1996). Regression shrinkage and selection via the LASSO, Journal of the Royal Statistical Society Series B (Methodological), 58, 267-288. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로