본 연구에서는 최근 통계 분야에서 활용도가 급격히 높아지고 있는 중요한 컴퓨터 언어이자 오픈 소스 통계 프로그램인 R을 활용하는 '대화형(interactive) 통계학 입문 실습실'의 개발 과정과 내용 및 활용을 다룬다. 최근에 개발을 마치고 2014 서울 세계수학자대회에서 소개된 후, 통계 강좌 등에 실제 사용되는 웹상의 R을 활용한 본 대화형 통계학 입문 실습실의 특징은 웹상에서 본문과 예제의 설명 및 풀이과정과 함께 대응하는 R 명령어 코드들을 함께 박스안에 제공하여, 실습 때마다 일일이 컴퓨터 명령어 코드들을 입력해야하는 번거로움을 없앴다. 또한, 명령어의 실행을 위하여 프로그램을 설치하지 않고, 명령어 상자 아래 제공한 [클릭-실행] 버튼을 누르기만 하면, 클라우드 컴퓨팅으로 그 결과값과 그래픽을 동시에 바로 같은 화면에서 확인하면서, 시뮬레이션 및 실습을 할 수 있고, 더 나아가 그와 유사한 다른 문제에 함수와 조건만을 수정하여 바로 사용할 수 있는 편리함이 추가되었다. 그 결과 대화형 통계학 입문 실습실에서는 R 명령어를 이해하는 데 필요한 시간과 노력이 대폭 줄어들 뿐 아니라, 초보자에게 통계학 입문 과목을 지도하기에 적절하며, 그밖에 다양한 Java 시각화 도구와 이미지 및 통계 자료를 사용하여 사용자 맞춤형 강의실 개발이 가능하여 통계학입문 강의를 수강하는 학생들의 관심과 흥미를 유도할 수 있도록 하였다. 본 연구에서는 본 실습실을 통계입문 강좌의 효과적인 실습실 모델의 하나로 소개한다.
본 연구에서는 최근 통계 분야에서 활용도가 급격히 높아지고 있는 중요한 컴퓨터 언어이자 오픈 소스 통계 프로그램인 R을 활용하는 '대화형(interactive) 통계학 입문 실습실'의 개발 과정과 내용 및 활용을 다룬다. 최근에 개발을 마치고 2014 서울 세계수학자대회에서 소개된 후, 통계 강좌 등에 실제 사용되는 웹상의 R을 활용한 본 대화형 통계학 입문 실습실의 특징은 웹상에서 본문과 예제의 설명 및 풀이과정과 함께 대응하는 R 명령어 코드들을 함께 박스안에 제공하여, 실습 때마다 일일이 컴퓨터 명령어 코드들을 입력해야하는 번거로움을 없앴다. 또한, 명령어의 실행을 위하여 프로그램을 설치하지 않고, 명령어 상자 아래 제공한 [클릭-실행] 버튼을 누르기만 하면, 클라우드 컴퓨팅으로 그 결과값과 그래픽을 동시에 바로 같은 화면에서 확인하면서, 시뮬레이션 및 실습을 할 수 있고, 더 나아가 그와 유사한 다른 문제에 함수와 조건만을 수정하여 바로 사용할 수 있는 편리함이 추가되었다. 그 결과 대화형 통계학 입문 실습실에서는 R 명령어를 이해하는 데 필요한 시간과 노력이 대폭 줄어들 뿐 아니라, 초보자에게 통계학 입문 과목을 지도하기에 적절하며, 그밖에 다양한 Java 시각화 도구와 이미지 및 통계 자료를 사용하여 사용자 맞춤형 강의실 개발이 가능하여 통계학입문 강의를 수강하는 학생들의 관심과 흥미를 유도할 수 있도록 하였다. 본 연구에서는 본 실습실을 통계입문 강좌의 효과적인 실습실 모델의 하나로 소개한다.
In this paper, we introduce development process and application of a simple and effective model of a statistics laboratory using open source software R, one of leading language and environment for statistical computing and graphics. This model consists of HTML files, including Sage cells, video lect...
In this paper, we introduce development process and application of a simple and effective model of a statistics laboratory using open source software R, one of leading language and environment for statistical computing and graphics. This model consists of HTML files, including Sage cells, video lectures and enough internet resources. Users do not have to install statistical softwares to run their code. Clicking 'evaluate' button in the web page displays the result that is calculated through cloud-computing environment. Hence, with any type of mobile equipment and internet, learners can freely practice statistical concepts and theorems via various examples with sample R (or Sage) codes which were given, while instructors can easily design and modify it for his/her lectures, only gathering many existing resources and editing HTML file. This will be a resonable model of laboratory for studying statistics. This model with bunch of provided materials will reduce the time and effort needed for R-beginners to be acquainted with and understand R language and also stimulate beginners' interest in statistics. We introduce this interactive statistical laboratory as an useful model for beginners to learn basic statistical concepts and R.
In this paper, we introduce development process and application of a simple and effective model of a statistics laboratory using open source software R, one of leading language and environment for statistical computing and graphics. This model consists of HTML files, including Sage cells, video lectures and enough internet resources. Users do not have to install statistical softwares to run their code. Clicking 'evaluate' button in the web page displays the result that is calculated through cloud-computing environment. Hence, with any type of mobile equipment and internet, learners can freely practice statistical concepts and theorems via various examples with sample R (or Sage) codes which were given, while instructors can easily design and modify it for his/her lectures, only gathering many existing resources and editing HTML file. This will be a resonable model of laboratory for studying statistics. This model with bunch of provided materials will reduce the time and effort needed for R-beginners to be acquainted with and understand R language and also stimulate beginners' interest in statistics. We introduce this interactive statistical laboratory as an useful model for beginners to learn basic statistical concepts and R.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
R의 이용은 기존의 엑셀 또는 SAS, SPSS의 장점을 모두 가지고 있으며, 새로운 언어를 학습해야 하는 번거로움을 줄이면서, 데이터 처리(불러오기, 저장하기 등) 및 다른 프로그램과 호환이 가능하다. 따라서 본 연구에서는 이러한 현실적 어려움을 해결하기 위하여 통계 실습실의 주소를 사용한다면 많은 학생들이 손쉽게 이용할 수 있을 것이라는 아이디어를 적용하였다.
본 연구는 대학에서 배우는 통계학 지식의 습득과 실습을 시간과 장소에 구애받지 않고 누구나 무료로 활용할 수 있도록 하는 환경을 제공하는데 그 목적이 있다. 지금까지 대중적으로 활용되고 있는 상업용 통계 소프트웨어는 사용자에게 비용 부담이 될 뿐 아니라 설치한 소프트웨어의 유지와 보수 그리고 프로그래밍 언어 학습 등의 여러 가지 제한점을 가지고 있다.
특히 미적분학, 선형대수학 및 공학수학 교육을 위해 개발한 웹 콘텐츠와 모바일 콘텐츠 및 계산도구는 교재에 반영되어 교육에 꾸준히 활용되고 있다(고래영 외, 2009;김경원·이상구, 2013;이상구·신준국·김경원, 2014;이상구·이재화·김경원, 2014; 이상구·이재화·김덕선, 2012;이상구·장지은·김경원, 2013;Kim et al, 2013;Lee et al, 2014; Lee et al, 2013). 본 연구에서는 그간 축적된 Sage 활용의 기술력을 통계학에 적용하고 급속도로 많은 관심을 받고 있는 R을 접목시켜 통계 입문반에서 활용할 수 있는 대화형 통계학 입문 실습실 모델의 개발 내용을 소개한다.
본 연구진이 개발한 통계학 입문 실습실 모델을 어떻게 효율적으로 활용 할 수 있는지에 대하여 설명한다. 먼저 교수자는 자신이 강의하고자 하는 내용과 실습의 범위에 따라 기존에 이미 만들어진 실습실과는 차별화된 강의 맞춤형 실습실을 구성할 수 있다.
이 실습실은 통계입문 강좌의 효과적인 실습실의 모델이 될 수 있다고 판단한다. 이제 본 연구진이 개발한 R을 활용한 대화형 통계학 입문 실습실 모델의 구조와 활용 및 개발에 대하여 논한다.
제안 방법
그 결과 기존의 상업용 통계 소프트웨어를 사용할 때 제기되는 문제점들을 해결할 수 있을 뿐아니라, 아래 [그림 Ⅱ-1] 에서 보는 ‘스크롤바(Scroll Bar)’를 이용하여 마우스의 간단한 조작만으로도 다양한 시뮬레이션이 가능하도록 하였다.
모평균과 모비율에 대한 신뢰구간은 [그림 Ⅱ-12]와 같이 처리된다. 그 외에 실습실의 각 예제마다 각 단원의 중요한 정의나 정리 등을 간단하게 클릭하여 확인해 보면서 실습을 할 수 있도록 하여 사이버 실습실의 장점을 살렸다.
도 사용가능하다. 그러나 Sage 노트북은 로그인을 해야 하는 번거로움이 있으므로 본 실습실에서는 Sage 셀을 연산에 활용하였다.
본 연구에서 Sage를 활용하여 개발한 통계 실습실은 python 기반의 Sage 언어 대신에 통계학에서 최근 그 사용이 빠르게 확산되는 R 언어를 이용하여 모든 실습이 가능하도록 만들었다. 그리고 예제와 설명 아래에, R 명령어를 미리 입력하여 두어, 실습 때마다 매번 명령어를 입력해야하는 번거로움 없이 바로 실행하기를 클릭하면서 실습하고, 그와 유사한 다른 문제에 함수와 조건만 수정하여 바로 사용할 수 있도록 하였다. 더구나 R 소프트웨어를 다운 받아 사용해야 하는 불편함을 완전히 제거하였을 뿐만 아니라, 모바일 기기의 저장용량에도 전혀 영향을 받지 않는다([그림 Ⅱ-2] 참조).
지금까지 대중적으로 활용되고 있는 상업용 통계 소프트웨어는 사용자에게 비용 부담이 될 뿐 아니라 설치한 소프트웨어의 유지와 보수 그리고 프로그래밍 언어 학습 등의 여러 가지 제한점을 가지고 있다. 따라서 이러한 한계를 극복하고 모바일 시대에 맞도록 모바일 기기를 이용하여 언제 어디서든 쉽게 통계 프로그래밍을 실행할 수 있는 환경을 제공하기 위하여, 한국에 맞게 자체적으로 개발한 오픈소스 소프트웨어인 Sage 기반의 서버를 이용하여 통계학 입문에 필요한 콘텐츠와 웹(Web) 도구를 개발하였다. 그 결과 기존의 상업용 통계 소프트웨어를 사용할 때 제기되는 문제점들을 해결할 수 있을 뿐아니라, 아래 [그림 Ⅱ-1] 에서 보는 ‘스크롤바(Scroll Bar)’를 이용하여 마우스의 간단한 조작만으로도 다양한 시뮬레이션이 가능하도록 하였다.
먼저 각 실습실에는 다른 실습실로 연결되는 링크를 주어 자유자재로 실습실을 옮길 수 있도록 하였고, 사용된 “R 명령어 모음”11) 과 R 관련 동영상12) 및 관련 개념을 출처와 함께 첨부하여 추가정보에 접속할 수 있도록 하였다.
서론에서 언급한 바와 같이 Sage는 이미 미적분학, 선형대수학, 공학수학 실습실에서 활발히 이용되고 있다. 본 연구에서 Sage를 활용하여 개발한 통계 실습실은 python 기반의 Sage 언어 대신에 통계학에서 최근 그 사용이 빠르게 확산되는 R 언어를 이용하여 모든 실습이 가능하도록 만들었다. 그리고 예제와 설명 아래에, R 명령어를 미리 입력하여 두어, 실습 때마다 매번 명령어를 입력해야하는 번거로움 없이 바로 실행하기를 클릭하면서 실습하고, 그와 유사한 다른 문제에 함수와 조건만 수정하여 바로 사용할 수 있도록 하였다.
이미 세계 최고 수준의 모바일 인프라를 갖추고 있는 한국은 시간과 장소에 구애받지 않고 웹(Web) 도구를 이용하여 누구나 무료로 수학 연산 및 시뮬레이션 실습을 할 수 있는 잠재력을 갖추고 있다. 본 연구진은 이러한 강점을 활용하여 수 년 동안 공개 소프트웨어인 Sage7)를 기반으로 자체적으로 구축한 연산서버를 통해 다양한 시도를 하였다. 특히 미적분학, 선형대수학 및 공학수학 교육을 위해 개발한 웹 콘텐츠와 모바일 콘텐츠 및 계산도구는 교재에 반영되어 교육에 꾸준히 활용되고 있다(고래영 외, 2009;김경원·이상구, 2013;이상구·신준국·김경원, 2014;이상구·이재화·김경원, 2014; 이상구·이재화·김덕선, 2012;이상구·장지은·김경원, 2013;Kim et al, 2013;Lee et al, 2014; Lee et al, 2013).
C++ 언어를 대체하면서 21세기 현재 가장 주목 받는 오픈소스 소프트웨어인 Python 언어도 사용가능하다. 정의와 정리에 대한 설명, 흥미를 유발시키는 참고자료, 코드를 사용한 다양한 예시를 통해 학생들이 휴대용 기기를 사용해 공부할 수 있는 걸어 다니는 강의실 및 학습실을 실제로 구현하였다. R 또는 Sage의 소용량 버전이 아니라 웹사이트에 연결만 하면 바로 실행할 수 있기에 휴대용 기기의 용량을 차지하지 않는다.
대상 데이터
본론에서 소개한 통계 입문 강좌용 모든 실습은 노트북 PC 뿐만 아니라, 스마트폰, 갤럭시 탭, 아이패드를 포함한 다양한 모바일 기기에서 가능하도록 디자인된 대화형 통계학 입문 실습실이다. 이는 현대 사회의 휴대용 기기를 사용이 증가하는 추세에 맞추어 언제 어디서든 쉽게 프로그래밍을 학습, 수정, 실행이 가능하다는 커다란 장점을 확인해 준다.
통계 실습실은 하나의 html 파일에 기초통계학 강좌에 적합한 예제 문제와 R 명령어를 실행할 수 있는 Sage 셀, 통계 관련 웹페이지 주소 및 관련 강의 녹화 파일을 통합하여 구성되어 있다. 따라서 기본적인 Sage 명령어를 이용한 통계 및 확률 계산, R 명령어를 자유롭게 사용할 수 있다([그림 Ⅱ-3]).
성능/효과
그러나 R은 다양한 기본 시스템과 전문가들이 기여한 공개 패키지로 구성되어 있으며 현재 R의 패키지 수는 약 5천개 정도가 될 정도로 다양하다. 기존 타 메뉴 방식의 통계 소프트웨어와는 달리 오브젝트 기반으로 작동하므로 분석 결과를 나중 작업에 사용할 수 있으며 엑셀(Excel)의 자료를 쉽게 불러들이고 R에서 작업한 자료를 엑셀로 내 보낼 수 있는 장점이 있다.
과거에는 강의에서 배운 이론을 실습하기 위해 고가의 각종 통계 패키지를 구입하고 이의 사용법을 숙지하여야 했다. 본 연구에서 소개하는 통계 대화형 실습실에서는 프로그램을 설치할 필요 없이 인터넷만 연결되어 있으면 모바일을 통해 홈페이지에 접속하여 웹주소를 클릭하는 것만으로도 각종 통계 패키지의 사용과 연산 및 시뮬레이션 실습이 가능하다. 또한 수업에서 배우는 통계적 지식을 바탕으로 제시된 R 명령어를 통해 다양한 예제를 다룰 수 있다.
따라서 통계학 입문자에게 컴퓨터 코딩 지식을 통계학 입문 교육 안에서 가장 효과적으로 학습 시키는 방법에 대한 고려와 대안 제시는 필수적이다. 본 연구와 개발 결과는 통계학 입문에 필요한 코딩 지식을 포함한 R 명령어를 이해하는 데 필요한 시간과 노력을 대폭 줄여 줄 뿐 아니라, 초보자에게 통계학 입문 과목을 지도하기에도 적절하다. 게다가 다양한 동영상 및 학습 자료의 사용으로 실제 학생들의 관심과 흥미를 유도할 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
R이란?
R은 다양한 통계 계산 기법과 그래픽스 및 수치 해석 기법을 지원하는 오픈 소스 프로그래밍 언어이자 소프트웨어 환경이다(Bloomfield, 2014;Stowell, 2014). R은 특히 수학 기호를 포함할 수 있는 출판물 수준의 훌륭한 그래픽 기능 때문에, 통계학자들 사이에서 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있다.
통계적 지식과 활용을 위한 대표적인 프로그래밍 언어는 무엇이 있는가?
대학의 통계학 강좌에 활용되는 많은 소프트웨어 중에 본 연구에서주목한 것은 현재 대학뿐만 아니라 구글과 페이스북, 뉴욕타임즈 등이 사용하는 R4)이다. 2014년 6월 3일 권위 있는 데이터 캠프 블로그에 실린 ‘What is the best statistical programming language?’ 5)라는 제목의 글에서, 통계학의 가장 보편적인 소프트웨어 3개가 SAS, SPSS, R 임을 확인하였으며, 특히 2013년 당신이 사용한 통계학 소프트웨어 부분 설문조사에서 R은 SAS나 SPSS를 압도적으로 추월하면서 1등으로 선정되었다.
R의 장점은?
R은 다양한 통계 계산 기법과 그래픽스 및 수치 해석 기법을 지원하는 오픈 소스 프로그래밍 언어이자 소프트웨어 환경이다(Bloomfield, 2014;Stowell, 2014). R은 특히 수학 기호를 포함할 수 있는 출판물 수준의 훌륭한 그래픽 기능 때문에, 통계학자들 사이에서 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있다. R은 최초 설치시 함께 설치되는 핵심적인 패키지이외에, 사용자가 직접 제작한 패키지들을 쉽게 추가하여 기능을 확장할 수 있도록 설계되었다.
참고문헌 (15)
고래영?김덕선?박진영?이상구 (2009). 모바일 환경에서의 Sage-Math의 개발과 선형대수학에서의 활용, 한국 수학교육학회지 시리즈 E , 23(4), 1023-1041. Ko, R.-Y., Kim, D.-S., Bak, J.-Y. & Lee, S.-G. (2009). Development of Mobile Sage-math and its use in Linear Algebra, J. Korea Soc. Math. Ed. Ser. E: Communications of Mathematical Education, 23(4), 1023-1041.
김경원?이상구 (2013). 모바일 선형대수학 스마트폰 콘텐츠 개발과 활용, 한국수학교육학회지 시리즈 E , 27(2), 121-134. Kim, K.-W. & Lee, S.-G. (2013). Development of smart-phone contents for mobile linear algebra, J. Korea Soc. Math. Ed. Ser. E: Communications of Mathematical Education, 27(2), 121-134.
이상구?신준국?김경원 (2014). 스토리텔링 수학 교과서에서 공학적 도구의 활용과 미분적분학 단원에 대한 개발 사례, 한국수학교육학회지 시리즈 E , 28(1), 65-79. Lee, S.-G., Shin, J. & Kim, K.-W. (2014). A Case Study of Perceptions on Storytelling Mathematics Textbooks with Computer Algebra System, J. Korea Soc. Math. Ed. Ser. E: Communications of Mathematical Education, 28(1), 65-79.
이상구?이재화?김경원 (2014). [빅북] 선형대수학, 교보출판사. Lee, S.-G., Lee, J. H. & Kim, K.-W. (2014). [BigBook] Linear Algebra, Kyobo Book. http://matrix.skku.ac.kr/2015-Album/BigBook-LinearAlgebra-SGLee-New-2015.pdf
이상구?이재화?김덕선 (2012). 현대선형대수학 with Sage, 경문사. Lee, S.-G., Lee, J. H. & Kim, D.-S. (2012). Contemporary Linear Algebra with Sage, KyungMoonSa.
이상구?장지은?김경원 (2013). Sage와 GeoGebra를 이용한 선형대수학 개념의 Visual-Dynamic 자료 개발과 활용, 한국수학교육학회지 시리즈 E , 27(1), 1-17. Lee, S.-G., Jang, J.-E. & Kim, K.-W. (2013). Visualization of Linear Algebra concepts with Sage and GeoGebra, J. Korea Soc. Math. Ed. Ser. E: Communications of Mathematical Education, 27(1), 1-17.
최용석?정광모 (2003). SAS를 활용한 다변량 분석 기법과 응용, 자유아카데미. Choi, Y,-S. & Jeong, K.M(2003). Methods and Applications of Multivariate Analysis Using SAS, Free Academy.
최용석 (2014a). [빅북] R과 함께하는 통계학의 이해, 교보출판사. Choi, Y.-S. (2014a). [BigBook] Introduction to Statistics with R, Kyobo Book.
최용석 (2014b). 다차원척도법의 산책, 자유아카데미. Choi, Y.-S. (2014b). Walk in Multidimensional Scaling, Free Academy.
허명회 (2014). 응용데이터분석, 자유아카데미. Huh, M.-H. (2014). Applied Data Analysis Using R, Free Academy.
Bloomfield, V. A. (2014). Using R for Numerical Analysis in Science and Engineering, Chapman & Hall/CRC.
Kim, K.-W., Lee, S.-G. & Sun, S. (2013). Modeling of Mobile Sage and Graphing Calculator, Journal of Modern Education Review, 3(12), 918-925.
Lee, S.-G., Kim, E.-K., Ham, Y., Kumar, A., Beezer. R., Vu, Q.-P., Simon, L. & Hwang, S.-G. (2014). Calculus with Sage, KyungMoonSa. http://matrix.skku.ac.kr/Cal-Book
Lee, S.-G., Kim, K.-W. & Lee, J. H. (2013). Sage matrix calculator and full Sage contents for linear algebra, Korean J. Math., 21(4), 503-521.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.