[국내논문]동영상 기반 학습 환경에서 머신러닝을 활용한 행동로그의 학업성취 예측 모형 탐색 Exploration of Predictive Model for Learning Achievement of Behavior Log Using Machine Learning in Video-based Learning Environment원문보기
동영상 강의 중심의 온라인 학습 형태가 보편화 되고 지속적으로 증가됨에 따라 다양한 교육방법을 적용한 동영상 기반 학습 환경도 학습 효과성을 높이기 위해 변화, 발전하고 있다. 온라인 학습 환경에서의 교육 효과성 측정을 위해 학습자 로그 데이터가 대두되었으며, 학습자 맞춤형 학습 처방을 위해 로그 데이터의 다양한 분석 방법이 중요하다. 이를 위해 본 연구에서는 동영상 기반 학습 환경에서의 학습자 행동 데이터 분석, 머신러닝 기법에 따른 학업성취 예측을 실험을 통해 분석하였다. 분석 결과 각 모델에서 공통적으로 동영상 탐색과 코멘트 작성과 같은 상호작용 행동, 학습자 주도적 학습 행동이 학업성취를 예측하였다. 연구 결과를 토대로 동영상 학습 환경 설계에 있어 시사점을 제공하였다.
동영상 강의 중심의 온라인 학습 형태가 보편화 되고 지속적으로 증가됨에 따라 다양한 교육방법을 적용한 동영상 기반 학습 환경도 학습 효과성을 높이기 위해 변화, 발전하고 있다. 온라인 학습 환경에서의 교육 효과성 측정을 위해 학습자 로그 데이터가 대두되었으며, 학습자 맞춤형 학습 처방을 위해 로그 데이터의 다양한 분석 방법이 중요하다. 이를 위해 본 연구에서는 동영상 기반 학습 환경에서의 학습자 행동 데이터 분석, 머신러닝 기법에 따른 학업성취 예측을 실험을 통해 분석하였다. 분석 결과 각 모델에서 공통적으로 동영상 탐색과 코멘트 작성과 같은 상호작용 행동, 학습자 주도적 학습 행동이 학업성취를 예측하였다. 연구 결과를 토대로 동영상 학습 환경 설계에 있어 시사점을 제공하였다.
As online learning forms centered on video lectures become more common and constantly increasing, the video-based learning environment applying various educational methods is also changing and developing to enhance learning effectiveness. Learner's log data has emerged for measuring the effectivenes...
As online learning forms centered on video lectures become more common and constantly increasing, the video-based learning environment applying various educational methods is also changing and developing to enhance learning effectiveness. Learner's log data has emerged for measuring the effectiveness of education in the online learning environment, and various analysis methods of log data are important for learner's customized learning prescriptions. To this end, the study analyzed learner behavior data and predictions of achievement by machine learning in video-based learning environments. As a result, interactive behaviors such as video navigation and comment writing, and learner-led learning behaviors predicted achievement in common in each model. Based on the results, the study provided implications for the design of the video learning environment.
As online learning forms centered on video lectures become more common and constantly increasing, the video-based learning environment applying various educational methods is also changing and developing to enhance learning effectiveness. Learner's log data has emerged for measuring the effectiveness of education in the online learning environment, and various analysis methods of log data are important for learner's customized learning prescriptions. To this end, the study analyzed learner behavior data and predictions of achievement by machine learning in video-based learning environments. As a result, interactive behaviors such as video navigation and comment writing, and learner-led learning behaviors predicted achievement in common in each model. Based on the results, the study provided implications for the design of the video learning environment.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
하지만 피험자 내 설계(within-subject design)로 1인 당 150건 이상의 개별 학습자 데이터로 머신러닝 연구가 가능하도록 보완하였다. 본 연구를 통해 출결 및 시험 성적 데이터 중심의 연구에서 학습 과정 중 데이터를 중심으로 학업성취에 주요한 영향을 주는 요인을 규명하고자 하였다. 본 연구에서 활용한 학습자 행동 데이터는 동영상 학습 상황에서의 학습자 행동 및 매체 사용에 대한 태도를 나타내기 때문에 플립러닝, 블렌디드 러닝과 같은 동영상을 활용하는 학습 환경에 대한 예측에도 공통적으로 적용할 수 있는 틀을 제시한다.
본 연구에서 사용된 동영상 학습 플레이어는 소셜 클 라우딩을 통한 동영상 기반 학습을 중심으로 양방향적 상호작용이 가능한 동영상 기반 학습[36][37]을 기술적으로 지원하기 위해 설계 및 개발되었다[38]. 학습자는 본 동영상 학습 플레이어를 통해 기본 영상 제어와 코멘트, 북마크, URL 링크 첨부 기능 등을 활용하여 학습 활동을 기록할 수 있고, 목록화된 형태로 열람할 수 있다.
본 연구를 통해 출결 및 시험 성적 데이터 중심의 연구에서 학습 과정 중 데이터를 중심으로 학업성취에 주요한 영향을 주는 요인을 규명하고자 하였다. 본 연구에서 활용한 학습자 행동 데이터는 동영상 학습 상황에서의 학습자 행동 및 매체 사용에 대한 태도를 나타내기 때문에 플립러닝, 블렌디드 러닝과 같은 동영상을 활용하는 학습 환경에 대한 예측에도 공통적으로 적용할 수 있는 틀을 제시한다. 특히 머신러닝기법을 활용하여 다양한 특성을 가진 학습자 행동을 분석할 수 있었다.
본 연구에서는 동영상 기반 학습 환경에서 학습자들의 인지적, 행동적 과정에 따라 발생하는 행동 로그 데이터를 분석하고, 머신러닝 기법에 따라 학습자 행동 로그가 학업성취를 어떻게 예측하는지 분석하고자 한다. 분석결과를 통해서는 학습에 영향을 미치는 학습자의 공통적 행동 요인을 도출하고 실제 동영상 학습 환경 설계에서의 적용점을 모색하고자 한다.
본 연구의 목적은 동영상 학습 상황에서의 학습자들의 지각과 인지적 과정에 따라 발생하는 학습 행동에 대한 결과가 학업에 미치는 영향을 분석하는 데 있다. 동영상 기반 학습 상황에서 학습자들의 지각된 어포던스가 학업성취에 미치는 영향을 규명하고자 하며, 시험 결과를 동영상 학습의 결과로서 학업성취를 측정하는 지표로 활용하였다.
본 연구에서는 동영상 기반 학습 환경에서 학습자들의 인지적, 행동적 과정에 따라 발생하는 행동 로그 데이터를 분석하고, 머신러닝 기법에 따라 학습자 행동 로그가 학업성취를 어떻게 예측하는지 분석하고자 한다. 분석결과를 통해서는 학습에 영향을 미치는 학습자의 공통적 행동 요인을 도출하고 실제 동영상 학습 환경 설계에서의 적용점을 모색하고자 한다.
본 연구에서는 상호작용이 가능한 동영상 기반 학습환경에서 학습자들의 인지적, 행동적 과정을 표상하는 지각된 어포던스에 대한 지표로 행동로그 데이터를 활용하였다. 행동로그가 학업성취를 예측하는지, 학업성취에 영향을 미치는 공통 행동이 무엇인지 탐색함으로써 동영상 학습 환경 설계 및 개발에 시사점을 제시하고자 하였다. 이를 위해 행동로그를 산출 및 수집하고, 기술통계와 머신러닝 기법으로 분석하였다.
제안 방법
본 연구의 목적은 동영상 학습 상황에서의 학습자들의 지각과 인지적 과정에 따라 발생하는 학습 행동에 대한 결과가 학업에 미치는 영향을 분석하는 데 있다. 동영상 기반 학습 상황에서 학습자들의 지각된 어포던스가 학업성취에 미치는 영향을 규명하고자 하며, 시험 결과를 동영상 학습의 결과로서 학업성취를 측정하는 지표로 활용하였다.
학습자는 본 동영상 학습 플레이어를 통해 기본 영상 제어와 코멘트, 북마크, URL 링크 첨부 기능 등을 활용하여 학습 활동을 기록할 수 있고, 목록화된 형태로 열람할 수 있다. 모든 연구대상자들은 독립된 실험환경에서 해당 동영상 학습 플레이어를 이용하여 자기주도적 학습을 진행하였다. 동영상 학습 플레이어 인터페이스 화면은 [그림 1]과 같다[38].
시험내용은 ‘수리논리학의 기초 증명’에 대한 것으로 시험 문항은 수학교육과 교수와 교육공학과 전문가가 협력하여 개발하였다. 본 시험은 총 44문항, 44점 만점으로 구성하였으며, 시험 문제 풀이를 위해 총 15분의 제한시간이 주어졌다. 모든 연구대상자는 제한시간 내에 시험을 응시하고, 모르는 문항은 공란으로 남겨두도록 안내받았다.
본 실험은 19일간 개별적으로 진행되었으며, 각 실험 참가자들에게는 실험 환경 준비와 개별 안내를 포함하여, 사전 및 사후 시험, 학습, 휴식시간까지 약 90분을 할당하며, 하루 최대 6명의 실험을 진행하였다. 참가자의 실험 준비가 완료되면 설계된 실험 절차에 따라 사전시험, 동영상 기반 학습, 사후시험의 순서로 진행하였다.
전처리 과정 후, 행동로그와 학업성취 데이터에 대한 기술통계 분석을 진행하고, 머신러닝기법을 통한 예측 모형을 도출하고 모형별 변수 중요도를 비교 분석하였다. 본 연구에서는 동일한 행동 로그 데이터를 토대로 머신러닝의 주요 기법으로 제시되는 각 알고리즘인, K-근접 이웃(K-Nearest Neighbors; KNN), 인공신경망(Artificial Neural Network), 서포트 벡터 머신(Support Vector Machine; SVM), 랜덤 포레스트(Random Forest) 기법을 적용하여 모형을 도출하고, 분류 분석 결과를 위주로 주요 변수별 중요도를 확인하였다.
분석 자료는 행동로그 데이터와 학업성취 데이터로 나누어 수집하였다. 행동로그는 동영상 학습 플레이어를 개발한 개발사의 데이터베이스에 저장된 행동로그 데이터를 추출하였으며, 학업성취 예측모형을 개발한 선행연구[38]를 기준으로 변수를 동일하게 8가지로 재범주화하고, 최종적으로 산출 된 16개의 행동로그 변수에 따라 자료를 분석하였다.
총 76명의 연구대상자들의 전반적인 행동로그 및 학업성취 데이터의 일반적 경향을 파악하기 위해 기술통계 분석을 실시하였다. 설명변수로 활용 된 행동로그 지표는 동영상 학습 플레이어 구동에 따른 행동으로 분류되었으며, 총 21가지로 구성되었다. 행동로그 지표는 <표 3>과 같이 행동 빈도와 및 행동 시간으로 나뉘었다.
시험내용은 ‘수리논리학의 기초 증명’에 대한 것으로 시험 문항은 수학교육과 교수와 교육공학과 전문가가 협력하여 개발하였다.
시험은 동영상 학습 전과 후를 기준으로 사전시험과 사후시험으로 나누었으며, 동형검사로 진행하였다. 시험내용은 ‘수리논리학의 기초 증명’에 대한 것으로 시험 문항은 수학교육과 교수와 교육공학과 전문가가 협력하여 개발하였다.
실험 배정이 완료된 참가자에게는 주의사항, 실험 장소 안내, 참여 확인 내용을 제시하고 관련 공지 사항을 설명하였다. 실험에 앞서 실험과 동일한 연구 환경에서 모의실험을 실행하고, 진행과 관련된 세부사항을 확인하고 개선하였다.
행동로그가 학업성취를 예측하는지, 학업성취에 영향을 미치는 공통 행동이 무엇인지 탐색함으로써 동영상 학습 환경 설계 및 개발에 시사점을 제시하고자 하였다. 이를 위해 행동로그를 산출 및 수집하고, 기술통계와 머신러닝 기법으로 분석하였다. 각각의 머신러닝 모델이 가지는 단점을 보완하여 해석하기 위해 주요 분류 모델인 K-근접 이웃, 인공신경망, 서포트 벡터 머신, 랜덤 포레스트를 활용하였다.
전처리 과정에서 연구대상자별로 취합한 행동로그 데이터 중 사전 및 사후시험 결과값이 결측치였던 2명의 데이터를 이상치로 보고 제외하여 최종 76명의 연구대상자의 실험 데이터를 활용하였다. 전처리 과정 후, 행동로그와 학업성취 데이터에 대한 기술통계 분석을 진행하고, 머신러닝기법을 통한 예측 모형을 도출하고 모형별 변수 중요도를 비교 분석하였다. 본 연구에서는 동일한 행동 로그 데이터를 토대로 머신러닝의 주요 기법으로 제시되는 각 알고리즘인, K-근접 이웃(K-Nearest Neighbors; KNN), 인공신경망(Artificial Neural Network), 서포트 벡터 머신(Support Vector Machine; SVM), 랜덤 포레스트(Random Forest) 기법을 적용하여 모형을 도출하고, 분류 분석 결과를 위주로 주요 변수별 중요도를 확인하였다.
본 실험은 19일간 개별적으로 진행되었으며, 각 실험 참가자들에게는 실험 환경 준비와 개별 안내를 포함하여, 사전 및 사후 시험, 학습, 휴식시간까지 약 90분을 할당하며, 하루 최대 6명의 실험을 진행하였다. 참가자의 실험 준비가 완료되면 설계된 실험 절차에 따라 사전시험, 동영상 기반 학습, 사후시험의 순서로 진행하였다.
k=4일 때와, k=20일 때의 정확도는 [그림 2]에서와 같이 동일하게 나타났다. 하지만 보다 정합성 있는 분석 결과를 도출하기 위해 k=4일 때 모델의 성능을 평가하였다.
본 연구는 기존의 빅 데이터를 중심으로 머신러닝을 활용한 연구와 달리 통제된 환경에서 일회적으로 진행된 실험 상황에서 적은 수의 학습자 데이터를 수집하였다. 하지만 피험자 내 설계(within-subject design)로 1인 당 150건 이상의 개별 학습자 데이터로 머신러닝 연구가 가능하도록 보완하였다. 본 연구를 통해 출결 및 시험 성적 데이터 중심의 연구에서 학습 과정 중 데이터를 중심으로 학업성취에 주요한 영향을 주는 요인을 규명하고자 하였다.
연구대상자는 2주간의 온라인 공고를 통해 수도권 소재 대학에 재학 중인 학부생을 모집하였다. 학교 홈페이지 게시판, 학교 커뮤니티 및 학생회 메신저를 통해 공고물을 배포하고, 연구 희망 참가자들의 일정을 조율하여 회신 후 최종적으로 실험 일정을 배정하였다. 실험 배정이 완료된 참가자에게는 주의사항, 실험 장소 안내, 참여 확인 내용을 제시하고 관련 공지 사항을 설명하였다.
분석 자료는 행동로그 데이터와 학업성취 데이터로 나누어 수집하였다. 행동로그는 동영상 학습 플레이어를 개발한 개발사의 데이터베이스에 저장된 행동로그 데이터를 추출하였으며, 학업성취 예측모형을 개발한 선행연구[38]를 기준으로 변수를 동일하게 8가지로 재범주화하고, 최종적으로 산출 된 16개의 행동로그 변수에 따라 자료를 분석하였다. 학업성취는 사전시험과 사후시험의 점수 결과를 이용하였다.
각각의 머신러닝 모델이 가지는 단점을 보완하여 해석하기 위해 주요 분류 모델인 K-근접 이웃, 인공신경망, 서포트 벡터 머신, 랜덤 포레스트를 활용하였다. 행동로그에 대한 학업성취를 분류하고 주요 행동들을 분석함으로써 각 모델에서 공통적으로 학업성취에 영향을 미치는 주요 행동을 도출하였다.
대상 데이터
본 실험에서는 외부 웹페이지 방문을 제한하였기 때문에 링크 달기 기능은 제외하고 동영상 학습 플레이어를 활용하였다.
다양한 머신러닝 모델을 활용한 교육 연구로는 이러닝 강의에 참여한 학습자의 출결, 과제 제출, 시험 성적 기록 등을 토대로 학습자 성취 수준을 예측한 것이 있다[41]. 본 연구는 기존의 빅 데이터를 중심으로 머신러닝을 활용한 연구와 달리 통제된 환경에서 일회적으로 진행된 실험 상황에서 적은 수의 학습자 데이터를 수집하였다. 하지만 피험자 내 설계(within-subject design)로 1인 당 150건 이상의 개별 학습자 데이터로 머신러닝 연구가 가능하도록 보완하였다.
본 연구는 수도권 소재 대학교 학부생 총 78명을 대상으로, 남자 33명(42.31%), 여자 45명(57.69%)으로 진행되었다. 실험에 참여한 연구대상자들은 인문계열 36명(46.
본 연구에서는 상호작용이 가능한 동영상 기반 학습환경에서 학습자들의 인지적, 행동적 과정을 표상하는 지각된 어포던스에 대한 지표로 행동로그 데이터를 활용하였다. 행동로그가 학업성취를 예측하는지, 학업성취에 영향을 미치는 공통 행동이 무엇인지 탐색함으로써 동영상 학습 환경 설계 및 개발에 시사점을 제시하고자 하였다.
69%)으로 진행되었다. 실험에 참여한 연구대상자들은 인문계열 36명(46.15%), 자연계열 42명(53.85%)으로 구성되었다.
본 연구는 크게 준비와 실험으로 구분되며, 준비 단계에서 생명윤리위원회의 심의와 결과에 따라 진행하였다[38]. 연구대상자는 2주간의 온라인 공고를 통해 수도권 소재 대학에 재학 중인 학부생을 모집하였다. 학교 홈페이지 게시판, 학교 커뮤니티 및 학생회 메신저를 통해 공고물을 배포하고, 연구 희망 참가자들의 일정을 조율하여 회신 후 최종적으로 실험 일정을 배정하였다.
수집한 데이터는 RStudio가 제공하는 패키지와 프로그램을 활용하여 분석과 시각화를 하였다. 전처리 과정에서 연구대상자별로 취합한 행동로그 데이터 중 사전 및 사후시험 결과값이 결측치였던 2명의 데이터를 이상치로 보고 제외하여 최종 76명의 연구대상자의 실험 데이터를 활용하였다. 전처리 과정 후, 행동로그와 학업성취 데이터에 대한 기술통계 분석을 진행하고, 머신러닝기법을 통한 예측 모형을 도출하고 모형별 변수 중요도를 비교 분석하였다.
학습자 행동로그 데이터는 지각된 어포던스의 직접적인 지표 변인으로서 앞서 언급한 동영상 학습 플레이어를 통해 수집되었다. 동영상 학습 플레이어는 재생, 동영상 탐색, 주석 생성, 주석 탐색, 외부환경 조정활동의 5가지 기능을 지원한다.
데이터처리
수집한 데이터는 RStudio가 제공하는 패키지와 프로그램을 활용하여 분석과 시각화를 하였다. 전처리 과정에서 연구대상자별로 취합한 행동로그 데이터 중 사전 및 사후시험 결과값이 결측치였던 2명의 데이터를 이상치로 보고 제외하여 최종 76명의 연구대상자의 실험 데이터를 활용하였다.
총 76명의 연구대상자들의 전반적인 행동로그 및 학업성취 데이터의 일반적 경향을 파악하기 위해 기술통계 분석을 실시하였다. 설명변수로 활용 된 행동로그 지표는 동영상 학습 플레이어 구동에 따른 행동으로 분류되었으며, 총 21가지로 구성되었다.
이론/모형
이를 위해 행동로그를 산출 및 수집하고, 기술통계와 머신러닝 기법으로 분석하였다. 각각의 머신러닝 모델이 가지는 단점을 보완하여 해석하기 위해 주요 분류 모델인 K-근접 이웃, 인공신경망, 서포트 벡터 머신, 랜덤 포레스트를 활용하였다. 행동로그에 대한 학업성취를 분류하고 주요 행동들을 분석함으로써 각 모델에서 공통적으로 학업성취에 영향을 미치는 주요 행동을 도출하였다.
사전시험 대비 사후시험 점수가 향상했는지에 따라 학업성취 유무 집단으로 구분하고 행동로그가 학업성취를 예측하는지 K-근접 이웃(K-Nearest Neighbor; KNN) 모형을 통해 예측력을 확인하였다. 모형을 도출하기 위해 k값을 1부터 10까지 설정하고 분석한 결과, 최적의 결과는 k=20이었지만(Accuracy=0.
서포트 벡터 머신(Support Vector Machine; SVM) 기법으로 학습자 행동로그에 따른 성취 유무를 예측하기 위해 RStudio에서 제공하는 e1071 패키지를 사용하여 분석을 진행하였다. 분류 유형으로 41개의 서포트 벡터 수를 가지고 결과를 예측한 결과, 95% 신뢰구간(0.
실제 값과 예측한 값에 대한 분류 모델 평가를 위해 교차분석(CrossTable)과 혼동행렬(Confusion Matrix)을 사용하였다. 교차분석에서는 총 관측치는 30개로 정밀도는 82.
71로 차이는있으나, Kappa계수가 0으로 신뢰하기 어려웠다. 학습률(Learning rate)을 0.5, 5개의 은닉 뉴런을 가지도록 설정한 훈련 데이터에 대한 인공신경망 분석 모델은 정확도 기준의 분류 문제로 nnet 방법을 사용하였다.
성능/효과
MDA 그래프 상 중요도가 높다고 분류된 행동변수는 코멘트 작성 시간, 총 일시정지 시간, 슬라이드 조정 시간, 외부환경 조정시간, 슬라이드 조정 빈도 순이었다. MDG 그래프에서는 총 재생시간, 동영상 탐색 시간, 총 일시정지 시간, 코멘트 작성 시간, 재생 빈도 순으로 중요하다고 나타났다. 두 지표에서 동일하게 중요도가 높다고 분류 된 변수는 코멘트 작성 시간, 총 일시정지 시간이었다.
SVM 최종 모델에 적용된 서포트 벡터 수는 43이었고, 85.71%의 동일한 정확도로 학업성취가 있을 것으로 예측하였다.
kernlab 패키지를 사용하여 SVM 분류를 한 결과 최적모델을 위한 파라미터는 sigma= 0.103328, cost=0.25였다(Accuracy=0.8166667, κ=0.0000000)[그림 8].
8571 에서 학업성취가 있을 것으로 분류하였다. tune.svm으로 예측률이 가장 좋은 파라미터를 확인한 결과, gamma=0.125, cost=0.125였다. 최적의 값을 넣었을 때의 서포트 벡터 수는 45이었다.
1429로 분류 추정 값이 불확실했다. 관찰된 정확도가 단순히 예측한 NIR(No Information Rate)와 유의미한 차이를 보이는지 나타내는 p-value 검정에 있어서도 정확도는 14.29%인데 NIR은 85.71로 차이는있으나, Kappa계수가 0으로 신뢰하기 어려웠다. 학습률(Learning rate)을 0.
실제 값과 예측한 값에 대한 분류 모델 평가를 위해 교차분석(CrossTable)과 혼동행렬(Confusion Matrix)을 사용하였다. 교차분석에서는 총 관측치는 30개로 정밀도는 82.1%, 재현율은 92.0% 정확도는 93.3의 결과로 모델 성능이 높은 것으로 확인되었다. 혼동행렬 결과에서도 모델에 대한 정확도가 83.
변수 중요도를 통해 도출한 학업성취에 영향을 가장 많이 미치는 학습자 행동은 서포트 벡터 머신, 인공신경망, 랜덤 포레스트 모형 모두 학습 중 동료 학습자가 작성한 코멘트를 확인하는 것으로 나타났다. 다음으로 학업성취를 높게 예측하는 행동은 총 일시정지 시간, 일시정지 빈도, 슬라이드 조정 빈도로 나타났다. 이는 학업성취가 있었던 대부분의 학생들이 성취가 없었던 학생들에 비해 코멘트 및 북마크 설정과 같이 학습에 있어 적극적인 행동을 보였던 점을 참고하면 동영상 학습에 있어 자신의 생각을 정리하는 일련의 행동을 위해 동영상을 일시적으로 정지시키거나, 학습자 스스로에게 적절한 학습환경을 조성하기 위해 슬라이드를 조작하는 행동을 했음을 추측할 수 있다.
두 가지 지표는 모두 값이 커질수록 변수 중요도가 높으며, 랜덤 포레스트 분류 결과 변수 중요도는 와 같이 나타났다.
더불어 코멘트 작성과 북마크 설정 등 학습 중 내용 정리 및 중요도 파악과 같은 사고 활동을 많이 한 학습자의 학업성취가 높았다. 따라서 학습자 간 상호작용이 가능한 동영상 학습 환경 설계가 필요하며, 학습자들이 학습 활동에 적극적으로 참여할 수 있도록 학습 환경에서의 지각된 어포던스를 부각시킬 필요가 있을 것이라는 시사점을 도출하였다.
랜덤 포레스트에서 설명변수의 중요도를 분석하였고, 변수 간 상관에 따라 시각화하여 도출한 결과 동료 학습자 코멘트 확인 빈도와 슬라이드 조정 빈도가 중요한 것으로 나타났다[그림 11].
모형을 도출하기 위해 k값을 1부터 10까지 설정하고 분석한 결과, 최적의 결과는 k=20이었지만(Accuracy=0.840000, κ=0.00000000), Kappa 계수가 0으로 신뢰할 수 없었다.
행동로그에서 빈도와 관련된 지표에서는 재생 빈도와 탐색 빈도가 가장 높은 평균 빈도를 보였다. 반대로 다른 학습자와의 상호작용을 나타내는 동료학습자 코멘트 확인, 답 코멘트 작성 행동과 좋아요 클릭 행동 빈도가 낮았으며, 개인학습에 있어서는 재생 환경 조정 빈도가 가장 낮았다. 행동로그의 지속시간과 관련해서는 총 재생 시간이 가장 높은 평균 지속시간을 나타냈으며, 슬라이드 조정 지표에 대해서는 가장 낮은 지속 시간이 나타났다.
변수 중요도를 통해 도출한 학업성취에 영향을 가장 많이 미치는 학습자 행동은 서포트 벡터 머신, 인공신경망, 랜덤 포레스트 모형 모두 학습 중 동료 학습자가 작성한 코멘트를 확인하는 것으로 나타났다. 다음으로 학업성취를 높게 예측하는 행동은 총 일시정지 시간, 일시정지 빈도, 슬라이드 조정 빈도로 나타났다.
하지만 현대 교육에서 동영상 학습이 보편화 되었으나 일반적인 동영상 학습이 학업성취에 항상 기여하지 못한다는 한계에 따라 보다 효과적인 방법으로 양방향적 동영상 학습이 제안되었다[37]. 본 연구에서도 양방향적 동영상 학습이 가능한 학습 환경에서 학습자 상호작용 행동이 학업성취에 영향을 미치는 결과를 도출하였다. 학습자 간 상호작용이라고 할 수 있는 동료 학습자가 작성한 코멘트를 확인하는 행동이 학업성취에 유의미하다는 결과를 도출했다.
북마크 및 코멘트 열람 빈도와 시간 92.4%, 일시정지 빈도와 총 시간 86.6%, 일시정지 빈도와 재생 빈도는 86.3%, 재생 빈도와 동영상 탐색 빈도가 82.6%로 높은 상관을 나타냈다. 대부분의 지표가 동일한 행동에 대한 빈도와 시간의 상관이 높게 평가되었으나 북마크와 코멘트 열람, 일시정지와 같은 행동을 한 실제 학습자의 수가 한정적이었기에 실제 데이터와 상이한 예측 결과를 도출하였다.
서포트 벡터 머신(Support Vector Machine; SVM) 기법으로 학습자 행동로그에 따른 성취 유무를 예측하기 위해 RStudio에서 제공하는 e1071 패키지를 사용하여 분석을 진행하였다. 분류 유형으로 41개의 서포트 벡터 수를 가지고 결과를 예측한 결과, 95% 신뢰구간(0.6366, 0.9695)에서 정확도가 0.8571 에서 학업성취가 있을 것으로 분류하였다. tune.
분석결과 모든 모델에서 상호작용이 가능한 동영상 학습 환경에서의 학업성취는 있을 것으로 예측하였다. 혼동행렬 분석 결과를 기준으로 예측력이 가장 높게 나온 알고리즘은 서포트 벡터 머신 모형이었으며, 인공신경망 모형의 분석력이 가장 낮았다.
56)점 향상된 결과를 성취하였다. 성취결과 최대 19점이 향상되기도 하였으나, 사전 성취 결과보다 7점 하락하기도 하였다.
실제 데이터에 대해 학업성취를 예측하는지를 인공신경망 기법을 통해 분석한 결과 학업성취가 거의 없을 것으로 예측하였다. 하지만 95% 신뢰구간(0.
의사결정 나무의 과적합과 불안정성 문제를 앙상블 기법으로 개선한 랜덤 포레스트는 설명 변수가 반응 변수를 예측하는 상대적인 중요도를 도출하여 실무적인 유용성이 크다고 할 수 있다. 최대 500개의 트리 분류 결과를 적용하여 랜덤 포레스트 분석 결과 최적의 mtry는 값은 1일 때 OOB error 18.18%, 2일 때 OOB error 20%이었다. 랜덤 포레스트 트리 수에 따른 오차율은 [그림 10]과 같이 나타난다.
최적 모델에 대한 예측 결과, 95% 신뢰구간(0.3402, 0.7818)에서 정확도는 0.5714로 실제 데이터와 달리 상당부분 상승했으며, 학업성취를 예측하는 것으로 나타났다. 인공신경망 기법에서 학업 성취를 예측하는 중요 행동로 그 지표는 동료 학습자 코멘트 확인 빈도와 일시정지 빈도, 북마크 및 코멘트 열람 빈도, 총 일시정지 시간, 총 재생시간이 학업성취에 가장 영향을 많이 미치는 것으로 나타났다[그림 7].
최적 모델을 도출한 결과 [그림 6]과 같이 모델 크기가 3이며 가중치는 70, 학습률에 대한 감쇠율(decay)을 0.1로 조정할 때, 정확도가 0.7822222(κ=0.0983622), 정확도에 대한 표준편차 0.1997604(κSD=0.3639474)로 최적 조정값이라고 제시되었다.
본 연구에서도 양방향적 동영상 학습이 가능한 학습 환경에서 학습자 상호작용 행동이 학업성취에 영향을 미치는 결과를 도출하였다. 학습자 간 상호작용이라고 할 수 있는 동료 학습자가 작성한 코멘트를 확인하는 행동이 학업성취에 유의미하다는 결과를 도출했다. 더불어 코멘트 작성과 북마크 설정 등 학습 중 내용 정리 및 중요도 파악과 같은 사고 활동을 많이 한 학습자의 학업성취가 높았다.
행동로그에서 빈도와 관련된 지표에서는 재생 빈도와 탐색 빈도가 가장 높은 평균 빈도를 보였다. 반대로 다른 학습자와의 상호작용을 나타내는 동료학습자 코멘트 확인, 답 코멘트 작성 행동과 좋아요 클릭 행동 빈도가 낮았으며, 개인학습에 있어서는 재생 환경 조정 빈도가 가장 낮았다.
반대로 다른 학습자와의 상호작용을 나타내는 동료학습자 코멘트 확인, 답 코멘트 작성 행동과 좋아요 클릭 행동 빈도가 낮았으며, 개인학습에 있어서는 재생 환경 조정 빈도가 가장 낮았다. 행동로그의 지속시간과 관련해서는 총 재생 시간이 가장 높은 평균 지속시간을 나타냈으며, 슬라이드 조정 지표에 대해서는 가장 낮은 지속 시간이 나타났다.
분석결과 모든 모델에서 상호작용이 가능한 동영상 학습 환경에서의 학업성취는 있을 것으로 예측하였다. 혼동행렬 분석 결과를 기준으로 예측력이 가장 높게 나온 알고리즘은 서포트 벡터 머신 모형이었으며, 인공신경망 모형의 분석력이 가장 낮았다. 동영상 학습 환경에서 학습자들이 가장 많이 하는 행동은 재생 활동과 같은 기본행위를 포함하여 동영상 탐색과 일시정지, 북마크 설정 및 코멘트 작성에 시간을 많이 할애하였다.
두 변수가 학업성취를 분류하는데 중요하게 작용한 결과에 따르면, 코멘트 작성과 동영상을 일시정지 하는 행동이 학업성취 분류를 위한 주요 속성으로 해석된다. 혼동행렬을 통해 본 모델의 정확도를 분석한 결과 95% 신뢰구간(0.5809, 0.9455)에서 정확도가 0.8095에서 학업성취가 있을 것으로 분류하였다.
후속연구
보다 우수한 예측률과 학습자 행동의 일반화된 경향성을 도출하기 위해서는 중장기적 관찰을 통한 데이터 수집이 필요하다. 그리고 학습자 성향과 수준을 고려하여 세부 집단별 데이터를 추가 확보한 후, 머신러닝 기법을 활용하면 학습자 특성에 따른 행동을 분류하고 학업성취 예측과 더불어 학습자의 학습 효과성을 증대시킬 수 있는 맞춤형 교수설계를 제공할 수 있을 것이다.
본 연구는 학습자 배경과 특성의 다양성을 충분히 고려하지 못한 한계를 가진다. 하지만 현대 교육에서 동영상 학습이 보편화 되었으나 일반적인 동영상 학습이 학업성취에 항상 기여하지 못한다는 한계에 따라 보다 효과적인 방법으로 양방향적 동영상 학습이 제안되었다[37].
질의응답
핵심어
질문
논문에서 추출한 답변
동영상 기반 학습이란 무엇인가?
동영상 기반 학습은 동영상을 활용한 학습으로, 교육맥락에서의 동영상은 문자와 그림, 소리 등의 시청각 자료를 통합하여, 단일 문자나 정적인 그림만 제공함으로 인해 내용 표현에 어려움이 있는 부분까지 전달해 주는 매체를 의미한다[21]. 이는 학습자의 집중과 몰입을 유발하고 인지적 실재감과 만족도를 향상시키는 효과적인 교수 학습 매체라고 할 수 있다[22][21].
현대 교육환경에서 머신러닝 기법이 교육 연구에 더욱 유용하게 활용할 수 있는 이유는?
온라인 학습과 웹 기반 학습자 관리 시스템이 보편화된 현대 교육환경에서 머신러닝 기법은 교육 연구에 더욱 유용하게 활용할 수 있다. 학습자의 디지털 로그 파일이 빅데이터로 수집되기에 전통적인 통계기법으로는 분석이 어렵기 때문이다. 소수의 변수만을 이용한 모형 설정뿐만 아니라, 새로운 변수를 탐색할 수 있다는 점에서 머신러닝 기법은 학습분석학 연구에 있어서도 유용하게 활용할 수 있다[35].
행동로그 데이터가 유망한 자원으로 여겨지는 이유는 무엇인가?
온라인 학습 환경에서 수집할 수 있는 학습자 데이터는 학습자 행동로그, 맥락, 제스처, 표정, 생리심리반응과 같은 생체 데이터 등 매우 다양하다[30]. 행동로그 데이터는 학습자의 클릭, 재생, 글쓰기와 같은 행동을 그대로 나타내는 데이터로, 교수자와 학습자가 분리되어 직접 관찰하기 힘든 학습자의 온라인 학습 행동 양상을 간접적으로 확인할 수 있다는 점에서 가장 유망한 자원으로 여겨진다[31]. 학습자와 학습 환경과의 상호작용을 통해 발생하는 행동은 인지적 정보처리 과정과 의도성을 내포하며, 특정 행동에 따른 로그 데이터는 환경에 대한 행위유발성을 표상한다.
참고문헌 (41)
산업통상자원부.정보통신산업진흥원 (2019). 2018년 이러닝 산업 실태조사. 세종:산업통상자원부.
Zorrilla, M. E., Menasalvas, E., Marin, D., Mora, E., & Segovia, J. (2005). Web Usage Mining Project for Improving Web-Based Learning Sites. In Web Mining Workshop. Cataluna (pp.1-22).
Romero, C., & Ventura, S. (2010). Educational data mining: A Review of The State-of-the-art. IEEE Transactions on Systems, Man and Cybernetics, 40(6), 601-618.
이은환.이종연 (2013). 스마트교육 환경에서 학습자 특성, 상호작용, 몰입, 지각된 유용성 및 학습만족도의 구조적 관계 분석-초등학교를 중심으로-. 교육정보미디어연구, 19(3), 573-603.
김선영 (2016). 융합(STEAM)형 디자인 교육을 위한 행동유도성 학습환경 고찰-노먼의 인지적 어포던스 디자인 이론을 중심으로-. 디자인융복합연구, 15(5), 105-118.
Gibson, J. J. (1979). The Ecological Approach to Visual Perception. Houghton Mifflin, New York.
Norman, D. A. (1988). The Psychology of Everyday Things. New York: Basic Books.
Mishra P. & Koehler, M. J. (2006). Technological Pedagogical Content Knowledge: A Framework for Teacher Knowledge. Teachers College Record, 108(6), 1017-1054.
Brinton, C. G., & Chiang, M. (2015, April). MOOC performance prediction via clickstream data and social learning networks. In 2015 IEEE conference on computer communications (INFOCOM) (pp. 2299-2307). IEEE.
Yoo, J. E. (2018). TIMSS 2011 Student and Teacher Pre dictors for Mathematics Achievement Explored and Identified via Elastic Net. Frontiers in Psychology, 9, 317. Retrieved from https://www.frontiersin.org/articles/10.3389/fpsyg.2018.00317/full
Cutler, D. R., Edwards, T. C., Beard, K. H., Cutler, A., Hess, K. T., Gibson, J., & Lawler, J. J. (2007). Random forests for classification in ecology. Ecology, 88, 2783-2792.
Strobl, C., Malley, J., & Tutz, G. (2009). An introduction to recursive partitioning: Rationale, application, and characteristics of classification and regression trees, bagging, and random forests. Psychological Methods, 14, 323-348.
Hastie, T., Tibshirani, R., & Friedman, J. H. (2009). The elements of statistical learning: Data mining, inference, and prediction (2nd ed.). New York: Springer.
Mayer, R. E. (2009). Multimedia Learning (Vol. 2nd ed). Cambridge: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?directtrue &dbe000xww&AN400712& langko&siteehost-live
Maniar, N., Bennett, E., Hand, S., & Allan, G. (2008). The Effect of Mobile Phone Screen Size on Video Based Learning. Journal of software,3(4), 51-61.
김지현 (2019). 동영상 기반 학습 환경에서 학습자의 시각 행동에 의한 입체적 학습과정 분석 및 학습성과 예측모형 개발. 석사학위 논문. 이화여자대학교.
임철일 (2001). 웹 기반 자기조절학습환경을 위한 설계 전략의 특성과 효과. 교육공학연구, 17(3), 53-83.
고호경 (2016). 스마트 기기 활용 시니어 수학 앱 개발을 위한 어포던스 설계 전략. E-수학교육 논문집, 30(1), 85-99.
박형주 (2012). 이러닝 콘텐츠 사용자 인터페이스의 교육적 사용성 증진을 위한 어포던스 설계 전략 개발. 박사학위논문. 중앙대학교.
민병택 (2007). 스마트 공간 환경에 있어 어포던스 디자인의 요인과 구조. 석사학위논문. 홍익대학교.
김성훈.김인수 (2013). 인지적 어포던스 기반의 인터랙티브 e-퍼블리싱 컨텐츠 디자인에 관한 연구. 디자인지식저널, 25, 355-366.
박성억 (2010). 공공기관 교육용 콘텐츠의 학습효과 증진을 위한 디자인 전략. 한국콘텐츠학회논문지, 10(3), 444-453.
Bower, M., & Hedberg, J. G. (2010). A Quantitative Multimodal Discourse Analysis of Teaching and Learning in a Web-conferencing Environment-the Efficacy of Student-centred Learning Designs. Computers & education, 54(2), 462-478.
Black, E. W., Dawson, K., & Priem, J. (2008). Data for Free: Using LMS Activity Logs to Measure Community in Online Courses. The Internet and Higher Education, 11(2), 65-70.
Mesgari, M., & Okoli, C. (2015). Ecological Approach to User Sensemaking of Technology. In Proceeding of International Conference on Information Systems, 1-12.
Bzdok, D., Altman, N., & Krzywinski, M. (2018). Statistics Versus Machine Learning. Nature Methods, 15(4), 233-234.
Yoo, J. E., & Rho, M. (2018). Exploration of Predictors to Teacher Job Satisfaction Using TALIS 2013 Korea Data. Presented at the 19th ICER(International Conference on Educational Research). Seoul, South Korea.
Kleftodimos A., & Evangelidis G. (2016) An Interactive Video-Based Learning Environment Supporting Learning Analytics: Insights Obtained from Analyzing Learner Activity Data. In State-of-the-Art and Future Directions of Smart Learning, 471-481.
Zhang, D., Zhou, L., Briggs, R. O., & Nunamaker Jr, J. F. (2006). Instructional video in e-learning: Assessing the impact of interactive video on learning effectiveness. Information & management, 43(1), 15-27.
김다솜 (2019). 동영상 기반 학습 환경에서 지각된 어포던스를 통한 학업성취 예측모형 개발: 행동 로그와 안구 운동을 중심으로. 석사학위 논문. 이화여자대학교.
Altman, D. G. (1991). Practical Statistics for Medical Research. London: Chapman and Hall.
Archer, K. J., & Kimes, R. V. (2008). Empirical characterization of random forest variable importance measures. Computational Statistics & Data Analysis, 52(4), 2249-2260.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.