[논문]동영상 기반 학습 환경에서 머신러닝을 활용한 행동로그의 학업성취 예측 모형 탐색

이정은; 김다솜; 조일현

doi:10.32431/kace.2020.23.2.006

문제 정의

하지만 피험자 내 설계(within-subject design)로 1인 당 150건 이상의 개별 학습자 데이터로 머신러닝 연구가 가능하도록 보완하였다. 본 연구를 통해 출결 및 시험 성적 데이터 중심의 연구에서 학습 과정 중 데이터를 중심으로 학업성취에 주요한 영향을 주는 요인을 규명하고자 하였다. 본 연구에서 활용한 학습자 행동 데이터는 동영상 학습 상황에서의 학습자 행동 및 매체 사용에 대한 태도를 나타내기 때문에 플립러닝, 블렌디드 러닝과 같은 동영상을 활용하는 학습 환경에 대한 예측에도 공통적으로 적용할 수 있는 틀을 제시한다.
본 연구에서 사용된 동영상 학습 플레이어는 소셜 클 라우딩을 통한 동영상 기반 학습을 중심으로 양방향적 상호작용이 가능한 동영상 기반 학습[36][37]을 기술적으로 지원하기 위해 설계 및 개발되었다[38]. 학습자는 본 동영상 학습 플레이어를 통해 기본 영상 제어와 코멘트, 북마크, URL 링크 첨부 기능 등을 활용하여 학습 활동을 기록할 수 있고, 목록화된 형태로 열람할 수 있다.
본 연구를 통해 출결 및 시험 성적 데이터 중심의 연구에서 학습 과정 중 데이터를 중심으로 학업성취에 주요한 영향을 주는 요인을 규명하고자 하였다. 본 연구에서 활용한 학습자 행동 데이터는 동영상 학습 상황에서의 학습자 행동 및 매체 사용에 대한 태도를 나타내기 때문에 플립러닝, 블렌디드 러닝과 같은 동영상을 활용하는 학습 환경에 대한 예측에도 공통적으로 적용할 수 있는 틀을 제시한다. 특히 머신러닝기법을 활용하여 다양한 특성을 가진 학습자 행동을 분석할 수 있었다.
본 연구에서는 동영상 기반 학습 환경에서 학습자들의 인지적, 행동적 과정에 따라 발생하는 행동 로그 데이터를 분석하고, 머신러닝 기법에 따라 학습자 행동 로그가 학업성취를 어떻게 예측하는지 분석하고자 한다. 분석결과를 통해서는 학습에 영향을 미치는 학습자의 공통적 행동 요인을 도출하고 실제 동영상 학습 환경 설계에서의 적용점을 모색하고자 한다.
본 연구의 목적은 동영상 학습 상황에서의 학습자들의 지각과 인지적 과정에 따라 발생하는 학습 행동에 대한 결과가 학업에 미치는 영향을 분석하는 데 있다. 동영상 기반 학습 상황에서 학습자들의 지각된 어포던스가 학업성취에 미치는 영향을 규명하고자 하며, 시험 결과를 동영상 학습의 결과로서 학업성취를 측정하는 지표로 활용하였다.
본 연구에서는 동영상 기반 학습 환경에서 학습자들의 인지적, 행동적 과정에 따라 발생하는 행동 로그 데이터를 분석하고, 머신러닝 기법에 따라 학습자 행동 로그가 학업성취를 어떻게 예측하는지 분석하고자 한다. 분석결과를 통해서는 학습에 영향을 미치는 학습자의 공통적 행동 요인을 도출하고 실제 동영상 학습 환경 설계에서의 적용점을 모색하고자 한다.
본 연구에서는 상호작용이 가능한 동영상 기반 학습환경에서 학습자들의 인지적, 행동적 과정을 표상하는 지각된 어포던스에 대한 지표로 행동로그 데이터를 활용하였다. 행동로그가 학업성취를 예측하는지, 학업성취에 영향을 미치는 공통 행동이 무엇인지 탐색함으로써 동영상 학습 환경 설계 및 개발에 시사점을 제시하고자 하였다. 이를 위해 행동로그를 산출 및 수집하고, 기술통계와 머신러닝 기법으로 분석하였다.

제안 방법

본 연구의 목적은 동영상 학습 상황에서의 학습자들의 지각과 인지적 과정에 따라 발생하는 학습 행동에 대한 결과가 학업에 미치는 영향을 분석하는 데 있다. 동영상 기반 학습 상황에서 학습자들의 지각된 어포던스가 학업성취에 미치는 영향을 규명하고자 하며, 시험 결과를 동영상 학습의 결과로서 학업성취를 측정하는 지표로 활용하였다.
학습자는 본 동영상 학습 플레이어를 통해 기본 영상 제어와 코멘트, 북마크, URL 링크 첨부 기능 등을 활용하여 학습 활동을 기록할 수 있고, 목록화된 형태로 열람할 수 있다. 모든 연구대상자들은 독립된 실험환경에서 해당 동영상 학습 플레이어를 이용하여 자기주도적 학습을 진행하였다. 동영상 학습 플레이어 인터페이스 화면은 [그림 1]과 같다[38].
시험내용은 ‘수리논리학의 기초 증명’에 대한 것으로 시험 문항은 수학교육과 교수와 교육공학과 전문가가 협력하여 개발하였다. 본 시험은 총 44문항, 44점 만점으로 구성하였으며, 시험 문제 풀이를 위해 총 15분의 제한시간이 주어졌다. 모든 연구대상자는 제한시간 내에 시험을 응시하고, 모르는 문항은 공란으로 남겨두도록 안내받았다.
본 실험은 19일간 개별적으로 진행되었으며, 각 실험 참가자들에게는 실험 환경 준비와 개별 안내를 포함하여, 사전 및 사후 시험, 학습, 휴식시간까지 약 90분을 할당하며, 하루 최대 6명의 실험을 진행하였다. 참가자의 실험 준비가 완료되면 설계된 실험 절차에 따라 사전시험, 동영상 기반 학습, 사후시험의 순서로 진행하였다.
전처리 과정 후, 행동로그와 학업성취 데이터에 대한 기술통계 분석을 진행하고, 머신러닝기법을 통한 예측 모형을 도출하고 모형별 변수 중요도를 비교 분석하였다. 본 연구에서는 동일한 행동 로그 데이터를 토대로 머신러닝의 주요 기법으로 제시되는 각 알고리즘인, K-근접 이웃(K-Nearest Neighbors; KNN), 인공신경망(Artificial Neural Network), 서포트 벡터 머신(Support Vector Machine; SVM), 랜덤 포레스트(Random Forest) 기법을 적용하여 모형을 도출하고, 분류 분석 결과를 위주로 주요 변수별 중요도를 확인하였다.
분석 자료는 행동로그 데이터와 학업성취 데이터로 나누어 수집하였다. 행동로그는 동영상 학습 플레이어를 개발한 개발사의 데이터베이스에 저장된 행동로그 데이터를 추출하였으며, 학업성취 예측모형을 개발한 선행연구[38]를 기준으로 변수를 동일하게 8가지로 재범주화하고, 최종적으로 산출 된 16개의 행동로그 변수에 따라 자료를 분석하였다.
총 76명의 연구대상자들의 전반적인 행동로그 및 학업성취 데이터의 일반적 경향을 파악하기 위해 기술통계 분석을 실시하였다. 설명변수로 활용 된 행동로그 지표는 동영상 학습 플레이어 구동에 따른 행동으로 분류되었으며, 총 21가지로 구성되었다. 행동로그 지표는 <표 3>과 같이 행동 빈도와 및 행동 시간으로 나뉘었다.
시험내용은 ‘수리논리학의 기초 증명’에 대한 것으로 시험 문항은 수학교육과 교수와 교육공학과 전문가가 협력하여 개발하였다.
시험은 동영상 학습 전과 후를 기준으로 사전시험과 사후시험으로 나누었으며, 동형검사로 진행하였다. 시험내용은 ‘수리논리학의 기초 증명’에 대한 것으로 시험 문항은 수학교육과 교수와 교육공학과 전문가가 협력하여 개발하였다.
실험 배정이 완료된 참가자에게는 주의사항, 실험 장소 안내, 참여 확인 내용을 제시하고 관련 공지 사항을 설명하였다. 실험에 앞서 실험과 동일한 연구 환경에서 모의실험을 실행하고, 진행과 관련된 세부사항을 확인하고 개선하였다.
행동로그가 학업성취를 예측하는지, 학업성취에 영향을 미치는 공통 행동이 무엇인지 탐색함으로써 동영상 학습 환경 설계 및 개발에 시사점을 제시하고자 하였다. 이를 위해 행동로그를 산출 및 수집하고, 기술통계와 머신러닝 기법으로 분석하였다. 각각의 머신러닝 모델이 가지는 단점을 보완하여 해석하기 위해 주요 분류 모델인 K-근접 이웃, 인공신경망, 서포트 벡터 머신, 랜덤 포레스트를 활용하였다.
전처리 과정에서 연구대상자별로 취합한 행동로그 데이터 중 사전 및 사후시험 결과값이 결측치였던 2명의 데이터를 이상치로 보고 제외하여 최종 76명의 연구대상자의 실험 데이터를 활용하였다. 전처리 과정 후, 행동로그와 학업성취 데이터에 대한 기술통계 분석을 진행하고, 머신러닝기법을 통한 예측 모형을 도출하고 모형별 변수 중요도를 비교 분석하였다. 본 연구에서는 동일한 행동 로그 데이터를 토대로 머신러닝의 주요 기법으로 제시되는 각 알고리즘인, K-근접 이웃(K-Nearest Neighbors; KNN), 인공신경망(Artificial Neural Network), 서포트 벡터 머신(Support Vector Machine; SVM), 랜덤 포레스트(Random Forest) 기법을 적용하여 모형을 도출하고, 분류 분석 결과를 위주로 주요 변수별 중요도를 확인하였다.
본 실험은 19일간 개별적으로 진행되었으며, 각 실험 참가자들에게는 실험 환경 준비와 개별 안내를 포함하여, 사전 및 사후 시험, 학습, 휴식시간까지 약 90분을 할당하며, 하루 최대 6명의 실험을 진행하였다. 참가자의 실험 준비가 완료되면 설계된 실험 절차에 따라 사전시험, 동영상 기반 학습, 사후시험의 순서로 진행하였다.
k=4일 때와, k=20일 때의 정확도는 [그림 2]에서와 같이 동일하게 나타났다. 하지만 보다 정합성 있는 분석 결과를 도출하기 위해 k=4일 때 모델의 성능을 평가하였다.
본 연구는 기존의 빅 데이터를 중심으로 머신러닝을 활용한 연구와 달리 통제된 환경에서 일회적으로 진행된 실험 상황에서 적은 수의 학습자 데이터를 수집하였다. 하지만 피험자 내 설계(within-subject design)로 1인 당 150건 이상의 개별 학습자 데이터로 머신러닝 연구가 가능하도록 보완하였다. 본 연구를 통해 출결 및 시험 성적 데이터 중심의 연구에서 학습 과정 중 데이터를 중심으로 학업성취에 주요한 영향을 주는 요인을 규명하고자 하였다.
연구대상자는 2주간의 온라인 공고를 통해 수도권 소재 대학에 재학 중인 학부생을 모집하였다. 학교 홈페이지 게시판, 학교 커뮤니티 및 학생회 메신저를 통해 공고물을 배포하고, 연구 희망 참가자들의 일정을 조율하여 회신 후 최종적으로 실험 일정을 배정하였다. 실험 배정이 완료된 참가자에게는 주의사항, 실험 장소 안내, 참여 확인 내용을 제시하고 관련 공지 사항을 설명하였다.
분석 자료는 행동로그 데이터와 학업성취 데이터로 나누어 수집하였다. 행동로그는 동영상 학습 플레이어를 개발한 개발사의 데이터베이스에 저장된 행동로그 데이터를 추출하였으며, 학업성취 예측모형을 개발한 선행연구[38]를 기준으로 변수를 동일하게 8가지로 재범주화하고, 최종적으로 산출 된 16개의 행동로그 변수에 따라 자료를 분석하였다. 학업성취는 사전시험과 사후시험의 점수 결과를 이용하였다.
각각의 머신러닝 모델이 가지는 단점을 보완하여 해석하기 위해 주요 분류 모델인 K-근접 이웃, 인공신경망, 서포트 벡터 머신, 랜덤 포레스트를 활용하였다. 행동로그에 대한 학업성취를 분류하고 주요 행동들을 분석함으로써 각 모델에서 공통적으로 학업성취에 영향을 미치는 주요 행동을 도출하였다.

대상 데이터

본 실험에서는 외부 웹페이지 방문을 제한하였기 때문에 링크 달기 기능은 제외하고 동영상 학습 플레이어를 활용하였다.
다양한 머신러닝 모델을 활용한 교육 연구로는 이러닝 강의에 참여한 학습자의 출결, 과제 제출, 시험 성적 기록 등을 토대로 학습자 성취 수준을 예측한 것이 있다[41]. 본 연구는 기존의 빅 데이터를 중심으로 머신러닝을 활용한 연구와 달리 통제된 환경에서 일회적으로 진행된 실험 상황에서 적은 수의 학습자 데이터를 수집하였다. 하지만 피험자 내 설계(within-subject design)로 1인 당 150건 이상의 개별 학습자 데이터로 머신러닝 연구가 가능하도록 보완하였다.
본 연구는 수도권 소재 대학교 학부생 총 78명을 대상으로, 남자 33명(42.31%), 여자 45명(57.69%)으로 진행되었다. 실험에 참여한 연구대상자들은 인문계열 36명(46.
본 연구에서는 상호작용이 가능한 동영상 기반 학습환경에서 학습자들의 인지적, 행동적 과정을 표상하는 지각된 어포던스에 대한 지표로 행동로그 데이터를 활용하였다. 행동로그가 학업성취를 예측하는지, 학업성취에 영향을 미치는 공통 행동이 무엇인지 탐색함으로써 동영상 학습 환경 설계 및 개발에 시사점을 제시하고자 하였다.
69%)으로 진행되었다. 실험에 참여한 연구대상자들은 인문계열 36명(46.15%), 자연계열 42명(53.85%)으로 구성되었다.
본 연구는 크게 준비와 실험으로 구분되며, 준비 단계에서 생명윤리위원회의 심의와 결과에 따라 진행하였다[38]. 연구대상자는 2주간의 온라인 공고를 통해 수도권 소재 대학에 재학 중인 학부생을 모집하였다. 학교 홈페이지 게시판, 학교 커뮤니티 및 학생회 메신저를 통해 공고물을 배포하고, 연구 희망 참가자들의 일정을 조율하여 회신 후 최종적으로 실험 일정을 배정하였다.
수집한 데이터는 RStudio가 제공하는 패키지와 프로그램을 활용하여 분석과 시각화를 하였다. 전처리 과정에서 연구대상자별로 취합한 행동로그 데이터 중 사전 및 사후시험 결과값이 결측치였던 2명의 데이터를 이상치로 보고 제외하여 최종 76명의 연구대상자의 실험 데이터를 활용하였다. 전처리 과정 후, 행동로그와 학업성취 데이터에 대한 기술통계 분석을 진행하고, 머신러닝기법을 통한 예측 모형을 도출하고 모형별 변수 중요도를 비교 분석하였다.
학습자 행동로그 데이터는 지각된 어포던스의 직접적인 지표 변인으로서 앞서 언급한 동영상 학습 플레이어를 통해 수집되었다. 동영상 학습 플레이어는 재생, 동영상 탐색, 주석 생성, 주석 탐색, 외부환경 조정활동의 5가지 기능을 지원한다.

데이터처리

수집한 데이터는 RStudio가 제공하는 패키지와 프로그램을 활용하여 분석과 시각화를 하였다. 전처리 과정에서 연구대상자별로 취합한 행동로그 데이터 중 사전 및 사후시험 결과값이 결측치였던 2명의 데이터를 이상치로 보고 제외하여 최종 76명의 연구대상자의 실험 데이터를 활용하였다.
총 76명의 연구대상자들의 전반적인 행동로그 및 학업성취 데이터의 일반적 경향을 파악하기 위해 기술통계 분석을 실시하였다. 설명변수로 활용 된 행동로그 지표는 동영상 학습 플레이어 구동에 따른 행동으로 분류되었으며, 총 21가지로 구성되었다.

이론/모형

이를 위해 행동로그를 산출 및 수집하고, 기술통계와 머신러닝 기법으로 분석하였다. 각각의 머신러닝 모델이 가지는 단점을 보완하여 해석하기 위해 주요 분류 모델인 K-근접 이웃, 인공신경망, 서포트 벡터 머신, 랜덤 포레스트를 활용하였다. 행동로그에 대한 학업성취를 분류하고 주요 행동들을 분석함으로써 각 모델에서 공통적으로 학업성취에 영향을 미치는 주요 행동을 도출하였다.
사전시험 대비 사후시험 점수가 향상했는지에 따라 학업성취 유무 집단으로 구분하고 행동로그가 학업성취를 예측하는지 K-근접 이웃(K-Nearest Neighbor; KNN) 모형을 통해 예측력을 확인하였다. 모형을 도출하기 위해 k값을 1부터 10까지 설정하고 분석한 결과, 최적의 결과는 k=20이었지만(Accuracy=0.
서포트 벡터 머신(Support Vector Machine; SVM) 기법으로 학습자 행동로그에 따른 성취 유무를 예측하기 위해 RStudio에서 제공하는 e1071 패키지를 사용하여 분석을 진행하였다. 분류 유형으로 41개의 서포트 벡터 수를 가지고 결과를 예측한 결과, 95% 신뢰구간(0.
실제 값과 예측한 값에 대한 분류 모델 평가를 위해 교차분석(CrossTable)과 혼동행렬(Confusion Matrix)을 사용하였다. 교차분석에서는 총 관측치는 30개로 정밀도는 82.
71로 차이는있으나, Kappa계수가 0으로 신뢰하기 어려웠다. 학습률(Learning rate)을 0.5, 5개의 은닉 뉴런을 가지도록 설정한 훈련 데이터에 대한 인공신경망 분석 모델은 정확도 기준의 분류 문제로 nnet 방법을 사용하였다.

성능/효과

MDA 그래프 상 중요도가 높다고 분류된 행동변수는 코멘트 작성 시간, 총 일시정지 시간, 슬라이드 조정 시간, 외부환경 조정시간, 슬라이드 조정 빈도 순이었다. MDG 그래프에서는 총 재생시간, 동영상 탐색 시간, 총 일시정지 시간, 코멘트 작성 시간, 재생 빈도 순으로 중요하다고 나타났다. 두 지표에서 동일하게 중요도가 높다고 분류 된 변수는 코멘트 작성 시간, 총 일시정지 시간이었다.
SVM 최종 모델에 적용된 서포트 벡터 수는 43이었고, 85.71%의 동일한 정확도로 학업성취가 있을 것으로 예측하였다.
kernlab 패키지를 사용하여 SVM 분류를 한 결과 최적모델을 위한 파라미터는 sigma= 0.103328, cost=0.25였다(Accuracy=0.8166667, κ=0.0000000)[그림 8].
8571 에서 학업성취가 있을 것으로 분류하였다. tune.svm으로 예측률이 가장 좋은 파라미터를 확인한 결과, gamma=0.125, cost=0.125였다. 최적의 값을 넣었을 때의 서포트 벡터 수는 45이었다.
1429로 분류 추정 값이 불확실했다. 관찰된 정확도가 단순히 예측한 NIR(No Information Rate)와 유의미한 차이를 보이는지 나타내는 p-value 검정에 있어서도 정확도는 14.29%인데 NIR은 85.71로 차이는있으나, Kappa계수가 0으로 신뢰하기 어려웠다. 학습률(Learning rate)을 0.
실제 값과 예측한 값에 대한 분류 모델 평가를 위해 교차분석(CrossTable)과 혼동행렬(Confusion Matrix)을 사용하였다. 교차분석에서는 총 관측치는 30개로 정밀도는 82.1%, 재현율은 92.0% 정확도는 93.3의 결과로 모델 성능이 높은 것으로 확인되었다. 혼동행렬 결과에서도 모델에 대한 정확도가 83.
변수 중요도를 통해 도출한 학업성취에 영향을 가장 많이 미치는 학습자 행동은 서포트 벡터 머신, 인공신경망, 랜덤 포레스트 모형 모두 학습 중 동료 학습자가 작성한 코멘트를 확인하는 것으로 나타났다. 다음으로 학업성취를 높게 예측하는 행동은 총 일시정지 시간, 일시정지 빈도, 슬라이드 조정 빈도로 나타났다. 이는 학업성취가 있었던 대부분의 학생들이 성취가 없었던 학생들에 비해 코멘트 및 북마크 설정과 같이 학습에 있어 적극적인 행동을 보였던 점을 참고하면 동영상 학습에 있어 자신의 생각을 정리하는 일련의 행동을 위해 동영상을 일시적으로 정지시키거나, 학습자 스스로에게 적절한 학습환경을 조성하기 위해 슬라이드를 조작하는 행동을 했음을 추측할 수 있다.
두 가지 지표는 모두 값이 커질수록 변수 중요도가 높으며, 랜덤 포레스트 분류 결과 변수 중요도는 와 같이 나타났다.
더불어 코멘트 작성과 북마크 설정 등 학습 중 내용 정리 및 중요도 파악과 같은 사고 활동을 많이 한 학습자의 학업성취가 높았다. 따라서 학습자 간 상호작용이 가능한 동영상 학습 환경 설계가 필요하며, 학습자들이 학습 활동에 적극적으로 참여할 수 있도록 학습 환경에서의 지각된 어포던스를 부각시킬 필요가 있을 것이라는 시사점을 도출하였다.
랜덤 포레스트에서 설명변수의 중요도를 분석하였고, 변수 간 상관에 따라 시각화하여 도출한 결과 동료 학습자 코멘트 확인 빈도와 슬라이드 조정 빈도가 중요한 것으로 나타났다[그림 11].
모형을 도출하기 위해 k값을 1부터 10까지 설정하고 분석한 결과, 최적의 결과는 k=20이었지만(Accuracy=0.840000, κ=0.00000000), Kappa 계수가 0으로 신뢰할 수 없었다.
행동로그에서 빈도와 관련된 지표에서는 재생 빈도와 탐색 빈도가 가장 높은 평균 빈도를 보였다. 반대로 다른 학습자와의 상호작용을 나타내는 동료학습자 코멘트 확인, 답 코멘트 작성 행동과 좋아요 클릭 행동 빈도가 낮았으며, 개인학습에 있어서는 재생 환경 조정 빈도가 가장 낮았다. 행동로그의 지속시간과 관련해서는 총 재생 시간이 가장 높은 평균 지속시간을 나타냈으며, 슬라이드 조정 지표에 대해서는 가장 낮은 지속 시간이 나타났다.
변수 중요도를 통해 도출한 학업성취에 영향을 가장 많이 미치는 학습자 행동은 서포트 벡터 머신, 인공신경망, 랜덤 포레스트 모형 모두 학습 중 동료 학습자가 작성한 코멘트를 확인하는 것으로 나타났다. 다음으로 학업성취를 높게 예측하는 행동은 총 일시정지 시간, 일시정지 빈도, 슬라이드 조정 빈도로 나타났다.
하지만 현대 교육에서 동영상 학습이 보편화 되었으나 일반적인 동영상 학습이 학업성취에 항상 기여하지 못한다는 한계에 따라 보다 효과적인 방법으로 양방향적 동영상 학습이 제안되었다[37]. 본 연구에서도 양방향적 동영상 학습이 가능한 학습 환경에서 학습자 상호작용 행동이 학업성취에 영향을 미치는 결과를 도출하였다. 학습자 간 상호작용이라고 할 수 있는 동료 학습자가 작성한 코멘트를 확인하는 행동이 학업성취에 유의미하다는 결과를 도출했다.
북마크 및 코멘트 열람 빈도와 시간 92.4%, 일시정지 빈도와 총 시간 86.6%, 일시정지 빈도와 재생 빈도는 86.3%, 재생 빈도와 동영상 탐색 빈도가 82.6%로 높은 상관을 나타냈다. 대부분의 지표가 동일한 행동에 대한 빈도와 시간의 상관이 높게 평가되었으나 북마크와 코멘트 열람, 일시정지와 같은 행동을 한 실제 학습자의 수가 한정적이었기에 실제 데이터와 상이한 예측 결과를 도출하였다.
서포트 벡터 머신(Support Vector Machine; SVM) 기법으로 학습자 행동로그에 따른 성취 유무를 예측하기 위해 RStudio에서 제공하는 e1071 패키지를 사용하여 분석을 진행하였다. 분류 유형으로 41개의 서포트 벡터 수를 가지고 결과를 예측한 결과, 95% 신뢰구간(0.6366, 0.9695)에서 정확도가 0.8571 에서 학업성취가 있을 것으로 분류하였다. tune.
분석결과 모든 모델에서 상호작용이 가능한 동영상 학습 환경에서의 학업성취는 있을 것으로 예측하였다. 혼동행렬 분석 결과를 기준으로 예측력이 가장 높게 나온 알고리즘은 서포트 벡터 머신 모형이었으며, 인공신경망 모형의 분석력이 가장 낮았다.
56)점 향상된 결과를 성취하였다. 성취결과 최대 19점이 향상되기도 하였으나, 사전 성취 결과보다 7점 하락하기도 하였다.
실제 데이터에 대해 학업성취를 예측하는지를 인공신경망 기법을 통해 분석한 결과 학업성취가 거의 없을 것으로 예측하였다. 하지만 95% 신뢰구간(0.
의사결정 나무의 과적합과 불안정성 문제를 앙상블 기법으로 개선한 랜덤 포레스트는 설명 변수가 반응 변수를 예측하는 상대적인 중요도를 도출하여 실무적인 유용성이 크다고 할 수 있다. 최대 500개의 트리 분류 결과를 적용하여 랜덤 포레스트 분석 결과 최적의 mtry는 값은 1일 때 OOB error 18.18%, 2일 때 OOB error 20%이었다. 랜덤 포레스트 트리 수에 따른 오차율은 [그림 10]과 같이 나타난다.
최적 모델에 대한 예측 결과, 95% 신뢰구간(0.3402, 0.7818)에서 정확도는 0.5714로 실제 데이터와 달리 상당부분 상승했으며, 학업성취를 예측하는 것으로 나타났다. 인공신경망 기법에서 학업 성취를 예측하는 중요 행동로 그 지표는 동료 학습자 코멘트 확인 빈도와 일시정지 빈도, 북마크 및 코멘트 열람 빈도, 총 일시정지 시간, 총 재생시간이 학업성취에 가장 영향을 많이 미치는 것으로 나타났다[그림 7].
최적 모델을 도출한 결과 [그림 6]과 같이 모델 크기가 3이며 가중치는 70, 학습률에 대한 감쇠율(decay)을 0.1로 조정할 때, 정확도가 0.7822222(κ=0.0983622), 정확도에 대한 표준편차 0.1997604(κSD=0.3639474)로 최적 조정값이라고 제시되었다.
본 연구에서도 양방향적 동영상 학습이 가능한 학습 환경에서 학습자 상호작용 행동이 학업성취에 영향을 미치는 결과를 도출하였다. 학습자 간 상호작용이라고 할 수 있는 동료 학습자가 작성한 코멘트를 확인하는 행동이 학업성취에 유의미하다는 결과를 도출했다. 더불어 코멘트 작성과 북마크 설정 등 학습 중 내용 정리 및 중요도 파악과 같은 사고 활동을 많이 한 학습자의 학업성취가 높았다.
행동로그에서 빈도와 관련된 지표에서는 재생 빈도와 탐색 빈도가 가장 높은 평균 빈도를 보였다. 반대로 다른 학습자와의 상호작용을 나타내는 동료학습자 코멘트 확인, 답 코멘트 작성 행동과 좋아요 클릭 행동 빈도가 낮았으며, 개인학습에 있어서는 재생 환경 조정 빈도가 가장 낮았다.
반대로 다른 학습자와의 상호작용을 나타내는 동료학습자 코멘트 확인, 답 코멘트 작성 행동과 좋아요 클릭 행동 빈도가 낮았으며, 개인학습에 있어서는 재생 환경 조정 빈도가 가장 낮았다. 행동로그의 지속시간과 관련해서는 총 재생 시간이 가장 높은 평균 지속시간을 나타냈으며, 슬라이드 조정 지표에 대해서는 가장 낮은 지속 시간이 나타났다.
분석결과 모든 모델에서 상호작용이 가능한 동영상 학습 환경에서의 학업성취는 있을 것으로 예측하였다. 혼동행렬 분석 결과를 기준으로 예측력이 가장 높게 나온 알고리즘은 서포트 벡터 머신 모형이었으며, 인공신경망 모형의 분석력이 가장 낮았다. 동영상 학습 환경에서 학습자들이 가장 많이 하는 행동은 재생 활동과 같은 기본행위를 포함하여 동영상 탐색과 일시정지, 북마크 설정 및 코멘트 작성에 시간을 많이 할애하였다.
두 변수가 학업성취를 분류하는데 중요하게 작용한 결과에 따르면, 코멘트 작성과 동영상을 일시정지 하는 행동이 학업성취 분류를 위한 주요 속성으로 해석된다. 혼동행렬을 통해 본 모델의 정확도를 분석한 결과 95% 신뢰구간(0.5809, 0.9455)에서 정확도가 0.8095에서 학업성취가 있을 것으로 분류하였다.

후속연구

보다 우수한 예측률과 학습자 행동의 일반화된 경향성을 도출하기 위해서는 중장기적 관찰을 통한 데이터 수집이 필요하다. 그리고 학습자 성향과 수준을 고려하여 세부 집단별 데이터를 추가 확보한 후, 머신러닝 기법을 활용하면 학습자 특성에 따른 행동을 분류하고 학업성취 예측과 더불어 학습자의 학습 효과성을 증대시킬 수 있는 맞춤형 교수설계를 제공할 수 있을 것이다.
본 연구는 학습자 배경과 특성의 다양성을 충분히 고려하지 못한 한계를 가진다. 하지만 현대 교육에서 동영상 학습이 보편화 되었으나 일반적인 동영상 학습이 학업성취에 항상 기여하지 못한다는 한계에 따라 보다 효과적인 방법으로 양방향적 동영상 학습이 제안되었다[37].

핵심어	질문	논문에서 추출한 답변
	동영상 기반 학습이란 무엇인가?	동영상 기반 학습은 동영상을 활용한 학습으로, 교육맥락에서의 동영상은 문자와 그림, 소리 등의 시청각 자료를 통합하여, 단일 문자나 정적인 그림만 제공함으로 인해 내용 표현에 어려움이 있는 부분까지 전달해 주는 매체를 의미한다[21]. 이는 학습자의 집중과 몰입을 유발하고 인지적 실재감과 만족도를 향상시키는 효과적인 교수 학습 매체라고 할 수 있다[22][21].
	현대 교육환경에서 머신러닝 기법이 교육 연구에 더욱 유용하게 활용할 수 있는 이유는?	온라인 학습과 웹 기반 학습자 관리 시스템이 보편화된 현대 교육환경에서 머신러닝 기법은 교육 연구에 더욱 유용하게 활용할 수 있다. 학습자의 디지털 로그 파일이 빅데이터로 수집되기에 전통적인 통계기법으로는 분석이 어렵기 때문이다. 소수의 변수만을 이용한 모형 설정뿐만 아니라, 새로운 변수를 탐색할 수 있다는 점에서 머신러닝 기법은 학습분석학 연구에 있어서도 유용하게 활용할 수 있다[35].
	행동로그 데이터가 유망한 자원으로 여겨지는 이유는 무엇인가?	온라인 학습 환경에서 수집할 수 있는 학습자 데이터는 학습자 행동로그, 맥락, 제스처, 표정, 생리심리반응과 같은 생체 데이터 등 매우 다양하다[30]. 행동로그 데이터는 학습자의 클릭, 재생, 글쓰기와 같은 행동을 그대로 나타내는 데이터로, 교수자와 학습자가 분리되어 직접 관찰하기 힘든 학습자의 온라인 학습 행동 양상을 간접적으로 확인할 수 있다는 점에서 가장 유망한 자원으로 여겨진다[31]. 학습자와 학습 환경과의 상호작용을 통해 발생하는 행동은 인지적 정보처리 과정과 의도성을 내포하며, 특정 행동에 따른 로그 데이터는 환경에 대한 행위유발성을 표상한다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

[국내논문] 동영상 기반 학습 환경에서 머신러닝을 활용한 행동로그의 학업성취 예측 모형 탐색
Exploration of Predictive Model for Learning Achievement of Behavior Log Using Machine Learning in Video-based Learning Environment 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (41)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

[국내논문] 동영상 기반 학습 환경에서 머신러닝을 활용한 행동로그의 학업성취 예측 모형 탐색 Exploration of Predictive Model for Learning Achievement of Behavior Log Using Machine Learning in Video-based Learning Environment 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (41)

이 논문을 인용한 문헌

저자의 다른 논문 :

조일현 (2)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

[국내논문] 동영상 기반 학습 환경에서 머신러닝을 활용한 행동로그의 학업성취 예측 모형 탐색
Exploration of Predictive Model for Learning Achievement of Behavior Log Using Machine Learning in Video-based Learning Environment 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper