[논문]모의실험을 통한 표본 강의평가제의 실현 가능성 탐구

김용태; 김성윤; 이상준

doi:10.5392/jkca.2018.18.02.468

모의실험을 통한 표본 강의평가제의 실현 가능성 탐구
The Practicability of the Sample Course Evaluation System through Simulation 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.18 no.2, 2018년, pp.468 - 475

김용태 (세명대학교 교양대학) , 김성윤 (배화여자대학교 경영과) , 이상준 (세명대학교 정보통신학부)

초록
AI-Helper

현재 국내 대학들이 강의평가의 저조한 참여율을 보완하기 위해 부가한 강제성은 학생들의 불성실한 응답을 야기하여 평가결과의 타당성을 크게 저해하는 요인으로 지적되고 있다. 본 연구는 전수조사로 진행되는 강의평가제의 문제점을 지적하고 표본 강의평가제를 그 대안으로 제시하면서 표본평균을 이용해 모평균을 추론하는 것이 통계적으로 의미 있다는 것을 모의실험을 통해 확인하고자 한다. 이를 위해 2016년 2학기 S 대학에서 개설된 강좌의 소형, 중형, 대형, 사이버 강좌를 모집단으로 가정하였고, 각 강좌의 강의평가 평균점수를 모평균으로 가정하였다. 그리고 표본수의 결정을 위하여 직전년도 동일 교과목에 대한 평균과 표준편차를 사용하였고, 신뢰수준은 95%, 오차한계는 ${\pm}0.25$로 하였다. 데이터 분석도구인 R을 이용한 모의실험 시행결과 소형, 중형, 대형, 사이버 강좌 모두 모평균을 포함하는 신뢰수준이 95% 이상 근사하는 것으로 나타나 대표성 있는 표본 강의평가제의 실현 가능성을 확인하였다.

Abstract ▼ AI-Helper

The current system of making course evaluations mandatory in universities in Korea in order to supplement low participation levels is a major hindering factor for the validity of the evaluation results due to students' insincere responses. This study points out the problems in course evaluations that are in the form of surveys and instead proposes a sample course evaluation system that utilizes a sample mean to deduce a population mean, attempting to prove through simulation that this is statistically significant. Thus, small, medium, and large scale courses as well as cyber courses that were available in S University in the fall 2016 semester were set as the population, and each course's evaluation average grade was set as the population mean. Furthermore, we used the average grade and standard deviation of the same courses from the previous year in order to decide the sample number, the reliability level was set as 95%, and the margin of error was set as ${\pm}0.25$. As a result of carrying out a simulation using the data analysis tool R, all the courses (small scale, medium scale, large scale, and cyber) showed to have a reliability level close to 95% including the population mean, and consequently practicality of the representative sample course evaluation system was proven.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 연구는 전수조사로 진행되는 강의평가제의 강의 평가점수를 표본 강의평가제를 통해 추정하는 것이 목적이기 때문에 먼저 모평균의 추정에 대한 표본수를 결정해야 한다. 연구자들은 모집단의 크기를 일반적인 강의개설 기준인 1) 10명 이상 30명 미만인 소형 강의, 2) 30명 이상 50명 미만인 중형 강의, 3) 50명 이상인 대형강의, 4) 대형 강의보다 많은 인원수를 보이며 온라인상에서 수강하는 사이버강의로 구분하였다.
본 연구는 현재의 강제적인 강의평가 방식으로 얻은 결과를 강의평가분석 및 개선점 도출을 위한 유용한 데이터로 사용되는 것은 문제가 있다고 보고 전수조사로 진행되는 강의평가제 대신 대표성 있는 표본 강의평가제를 제안하고자 한다. 보다 구체적으로1) 대학은 강좌 크기에 따른 최적의 표본수를 산출하여 각 강좌에 참여한 학생들을 추출하고2) 학생은 해당 학기에 수강한 모든 교과목에 대해 강의평가를 하는 것이 아니라 본인이 표본으로 선정된 최소 강좌에 대해서만 강의평가를 하는 것이다.
현재 국내 대학들이 온라인 강의평가의 단점인 저조한 참여율을 보완하기 위해 부가한 강제성은 강의평가결과의 타당성을 크게 저해하는 요인이다. 이에 본 연구는 전수조사 강의평가 제도의 단점을 보완하기 위한대안으로 모의실험을 통해 대표성 있는 표본 강의평가제의 실현 가능성을 제시하였다. 이를 위해 모집단 N에서 표본 n을 선택하여 신뢰수준 (1-α)・100%에서 모평균(μ)에 대한 신뢰구간을 추정하고 이 신뢰구간을 이용하여 모평균(μ)가 신뢰구간 내에 포함되는지 살펴보았다.

가설 설정

2016년 2학기에 개설된 S 대학의 강좌에 대한 강의평가 결과를 바탕으로 소형, 중형, 대형, 사이버 강좌를 모집단으로 설정하였고, 선택된 강좌의 강의평가 평균점수를 모평균(μ)으로 가정하였다.

제안 방법

먼저 소형, 중형, 대형, 사이버 강좌별 표본수의 결정을 위해 직전년도 동일 교과목 자료에서 소형, 중형, 대형, 사이버 강좌의 모평균(μ)과 모표준편차(σ)를 산출하였고, 이후 결정된 모수들을 이용하여 강좌별 표본 수(n)를 산출하였다.
모의실험은 강의평가제를 표본조사로 진행하더라도 전수조사로 진행되는 강의평가 결과를 대표할 수 있다는 것을 증명하고자 표본평균을 이용해 모평균을 추론하였으며, 다음과 같은 절차로 진행하였다.
본 연구는 실제 실험환경을 설정하기 어렵기 때문에 모의실험을 5,000회 진행하였는데, [표 1]에서 산출한 각 강좌별 표본수를 바탕으로 데이터분석 도구인 R을 이용하여 모의실험을 구현하였다[16][17][18]. [그림 1]은 소형 강좌의 모의실험을 위한 R 코드의 예시이고,구체적인 수행내용은 다음과 같다.
본 연구는 표본에 의한 모평균의 추론이 타당한지 알아보고자 모집단 N에서 표본 n을 선택하여 신뢰수준(1-α)・100%에서 모평균(μ)에 대한 신뢰구간을 추정하고, 모평균(μ)가 신뢰구간 내에 포함되는지 살펴보았는데 구체적인 실험결과는 다음과 같다.
2016년 2학기에 개설된 S 대학의 강좌에 대한 강의평가 결과를 바탕으로 소형, 중형, 대형, 사이버 강좌를 모집단으로 설정하였고, 선택된 강좌의 강의평가 평균점수를 모평균(μ)으로 가정하였다. 이를 위해 2016년 2학기 강의평가 자료에서 소형 강좌(N=15), 중형 강좌(N=40), 대형 강좌(N=60), 사이버 강좌(N=150)에 대한 모집단의 크기를 결정하였고, 이를 대표할만한 교과목을 인원수를 고려하여 각각 하나씩 선정하였다. 그리고 표본수의 결정을 위하여 직전년도 동일 교과목에 대한 표준편차를 사용하였고, 신뢰수준은 95%, 오차한계는 ±0.
이를 위해 강좌를 규모별로 소형, 중형, 대형, 사이버 강좌로 구분하고, 각 모집단 N명 중에서 완전 랜덤방식으로 표본 n명을 선택하여 이 n명의 표본평균으로 모평균을 추론하는 것이 통계적으로 의미 있다는 것을 모의실험의 신뢰구간 추론을 통해 확인하고자 한다. 즉 신뢰구간 추론은 신뢰수준 (1-α)・100%에서 수행되므로 이러한 동일한 실험(모집단 N에서 표본 n을 추출하여 모평균의 신뢰구간을 추정)을 m회 반복하면이 반복한 m번의 실험 중에서 모평균 µ를 포함할 비율이 약 (1-α)가 될 것이다.
이를 위해 모집단 N에서 표본 n을 선택하여 신뢰수준 (1-α)・100%에서 모평균(μ)에 대한 신뢰구간을 추정하고 이 신뢰구간을 이용하여 모평균(μ)가 신뢰구간 내에 포함되는지 살펴보았다.

대상 데이터

699로 나타났다. 이를 바탕으로 표본 강의평가제의 추론을 위한 강좌별 표본수를 소형 강좌 9명,중형 강좌 19명, 대형 강좌 20명, 사이버 강좌 26명으로 산출하였다.

데이터처리

그리고 표본수의 결정을 위하여 직전년도 동일 교과목에 대한 표준편차를 사용하였고, 신뢰수준은 95%, 오차한계는 ±0.25로 설정하였다.

성능/효과

보다 구체적으로1) 대학은 강좌 크기에 따른 최적의 표본수를 산출하여 각 강좌에 참여한 학생들을 추출하고2) 학생은 해당 학기에 수강한 모든 교과목에 대해 강의평가를 하는 것이 아니라 본인이 표본으로 선정된 최소 강좌에 대해서만 강의평가를 하는 것이다.3) 이렇게 되면 모든 교과목에 대한 평가를 하는 것이 아니기 때문에 학생 스스로 강의평가에 대한 부담감을 줄일 수 있고, 강의에 대한 대표성을 가진 책임감 있는 응답을 할 것으로 유추할 수 있다
본 연구는 전수조사로 진행되는 강의평가제의 강의 평가점수를 표본 강의평가제를 통해 추정하는 것이 목적이기 때문에 먼저 모평균의 추정에 대한 표본수를 결정해야 한다. 연구자들은 모집단의 크기를 일반적인 강의개설 기준인 1) 10명 이상 30명 미만인 소형 강의, 2) 30명 이상 50명 미만인 중형 강의, 3) 50명 이상인 대형강의, 4) 대형 강의보다 많은 인원수를 보이며 온라인상에서 수강하는 사이버강의로 구분하였다.
일반적으로 신뢰수준은 95%를 많이 사용하므로 본 연구에서도 신뢰수준은 95%로 정의하였다. 그리고 표본 표준편차는 사전에 알 수 없으므로 사전조사의 결과나 이전조사의 결과를 이용할 수 있으며, 모비율 p도 사전조사의 결과나 분산을 최대화할 수 있는 0.5를 이용할 수 있다.
보다 구체적으로 신뢰구간이 모평균(μ)을 포함하는 비율이 (1-α)로 근사한다면 표본평균을 이용하여 모평균을 추론하는 것이 타당한 것인지를 판단하였는데, 모의실험 결과 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95%로 근사하는 것으로 나타났다. 따라서 소형, 중형 강좌의 경우 약 50% 정도의 표본을 통해 유의한 강의평가가 가능하다고 볼 수 있고,특히 소형, 중형 강좌보다는 대형, 사이버 강좌에서 본연구가 제안한 표본 강의평가제의 운영 가능성이 훨씬 높다고 할 수 있다.
4%로 수렴하는 것으로 나타났다. 또한 대형 강좌의 경우 모평균을 포함한 신뢰수준은 95.2%로 수렴하는 것으로 나타났으며, 사이버 강좌의 경우 모평균을 포함한 신뢰수준은 95.9%로 수렴하는 것으로 나타났다. 이를 종합해볼 때 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95% 이상으로 근사하는 것으로 볼 수 있어 모집단 N명 중에서 단순 무작위 표본추출로 표본 n명을 선택하여 이 n명의 표본평균으로 모평균을 추론하는 것은 통계적으로 의미 있다고 할 수 있다.
전수조사로 진행되는 강의평가의 모평균을 추론하기 위해 5,000회 반복 시행한 모의실험 결과는 다음 [그림 2]와 같다. 먼저 소형 강좌의 경우 모평균을 포함한 신뢰수준은 96.2%로 수렴하는 것으로 나타났고, 중형 강좌의 경우 모평균을 포함한 신뢰수준은 95.4%로 수렴하는 것으로 나타났다. 또한 대형 강좌의 경우 모평균을 포함한 신뢰수준은 95.
보다 구체적으로 신뢰구간이 모평균(μ)을 포함하는 비율이 (1-α)로 근사한다면 표본평균을 이용하여 모평균을 추론하는 것이 타당한 것인지를 판단하였는데, 모의실험 결과 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95%로 근사하는 것으로 나타났다.
9%로 수렴하는 것으로 나타났다. 이를 종합해볼 때 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95% 이상으로 근사하는 것으로 볼 수 있어 모집단 N명 중에서 단순 무작위 표본추출로 표본 n명을 선택하여 이 n명의 표본평균으로 모평균을 추론하는 것은 통계적으로 의미 있다고 할 수 있다.

질의응답

핵심어	질문	논문에서 추출한 답변
	강의평가란 무엇인가?	강의평가는 대학교 강의의 질적인 효율성을 목적으로 타당한 평가도구를 사용하여 강의자의 교수학습 활동의 정보를 수집하고 교수 프로그램에 대한 가치를 판단하는 교육적인 의사결정이다[7]. 또한 강의평가는 강의의 질을 진단․평가하여 이를 개선하기 위한 정보를 수집하는 형성적 목적과 교육프로그램의 지속성 여부 및 교수의 승진이나 재임용, 정년보장 등에 활용하기 위한 총괄적 목적으로 활용되고 있는데[1], 누가 평가를 받으며 누가 평가하는지, 무엇을 평가해야 하는지, 어떤 평가도구를 어떤 방법으로 시행해야 하는지, 어떤 기준으로 평가해야 하는지, 평가결과는 어떻게 처리되며 어떻게 활용되는지, 평가결과는 타당하고 신뢰할만한지 다양한 관점에서 연구들이 이루어지고 있다[8].
	강의평가의 중요성과 이에 대한 관심이 점점 높아지는 이유는 무엇인가?	1990년 중반부터 도입된 강의평가제는 초기 찬반의견이 활발히 논의되었지만 1997년 대학종합평가의 평가항목으로 강의평가제 적용여부가 공식적으로 포함되면서 현재 대부분의 대학에서 실시하고 있다. 특히 수업에 대한 가치판단의 수단뿐만 아니라 대학교육의 질 향상이 교육개혁의 주요 요인으로 부각되면서 강의평가의 중요성과 이에 대한 관심은 점점 높아지고 있다[1]. 강의평가의 목적은 크게 세 가지로 구분할 수 있는데 첫째, 강의평가 결과를 교수들에게 제공하여 강의를 개선하고, 둘째, 교수 효과성을 정확히 측정하여 보상과 처벌의 기초자료로 활용하며, 셋째, 학생들에게 교과목을 선택할 때 도움이 되고자 교수와 교과목에 대한 정보를 제공하기 위함이다[2]
	현재 성적열람 또는 수강신청의 선행조건으로 강의평가가 어떻게 이뤄지고 있는 실정인가?	현재 국내 대부분의 대학에서 온라인 방식으로 진행하고 있는 강의평가는 성적열람 또는 수강신청의 선행조건으로 학생들이 강의평가에 의무적으로 참여해야 하는 강제성을 부여하고 있다. 이에 따라 학생들은 수강했던 모든 교과목을 평가하는 과정에서 성적열람에 대한 조바심, 응답에 대한 피로도 등으로 인해 무성의한 응답과 왜곡된 응답을 하게 되고, 강의평가 결과를 활용해야 하는 학교의 입장에서는 학생들의 성실한 참여를 절실히 요구하고 있는 실정이다.

참고문헌 (18)

한신일, 김혜정, 이정연, "한국대학의 강의평가실태분석," 교육행정학연구, 제23권, 제3호, pp.379-403, 2005.
김명화, "강의평가의 타당도와 신뢰도," 아시아교육연구, 제6권, 제3호, pp.1-24, 2005.
하오선, 정민호, "강의평가 응답분석을 통한 강의 평가도구 개선방안," 열린교육연구, 제22권, 제3호, pp.273-294, 2014.
양길석, "대학 강의평가 일관적 응답의 경향성과 영향력 분석," 제27권, 제2호, pp.255-278, 2014.
홍경선, "대학교 강의평가에 나타난 일관적 응답분석," 교육정보미디어연구, 제12권, 제2호, pp.97-127, 2006.
신소영, 권진희, "강의평가결과의 신뢰성 제고 방안 연구: 강의평가제도의 운영을 중심으로," 순천향 인문과학논총, 제35권, 제4호, pp.115-145, 2016.
오숙영, "강의평가점수 영향력 요인에 대한 사후조정 연구," 교육평가연구, 제28권, 제4호, pp.1225-1254.
W. Hoy and C. Miskel, Educational Administration: Theory, Research, and Practice, New York: Mcgraw Hill, 2005.
이원석, 이현우, 정영근, "대학 강의평가에서 실시방식이 학생들의 불성실한 응답에 미치는 영향에 관한 연구," 교육방법연구, 제24권, 제3호, pp.547-561, 2012.
최보금, 김재웅, "위계적 선형모형을 활용한 대학생 강의평가 관련 요인 탐색: 무성의 응답의 영향을 중심으로," 열린교육연구, 제21권, 제1호, pp.77-100, 2013.
김성숙, 김학일, "학기중 적용을 위한 강의진단 평가도구 개발과 타당성 분석," 교육평가연구, 제21권, 제1호, pp.55-78, 2008.
안수현, 이상준, "교육수요자 만족도조사의 신뢰성 제고방안 탐색: S대학교 사례를 중심으로," 디지털융복합연구, 제15권, 제12호, pp.71-77, 2017.

원문보기 상세보기
한경수, 최숙희, 박재철, "강제적인 대학 강의평가의 문제점," 한국통계학회논문집, 제18권, 제1호, pp.35-45, 2011.

원문보기 상세보기
M. Milton, Head First Data Analysis: A Learner's Guide to Big Numbers, Statistics, and Good Decisions, O'Reilly Media, 2009.
D. Griffiths, Head First Statistics: A Brain-Friendly Guide, O'Reilly Media, 2008.
서민구, R을 이용한 데이터 처리&분석 실무, 길벗, 2014.
M. J. Crawley, The R book, John Wiley & Sons, 2012.
P. Teetor, R Cookbook: Proven Recipes for Data Analysis, Statistics, and Graphics, O'Reilly Media, 2011.

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증