현재 국내 대학들이 강의평가의 저조한 참여율을 보완하기 위해 부가한 강제성은 학생들의 불성실한 응답을 야기하여 평가결과의 타당성을 크게 저해하는 요인으로 지적되고 있다. 본 연구는 전수조사로 진행되는 강의평가제의 문제점을 지적하고 표본 강의평가제를 그 대안으로 제시하면서 표본평균을 이용해 모평균을 추론하는 것이 통계적으로 의미 있다는 것을 모의실험을 통해 확인하고자 한다. 이를 위해 2016년 2학기 S 대학에서 개설된 강좌의 소형, 중형, 대형, 사이버 강좌를 모집단으로 가정하였고, 각 강좌의 강의평가 평균점수를 모평균으로 가정하였다. 그리고 표본수의 결정을 위하여 직전년도 동일 교과목에 대한 평균과 표준편차를 사용하였고, 신뢰수준은 95%, 오차한계는 ${\pm}0.25$로 하였다. 데이터 분석도구인 R을 이용한 모의실험 시행결과 소형, 중형, 대형, 사이버 강좌 모두 모평균을 포함하는 신뢰수준이 95% 이상 근사하는 것으로 나타나 대표성 있는 표본 강의평가제의 실현 가능성을 확인하였다.
현재 국내 대학들이 강의평가의 저조한 참여율을 보완하기 위해 부가한 강제성은 학생들의 불성실한 응답을 야기하여 평가결과의 타당성을 크게 저해하는 요인으로 지적되고 있다. 본 연구는 전수조사로 진행되는 강의평가제의 문제점을 지적하고 표본 강의평가제를 그 대안으로 제시하면서 표본평균을 이용해 모평균을 추론하는 것이 통계적으로 의미 있다는 것을 모의실험을 통해 확인하고자 한다. 이를 위해 2016년 2학기 S 대학에서 개설된 강좌의 소형, 중형, 대형, 사이버 강좌를 모집단으로 가정하였고, 각 강좌의 강의평가 평균점수를 모평균으로 가정하였다. 그리고 표본수의 결정을 위하여 직전년도 동일 교과목에 대한 평균과 표준편차를 사용하였고, 신뢰수준은 95%, 오차한계는 ${\pm}0.25$로 하였다. 데이터 분석도구인 R을 이용한 모의실험 시행결과 소형, 중형, 대형, 사이버 강좌 모두 모평균을 포함하는 신뢰수준이 95% 이상 근사하는 것으로 나타나 대표성 있는 표본 강의평가제의 실현 가능성을 확인하였다.
The current system of making course evaluations mandatory in universities in Korea in order to supplement low participation levels is a major hindering factor for the validity of the evaluation results due to students' insincere responses. This study points out the problems in course evaluations tha...
The current system of making course evaluations mandatory in universities in Korea in order to supplement low participation levels is a major hindering factor for the validity of the evaluation results due to students' insincere responses. This study points out the problems in course evaluations that are in the form of surveys and instead proposes a sample course evaluation system that utilizes a sample mean to deduce a population mean, attempting to prove through simulation that this is statistically significant. Thus, small, medium, and large scale courses as well as cyber courses that were available in S University in the fall 2016 semester were set as the population, and each course's evaluation average grade was set as the population mean. Furthermore, we used the average grade and standard deviation of the same courses from the previous year in order to decide the sample number, the reliability level was set as 95%, and the margin of error was set as ${\pm}0.25$. As a result of carrying out a simulation using the data analysis tool R, all the courses (small scale, medium scale, large scale, and cyber) showed to have a reliability level close to 95% including the population mean, and consequently practicality of the representative sample course evaluation system was proven.
The current system of making course evaluations mandatory in universities in Korea in order to supplement low participation levels is a major hindering factor for the validity of the evaluation results due to students' insincere responses. This study points out the problems in course evaluations that are in the form of surveys and instead proposes a sample course evaluation system that utilizes a sample mean to deduce a population mean, attempting to prove through simulation that this is statistically significant. Thus, small, medium, and large scale courses as well as cyber courses that were available in S University in the fall 2016 semester were set as the population, and each course's evaluation average grade was set as the population mean. Furthermore, we used the average grade and standard deviation of the same courses from the previous year in order to decide the sample number, the reliability level was set as 95%, and the margin of error was set as ${\pm}0.25$. As a result of carrying out a simulation using the data analysis tool R, all the courses (small scale, medium scale, large scale, and cyber) showed to have a reliability level close to 95% including the population mean, and consequently practicality of the representative sample course evaluation system was proven.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 전수조사로 진행되는 강의평가제의 강의 평가점수를 표본 강의평가제를 통해 추정하는 것이 목적이기 때문에 먼저 모평균의 추정에 대한 표본수를 결정해야 한다. 연구자들은 모집단의 크기를 일반적인 강의개설 기준인 1) 10명 이상 30명 미만인 소형 강의, 2) 30명 이상 50명 미만인 중형 강의, 3) 50명 이상인 대형강의, 4) 대형 강의보다 많은 인원수를 보이며 온라인상에서 수강하는 사이버강의로 구분하였다.
본 연구는 현재의 강제적인 강의평가 방식으로 얻은 결과를 강의평가분석 및 개선점 도출을 위한 유용한 데이터로 사용되는 것은 문제가 있다고 보고 전수조사로 진행되는 강의평가제 대신 대표성 있는 표본 강의평가제를 제안하고자 한다. 보다 구체적으로1) 대학은 강좌 크기에 따른 최적의 표본수를 산출하여 각 강좌에 참여한 학생들을 추출하고2) 학생은 해당 학기에 수강한 모든 교과목에 대해 강의평가를 하는 것이 아니라 본인이 표본으로 선정된 최소 강좌에 대해서만 강의평가를 하는 것이다.
현재 국내 대학들이 온라인 강의평가의 단점인 저조한 참여율을 보완하기 위해 부가한 강제성은 강의평가결과의 타당성을 크게 저해하는 요인이다. 이에 본 연구는 전수조사 강의평가 제도의 단점을 보완하기 위한대안으로 모의실험을 통해 대표성 있는 표본 강의평가제의 실현 가능성을 제시하였다. 이를 위해 모집단 N에서 표본 n을 선택하여 신뢰수준 (1-α)・100%에서 모평균(μ)에 대한 신뢰구간을 추정하고 이 신뢰구간을 이용하여 모평균(μ)가 신뢰구간 내에 포함되는지 살펴보았다.
가설 설정
2016년 2학기에 개설된 S 대학의 강좌에 대한 강의평가 결과를 바탕으로 소형, 중형, 대형, 사이버 강좌를 모집단으로 설정하였고, 선택된 강좌의 강의평가 평균점수를 모평균(μ)으로 가정하였다.
제안 방법
먼저 소형, 중형, 대형, 사이버 강좌별 표본수의 결정을 위해 직전년도 동일 교과목 자료에서 소형, 중형, 대형, 사이버 강좌의 모평균(μ)과 모표준편차(σ)를 산출하였고, 이후 결정된 모수들을 이용하여 강좌별 표본 수(n)를 산출하였다.
모의실험은 강의평가제를 표본조사로 진행하더라도 전수조사로 진행되는 강의평가 결과를 대표할 수 있다는 것을 증명하고자 표본평균을 이용해 모평균을 추론하였으며, 다음과 같은 절차로 진행하였다.
본 연구는 실제 실험환경을 설정하기 어렵기 때문에 모의실험을 5,000회 진행하였는데, [표 1]에서 산출한 각 강좌별 표본수를 바탕으로 데이터분석 도구인 R을 이용하여 모의실험을 구현하였다[16][17][18]. [그림 1]은 소형 강좌의 모의실험을 위한 R 코드의 예시이고,구체적인 수행내용은 다음과 같다.
본 연구는 표본에 의한 모평균의 추론이 타당한지 알아보고자 모집단 N에서 표본 n을 선택하여 신뢰수준(1-α)・100%에서 모평균(μ)에 대한 신뢰구간을 추정하고, 모평균(μ)가 신뢰구간 내에 포함되는지 살펴보았는데 구체적인 실험결과는 다음과 같다.
2016년 2학기에 개설된 S 대학의 강좌에 대한 강의평가 결과를 바탕으로 소형, 중형, 대형, 사이버 강좌를 모집단으로 설정하였고, 선택된 강좌의 강의평가 평균점수를 모평균(μ)으로 가정하였다. 이를 위해 2016년 2학기 강의평가 자료에서 소형 강좌(N=15), 중형 강좌(N=40), 대형 강좌(N=60), 사이버 강좌(N=150)에 대한 모집단의 크기를 결정하였고, 이를 대표할만한 교과목을 인원수를 고려하여 각각 하나씩 선정하였다. 그리고 표본수의 결정을 위하여 직전년도 동일 교과목에 대한 표준편차를 사용하였고, 신뢰수준은 95%, 오차한계는 ±0.
이를 위해 강좌를 규모별로 소형, 중형, 대형, 사이버 강좌로 구분하고, 각 모집단 N명 중에서 완전 랜덤방식으로 표본 n명을 선택하여 이 n명의 표본평균으로 모평균을 추론하는 것이 통계적으로 의미 있다는 것을 모의실험의 신뢰구간 추론을 통해 확인하고자 한다. 즉 신뢰구간 추론은 신뢰수준 (1-α)・100%에서 수행되므로 이러한 동일한 실험(모집단 N에서 표본 n을 추출하여 모평균의 신뢰구간을 추정)을 m회 반복하면이 반복한 m번의 실험 중에서 모평균 µ를 포함할 비율이 약 (1-α)가 될 것이다.
이를 위해 모집단 N에서 표본 n을 선택하여 신뢰수준 (1-α)・100%에서 모평균(μ)에 대한 신뢰구간을 추정하고 이 신뢰구간을 이용하여 모평균(μ)가 신뢰구간 내에 포함되는지 살펴보았다.
대상 데이터
699로 나타났다. 이를 바탕으로 표본 강의평가제의 추론을 위한 강좌별 표본수를 소형 강좌 9명,중형 강좌 19명, 대형 강좌 20명, 사이버 강좌 26명으로 산출하였다.
데이터처리
그리고 표본수의 결정을 위하여 직전년도 동일 교과목에 대한 표준편차를 사용하였고, 신뢰수준은 95%, 오차한계는 ±0.25로 설정하였다.
성능/효과
보다 구체적으로1) 대학은 강좌 크기에 따른 최적의 표본수를 산출하여 각 강좌에 참여한 학생들을 추출하고2) 학생은 해당 학기에 수강한 모든 교과목에 대해 강의평가를 하는 것이 아니라 본인이 표본으로 선정된 최소 강좌에 대해서만 강의평가를 하는 것이다.3) 이렇게 되면 모든 교과목에 대한 평가를 하는 것이 아니기 때문에 학생 스스로 강의평가에 대한 부담감을 줄일 수 있고, 강의에 대한 대표성을 가진 책임감 있는 응답을 할 것으로 유추할 수 있다
본 연구는 전수조사로 진행되는 강의평가제의 강의 평가점수를 표본 강의평가제를 통해 추정하는 것이 목적이기 때문에 먼저 모평균의 추정에 대한 표본수를 결정해야 한다. 연구자들은 모집단의 크기를 일반적인 강의개설 기준인 1) 10명 이상 30명 미만인 소형 강의, 2) 30명 이상 50명 미만인 중형 강의, 3) 50명 이상인 대형강의, 4) 대형 강의보다 많은 인원수를 보이며 온라인상에서 수강하는 사이버강의로 구분하였다.
일반적으로 신뢰수준은 95%를 많이 사용하므로 본 연구에서도 신뢰수준은 95%로 정의하였다. 그리고 표본 표준편차는 사전에 알 수 없으므로 사전조사의 결과나 이전조사의 결과를 이용할 수 있으며, 모비율 p도 사전조사의 결과나 분산을 최대화할 수 있는 0.5를 이용할 수 있다.
보다 구체적으로 신뢰구간이 모평균(μ)을 포함하는 비율이 (1-α)로 근사한다면 표본평균을 이용하여 모평균을 추론하는 것이 타당한 것인지를 판단하였는데, 모의실험 결과 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95%로 근사하는 것으로 나타났다. 따라서 소형, 중형 강좌의 경우 약 50% 정도의 표본을 통해 유의한 강의평가가 가능하다고 볼 수 있고,특히 소형, 중형 강좌보다는 대형, 사이버 강좌에서 본연구가 제안한 표본 강의평가제의 운영 가능성이 훨씬 높다고 할 수 있다.
4%로 수렴하는 것으로 나타났다. 또한 대형 강좌의 경우 모평균을 포함한 신뢰수준은 95.2%로 수렴하는 것으로 나타났으며, 사이버 강좌의 경우 모평균을 포함한 신뢰수준은 95.9%로 수렴하는 것으로 나타났다. 이를 종합해볼 때 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95% 이상으로 근사하는 것으로 볼 수 있어 모집단 N명 중에서 단순 무작위 표본추출로 표본 n명을 선택하여 이 n명의 표본평균으로 모평균을 추론하는 것은 통계적으로 의미 있다고 할 수 있다.
전수조사로 진행되는 강의평가의 모평균을 추론하기 위해 5,000회 반복 시행한 모의실험 결과는 다음 [그림 2]와 같다. 먼저 소형 강좌의 경우 모평균을 포함한 신뢰수준은 96.2%로 수렴하는 것으로 나타났고, 중형 강좌의 경우 모평균을 포함한 신뢰수준은 95.4%로 수렴하는 것으로 나타났다. 또한 대형 강좌의 경우 모평균을 포함한 신뢰수준은 95.
보다 구체적으로 신뢰구간이 모평균(μ)을 포함하는 비율이 (1-α)로 근사한다면 표본평균을 이용하여 모평균을 추론하는 것이 타당한 것인지를 판단하였는데, 모의실험 결과 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95%로 근사하는 것으로 나타났다.
9%로 수렴하는 것으로 나타났다. 이를 종합해볼 때 소형, 중형, 대형, 사이버 강좌 모두 신뢰수준은 95% 이상으로 근사하는 것으로 볼 수 있어 모집단 N명 중에서 단순 무작위 표본추출로 표본 n명을 선택하여 이 n명의 표본평균으로 모평균을 추론하는 것은 통계적으로 의미 있다고 할 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
강의평가란 무엇인가?
강의평가는 대학교 강의의 질적인 효율성을 목적으로 타당한 평가도구를 사용하여 강의자의 교수학습 활동의 정보를 수집하고 교수 프로그램에 대한 가치를 판단하는 교육적인 의사결정이다[7]. 또한 강의평가는 강의의 질을 진단․평가하여 이를 개선하기 위한 정보를 수집하는 형성적 목적과 교육프로그램의 지속성 여부 및 교수의 승진이나 재임용, 정년보장 등에 활용하기 위한 총괄적 목적으로 활용되고 있는데[1], 누가 평가를 받으며 누가 평가하는지, 무엇을 평가해야 하는지, 어떤 평가도구를 어떤 방법으로 시행해야 하는지, 어떤 기준으로 평가해야 하는지, 평가결과는 어떻게 처리되며 어떻게 활용되는지, 평가결과는 타당하고 신뢰할만한지 다양한 관점에서 연구들이 이루어지고 있다[8].
강의평가의 중요성과 이에 대한 관심이 점점 높아지는 이유는 무엇인가?
1990년 중반부터 도입된 강의평가제는 초기 찬반의견이 활발히 논의되었지만 1997년 대학종합평가의 평가항목으로 강의평가제 적용여부가 공식적으로 포함되면서 현재 대부분의 대학에서 실시하고 있다. 특히 수업에 대한 가치판단의 수단뿐만 아니라 대학교육의 질 향상이 교육개혁의 주요 요인으로 부각되면서 강의평가의 중요성과 이에 대한 관심은 점점 높아지고 있다[1]. 강의평가의 목적은 크게 세 가지로 구분할 수 있는데 첫째, 강의평가 결과를 교수들에게 제공하여 강의를 개선하고, 둘째, 교수 효과성을 정확히 측정하여 보상과 처벌의 기초자료로 활용하며, 셋째, 학생들에게 교과목을 선택할 때 도움이 되고자 교수와 교과목에 대한 정보를 제공하기 위함이다[2]
현재 성적열람 또는 수강신청의 선행조건으로 강의평가가 어떻게 이뤄지고 있는 실정인가?
현재 국내 대부분의 대학에서 온라인 방식으로 진행하고 있는 강의평가는 성적열람 또는 수강신청의 선행조건으로 학생들이 강의평가에 의무적으로 참여해야 하는 강제성을 부여하고 있다. 이에 따라 학생들은 수강했던 모든 교과목을 평가하는 과정에서 성적열람에 대한 조바심, 응답에 대한 피로도 등으로 인해 무성의한 응답과 왜곡된 응답을 하게 되고, 강의평가 결과를 활용해야 하는 학교의 입장에서는 학생들의 성실한 참여를 절실히 요구하고 있는 실정이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.