실제 쓰기 능력을 확인하고 그 결과를 쓰기 교육에 피드백하기 위해서는, 쓰기 지식, 기능, 전략, 태도 등이 종합적으로 발현된, 쓰기의 최종 결과물인 글을 직접 평가하는 방법이 적합할 것이다. 그런데 이러한 쓰기 평가는 교사와 학생 모두에게 매우 큰 부담이 된다. 특히 쓰기 평가 결과의 신뢰도 문제와 쓰기 평가 과정의 번거로움은 오랫동안 해결이 쉽지 않은 핵심 문제이다. 이러한 문제를 해결하기 위해 평가자 훈련, 평가자 협의, 세밀한 분석적 평가 기준 설정 등의 방법이 제안되기도 하였다. 하지만 이러한 방법은 쓰기 평가 결과의 신뢰도를 높이는 데는 도움이 되나 쓰기 평가 과정의 과중한 부담과 절차상의 번거로움 등은 여전히 해결하지 못하여 학교 교육 현장에 쉽게 활용되지 못하였다. 그러다보니 아직도 쓰기 평가 방법으로 간략한 상중하 기준을 바탕으로 인상 평가나 총체적 평가를 실시하는 경우가 많다. 이러한 문제의식을 바탕으로 쓰기 평가의 결과와 과정의 문제를 함께 해결할 수 있는 ‘표준 평가 예시문을 활용한 쓰기 평가’를 연구하였다. 그리고 평가 기준표를 사용한 쓰기 평가와 비교하여 그 효과를 확인하였다. 먼저 쓰기 평가를 위해 논설문 쓰기 과제로 중학생의 글 40편을 수집하였고, 이 글을 18명의 현직 국어교사가 평가하게 하였다. 평가자들은 경력, 성별, 인원수 비율을 동일하게 A집단(통제집단)과 B집단(실험집단)으로 구성하였다. A집단은 평가 기준표를 가지고 평가하였고, B집단은 평가 기준과 함께 표준 평가 예시문을 활용하여 평가하였다. 평가자들은 개별적으로 쓰기 평가 상황 통제를 점검한 후 평가를 진행하였고, 평가 후 쓰기 평가자 주관적 경험 검사 설문지에 응답하였다. 모든 과정을 마친 평가 결과 자료를 수합하여 PASW Statistics 18.0, EduG 6.0, FACETS 3.66.1 프로그램을 사용하여 집단별로 분석하였다. 이러한 과정을 통해 이 연구에서 얻은 결론은 다음과 같다. 첫째, 기술 통계 분석 결과, A집단의 점수가 10%정도 B집단보다 후하고, A집단의 쓰기 평가 항목별 ...
실제 쓰기 능력을 확인하고 그 결과를 쓰기 교육에 피드백하기 위해서는, 쓰기 지식, 기능, 전략, 태도 등이 종합적으로 발현된, 쓰기의 최종 결과물인 글을 직접 평가하는 방법이 적합할 것이다. 그런데 이러한 쓰기 평가는 교사와 학생 모두에게 매우 큰 부담이 된다. 특히 쓰기 평가 결과의 신뢰도 문제와 쓰기 평가 과정의 번거로움은 오랫동안 해결이 쉽지 않은 핵심 문제이다. 이러한 문제를 해결하기 위해 평가자 훈련, 평가자 협의, 세밀한 분석적 평가 기준 설정 등의 방법이 제안되기도 하였다. 하지만 이러한 방법은 쓰기 평가 결과의 신뢰도를 높이는 데는 도움이 되나 쓰기 평가 과정의 과중한 부담과 절차상의 번거로움 등은 여전히 해결하지 못하여 학교 교육 현장에 쉽게 활용되지 못하였다. 그러다보니 아직도 쓰기 평가 방법으로 간략한 상중하 기준을 바탕으로 인상 평가나 총체적 평가를 실시하는 경우가 많다. 이러한 문제의식을 바탕으로 쓰기 평가의 결과와 과정의 문제를 함께 해결할 수 있는 ‘표준 평가 예시문을 활용한 쓰기 평가’를 연구하였다. 그리고 평가 기준표를 사용한 쓰기 평가와 비교하여 그 효과를 확인하였다. 먼저 쓰기 평가를 위해 논설문 쓰기 과제로 중학생의 글 40편을 수집하였고, 이 글을 18명의 현직 국어교사가 평가하게 하였다. 평가자들은 경력, 성별, 인원수 비율을 동일하게 A집단(통제집단)과 B집단(실험집단)으로 구성하였다. A집단은 평가 기준표를 가지고 평가하였고, B집단은 평가 기준과 함께 표준 평가 예시문을 활용하여 평가하였다. 평가자들은 개별적으로 쓰기 평가 상황 통제를 점검한 후 평가를 진행하였고, 평가 후 쓰기 평가자 주관적 경험 검사 설문지에 응답하였다. 모든 과정을 마친 평가 결과 자료를 수합하여 PASW Statistics 18.0, EduG 6.0, FACETS 3.66.1 프로그램을 사용하여 집단별로 분석하였다. 이러한 과정을 통해 이 연구에서 얻은 결론은 다음과 같다. 첫째, 기술 통계 분석 결과, A집단의 점수가 10%정도 B집단보다 후하고, A집단의 쓰기 평가 항목별 표준편차가 B집단보다 크다. 곧 표준 평가 예시문이 자세한 평가 기준의 역할을 하며 평가자들의 점수 편차를 줄이는 데도 도움이 된다. 둘째, A집단 .901, B집단 .929로 B집단의 전체 Cronbach ɑ가 A집단보다 높고, 구체적인 쓰기 평가 항목에서도 B집단의 Cronbach ɑ가 A집단보다 높다. 곧 표준 평가 예시문이 평가자간 신뢰도 향상에 큰 역할을 한다. 셋째, 일반화가능도 계수의 상대값과 절대값은 B집단이 A집단보다 높고, 오차 분산 요인은 B집단이 A집단보다 작다. 곧 표준 평가 예시문이 높은 신뢰도 확보에 도움이 되며, 오차 요인의 감소에도 효과가 있다. 넷째, 일반화가능도 최적화를 상황별로 분석한 결과, B집단이 A집단보다 더 적은 인원으로 일반화가능도 최저 양호도를 확보하였다. 곧 평가 상황에 따라 특히 평가 인원이 소수이거나 평가 항목이 세분화될 경우에는 표준 평가 예시문을 활용하여 평가하는 것이 더 효과적이고 평가의 질적 신뢰도를 높일 수 있다. 다섯째, 다국면 라쉬 모형으로 평가자 국면을 분석한 결과, 표준 평가 예시문을 활용한 평가자가 더 엄격하고, 일관성을 더 빨리 확보하고 유지하며, 평가자간 높은 일치도를 보인다. 여섯째, 집단별 ±3.0 표준잔차를 벗어난 통계치를 비교한 결과, A집단이 9건, B집단이 8건으로 두 집단의 편향 평가 건수 차이는 1건으로 크게 차이가 나지 않지만 잔차 차이값이 상대적으로 A집단이 크다. 곧 표준 평가 예시문 활용이 편향 평가 부분에서 작으나마 긍정적인 효과가 있다. 일곱째, 쓰기 평가 과정에서 겪은 평가자의 주관적인 경험 분석 결과, 평가 기준표와 표준 평가 예시문은 모두 쓰기 평가에서 평가자들에게 긍정적인 도움을 주고 있다. 특히, 표준 평가 예시문의 활용은 평가 기준을 더 구체화 시켜 모호한 평가 기준을 명료하게 하고, 평가 기준의 구체적인 적용에 도움이 되며, 평가자의 객관적 잣대를 설정하는 데 도움이 된다. 뿐만 아니라 평가 시간의 단축과 평가 피로도 감소에도 도움이 되며, 평가 초기의 객관적이고 적절한 점수 부여와 전체적으로 판단 기준을 잡고 일관성을 유지해 가는 데도 도움이 된다. 이러한 연구 결과를 통해 얻은 의의와 교육적 시사점은 다음과 같다. 첫째, 표준 평가 예시문을 활용한 쓰기 평가 방법이 평가 결과의 신뢰도 확보에 도움이 된다는 것을 여러 가지 효과를 통해 확인하였다는 점에서 의의가 있다. 둘째, 쓰기 평가에서 표준 평가 예시문의 활용은 평가 기준표 사용보다 평가 판단의 명료화, 평가 관점의 일관성 유지, 평가자의 객관적 잣대 설정, 평가 시간 단축 등 평가 과정의 부담을 줄여주는 효과가 확인되었다는 점에서 의의가 있다. 따라서 표준 평가 예시문을 활용한 쓰기 평가 방법이 실제 쓰기 교육 현장에 적용 가능한 신뢰도 높고 효율적인 쓰기 평가 방법으로 일반화 되기를 기대하며, 이러한 쓰기 평가 방법의 개선은 궁극적으로 쓰기 교육의 정립과 확대에도 기여할 것으로 기대한다.
실제 쓰기 능력을 확인하고 그 결과를 쓰기 교육에 피드백하기 위해서는, 쓰기 지식, 기능, 전략, 태도 등이 종합적으로 발현된, 쓰기의 최종 결과물인 글을 직접 평가하는 방법이 적합할 것이다. 그런데 이러한 쓰기 평가는 교사와 학생 모두에게 매우 큰 부담이 된다. 특히 쓰기 평가 결과의 신뢰도 문제와 쓰기 평가 과정의 번거로움은 오랫동안 해결이 쉽지 않은 핵심 문제이다. 이러한 문제를 해결하기 위해 평가자 훈련, 평가자 협의, 세밀한 분석적 평가 기준 설정 등의 방법이 제안되기도 하였다. 하지만 이러한 방법은 쓰기 평가 결과의 신뢰도를 높이는 데는 도움이 되나 쓰기 평가 과정의 과중한 부담과 절차상의 번거로움 등은 여전히 해결하지 못하여 학교 교육 현장에 쉽게 활용되지 못하였다. 그러다보니 아직도 쓰기 평가 방법으로 간략한 상중하 기준을 바탕으로 인상 평가나 총체적 평가를 실시하는 경우가 많다. 이러한 문제의식을 바탕으로 쓰기 평가의 결과와 과정의 문제를 함께 해결할 수 있는 ‘표준 평가 예시문을 활용한 쓰기 평가’를 연구하였다. 그리고 평가 기준표를 사용한 쓰기 평가와 비교하여 그 효과를 확인하였다. 먼저 쓰기 평가를 위해 논설문 쓰기 과제로 중학생의 글 40편을 수집하였고, 이 글을 18명의 현직 국어교사가 평가하게 하였다. 평가자들은 경력, 성별, 인원수 비율을 동일하게 A집단(통제집단)과 B집단(실험집단)으로 구성하였다. A집단은 평가 기준표를 가지고 평가하였고, B집단은 평가 기준과 함께 표준 평가 예시문을 활용하여 평가하였다. 평가자들은 개별적으로 쓰기 평가 상황 통제를 점검한 후 평가를 진행하였고, 평가 후 쓰기 평가자 주관적 경험 검사 설문지에 응답하였다. 모든 과정을 마친 평가 결과 자료를 수합하여 PASW Statistics 18.0, EduG 6.0, FACETS 3.66.1 프로그램을 사용하여 집단별로 분석하였다. 이러한 과정을 통해 이 연구에서 얻은 결론은 다음과 같다. 첫째, 기술 통계 분석 결과, A집단의 점수가 10%정도 B집단보다 후하고, A집단의 쓰기 평가 항목별 표준편차가 B집단보다 크다. 곧 표준 평가 예시문이 자세한 평가 기준의 역할을 하며 평가자들의 점수 편차를 줄이는 데도 도움이 된다. 둘째, A집단 .901, B집단 .929로 B집단의 전체 Cronbach ɑ가 A집단보다 높고, 구체적인 쓰기 평가 항목에서도 B집단의 Cronbach ɑ가 A집단보다 높다. 곧 표준 평가 예시문이 평가자간 신뢰도 향상에 큰 역할을 한다. 셋째, 일반화가능도 계수의 상대값과 절대값은 B집단이 A집단보다 높고, 오차 분산 요인은 B집단이 A집단보다 작다. 곧 표준 평가 예시문이 높은 신뢰도 확보에 도움이 되며, 오차 요인의 감소에도 효과가 있다. 넷째, 일반화가능도 최적화를 상황별로 분석한 결과, B집단이 A집단보다 더 적은 인원으로 일반화가능도 최저 양호도를 확보하였다. 곧 평가 상황에 따라 특히 평가 인원이 소수이거나 평가 항목이 세분화될 경우에는 표준 평가 예시문을 활용하여 평가하는 것이 더 효과적이고 평가의 질적 신뢰도를 높일 수 있다. 다섯째, 다국면 라쉬 모형으로 평가자 국면을 분석한 결과, 표준 평가 예시문을 활용한 평가자가 더 엄격하고, 일관성을 더 빨리 확보하고 유지하며, 평가자간 높은 일치도를 보인다. 여섯째, 집단별 ±3.0 표준잔차를 벗어난 통계치를 비교한 결과, A집단이 9건, B집단이 8건으로 두 집단의 편향 평가 건수 차이는 1건으로 크게 차이가 나지 않지만 잔차 차이값이 상대적으로 A집단이 크다. 곧 표준 평가 예시문 활용이 편향 평가 부분에서 작으나마 긍정적인 효과가 있다. 일곱째, 쓰기 평가 과정에서 겪은 평가자의 주관적인 경험 분석 결과, 평가 기준표와 표준 평가 예시문은 모두 쓰기 평가에서 평가자들에게 긍정적인 도움을 주고 있다. 특히, 표준 평가 예시문의 활용은 평가 기준을 더 구체화 시켜 모호한 평가 기준을 명료하게 하고, 평가 기준의 구체적인 적용에 도움이 되며, 평가자의 객관적 잣대를 설정하는 데 도움이 된다. 뿐만 아니라 평가 시간의 단축과 평가 피로도 감소에도 도움이 되며, 평가 초기의 객관적이고 적절한 점수 부여와 전체적으로 판단 기준을 잡고 일관성을 유지해 가는 데도 도움이 된다. 이러한 연구 결과를 통해 얻은 의의와 교육적 시사점은 다음과 같다. 첫째, 표준 평가 예시문을 활용한 쓰기 평가 방법이 평가 결과의 신뢰도 확보에 도움이 된다는 것을 여러 가지 효과를 통해 확인하였다는 점에서 의의가 있다. 둘째, 쓰기 평가에서 표준 평가 예시문의 활용은 평가 기준표 사용보다 평가 판단의 명료화, 평가 관점의 일관성 유지, 평가자의 객관적 잣대 설정, 평가 시간 단축 등 평가 과정의 부담을 줄여주는 효과가 확인되었다는 점에서 의의가 있다. 따라서 표준 평가 예시문을 활용한 쓰기 평가 방법이 실제 쓰기 교육 현장에 적용 가능한 신뢰도 높고 효율적인 쓰기 평가 방법으로 일반화 되기를 기대하며, 이러한 쓰기 평가 방법의 개선은 궁극적으로 쓰기 교육의 정립과 확대에도 기여할 것으로 기대한다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.