본 연구는 교육 현장에서 A(당해연도 학교평가), B(당해연도 교육과정 만족도), C(차년도 학교계획 수립) 그룹에 대한 설문조사 결과를 수집하고 분석하여, 학교평가 결과를 정확하게 예측할 수 있는 핵심 설명변수(원인)들을 탐색하는 것을 목표로 하였다. 이를 위해 먼저 서로 다른 A, B, C 그룹에서 설명변수와 목적변수(결과)를 조합하여 다양한 데이터분석 시나리오를 정의한다. 설명변수와 목적변수 간에 정확도가 높은 모델을 찾아낸 후 500명의 랜덤 데이터를 개발한 모델에 넣어서 500명의 랜덤 데이터가 어떠한 학교평가 결과를 나타낼지 예측한다. 여기서 실시한 학교평가 설문 문항은 대부분 객관식이며 수집된 학교평가 데이터는 범주형 데이터(Categorical ...
본 연구는 교육 현장에서 A(당해연도 학교평가), B(당해연도 교육과정 만족도), C(차년도 학교계획 수립) 그룹에 대한 설문조사 결과를 수집하고 분석하여, 학교평가 결과를 정확하게 예측할 수 있는 핵심 설명변수(원인)들을 탐색하는 것을 목표로 하였다. 이를 위해 먼저 서로 다른 A, B, C 그룹에서 설명변수와 목적변수(결과)를 조합하여 다양한 데이터분석 시나리오를 정의한다. 설명변수와 목적변수 간에 정확도가 높은 모델을 찾아낸 후 500명의 랜덤 데이터를 개발한 모델에 넣어서 500명의 랜덤 데이터가 어떠한 학교평가 결과를 나타낼지 예측한다. 여기서 실시한 학교평가 설문 문항은 대부분 객관식이며 수집된 학교평가 데이터는 범주형 데이터(Categorical data)로 이루어져 있다. 본 연구에서 진행한 연구의 과정은 다음과 같다. 첫 번째로, 학부모와 학생에게 A, B, C에 해당하는 데이터를 수집하였다. 결측치는 제거하며, 객관식 문항은 수치화된 범주형 데이터(Categorical data)로 변환하여 데이터 전처리 과정을 거치고, 주관식 데이터 및 다중 응답 데이터는 데이터 가공 과정을 거쳤다. 두 번째로, 데이터 분석 시나리오에 따라서 다양하게 만들어진 모델들 중 평균 CA (ClassificationAccuracy) 값이 0.8 이상인 유의미한 예측 모델을 도출하였다. 세 번째로, 학년당 3개 학급을 기준으로 생각했을 때 전교생 수의 기준을 500명 정도로 생각할 수 있기에 500명의 랜덤 데이터를 발생시켜 모델 예측 결과를 안내하고 결과를 해석하였다. 마지막으로, 이 예측 모델을 활용했을 때 얻을 수 있는 기대효과 및 유의점을 결론 및 제언에 작성하였다. 이러한 과정을 통해 개발된 모델을 교육 현장에 적용하였을 때 가질 수 있는 연구의 의의는 다음과 같다. 첫째, 다양한 교육데이터를 분석하는 과정의 로드맵을 제시할 수 있다. 둘째, 교육 관련 의사결정을 할 때 데이터에 기반하여 인공지능이 제시한 의견을 참고할 수 있다. 셋째, 교육공동체 사이에서 발생하는 의사결정의 효율성을 높일 수 있다.
주제어: 데이터 분석, 머신러닝 분류모델, 예측, 의사결정
본 연구는 교육 현장에서 A(당해연도 학교평가), B(당해연도 교육과정 만족도), C(차년도 학교계획 수립) 그룹에 대한 설문조사 결과를 수집하고 분석하여, 학교평가 결과를 정확하게 예측할 수 있는 핵심 설명변수(원인)들을 탐색하는 것을 목표로 하였다. 이를 위해 먼저 서로 다른 A, B, C 그룹에서 설명변수와 목적변수(결과)를 조합하여 다양한 데이터분석 시나리오를 정의한다. 설명변수와 목적변수 간에 정확도가 높은 모델을 찾아낸 후 500명의 랜덤 데이터를 개발한 모델에 넣어서 500명의 랜덤 데이터가 어떠한 학교평가 결과를 나타낼지 예측한다. 여기서 실시한 학교평가 설문 문항은 대부분 객관식이며 수집된 학교평가 데이터는 범주형 데이터(Categorical data)로 이루어져 있다. 본 연구에서 진행한 연구의 과정은 다음과 같다. 첫 번째로, 학부모와 학생에게 A, B, C에 해당하는 데이터를 수집하였다. 결측치는 제거하며, 객관식 문항은 수치화된 범주형 데이터(Categorical data)로 변환하여 데이터 전처리 과정을 거치고, 주관식 데이터 및 다중 응답 데이터는 데이터 가공 과정을 거쳤다. 두 번째로, 데이터 분석 시나리오에 따라서 다양하게 만들어진 모델들 중 평균 CA (Classification Accuracy) 값이 0.8 이상인 유의미한 예측 모델을 도출하였다. 세 번째로, 학년당 3개 학급을 기준으로 생각했을 때 전교생 수의 기준을 500명 정도로 생각할 수 있기에 500명의 랜덤 데이터를 발생시켜 모델 예측 결과를 안내하고 결과를 해석하였다. 마지막으로, 이 예측 모델을 활용했을 때 얻을 수 있는 기대효과 및 유의점을 결론 및 제언에 작성하였다. 이러한 과정을 통해 개발된 모델을 교육 현장에 적용하였을 때 가질 수 있는 연구의 의의는 다음과 같다. 첫째, 다양한 교육데이터를 분석하는 과정의 로드맵을 제시할 수 있다. 둘째, 교육 관련 의사결정을 할 때 데이터에 기반하여 인공지능이 제시한 의견을 참고할 수 있다. 셋째, 교육공동체 사이에서 발생하는 의사결정의 효율성을 높일 수 있다.
This study aims to investigate the key explanatory variables that can accurately predict school evaluation results (cause), through collection and analysis of the survey results of groups from the educational scene: A (school evaluation), B (satisfaction with curriculum), and C (establishment of sch...
This study aims to investigate the key explanatory variables that can accurately predict school evaluation results (cause), through collection and analysis of the survey results of groups from the educational scene: A (school evaluation), B (satisfaction with curriculum), and C (establishment of school plan for 2023). For this, the explanatory variable and the objective variable (outcome) are first defined and classified in different groups of A, B, and C. After finding a model with high accuracy between the explanatory variable and the objective variable, 500 random data are put into the developed model to predict what kind of school evaluation result the 500 random data will render. Most of the school evaluation survey questions here are in the form of multiple choice and the collected data of school evaluation data consists of categorical data. The research process of this study is as follows. School evaluation data are collected from parents and students. Missing values are removed and for the multiple-choice questions they are converted into quantified categorical data, which are then subjected to data pre-processing. For the subject-type data and multiple response data, they are subjected to data processing. Among the various models formed according to the scenarios, a significant predictive model with an average CA value of 0.8 or higher was derived. Provided that there are three classes per grade, the total number of students is estimated to be around 500. So random data of 500 students is generated to guide and interpret the model prediction result. Finally, the expected effects and notes in using this predictive model are written in conclusions and suggestions section. The significance of the research in application of the model developed through this process to the educational scene are as follows: First, it can present a roadmap for the analysis process of various educational data. Second, in making education-related decisions, one can refer to the opinions that artificial intelligence presents based on data. Third, it can increase the efficiency of decision-making that occurs among the educational communities.
Key words: Data Analysis, Machine Learning Model for Classification, Prediction, Decision Making
This study aims to investigate the key explanatory variables that can accurately predict school evaluation results (cause), through collection and analysis of the survey results of groups from the educational scene: A (school evaluation), B (satisfaction with curriculum), and C (establishment of school plan for 2023). For this, the explanatory variable and the objective variable (outcome) are first defined and classified in different groups of A, B, and C. After finding a model with high accuracy between the explanatory variable and the objective variable, 500 random data are put into the developed model to predict what kind of school evaluation result the 500 random data will render. Most of the school evaluation survey questions here are in the form of multiple choice and the collected data of school evaluation data consists of categorical data. The research process of this study is as follows. School evaluation data are collected from parents and students. Missing values are removed and for the multiple-choice questions they are converted into quantified categorical data, which are then subjected to data pre-processing. For the subject-type data and multiple response data, they are subjected to data processing. Among the various models formed according to the scenarios, a significant predictive model with an average CA value of 0.8 or higher was derived. Provided that there are three classes per grade, the total number of students is estimated to be around 500. So random data of 500 students is generated to guide and interpret the model prediction result. Finally, the expected effects and notes in using this predictive model are written in conclusions and suggestions section. The significance of the research in application of the model developed through this process to the educational scene are as follows: First, it can present a roadmap for the analysis process of various educational data. Second, in making education-related decisions, one can refer to the opinions that artificial intelligence presents based on data. Third, it can increase the efficiency of decision-making that occurs among the educational communities.
Key words: Data Analysis, Machine Learning Model for Classification, Prediction, Decision Making
※ AI-Helper는 부적절한 답변을 할 수 있습니다.