4차 산업혁명을 맞이하여 학교 교육에 있어서 진로교육의 문제가 크게 대두되고 있다. 일선 현장에서도 인공지능 및 빅 데이터들을 효과적으로 처리하기 위한 서비스 또는 기술에 대하여 다양한 연구가 진행되고 있으나, 교육분야에 있어서는 학생들에 대한 데이터들을 단순처리과정을 거칠 뿐이다. 이에 본 논문에서는 인공지능 및 빅데이터를 활용한 학생들의 진로교육을 위한 진로 예측 프로그램을 설계 제시하고자 한다. 영재교육원 학생들의 관찰데이터를 이용하여 의사결정 트리중 가장 인공지능에 가깝고 효과적이라고 알려진 C4.5알고리즘으로 의사결정 트리를 구성하고 학생들의 희망 진로를 예측하는 것이다. 판별결과 카파계수는 0.7을 넘어 상당한 일치도를 보였고 평균절대오차도 0.1정도로 상당히 낮은 수치를 보였다. 이에 따라서 본 연구에서 보이듯이 많은 연구 및 데이터를 구축하여 학생들의 상담에 활용 진로를 제시하고 수업태도 및 방향을 제시하는데 도움이 될 것으로 사료된다.
4차 산업혁명을 맞이하여 학교 교육에 있어서 진로교육의 문제가 크게 대두되고 있다. 일선 현장에서도 인공지능 및 빅 데이터들을 효과적으로 처리하기 위한 서비스 또는 기술에 대하여 다양한 연구가 진행되고 있으나, 교육분야에 있어서는 학생들에 대한 데이터들을 단순처리과정을 거칠 뿐이다. 이에 본 논문에서는 인공지능 및 빅데이터를 활용한 학생들의 진로교육을 위한 진로 예측 프로그램을 설계 제시하고자 한다. 영재교육원 학생들의 관찰데이터를 이용하여 의사결정 트리중 가장 인공지능에 가깝고 효과적이라고 알려진 C4.5알고리즘으로 의사결정 트리를 구성하고 학생들의 희망 진로를 예측하는 것이다. 판별결과 카파계수는 0.7을 넘어 상당한 일치도를 보였고 평균절대오차도 0.1정도로 상당히 낮은 수치를 보였다. 이에 따라서 본 연구에서 보이듯이 많은 연구 및 데이터를 구축하여 학생들의 상담에 활용 진로를 제시하고 수업태도 및 방향을 제시하는데 도움이 될 것으로 사료된다.
In the wake of the 4th Industrial Revolution, the problem of career education in schools has become a big issue. While various studies are being conducted on services or technologies to effectively handle artificial intelligence and big data, in the field of education, data on students is simply pro...
In the wake of the 4th Industrial Revolution, the problem of career education in schools has become a big issue. While various studies are being conducted on services or technologies to effectively handle artificial intelligence and big data, in the field of education, data on students is simply processed. Therefore, in this paper, we are going to design and present career prediction programs for students using artificial intelligence and big data. Using observational data from students at the institute, the decision tree is constructed with the C4.5 algorithm known to be most intelligent and effective in the decision tree and is used to predict students' path of hope. As a result, the coefficient of kappa exceeded 0.7 and showed a fairly low average error of 0.1 degrees. As shown in this study, a number of studies and data will be deployed to help guide students in their consultation and to provide them with classroom attitudes and directions.
In the wake of the 4th Industrial Revolution, the problem of career education in schools has become a big issue. While various studies are being conducted on services or technologies to effectively handle artificial intelligence and big data, in the field of education, data on students is simply processed. Therefore, in this paper, we are going to design and present career prediction programs for students using artificial intelligence and big data. Using observational data from students at the institute, the decision tree is constructed with the C4.5 algorithm known to be most intelligent and effective in the decision tree and is used to predict students' path of hope. As a result, the coefficient of kappa exceeded 0.7 and showed a fairly low average error of 0.1 degrees. As shown in this study, a number of studies and data will be deployed to help guide students in their consultation and to provide them with classroom attitudes and directions.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 학생들의 수업행동 관찰 표준안을 만들고 이 표준안에 따라 학생들의 행동 및 진로를 예측하고 추천 하는 목적을 가지므로, 본 연구에서는 인공지능에 유사한 기반을 두고 있는 C4.5 알고리즘을 사용하고자한다.
이에 따라서 본 연구에서는 학생들의 수업 관찰을 통한 데이터를 활용하여 학생들의 희망진로를 바탕으로 학생들의 진로를 예측하여 진로교육에 도움을 주는 프로그램을 설계하고자 한다.
표 2에서 보이듯이 4년간의 학생 53명학생의 데이터를 활용하였으나 좀 더 다양한 데이터를 얻기 위하여 학생당 수강한 강의 별 관찰데이터를 오전 오후로 나누어서 데이터를 총 1038개의 데이터로 늘려서 연구를 실시하였다.
제안 방법
그림 2는 학생 관찰일지의 일부이다 관찰일지는 교사 및 학생들의 수업중의 행동 및 내용을 관찰교사가 기록하여 남겨둔 데이터로 관찰교사들이 학생들의 태도 및 행동들을 자세히 기술해 놓았다. 이는 데이터로서는 훌륭하지만 의사결정트리로 만들기 위해서는 다음 표 3과 같이 몇 가지 항목을 정리하여 데이터를 변환 전처리 및 수치화 하였다.
대상 데이터
본 연구는 공주대학교 과학영재교육원 소속의 정보반 학생들의 관찰 데이터를 이용하였다. 2014년부터 2017년까지의 영재교육원의 학생들의 수업을 대상으로 관찰교사가 학생들의 수업태도 및 다양한 행동들을 기록한 데이터를 바탕으로 상담일지에 기록된 학생들의 희망진로를 데이터로 사용하였다.
본 연구는 공주대학교 과학영재교육원 소속의 정보반 학생들의 관찰 데이터를 이용하였다. 2014년부터 2017년까지의 영재교육원의 학생들의 수업을 대상으로 관찰교사가 학생들의 수업태도 및 다양한 행동들을 기록한 데이터를 바탕으로 상담일지에 기록된 학생들의 희망진로를 데이터로 사용하였다.
표 5는 그림5의 의사결정트리를 요약 분석한 표이다. 위의 의사결정트리들을 분석해보면 총 1038개의 데이터 중에 79.7688%정도 되는 828개의 데이터가 유의미하게 사용되었고 20.2312%에 해당하는 210개의 데이터가 잘못 분류된 데이터로 사용되었다. 이는 데이터의 입력 할 떄 결석이나 지각으로 인하여 학생관찰기록이 없는 경우 별도의 분류로 표시하였으나 데이터 전처리 및 수치화할 때 적용시키지 못하였기에 이렇게 나타났다.
이론/모형
각각의 의사결정트리 알고리즘에 따라 결정 노드의 처리 할 수 있는 데이터의 종류와, 분류기준, 분류방법이 달라진다. CAHID와 CART 알고리즘은 통계적 기법을 기반으로 지니 계수(Gini index), 카이제곱(Chi-Squared statistics), 이득 비율(Gain rate)의 개념을 사용한다.[5]
성능/효과
본 시스템의 희망진로 예측에 따르면 학생들의 학습태도 및 성적 등의 다양한 관찰 데이터를 바탕으로 희망진로를 바탕으로 예측진로를 추천할 수가 있고, 희망진로에 따른 학습 태도 및 공부 방향까지 결정해 줄 수 있다. 카파계수가 0.
후속연구
다만 본 연구에서 사용된 데이터가 과학영재교육원 S/W반에 한정된 데이터기에 희망 진로 및 예측진로가 한쪽 방향으로 편중되어 있기에 향후에는 일단 학생들을 대상으로 더욱 다양한 데이터를 바탕으로 실험을 진행해 볼 필요가 있다. 더불어 현제 시스템의 구축보다는 의사결정트리를 만들어 해석하고 검증하는데 그쳐있기에 실제 DB를 구축하고 시스템을 구축하여 많은 사람들이 이용할 수 있는 자동화 시스템을 만드는 노력이 필요할 것이다.
다만 본 연구에서 사용된 데이터가 과학영재교육원 S/W반에 한정된 데이터기에 희망 진로 및 예측진로가 한쪽 방향으로 편중되어 있기에 향후에는 일단 학생들을 대상으로 더욱 다양한 데이터를 바탕으로 실험을 진행해 볼 필요가 있다. 더불어 현제 시스템의 구축보다는 의사결정트리를 만들어 해석하고 검증하는데 그쳐있기에 실제 DB를 구축하고 시스템을 구축하여 많은 사람들이 이용할 수 있는 자동화 시스템을 만드는 노력이 필요할 것이다.
향후 인공지능이나 기계학습, 통계분석 등을 폭 넓게 이용하여 교육분야의 빅 데이터에서 의미 있는 규칙이나 패턴 및 관계를 찾아내어, 실제 학생들에게 도움이 되는 데이터를 생산 지능적인 활용이 요구되고 있다.[3]
질의응답
핵심어
질문
논문에서 추출한 답변
의사결정트리는 무엇인가?
의사결정트리는 주어진 데이터를 분류하고 규칙을 생성하는 모형이다. 플로우 차트와 유사하며, 루트 노드와 리프 노드로 구성되어 있다.
의사결정트리의 알고리즘 종류는?
의사결정트리는 CAHID, CART, ID3, C4.5, C5.0 등의 다양한 알고리즘이 존재한다. 각각의 의사결정트리 알고리즘에 따라 결정 노드의 처리 할 수 있는 데이터의 종류와, 분류기준, 분류방법이 달라진다.
의사결정트리의 구성은?
의사결정트리는 주어진 데이터를 분류하고 규칙을 생성하는 모형이다. 플로우 차트와 유사하며, 루트 노드와 리프 노드로 구성되어 있다. 루트 노드는 입력된 데이터의 속성을 분류하여 결정한다.
참고문헌 (7)
M. S. Lee, "The Effect of Reasons of College Major Selection and Stresses of College Life on Career Confidence according to Experience of Gifted Education," Secondary Education Research, vol. 66, no. 1, pp. 229-255, Mar. 2011.
D. J. Kim, D. Sharma, "Implementation of Decision Based Fruits Protection System Using Classification and Clustering Techniques," Asia-pacific Journal of Convergent Research Interchange, vol. 2, no. 4, pp. 23-31, Dec. 2016.
S. H. Song, E. J. Kim, "The Recognition of Cyber Education and Development Plan of Chungcheongnam-do Civil Servants," Journal of the Korea Institute Of Information and Communication Engineering, vol. 21, no. 11, pp. 2184-2190, Nov. 2017.
L. Brett, Machine learning with R, 2th ed. Seoul, Seoul: Acornpub, 2017.
J. Ramos, D. C. Avila, and J. Morales "Induction of Decision Trees Using an Internal Control of Induction," Lecture Notes in Computer Science, vol. 3512, pp. 795-803, Jun. 2005.
H. W. Yim, "Security education and research in accordance with the paradigm shift in the industry Security," Journal of Security Engineering, vol. 12, no. 6 pp. 597-608, Dec. 2015.
J. H. Seo, "A Comparative Study on the Classification of the Imbalanced Intrusion Detection Dataset Based on Deep Learning," Journal of Korean Institute of Intelligent Systems, vol. 28, no. 2, pp. 152-159, Apr. 2018.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.