신경망은 데이터로부터 반복적인 학습 과정을 통해 숨어 있는 패턴을 찾아내고, 새로운 데이터의 목표값에 대한 정확한 예측에 유용한 모델링 기법이다. 본 논문은 개인적인 특성, 가정 사회적 환경, 타 교과 성적을 이용하여 학생의 컴퓨터 활용 능력 예측을 위한 다층 인식모형(MLP) 신경망을 구축하였다. 신경망의 인식률은 예측 방법으로 널리 활용되고 있는 로지스틱 회귀분석 모델과 비교하였다. 개발한 신경망에 대한 실험 결과, 개인적인 특성이 학생들의 컴퓨터 활용 능력을 가장 잘 설명하는 요소이며, 반면 가정 사회적 환경은 가장 낮은 예측 요소임을 발견하였다. 또한 본 연구의 신경망 모델은 회귀분석보다 더욱 높은 인식률을 나타냈다.
신경망은 데이터로부터 반복적인 학습 과정을 통해 숨어 있는 패턴을 찾아내고, 새로운 데이터의 목표값에 대한 정확한 예측에 유용한 모델링 기법이다. 본 논문은 개인적인 특성, 가정 사회적 환경, 타 교과 성적을 이용하여 학생의 컴퓨터 활용 능력 예측을 위한 다층 인식모형(MLP) 신경망을 구축하였다. 신경망의 인식률은 예측 방법으로 널리 활용되고 있는 로지스틱 회귀분석 모델과 비교하였다. 개발한 신경망에 대한 실험 결과, 개인적인 특성이 학생들의 컴퓨터 활용 능력을 가장 잘 설명하는 요소이며, 반면 가정 사회적 환경은 가장 낮은 예측 요소임을 발견하였다. 또한 본 연구의 신경망 모델은 회귀분석보다 더욱 높은 인식률을 나타냈다.
A neural network is a modeling technique useful for finding out hidden patterns from data through repetitive learning process and for predicting target values for new data. In this study, we built multilayer perceptron neural networks for prediction of the students' computer literacy based on their ...
A neural network is a modeling technique useful for finding out hidden patterns from data through repetitive learning process and for predicting target values for new data. In this study, we built multilayer perceptron neural networks for prediction of the students' computer literacy based on their personal characteristics, home and social environment, and academic record of other subjects. Prediction performance of the network was compared with that of a widely used prediction method, the regression model. From our experiments, it was found that personal characteristic features best explained computer proficiency level of a student, whereas the features of home and social environment resulted in the worse prediction accuracy among all. Moreover, the developed neural network model produced far more accurate prediction than the regression model.
A neural network is a modeling technique useful for finding out hidden patterns from data through repetitive learning process and for predicting target values for new data. In this study, we built multilayer perceptron neural networks for prediction of the students' computer literacy based on their personal characteristics, home and social environment, and academic record of other subjects. Prediction performance of the network was compared with that of a widely used prediction method, the regression model. From our experiments, it was found that personal characteristic features best explained computer proficiency level of a student, whereas the features of home and social environment resulted in the worse prediction accuracy among all. Moreover, the developed neural network model produced far more accurate prediction than the regression model.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
분석기법이다[4]. 본 논문에서는 신경망의 인식률을 전통적인 통계기법인 로지스틱 회귀분석의 인식률과 비교하였다. 로지스틱 회귀분석도 신경 망과 마찬가지로 입력 항목에 따라 4개의 모델로 구성하였다.
본 논문은 요즘 각 분야 연구에서 접목하고 있는 데이터 마이닝을 학생의 컴퓨터 활용 능력을 진단하는데 사용하였다. 본 연구에서는 컴퓨터 활용능력에 영향을 미치는 요소(개인적 특성, 가정 .
본 연구의 목적은 초등학생의 컴퓨터 활용 능력에 영향을 미치는 모든 가능한 요소들 사이의 관계에서 패턴을 발견하는데 있다. 이 패턴은 교사들에게 학생의 개인 정보를 통해 학생의 컴퓨터 활용능력을 예측 가능하게 하며 평가 절차를 통해 조사해야 하는 시간과 노력을 절약하게 할 수 있다.
사회적 환경으로 구성된 신경망(如), 타 교과 성적으로 구성된 신경망(亦) 그리고 전체 입력항목으로 구성된 신경망(如血)으로 총 4개 구성하였다. 이는 각 영역별로 신경망을 구성하여 어느 영역의 신경망이 가장 정확한 인식률을 보이는가를 알아보고자 한 것이다. 따라서 각 입력 항목별로 구성된 NNa, NNb, NNC 각각의 인식률 및 오류와 전체 입력항목으로 구성된 如血의 인식률 및 오류를 비교한다.
가설 설정
개인적 특성으로 구성한 신경망이 가장 높은 인식률을 보였고, 가정 . 사회적 환경으로 구성한 신경망이 가장 낮은 인식률을 보였으며 이는 로지스틱 회귀분석에서도 마찬가지였다.
9%의 설명력을 보임을 나타낸다. 개인적인 특성이 학생의 컴퓨터 활용 능력을 결정하는데 가장 큰 설명력을 보인 반면, 가정 .사회적인 환경은 가장 낮은 설명력을 보이는 것은 주목할 만하다.
분석한 결과이다. 로지스틱 회귀분석과 신경망 모두 개인적 특성에서 최고의 인식률을 보인 반면 가정 .사회적 환경에서 최하의 인식률을 보였다.
신경망 구축은 입력영역에 따라 개인적 특성으로 구성된 신경망(務預), 가정 . 사회적 환경으로 구성된 신경망(如), 타 교과 성적으로 구성된 신경망(亦) 그리고 전체 입력항목으로 구성된 신경망(如血)으로 총 4개 구성하였다.
이는 컴퓨터 총사용 기간, 학교 외 기관에서의 컴퓨터 교육 경험 등 컴퓨터 활용 능력에 미치는 영향이 비슷한 이유인 것으로 분석된다. 신경망은 로지스틱 회귀분석에 비해 가정 . 사회적 환경으로 구성된 신경망에서 약 35%, 전체 입력항목으로 구성된 신경망에서는 약 12% 더욱 향상된 인식률을 보였다.
사회적 환경의 입력 항목 이 외에 타 교과 성적 영역을 추가하였다. 신경망의 입력값은 설문지의 개인적 특성 14문제, 가정 . 사회적 환경 9문제, 타 교과 성적 10문제 등 3 가지 그룹으로 구성하였다.
본 연구에서는 컴퓨터 활용 능력에 영향을 미치는 것으로 판단되는 요소들로 구성된 설문지 데이터를 작성하고, 이를 이용하여 4개의 신경망을 구성하였다. 즉, 개인적인 특성, 가정 . 사회적 환경, 타 교과 성적 등 3가지 영역을 각각 입력 항목으로 구성한 신경망과 세 가지 모든 영역을 입력 항목으로 구성한 신경망 등, 총 4개의 신경망을 구성하였다.
본 연구에서는 컴퓨터 활용 능력에 영향을 미치는 것으로 판단되는 요소들로 구성된 설문지 데이터를 작성하고, 이를 이용하여 4개의 신경망을 구성하였다. 즉, 개인적인 특성, 가정 . 사회적 환경, 타 교과 성적 등 3가지 영역을 각각 입력 항목으로 구성한 신경망과 세 가지 모든 영역을 입력 항목으로 구성한 신경망 등, 총 4개의 신경망을 구성하였다.
환경에 속한 것으로 확인되었다. 학생의 컴퓨터 활용 능력을 정확하게 예측하기 위해 본 논문에서는 개인적 특성과 가정 . 사회적 환경의 입력 항목 이 외에 타 교과 성적 영역을 추가하였다.
제안 방법
3가지 항목(소유하고 있는 컴퓨터 관련 자격증의 개수, 활용 가능한 소프트웨어의 개수, 교내 컴퓨터대회 참여 횟수)의 선택: 답안에 차등 점수를 부여하고 교재내용 안의 5 문제 정답 개수를 합하여 아래 와 같은 점수 분포에 따라 컴퓨터 활용 능력(상, 중, 하)을 결정하였다.
그러기 위해 각 신경망의 은닉층 노드 개수를 1개부터 입력항목의 개수만큼 노드 수를 늘려가면서 실험하였으며, 각 신경망에 대한 최적의 은닉층 노드 개수는와 같다.
다음과 같다. 기존연구[2]에서 컴퓨터 활용능력에 미치는 여러 요인 중 높은 상관도를 보이는 것으로 확인된 문항 3개(소유하고 있는 컴퓨터 관련 자격증의 개수, 활용 가능한 소프트웨어의 개수, 교내 컴퓨터대회 참여 횟수)와 객관도를 높이기 위해 6학년 「즐거운 컴퓨터(경기도)」 교재내용 안에서 5문제를 추출하여 아동의 컴퓨터 활용 능력 (상, 중, 하)을 결정하였다. 3가지 항목(소유하고 있는 컴퓨터 관련 자격증의 개수, 활용 가능한 소프트웨어의 개수, 교내 컴퓨터대회 참여 횟수)의 선택: 답안에 차등 점수를 부여하고 교재내용 안의 5 문제 정답 개수를 합하여 아래 <표 4>와 같은 점수 분포에 따라 컴퓨터 활용 능력(상, 중, 하)을 결정하였다.
이는 각 영역별로 신경망을 구성하여 어느 영역의 신경망이 가장 정확한 인식률을 보이는가를 알아보고자 한 것이다. 따라서 각 입력 항목별로 구성된 NNa, NNb, NNC 각각의 인식률 및 오류와 전체 입력항목으로 구성된 如血의 인식률 및 오류를 비교한다.
반면 너무 많은 수의 노드를 사용하여 학습하는 경우 많은 결정 경계구간을 만들어 학습 패턴의 특정 속성에 대해 과장해서 반응하는 오버피팅(over fitting)이 발생한다[3, 16]. 따라서, 본 연구에서는 초기 은닉층의 노드 개수를 1개부터 세부입력 항목의 개수만큼 증가시켜 실험하여, 인식률이 높고 오류가 가장 적은 은닉층의 노드 개수를 결정하였다. 인식률과 오류를 수식흐로 나타내 면식⑵와 식(3)으로 표현된다.
신경망의 출력값은 컴퓨터 활용 능력 수준으로 하고, 상중하에 해당하는 값으로 하였다. 또한, 전체 입력값으로 구성한 신경망과 각 입력 영역으로 구성된 3개의 신경망의 인식률과 오류를 비교하였다. 최적의 신경망을 구축하기 위해서 은닉층의 노드 개수를 실험을 통해 결정하였다.
즉, NNa, NNb, NNc, NNall을 각각 3- 크로스 확인으로 구축하였다. 또한, 최고의 수행 결과를 얻기 위해 오류 역전파 알고리즘을 10000번 실험하였다.
다층 인식모형 신경망은 일반적으로 입력층, 은닉층, 출력층 3층 구조를 가진다. 본 논문에서는 은닉층이 1개로 구성된 3층 구조로 구축하였다. 은닉층의 수가 많아지면 연결 강도가 많아져서 신경망의 학습이 매우 느려지게 된다.
초기 연결강도가 잘못 설정되면 학습이 완전히 이루어지지 않은 상태에서 국소 최소 점에 수렴되어 더 이상 학습이 이루어지지 않게 된다. 본 연구에서 적용한 학습조건으로 초기 연결 가중치는 0과 1사이의 범위에서 임의의 작은 수로 하였으며, 학습 파라미터인 학습 상수와 모멘텀은 각각 연결 가중치의 변화량에 적용되는 값으로 0.1 에서 0.2 사이의 값으로 설정하였고 바이어스는 0.1 로 하였다. 다양한 범주에서 실험한 결과 최고의 인식률을 보인 학습 파라미터 값을 정리하면<표 3>과 같다.
본 연구에서는 컴퓨터 활용 능력에 영향을 미치는 것으로 판단되는 요소들로 구성된 설문지 데이터를 작성하고, 이를 이용하여 4개의 신경망을 구성하였다. 즉, 개인적인 특성, 가정 .
사용하였다. 본 연구에서는 컴퓨터 활용능력에 영향을 미치는 요소(개인적 특성, 가정 . 사회적 환경, 타 교과 성적)를 추출하여 3개의 입력항목 그룹으로 나누어 각 그룹별로 하나씩의 신경망을 구축하고 전체 요소를 입력 항목으로 포함하는 전체 신경망을 구축하였다. 신경망의 출력값은 컴퓨터 활용 능력 수준으로 하고, 상중하에 해당하는 값으로 하였다.
신경망의 입력값은 설문지의 개인적 특성 14문제, 가정 . 사회적 환경 9문제, 타 교과 성적 10문제 등 3 가지 그룹으로 구성하였다. 신경망은 각 입력 항목으로 구성된 신경망 3개, 그리고 3개를 통합한 전체 입력 항목으로 구성된 신경망 1개 등 모두 4개로 구성하였다.
즉, 개인적인 특성, 가정 . 사회적 환경, 타 교과 성적 등 3가지 영역을 각각 입력 항목으로 구성한 신경망과 세 가지 모든 영역을 입력 항목으로 구성한 신경망 등, 총 4개의 신경망을 구성하였다. 신경망의 성능은 인식률(Accuracy)과 오류(평균자승요차 함수, Mean Square Eitot : MSE) 로측정하였다.
즉, 개인적 특성, 가정 . 사회적 환경, 타 교과 성적, 전체의 입력항목에 해당하는 모델을 각각 REGa, REGb, REGc, REG.m* 표시 하였다. 로지스틱 회귀분석의 결과는 SPSS 12.
구성된 신경망(務預), 가정 . 사회적 환경으로 구성된 신경망(如), 타 교과 성적으로 구성된 신경망(亦) 그리고 전체 입력항목으로 구성된 신경망(如血)으로 총 4개 구성하였다. 이는 각 영역별로 신경망을 구성하여 어느 영역의 신경망이 가장 정확한 인식률을 보이는가를 알아보고자 한 것이다.
학생의 컴퓨터 활용 능력을 정확하게 예측하기 위해 본 논문에서는 개인적 특성과 가정 . 사회적 환경의 입력 항목 이 외에 타 교과 성적 영역을 추가하였다. 신경망의 입력값은 설문지의 개인적 특성 14문제, 가정 .
로지스틱 회귀분석은 전통적인 통계기법으로 예측에 유용한 모델이다. 신경망과의 성능을 비쿄하기위해 로지스틱 회귀분석 모델도 입력 항목에 따라 4개로 개발하였다. 본 연구의 실험 결과에 따르면, 제안한 신경망은 로지스틱 회귀분석에 비해 높은 인식률을 보임을 알 수 있었다.
사회적 환경, 타 교과 성적)를 추출하여 3개의 입력항목 그룹으로 나누어 각 그룹별로 하나씩의 신경망을 구축하고 전체 요소를 입력 항목으로 포함하는 전체 신경망을 구축하였다. 신경망의 출력값은 컴퓨터 활용 능력 수준으로 하고, 상중하에 해당하는 값으로 하였다. 또한, 전체 입력값으로 구성한 신경망과 각 입력 영역으로 구성된 3개의 신경망의 인식률과 오류를 비교하였다.
즉, NNa, NNb, NNc, NNall을 각각 3- 크로스 확인으로 구축하였다. 또한, 최고의 수행 결과를 얻기 위해 오류 역전파 알고리즘을 10000번 실험하였다.
훈련 데이터의 레코드(record) 하나에 대해 학습시키고 그 오차를 신경망에 반영한다. 즉, 데이터의 한 레코드의 필드값들을 신경망에 입력시키고, 각 계층을 거쳐 계산된 출력값과 그 레코드의 목표값의 오차를 구한 후, 신경망의 출력층부터 은닉층을 거쳐 입력층에 이르기까지 역순으로 오차를 연결강도에 반영시킨다. 이와 같이 모든 훈련데이터의 레코드에 대해 같은 작업을 반복적으로 수행한다.
또한, 전체 입력값으로 구성한 신경망과 각 입력 영역으로 구성된 3개의 신경망의 인식률과 오류를 비교하였다. 최적의 신경망을 구축하기 위해서 은닉층의 노드 개수를 실험을 통해 결정하였다.
대상 데이터
본 논문에서는 신경망의 인식률을 전통적인 통계기법인 로지스틱 회귀분석의 인식률과 비교하였다. 로지스틱 회귀분석도 신경 망과 마찬가지로 입력 항목에 따라 4개의 모델로 구성하였다. 즉, 개인적 특성, 가정 .
연구대상은 경기도 광명시 소재 A초등학교 6학년 134명을 대상으로 하였다. 테스트 데이터의 수는 35개, 훈련용 데이터의 수는 99개로 총 데이터의 수는 134개이다.
134명을 대상으로 하였다. 테스트 데이터의 수는 35개, 훈련용 데이터의 수는 99개로 총 데이터의 수는 134개이다.
데이터처리
전통적인 통계방법의 하나로 예측에 유용한 로지스틱 회귀분석과의 비교를 통해 신경망의 성능을 분석하였다. 개인적 특성으로 구성한 신경망이 가장 높은 인식률을 보였고, 가정 .
이론/모형
가장 간단한 신경망은 입력층, 은닉층, 출력층으로 되어 있고 보다 복잡한 신경망은 두 개 이상의 은닉층을 갖는 구조이다. 데이터의 패턴은 훈련 데이타를 통하여 신경망의 출력값과 목표값의차이를 최소화시키는 방향으로 신경망의 연결 강도를 갱신하는 오류 역전파 알고리즘(Error Backpro pagation Algorithm : EBP)으로 얻어진다. 為, 쪼류 역전파 알고리즘은 학습이라는 단계를 거쳐 출력값과 목표값의 차이를 허용된 오류의 임계치보다 작게 되도록 연결강도를 변화시키는 것이다[1].
본 연구에서 사용한 신경망은 다층 인식모형 (MLP) 신경망이다. 다층 인식모형 신경망은 일반적으로 입력층, 은닉층, 출력층 3층 구조를 가진다.
사회적 환경, 타 교과 성적 등 3가지 영역을 각각 입력 항목으로 구성한 신경망과 세 가지 모든 영역을 입력 항목으로 구성한 신경망 등, 총 4개의 신경망을 구성하였다. 신경망의 성능은 인식률(Accuracy)과 오류(평균자승요차 함수, Mean Square Eitot : MSE) 로측정하였다. 실험 결과, 개인적 특성으로 구성된 신경망이 학생의 컴퓨터 활용 능력을 설명하는데 가장 높은 인식률을 보였다.
또 다른 연구[8]에서 제안한 모델은 학생의 최종성적을 예측하는데 다수의 예측 모델을 통합하는 복합적인 방법을 사용했다. 심지어 이 모델은 유전자 알고리즘(GA)를 사용하여 최상의 예측 모델을 구성하였다. 학생의 최종 성적을 3개의 클래스 (class)로 분류하는데 있어서 이 모델은 약 72.
적은 수의 훈련용 데이터로 인해 생길 수 있는 오버피팅을 극복하기 위해 한 표본에 대해 성공한 방법을 다른 표본에 적용시켜 정당성을 확인하는 크로스 확인(k-fold cross validation)을 활용하였다 [17], 이 방법은 훈련용 데이터 전체를 k개 그룹으로 나누는데, 본 연구에서는 k=3으로 적용하여 실험하였다. 즉, NNa, NNb, NNc, NNall을 각각 3- 크로스 확인으로 구축하였다.
성능/효과
1% 의 인식률을 보였다. [8, 9]와 비교해 볼 때, 본 연구의 NN, 、는 84.8%, NNb는 72.7%, "는 77.8%, NNme은 83.8%의 인식률을 보였고 평균적으로 약 79.8%의 높은 인식률을 보였으므로, 기존 모델에 비해 매우 단순하면서도 우수한 성능을 나타낸 것을 알 수 있다.
신경망과의 성능을 비쿄하기위해 로지스틱 회귀분석 모델도 입력 항목에 따라 4개로 개발하였다. 본 연구의 실험 결과에 따르면, 제안한 신경망은 로지스틱 회귀분석에 비해 높은 인식률을 보임을 알 수 있었다. 본 논문의 나머지 부분은 다음과 같은 구성을 가진다.
로지스틱 회귀분석과 신경망 모두 개인적 특성에서 최고의 인식률을 보인 반면 가정 .사회적 환경에서 최하의 인식률을 보였다. 가정 .
신경망은 로지스틱 회귀분석에 비해 가정 . 사회적 환경으로 구성된 신경망에서 약 35%, 전체 입력항목으로 구성된 신경망에서는 약 12% 더욱 향상된 인식률을 보였다.
가정 . 사회적 환경으로 구성한 신경망의 인식률은 로지스틱 회귀분석의 인식률과 비교해 무려 35%나 더 높았다.
신경망의 성능은 인식률(Accuracy)과 오류(평균자승요차 함수, Mean Square Eitot : MSE) 로측정하였다. 실험 결과, 개인적 특성으로 구성된 신경망이 학생의 컴퓨터 활용 능력을 설명하는데 가장 높은 인식률을 보였다. 반면, 가정 .
사회적인 환경은 가장 낮은 설명력을 보이는 것은 주목할 만하다. 종합적으로 전체 입력항목으로 구성된 모델은 약 85.9% 설명력을 보였다.
심지어 이 모델은 유전자 알고리즘(GA)를 사용하여 최상의 예측 모델을 구성하였다. 학생의 최종 성적을 3개의 클래스 (class)로 분류하는데 있어서 이 모델은 약 72.1% 의 인식률을 보였다. [8, 9]와 비교해 볼 때, 본 연구의 NN, 、는 84.
후속연구
있다. 따라서, 향후 연구에서는 보다 향상된 신경망 구조로부터 규칙을 추출하여 컴퓨터 활용능력에 영향을 미치는 중요한 요소를 보다 쉽게 판별할 수 있는데 초점을 둘 것이다. 또한 정확도가 높은 신경망을 구축하기 위해 유전자 알고리즘을 적용한 최상의 연결 강도를 가진 신경망을 구성해야 할 필요가 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.