$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

교육종단연구 분석을 위한 빅데이터 플랫폼 개발 및 적용
Development and Application of a Big Data Platform for Education Longitudinal Study Analysis 원문보기

The journal of Bigdata = 한국빅데이터학회지, v.5 no.1, 2020년, pp.11 - 27  

박정 (흥도초등학교) ,  조완섭 (충북대학교 대학원 빅데이터학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 교육종단연구 데이터를 효과적으로 저장·처리·분석하기 위한 데이터 플랫폼을 개발하고, 이를 서울교육종단연구(SELS)에 적용하여 유용성을 확인한다. 플랫폼은 데이터 전처리부와 데이터 분석부로 구성된다. 데이터 전처리부에서는 1) 마스킹 2) 요인화 3) 정규화·이산화 4) 데이터 유도 5) 데이터 웨어하우징 과정을 통해 교육종단연구 데이터 웨어하우스를 생성하게 된다. 데이터 분석부는 OLAP과 데이터 마이닝(DM)으로 구성된다. 먼저, OLAP에서는 측정값 선정, 스키마 설계를 거쳐 OLAP을 수행하게 된다. 이후 DM에서는 변수 선택, 연구모형 선택, 데이터 수정, 인수튜닝, 모형학습, 모형평가 및 해석단계를 거친다. 본 플랫폼에서 전처리 과정을 거쳐 생성된 데이터 웨어하우스는 다양한 연구자들에 의해 공유될 수 있고, 지속적인 연구결과 데이터 셋의 축적이 가능하므로 후속 연구자들은 추가적인 분석을 수월하게 수행할 수 있게 된다. 또한, 정책입안자들도 SELS 데이터 웨어하우스에 직접 접근하여 다차원 분석을 통해 온라인으로 분석할 수 있어 과학적인 의사결정이 가능하게 된다. 본 연구에서는 개발된 플랫폼의 유용성을 입증하기 위해 SELS 데이터를 플랫폼 상에서 구축하고 수학 학업성취도를 측정값으로 선정하여 OLAP 및 DM을 수행하였으며, 측정값에 영향을 주는 다양한 요인을 데이터 마이닝 기법을 사용하여 분석하였다. 이를 통해 데이터 기반 교육정책 시사점을 빠르고 효과적으로 도출할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we developed a big data platform to store, process, and analyze effectively on such education longitudinal study data. And it was applied to the Seoul Education Longitudinal Study(SELS) to confirm its usefulness. The developed platform consists of data preprocessing unit and data anal...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 또한 이 과정을 상세히 기술하여 교육학 연구자의 연구방법론에 대한 선택의 폭을 넓혀 데이터 분석 연구의 활성화에 도움이 되도록 한다. 나아가 교육정책입안자의 교육종단연구 분석의 활용성을 제고하고, 데이터 기반 교육정책 수립의 기반을 마련하도록 함에 본 연구의 특징이 있다.
  • 이처럼 데이터 증가에 따른 데이터 전처리, 데이터 웨어하우스 구축 및 적절한 분석 기법의 부재와 같은 일련의 문제들은 교육종단연구에 대한 데이터 관점의 논의와 사례가 절대적으로 부족하다는 한계점을 보여주는 것이다. 따라서 이러한 한계를 극복하기 위해 본 논문은 교육종단연구 데이터에 적합한 데이터 플랫폼을 개발하고 이에 실제적인 적용을 통해 교육종단연구 데이터 분석을 효과적으로 수행할 수 있는 방법을 제안한다.
  • 본 연구는 각 시도교육청이 수집하는 교육종단연구 데이터의 보다 실제적 활용을 위해 데이터 관리를 위한 플랫폼 구축방안과 적합한 전처리, OLAP 및 DM 기법을 활용한 분석기법을 제시한다. 또한 이 과정을 상세히 기술하여 교육학 연구자의 연구방법론에 대한 선택의 폭을 넓혀 데이터 분석 연구의 활성화에 도움이 되도록 한다. 나아가 교육정책입안자의 교육종단연구 분석의 활용성을 제고하고, 데이터 기반 교육정책 수립의 기반을 마련하도록 함에 본 연구의 특징이 있다.
  • 본 논문에서는 교육종단연구 데이터를 분석하기 위한 데이터 플랫폼을 개발하였으며 이를 위한 데이터 전처리 및 분석 기법을 제안하였다. 또한 개발한 플랫폼을 SELS에 적용해 수학 학업성취도를 중심으로 그 타당성을 확인하였다.
  • 본 연구는 각 시도교육청이 수집하는 교육종단연구 데이터의 보다 실제적 활용을 위해 데이터 관리를 위한 플랫폼 구축방안과 적합한 전처리, OLAP 및 DM 기법을 활용한 분석기법을 제시한다. 또한 이 과정을 상세히 기술하여 교육학 연구자의 연구방법론에 대한 선택의 폭을 넓혀 데이터 분석 연구의 활성화에 도움이 되도록 한다.
  • 본 연구의 핵심 아이디어는 데이터 기반 교육정책 수립을 위해 필수적인 교육종단연구 분석 활성화를 위한 데이터 플랫폼을 개발하는데 있다. 교육종단연구 데이터 플랫폼 아키텍처는 Han, Kamber & Pei(2016)에서 제시한 3-계층 데이터 웨어하우징 아키텍처를 기반으로 하여 본 연구 목적에 적합하게 설계하였으며, <그림 1>과 같다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
교육종단연구 데이터의 기능은 무엇인가? 교육종단연구 데이터의 기능은 연구대상의 동태를 파악하는 것으로 학생의 변화, 발달 및 성장을 측정 분석하는 것이다(강호수, 김종민, 최보미, 2017). 특히 앞서 논의한 시도교육청 단위의 교육종단연구는 각 시도별 교육환경의 특성과 정책에 적합하게 설계되었으며, 이렇게 수집된 데이터는 현장에 더욱 밀착한 데이터로서 교육 현황을 잘 반영하고 있다.
교육종단연구의 목적은 무엇인가? 우리나라에서도 이러한 현상에 대응하기 위해 강원, 경기, 부산, 서울교육청은 학생, 학부모, 학교 등의 데이터를 장기간에 걸쳐 수집하고 이를 활용하여 데이터 기반 교육정책을 설계하기 위해 교육종단연구(부산교육정책연구소, 2019; 서울교육연구정보원, 2010; 성기선 외, 2013; 임성택, 어성민, 신미숙, 2013)를 수행하고 있다. 교육종단연구는 학생의 성장에 영향을 미치는 요인과 과정을 체계적으로 파악하기 위해 데이터를 생성하고 이를 활용하여 교육정책 및 예산투입 의사결정에 과학적 근거 마련을 목적으로 하고 있다(박현정 외, 2011). 경기, 부산, 서울의 교육종단연구는 중⋅장기 사업으로 운영되있어 그 데이터의 양은 시간이 갈수록 더욱 증가해 갈 것이며, 기존 파일 형태의 데이터 관리 체계는 그 한계를 드러낼 것이 분명하므로, 새로운 데이터 관리 체계로의 변화가 요구될 수밖에 없을 것이다.
교육종단연구 데이터 플랫폼 아키텍처는 어떤 계층들로 구성되는가? 교육종단연구 데이터 플랫폼 아키텍처는 Han, Kamber & Pei(2016)에서 제시한 3-계층 데이터 웨어하우징 아키텍처를 기반으로 하여 본 연구 목적에 적합하게 설계하였으며, <그림 1>과 같다. 이는 데이터 웨어하우스, OLAP 서버, 프론트 엔드 툴의 3-계층으로 구성된다. 하위계층인 데이터 웨어하우스는 기본적으로 데이터 베이스(Data Base: DB)를 기반으로 한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (30)

  1. 김계수(2007), Amos 구조방정식 모형 분석, 서울: 한나래. 

  2. 김슬람(2018), 노인 고혈압 외래환자 의료비 영향 요인 분석: 시도별 의료이용을 중심으로, 충북대학교 석사학위 논문. 

  3. 김양훈(2019), "인천시교육청, 학생 예측기법 빅데이터 학교 신설 업무 활용". 매일일보, 2019. 6. 27. 

  4. 문보경(2019), "교육 정책 빅데이터 활용해 수립...관계기관 첫 회의 가져". 전자신문, 2019. 2. 17. 

  5. 박선우(2018), "빅데이터 시대와 데이터 융합," 정보통신방송정책, 30(1), 1-24. 

  6. 박현정, 정동욱, 강주연, 하여진, 홍자연, 박민호, 신지숙, & 이진실(2012), 서울교육종단연구 2차 년도 기초분석 보고서, 서울특별시교육연구정보원. 

  7. 배미희, 최중진, & 김청송(2016), "학교폭력 가해자, 피해자, 방관자 예측모형 연구," 청소년학연구, 23(8), 385-413. 

  8. 배정수, & 송병국(2015), "의사결정나무 분석기법을 활용한 고등학생 진로결정수준 결정요인 우선순위 탐구," 진로교육연구, 28(4), 79-105. 

  9. 부산교육정책연구소.(2019), 2019 부산교육종단 연구 협력학교 설명회 자료집, 부산광역시교육청. 

  10. 서울교육연구정보원.(2010), 데이터 기반 서울 교육정책 설계 서울교육종단연구, 서울특별시 교육청. 

  11. 서울대학교 교육연구소(2011). 교육학용어사전, 서울: 하우동설. 

  12. 성기선, 양길석, 김준엽, 박소영, 민병철, 윤일경, 이종현, & 이경아.(2013), 경기교육종단연구 1차년도 기초분석 보고서, 경기도교육연구원. 

  13. 오영세(2019), "서울시교육청, 수요자 중심교육?교육서비스 빅데이터로 실현한다". 에듀인뉴스, 2019. 6. 17. 

  14. 이주리(2009), "Data Mining 을 이용한 초등학생의 삶의 만족도에 대한 보호요인 및 위험요인 탐색," 아동학회지, 30(1), 11-25. 

  15. 이현호(2016), R과 SQL을 활용한 실전 데이터 전처리, 서울: 카오스북. 

  16. 이혜주 & 정의현(2014), "데이터마이닝 기법을 이용한 스트레스 결정요인의 연차별 추이 분석," 아동교육, 23(3), 63-80. 

  17. 임성택, 어성민, & 신미숙.(2013), 강원 학생 교육성취도 종단연구, 강원도교육 연구원. 

  18. 조완섭(2017), "빅데이터 거버넌스와 표준화 동향," OSIA Standards & Technology Review, 30(2), 26-29. 

  19. 조완섭외(2018), 데이터베이스 시스템, 홍릉과학출판사. 

  20. 조철호(2015), SPSS/AMOS 활용 구조방정식모형 논문통계분석, 서울:청람. 

  21. 최선희(2014), 다중지능, 수학 기피성향, 수학학업성취도 간의 관계, 이화여자대학교 대학원 석사학위 논문. 

  22. 최지선, & 상경아(2019), "초등학생 수학 성취도에 영향을 미치는 교육맥락변인에 대한 동아시아 5개국 비교," 초등수학교육, 22(3), 167-180. 

  23. 최형철(2019), 결측 데이터의 결측치 대체 방법에서 효과적 투표방식 적용에 대한 연구, 한양대학교 대학원 석사학위 논문. 

  24. Breiman, L.(2001), "Random forests," Machine learning, 45(1), 5-32. 

  25. Cupples, L. A., Bailey, J. N., Cartier, K. C., Falk, C. T., Liu, K.-Y., Ye, Y., Yu, R., Zhang, H., & Zhao, H.(2005), "Data mining," Genetic Epidemiology, 29(S1), S103-S109. 

  26. Flach, P.(최재영 옮김) (2016), 머신러닝: 데이터 를 이해하는 알고리즘의 예술과 과학, 경기:비제이퍼블릭. 

  27. Goyal, M., & Vohra, R.(2012). "Applications of data mining in higher education," International Journal of Computer Science Issues, 9(2), 113-120. 

  28. Guyon, I., Weston, J., Barnhill, S., & Vapnik, V.(2002), "Gene selection for cancer classification using support vector machines," Machine learning, 46(1-3), 389-422. 

  29. Han, J., Kamber, M., & Pei, J.(정사범, 송용근 옮김)(2016), 데이터 마이닝: 개념과 기법, 서울:에이콘. 

  30. Kuhn, M., & Johnson, K.(권정민 옮김)(2018), 실천 예측 분석 모델링, 서울: 에이콘. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로