자동분류기반 성격 유형별 도서추천시스템 개발을 위한 실험적 연구 A Experimental Study on the Development of a Book Recommendation System Using Automatic Classification, Based on the Personality Type원문보기
이 연구의 목적은 개인별 성향이나 성격 유형에 따라 선호하는 도서에 차이가 있음을 전제로, 어린이 청소년을 위한 추천도서의 책소개 정보를 활용하여 개인별 성격유형에 적합한 도서를 합리적으로 추천할 수 있는 서평 자동분류시스템을 개발하는 것이다. 연구에서 사용한 데이터는 국립어린이청소년도서관에서 제공하는 501권의 유아 및 아동도서를 대상으로 하였다. 실험에 활용된 2가지 기계학습 모델(비선형 커널 및 선형 커널) 각각에 대해서 총 6가지의 색인어 가중치 계산 방법과 자질 선택 방법, 그리고 10가지의 자질 선정 임계치 조합으로 구성된 360개의 분류 모델들을 구성하고 각각의 성능을 측정하였다. 전체적으로는 선형 커널을 이용한 SVM 기반 학습 방법(LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보이는 것으로 나타났다. 다만 성능 측정 결과는 뉴스 기사나 논문을 대상으로 한 문헌 분류 성능에 비해서 낮은 것으로 나타났으나, 합리적인 분류 기준이 존재하는 뉴스기사나 주제 분류에 비해서 성격 유형 기반 분류는 그 난이도가 높다는 것을 감안할 때, 초기 실험 결과로서의 의미는 있다.
이 연구의 목적은 개인별 성향이나 성격 유형에 따라 선호하는 도서에 차이가 있음을 전제로, 어린이 청소년을 위한 추천도서의 책소개 정보를 활용하여 개인별 성격유형에 적합한 도서를 합리적으로 추천할 수 있는 서평 자동분류시스템을 개발하는 것이다. 연구에서 사용한 데이터는 국립어린이청소년도서관에서 제공하는 501권의 유아 및 아동도서를 대상으로 하였다. 실험에 활용된 2가지 기계학습 모델(비선형 커널 및 선형 커널) 각각에 대해서 총 6가지의 색인어 가중치 계산 방법과 자질 선택 방법, 그리고 10가지의 자질 선정 임계치 조합으로 구성된 360개의 분류 모델들을 구성하고 각각의 성능을 측정하였다. 전체적으로는 선형 커널을 이용한 SVM 기반 학습 방법(LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보이는 것으로 나타났다. 다만 성능 측정 결과는 뉴스 기사나 논문을 대상으로 한 문헌 분류 성능에 비해서 낮은 것으로 나타났으나, 합리적인 분류 기준이 존재하는 뉴스기사나 주제 분류에 비해서 성격 유형 기반 분류는 그 난이도가 높다는 것을 감안할 때, 초기 실험 결과로서의 의미는 있다.
The purpose of this study is to develop an automatic classification system for recommending appropriate books of 9 enneagram personality types, using book information data reviewed by librarians. Data used for this study are book review of 501 recommended titles for children and young adults from Na...
The purpose of this study is to develop an automatic classification system for recommending appropriate books of 9 enneagram personality types, using book information data reviewed by librarians. Data used for this study are book review of 501 recommended titles for children and young adults from National Library for Children and Young Adults. This study is implemented on the assumption that most people prefer different types of books, depending on their preference or personality type. Performance test for two different types of machine learning models, nonlinear kernel and linear kernel, composed of 360 clustering models with 6 different types of index term weighting and feature selections, and 10 feature selection critical mass were experimented. It is appeared that LIBLINEAR has better performance than that of LibSVM(RBF kernel). Although the performance of the developed system in this study is relatively below expectations, and the high level of difficulty in personality type base classification take into consideration, it is meaningful as a result of early stage of the experiment.
The purpose of this study is to develop an automatic classification system for recommending appropriate books of 9 enneagram personality types, using book information data reviewed by librarians. Data used for this study are book review of 501 recommended titles for children and young adults from National Library for Children and Young Adults. This study is implemented on the assumption that most people prefer different types of books, depending on their preference or personality type. Performance test for two different types of machine learning models, nonlinear kernel and linear kernel, composed of 360 clustering models with 6 different types of index term weighting and feature selections, and 10 feature selection critical mass were experimented. It is appeared that LIBLINEAR has better performance than that of LibSVM(RBF kernel). Although the performance of the developed system in this study is relatively below expectations, and the high level of difficulty in personality type base classification take into consideration, it is meaningful as a result of early stage of the experiment.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
실험에서는 분류 자질 추출에 필요한 다양한 색인 가중치 부여 방법 및 자질 선택 방법을 적용하여 최적의 성능을 보이는 매개변수를 선택하고자 하였다. 이를 위해서 501건의 데이터에 대해서 기계학습 모델, 색인어 가중치 계산방법, 자질 선택 방법, 그리고 자질 선정 임계치등 총 4가지 매개변수들을 변화시켜 가며 각 매개변수 설정 모드에 대해서 10겹 교차 검증을 수행하고 F-스코어를 계산하였다.
이 연구는 독서 효과를 극대화 하기 위한 방안의 하나로 개인별 성향이나 성격유형에 맞는 도서를 추천할 수 있도록 자동분류기반 도서추천시스템을 개발하기 위한 것으로, 수행한 연구의 내용 및 범위는 다음과 같다.
이 연구에서는 책에 대한 소개나 서평정보를 활용하여 개인의 성격유형별로 적합한 도서를 추천하기 위하여 서평으로부터 자질을 추출하고 이에 기반하여 문헌을 자동으로 분류할 수 있는 자동 분류시스템을 개발하였다. 개발된 시스템에서 채택한 분류 모델은 선형 분류를 제공 하는 LIBLINEAR 모델과 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델을 활용하였다.
이 연구의 목적은 개인별 성향이나 성격 유형에 따라 선호하는 도서에 차이가 있음을 전제로, 국립어린이청소년도서관에서 제공하는 어린이·청소년을 위한 추천도서에 대한 책소개 정보를 활용하여 개별 책을 대표할 수 있는 키워드를 추출하고, 이를 성격 유형을 대표하는 키워드와 비교함으로써 개인에게 가장 적합한 도서를 합리적으로 추천할 수 있는 서평 자동 분류시스템을 개발하는 것이다.
이 연구의 목적은 상황에 따라 혹은 개인별 성향이나 성격 유형에 따라 선호하는 도서에 차이가 있음을 고려하여 개인에게 가장 적합하고 필요한 도서를 합리적으로 선택할 수 있도록 출판사나 도서관에서 제공하는 서평을 분석하여 개인별 성격유형에 적합한 도서를 추천할수 있는 자동분류기반 도서추천시스템을 개발하는 것이다.
제안 방법
넷째, 국내에서 출판된 도서 가운데 현재 서점에서 판매중인 약 20만권을 대상으로 저자나출판사에서 제공하는 서평을 이용하여 도서의 내용을 대표할 수 있는 키워드를 추출하고, 출현빈도와 출현한 키워드 간의 유사도를 측정하여 순위화 하였으며, 이를 기반으로 학습 집합을 구축하였다.
넷째, 국내에서 출판된 도서 가운데 현재 서점에서 판매중인 약 20만권을 대상으로 저자나출판사에서 제공하는 서평을 이용하여 도서의 내용을 대표할 수 있는 키워드를 추출하고, 출현빈도와 출현한 키워드 간의 유사도를 측정하여 순위화하였다. 키워드를 추출하는 과정에서 특정 주제분야의 전문서적이 아닌 일반 도서를 대상으로 하는 것이기 때문에 추출된 용어가 책의 내용을 어느 정도 반영할 수 있는지를 확인하였고, 추출된 키워드를 기반으로 성격유형별 자동 분류를 위한 실험용 학습 집합을 구축하였다.
넷째, 도서로부터 추출하여 군집화한 키워드와 에니어그램 성격유형별로 대표하는 키워드를 매치시켜 성격유형별로 적합한 도서를 추천하였다.
다섯째, 전문가 집단에 의하여 수동 분류된 성격유형별 적합도서의 책소개 정보를 기반으로 이 연구에서 개발한 서평 자동분류시스템을 이용하여 자동분류를 실험적으로 수행하였다.
둘째, 전문가에 의하여 분류된 성격유형별 적합도서의 책소개 정보에 나타난 키워드를 다양한 가중치 지정 및 자질 추출 기법을 지원하는 서평자동분류시스템을 개발하였으며, 개발된 시스템에서 채택한 분류 모델은 선형 분류를 제공하는 LIBLINEAR 모델과 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델을 활용하였다.
표에서 보는 바와 같이 7번 유형에 해당하는 데이터건수가 26건으로 가장 적고, 9번 유형에 맞는 데이터는 79건으로 가장 많은 것으로 나타났다. 분류별 데이터 건수의 차이는 분류 성능과 직접적인 연관성이 있으므로 이를 감안한 성능최적화 실험을 시도하였다.
색인어 선택 방법은 문헌빈도(DF), 특정 단어에 대한 모든 분류와의 상호 정보(Mutual Information) 최대값 (MI_MAX), 특정 단어에 대한 모든 분류와의 상호 정보 평균값 (MI_AVG), 특정 단어에 대한 모든 분류와의 카이 제곱(Chi-square) 최대값 (CHI_MAX), 그리고 특정 단어에 대한 모든 분류와의 카이 제곱 평균값 (CHI_AVG)을 이용하였다.
, 2008)의 라이브러리를 활용하였다. 성능최적화 모듈은 개별 문헌을 학습된 자질에 기초하여 문헌을 자동으로 분류함에 있어서 성능을 극대화하기 위한 모듈로 이 연구에서는 높은 성능을 나타내는 매개변수 조합을 찾기 위하여 10겹 교차검증을 활용하여 최적화를 수행하였다.
셋째, 다양한 가중치 지정 및 자질 추출 기법을 지원하는 서평 자동분류시스템을 개발하였다.
셋째, 전문가 집단에 의하여 분류된 성격유형별 적합도서의 책소개 정보에 나타난 키워드를 이 연구에서 개발한 서평 자동분류시스템을 이용하여 자동분류를 실험적으로 수행하였으며, 이를 기반으로 도서 분류를 위한 학습 집합을 구축하였다.
셋째, 전문가에 의하여 분류된 성격유형별 적합도서의 책소개 정보에 나타난 키워드를 이 연구를 통하여 개발한 서평자동분류시스템을 이용하여 추출하였다.
실험에 활용된 2가지 기계학습 모델(비선형 커널 및 선형 커널) 각각에 대해서 총 6가지의 색인어 가중치 계산 방법과 자질 선택 방법, 그리고 10가지의 자질 선정 임계치 조합으로 구성된 360 개의 분류 모델들을 구성하고 각각의 성능을 측정하였다. 그 중 가장 높은 성능을 나타내는 분류 모델의 성능 측정 결과는 다음의 <표 6>과 같다.
실험용 학습 집합을 이용하여 유아 및 아동용 도서 501권을 대상으로 에니어그램 성격 유형별로 자동 분류를 시행하였다. 다음의 <표 5>는 이 연구에서 활용한 도서 서평 자료의 성격 유형 분류별 데이터 건수를 보여준다.
여섯째, 도서로부터 추출하여 군집화한 키워드와 에니어그램 성격유형별로 대표하는 키워드를 매치시켜 성격유형별로 적합한 도서를 추천하였다.
이 연구에서는 개인별 성향이나 성격 유형에 따라 선호하는 도서에 차이가 있음을 전제로, 국립어린이청소년도서관에서 제공하는 어린이·청소년을 위한 추천도서에 대한 책소개 정보를 활용하여 개별 책을 대표할 수 있는 키워드를 추출하고, 이를 성격 유형을 대표하는 키워드와 비교함으로써 개인에게 적합한 도서를 합리적으로 추천할 수 있는 도서 자동분류시스템을 개발하였다.
실험에서는 분류 자질 추출에 필요한 다양한 색인 가중치 부여 방법 및 자질 선택 방법을 적용하여 최적의 성능을 보이는 매개변수를 선택하고자 하였다. 이를 위해서 501건의 데이터에 대해서 기계학습 모델, 색인어 가중치 계산방법, 자질 선택 방법, 그리고 자질 선정 임계치등 총 4가지 매개변수들을 변화시켜 가며 각 매개변수 설정 모드에 대해서 10겹 교차 검증을 수행하고 F-스코어를 계산하였다.
정덕현(2015)은 글쓰기 수업을 수강하는 대학생을 대상으로 계획단계에서부터 쓰기단계에까지 학생들의 성격유형별로 차이가 있음을 확인하였다. 이에 따라 학생들의 성격유형별 특성을 고려하여 논술문 쓰기교육을 실시한 결과 의미 있는 효과를 발견하였으며, 성격유형별 맞춤교육을 작문지도를 위한 하나의 방법으로 제안하였다.
첫째, 에니어그램에서 9가지로 구분된 개인별 성격 유형 및 성향에 따라 각 유형별 특성을 대표하는 키워드를 선행연구에 기반하여 추출하였다.
첫째, 유아 및 아동을 위한 도서에 포함된 책소개 정보를 활용하여 우선 성격유형별 적합도서를 3인의 에니어그램 성격 유형에 관한 내용을 학습한 독서전문가가 1차 수작업으로 분류하였다.
넷째, 국내에서 출판된 도서 가운데 현재 서점에서 판매중인 약 20만권을 대상으로 저자나출판사에서 제공하는 서평을 이용하여 도서의 내용을 대표할 수 있는 키워드를 추출하고, 출현빈도와 출현한 키워드 간의 유사도를 측정하여 순위화하였다. 키워드를 추출하는 과정에서 특정 주제분야의 전문서적이 아닌 일반 도서를 대상으로 하는 것이기 때문에 추출된 용어가 책의 내용을 어느 정도 반영할 수 있는지를 확인하였고, 추출된 키워드를 기반으로 성격유형별 자동 분류를 위한 실험용 학습 집합을 구축하였다.
대상 데이터
분류 학습/실행 모듈은 분류를 위한 기계학습 모듈로 본 연구에서는 LibSVM(Chang & Lin, 2011)과 LIBLINEAR(Fan, er a., 2008)의 라이브러리를 활용하였다.
실험에 활용된 2가지 기계학습 모델(비선형 커널 및 선형 커널) 각각에 대해서 총 6가지의 색인어 가중치 계산 방법과 자질 선택 방법, 그리고 10가지의 자질 선정 임계치 조합으로 구성된 360 개의 분류 모델들을 구성하고 각각의 성능을 측정하였다.
연구에서 사용한 데이터는 국립어린이청소년도서관에서 유아, 초등저학년, 초등고학년, 그리고 청소년의 4등급으로 구분하여 제공하는 695권의 ‘사서 추천도서’ 가운데 501권의 유아 및 아동도서를 대상으로 하였으며, 그 결과는 다음과 같다.
이 연구에서 사용한 데이터는 국립어린이청소년도서관에서 유아, 초등저학년, 초등고학년, 그리고 청소년의 4등급으로 구분하여 제공하는 695권의 ‘사서추천도서’ 가운데 501권의 유아 및 아동도서를 대상으로 하였다.
이 연구에서 사용한 서평기반 도서 자동분류시스템은 서평데이터를 관리하기 위한 문서관 리모듈, 서평으로부터 키워드를 자동추출하기 위한 자동색인모듈, 추출된 색인어에 가중치를부여하고 선별하기 위한 자질추출모델, 인스턴스 관리모듈, 분류학습모듈, 그리고 성능 최적화모듈로 구성되어 있으며, 그 구조는 다음의 과 같다.
이론/모형
이 연구에서는 책에 대한 소개나 서평정보를 활용하여 개인의 성격유형별로 적합한 도서를 추천하기 위하여 서평으로부터 자질을 추출하고 이에 기반하여 문헌을 자동으로 분류할 수 있는 자동 분류시스템을 개발하였다. 개발된 시스템에서 채택한 분류 모델은 선형 분류를 제공 하는 LIBLINEAR 모델과 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델을 활용하였다.
자동색인 모듈은 서평 레코드의 제목과 서평 내용에서 키워드를 자동으로 추출하는 모듈로이 연구에서는 서울대학교 IDS(Intelligent Data Systems)연구실에서 개발한 한국어 형태소분석시스템 ‘꼬꼬마’ 버전 2.0 2) 을 사용하였다.
성능/효과
한윤옥 등(2012)은 초등학교 6학년생과 중학생을 대상으로 에니어그램 성격유형별로 차이점을 관찰하고, 또한 이들과의 심층면접을 통해 성격유형별 독서지도안을 개발하였다. 개발된 독서지도안에 기반하여 성격유형별로 독서지도를 실시한 결과 청소년의 독서태도, 독서 성향, 그리고 독서효과에서 유의미한 차이가 있음을 발견하였다. 한윤옥과 조미아(2012)는어린이와 청소년을 대상으로 성격에 따른 선호도서 목록을 개발하고, 이를 이용하여 독서 효과를 극대화하기 위한 독서지도안을 제시하였다.
김판준과 이재윤(2012)은 국내 주요 학술데이터베이스 검색서비스에서 독서분야 학술지논문에 부여된 저자 키워드를 기계학습한 결과에 따라 해당 논문들을 재분류함으로써 키워드를 추가로 할당하는 실험을 수행하였다. 그 결과 저자키워드의 재분류를 통하여 디스크립터의 자동 할당이 가능함을 발견하였다.
전체적으로는 선형 커널을 이용한 SVM 기반 학습 방법(LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보이는 것으로 나타났다. 다만 성능 측정 결과는 뉴스 기사나논문을 대상으로 한 문헌 분류 성능에 비해서 낮은 것으로 나타났으나, 합리적인 분류 기준이 존재하는 뉴스기사나 주제 분류에 비해서 성격 유형 기반 분류는 그 난이도가 높다는 것을 감안할 때, 초기 실험 결과로서의 의미는 부여할 수 있다.
둘째, 국립어린이청소년도서관에서 유아, 초등 저학년, 초등 고학년, 그리고 청소년의 4등급으로 구분하여 제공하는 ‘사서추천도서’ 695권 가운데 유아와 아동용 501권에 대한 책소개 정보를 활용하여 성격유형별 적합도서를 에니어그램 성격 유형을 학습한 3인의 독서전문 가가 수작업으로 1차 분류하였으며, 분류된 도서를 최종적으로 에니어그램과 성격유형별 독서 분야의 전문가로부터 검증하는 단계를 거쳤다.
둘째, 분류된 도서를 최종적으로 에니어그램과 성격유형별 독서 분야의 전문가가 수정하고, 검증하는 단계를 거쳤다.
이는 분류 성능에 있어서 자질 선택 방법이 결정적인 역할을 수행함을 의미한다. 또한 비선형 커널(LibSVM)과 비교하여 선형 커널 (LIBLINEAR)의 성능이 전반적으로 높을 뿐 아니라 살아남은 자질의 개수도 2배 정도 많은 것으로 나타났다. 개별 문헌을 수치적으로 표현하는데 있어서 기반 요소가 되는 어휘 자질의 규모가 크다는 의미는 문헌에 대한 표현 범위가 광범위함을 나타낸다.
백진환(2014)과조현양, 백진환(2015)은 2번 성격 유형의 초등학생을 대상으로 그들이 선호하는 도서와 그들의 부족한 부분을 강화할 수 있는 내용을 포함하고 있는 도서를 분석하였다. 분석 결과 2번유형의 초등학생들이 선호하는 도서, 즉 긍정적 특성을 강화할 수 있는 도서의 종류와 부정적 특성의 출현을 최소화하고 이를 보완할 수 있는 도서에 포함된 내용을 정리하였다. 정리한 내용은 다음의 <표 3>과 같다.
전체적으로는 선형 커널을 이용한 SVM(Support Vector Machine) 기반 학습 방법 (LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보여주고 있다. 비선형 커널을 활용한 모델은 전통적인 역문헌빈도 기반 색인어 가중치 계산방법이 가장 높은 성능을 보이고 있으며, 선형 커널을 사용한 모델은 TF-IDF 가중치를 적용한 경우 0.62를 나타내어 최고 성능을 보이고 있는 것으로 실험 결과 나타났다. 추출된 자질들 중에서 유효한 자질을 선정하는 자질 선택 방법에는 문헌 분류에 많이 활용되고 있는 카이제곱 점수의 최고값을 적용한 경우와 상호 정보 점수의 최고값을 적용한 모델이 높은 성능을 보이고 있다.
성능 측정 결과가 일반적인 뉴스 기사나 논문을 대상으로 한 문헌 분류 성능에 비해서 낮은 것으로 나타났으나, 명확한 의미 전달을 위하여 키워드의 선정을 우선시 하는 뉴스 기사나 합리적인 분류 기준이 존재하는 주제 분류에 비해서 성격 유형 기반 분류는 그 난이도가 월등히 높다는 것을 감안할 때, 초기 실험 결과로서 의미가 있다.
또한 “민주항쟁·가출”와 같은 미등록어의 경우 “민주항쟁”과 “가출”의 독립된 두 명사로 추출되어야 함에도 불구하고 하나의 명사로 인식하는 등의 문제점을 내포하고 있었다. 자동색인 과정에서 발생하는 몇 가지 문제점에도 불구하고 대용량이 아닌 소량의 데이터를 가지고 실행한 이번 실험에는 약간의 수작업을 추가함으로써 작업의 수행이 가능하다.
자질 선택 임계치 변화에 따른 자질 개수 및 성능 변화를 살펴 본 결과, 우선 임계치에 따라 성능이 극단적으로 변화함을 알 수 있다. 이는 분류 성능에 있어서 자질 선택 방법이 결정적인 역할을 수행함을 의미한다.
실험에 활용된 2가지 기계학습 모델(비선형 커널 및 선형 커널) 각각에 대해서 총 6가지의 색인어 가중치 계산 방법과 자질 선택 방법, 그리고 10가지의 자질 선정 임계치 조합으로 구성된 360 개의 분류 모델들을 구성하고 각각의 성능을 측정하였다. 전체적으로는 선형 커널을 이용한 SVM 기반 학습 방법(LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보이는 것으로 나타났다. 다만 성능 측정 결과는 뉴스 기사나논문을 대상으로 한 문헌 분류 성능에 비해서 낮은 것으로 나타났으나, 합리적인 분류 기준이 존재하는 뉴스기사나 주제 분류에 비해서 성격 유형 기반 분류는 그 난이도가 높다는 것을 감안할 때, 초기 실험 결과로서의 의미는 부여할 수 있다.
전체적으로는 선형 커널을 이용한 SVM(Support Vector Machine) 기반 학습 방법 (LIBLINEAR)이 비선형 분류를 지원하는 LibSVM(RBF 커널) 모델보다 더 나은 성능을 보여주고 있다. 비선형 커널을 활용한 모델은 전통적인 역문헌빈도 기반 색인어 가중치 계산방법이 가장 높은 성능을 보이고 있으며, 선형 커널을 사용한 모델은 TF-IDF 가중치를 적용한 경우 0.
첫째, 국립어린이청소년도서관에서 제공하는 유아 및 아동을 위한 추천도서에 포함된 책소개 정보를 활용하여 우선 성격유형별 적합도서를 3인의 에니어그램 성격 유형을 학습한 독서 전문가가 1차 수작업으로 분류하고, 분류된 도서를 최종적으로 에니어그램과 성격유형별 독서 분야의 전문가가 검증하는 단계를 거쳤다.
다음의 <표 5>는 이 연구에서 활용한 도서 서평 자료의 성격 유형 분류별 데이터 건수를 보여준다. 표에서 보는 바와 같이 7번 유형에 해당하는 데이터건수가 26건으로 가장 적고, 9번 유형에 맞는 데이터는 79건으로 가장 많은 것으로 나타났다. 분류별 데이터 건수의 차이는 분류 성능과 직접적인 연관성이 있으므로 이를 감안한 성능최적화 실험을 시도하였다.
후속연구
일반적으로 한정된 주제를 포함하고 있으며, 또한 이를 분류하기 위한 분류체계가 존재하는 분야별 전문 도서와는 달리 독서의 대상이 되는 도서의 경우 주제보다는 장르나 형태에 따른 분류가 일반적이기 때문에 키워드 기반의 분류는 한계점을 가질 수 있다. 결론적으로 개인별 성향에 맞는 도서를 분류하거나 추천하기 위해서는 정교하게 구축된 대량의 학습 집합을 바탕으로 보다 높은 수준의 기계학습 기반 분류 모델이 필요하다.
에니어그램은 인간의 선천적 기질과 성향을 구분할 수 있도록 개인별 생각과 행동 유형을 9가지로 분류한 성격유형이론으로 개인별 특성을 고려한 맞춤형 도서의 선택과 선택된 도서를 통한 독서 효율성 증대 방안의 하나로 제안될 수 있을 것이다. 특히 성인과는 달리 어린이나 청소년은 본능적 성향이나 성격 유형의 파악이 용이하여 성향별로 적합한 도서가 존재한다면 맞춤형 도서를 이용한 독서의 효과를 상승시키는 것이 가능할 것이다.
에서 제시된 바와 같이 성격 유형을 대표하는 키워드의 추출이 가능하고 또한 그들이 선호하는 도서에 대한 분류가 가능하다면, 그리고 선호도서에 빈번하게 출현하는 어휘를 정확하게 판별할 수 있다면, 자동분류 기법을 활용하여 성격 유형별로 선호하는 도서에 대한 분류가 가능할 것이다.
이 연구를 통하여 개발된 서평 자동 분류시스템은 지금까지 연구된 상황이나 성격 유형에 따른 도서 목록 생산 분야의 도서를 보다 신속하고 정확하게 분류할 수 있는 기초자료로 활용이 가능할 뿐만 아니라 양적 독서에서 탈피하여 질적 독서에 대한 가능성을 높이기 위한 수단으로 개인별 성향이나 상황에 적합한 도서를 추천할 수 있을 것이다. 또한 독자에게는 읽을꺼리에 보다 용이하게 접근할 수 있는 채널의 제공할 수 있으며, 출판사나 저작자들에게는 책에 대한 홍보활동 자료로 활용이 가능하다.
그 다음으로 성격 유형을 기준으로 도서를 더 정확하게 분류하기 위해서는 분류별 색인어리스트를 활용한 단순 매칭 혹은 검색 기법으로는 한계가 있음을 의미한다. 즉, 키워드 기반의 서평 자동분류시스템을 이용한 자동 분류의 정확도를 높이기 위해서는 시스템 자체의 성능도 중요하지만, 개인별 성격유형을 보다 명확하게 표현할 수 있는 색인어 집합의 지속적인 확대와 더불어 대용량의 학습 집합의 구축이 선행되어야 할 것으로 판단된다. 일반적으로 한정된 주제를 포함하고 있으며, 또한 이를 분류하기 위한 분류체계가 존재하는 분야별 전문 도서와는 달리 독서의 대상이 되는 도서의 경우 주제보다는 장르나 형태에 따른 분류가 일반적이기 때문에 키워드 기반의 분류는 한계점을 가질 수 있다.
성격 유형을 기준으로 도서를 분류하기 위해서는 분류별 색인어 리스트를 활용한 단순 매칭 혹은 검색 기법으로는 분명히 한계가 존재한다. 즉, 키워드 기반의 서평자동분류시스템을이용한 자동 분류의 정확도를 높이기 위해서는 시스템 자체의 성능도 중요하지만, 개인별 성격유형을 보다 명확하게 표현할 수 있는 색인어 집합의 지속적인 확대와 더불어 대용량의 학습 집합의 구축이 선행되어야 할 것이다. 또한 개인별 성향에 맞는 도서를 분류하거나 추천하기 위해서는 정교하게 구축된 대량의 학습 집합을 바탕으로 보다 높은 수준의 기계학습 기반 분류 모델이 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
독서의 효과를 높이기 위해 제시된 지금까지의 방안들은 어떤 것을 간과하고 있는가?
그러나 독서 효율성 증대를 위해 제시된 지금까지의 방안들은 선정된 책을 읽은 후의 효과를 높이기 위한 방법에 초점을 맞추고 있으며, 적합한 도서의 선정에 대한 중요성은 간과하고 있는 것이 사실이다. 아무리 좋은 책이라 할지라도 개인의 성향에 맞지 않다면 책읽기에 대한 집중력은 저하될 수밖에 없으며, 그 결과 독서의 효과 또한 낮게 나타날 것은 자명한 일이다.
자질추출 모듈의 기능은 무엇인가?
자질추출 모듈은 자동색인모듈을 이용하여 개별 서평에서 추출된 색인어에 가중치를 부여 하고 분류 성능에 중요한 색인어들을 선별하는 기능을 수행한다. 형태소 분석기를 통하여 1 차 추출된 키워드에 가중치를 부여하기 위하여 사용한 자질은 서평에 나타나는 단어빈도 (TF), 단어빈도의 로그값(LOG_TF), 역단어빈도(ITF), 역문헌빈도(IDF), 단어빈도와 역문헌비도의 곱(TF_IDF), 그리고 용어의 발생 유무(0 또는 1)이다.
에니어그램이란 무엇인가?
에니어그램은 인간의 선천적 기질과 성향을 구분할 수 있도록 개인별 생각과 행동 유형을 9가지로 분류한 성격유형이론으로 개인별 특성을 고려한 맞춤형 도서의 선택과 선택된 도서를 통한 독서 효율성 증대 방안의 하나로 제안될 수 있을 것이다. 특히 성인과는 달리 어린이나 청소년은 본능적 성향이나 성격 유형의 파악이 용이하여 성향별로 적합한 도서가 존재한다면 맞춤형 도서를 이용한 독서의 효과를 상승시키는 것이 가능할 것이다.
참고문헌 (23)
Chang, Jae-Young, Kim, JungMin, and Lee, SinYoung. 2012. "Automatic Classification of Korean Movie Reviews Using a Word Pattern Frequency." Proceedings of the Korean Information Science Society Conference. 39(1C): 51-53.
Cho, Hyun-Yang, Han, Yoon-Ok, and Paek, Jin-Hwan. 2015. "A Study on the Effects of reading Guidance Using a Happy Point Books, Focused on Enneagram Personality Type 2." Journal of the Korean Society For Library and Information Science, 49(1): 69-88.
Choi, Hyung-Rim et al. 2003. "An Automatic Question Routing System Using Machine Learning." Proceedings of the Korean Intelligent Information Systems Society. May 2003: 313-318.
Han, Yoon-Ok, & Cho, Miah. 2011. "A Study on the Relations of Personality Type and Reading Tendency of the Youth in Reading Education." Journal of Korean Library and Information Science Society, 42(4): 69-88.
Han, Yoon-Ok, & Cho, Miah. 2012. A Study on the Development of Preference Book List and the Operation of the Reading Guidance Program, Based on Children and Adolescents' Personality Type. Seoul: National Library for Children & Young Adults.
Han, Yoon-Ok, et al. 2012. "A Study on the Characteristics of Preference Books According to the Children's Personality Type." Journal of the Korean Society For Library and Information Science., 46(3): 5-34.
Han, Yoon-Ok, et al. 2012. "A Study on the Operation of the Reading Guidance program for the Youth According to Personality Type." Journal of the Korean Society For Library and Information Science, 46(1): 77-97.
Han, Yoon-Ok. 2008. Education and the Use of Reading Material. Seoul : Korean Library Association.
Jang, Ji-Sook, and Rieh, Hae-Young. 2009. "Design of Automatic Records Classification System Using Contextual Information." Journal of Korean Society of Archives and Records Management. 9(1): 151-173.
Jeong, Dukhyun. 2015. "Research on Cognitive Thinking and Writing Process as a Personality Type." Korean Journal of General Education. 9(3): 435-471.
Kim, Ki-Yeol. 2015. "Analysing Technological Thinking Disposition by Students' Personality Types in Middle School." Journal of korean Practical Arts Education. 28(2): 135-152.
Kim, Kook-Sun. 2013. "Space Design for Enhancing Learning Ability with Children's Character Type: Through Analyzed Enneagram Tool." Journal of the Korea Furniture Society. 24(1): 42-50.
Kim, Kyong. 2016. "Development of Art Therapy Program According to the Personality Type of Student with Intellectual Disabilities." The Korean Society Fisheries and Science Education. 28(1): 266-278.
Kim, Pan Jun, and Lee, Jae Yun. "A Study on the Reclassification of Author Keywords for Automatic Assignment of Descriptors." Journal of the Korean Society for Information Management. 29(2): 225-248.
Kim, Suah, Jho, Hee-Sun, and Lee Hyun Ah. 2015. "Automatic Classification of Blog Posts Considering Category-specific Information." Journal of the Korean Society of Marine Engineering, 39(1): 58-62.
Kim, Suah, Oh, Sungtak, and Lee, Jee-Hyong. 2015. "Automatic Classification of Blog Posts Considering Category-specific Information." Proceedings of the Korean Society of Computer Information Conference, 23(1): 11-14.
Lee, Byeong-Yeul. 2015. "A Study on the Relationship of Personality Type and Job Performance of Employees's on travel Industry." Journal of Tourism and Leisure Research. 27(2): 387-406.
Mo, Seul-ki and Kim, Youngsook. 2009. "A Study on the English Reading Strategies of Korean Secondary EFL Learners by Their Personality Type." English Language & Literature Teaching. 15(4): 291-311.
Paek, Jin-Hwan & Han, Yoon-Ok. 2014. "A Study on Effect of Reading Guidance Program based on Enneagram of Personality" Journal of the Korean Society For Library and Information Science, 48(2): 45-64.
Yun, U. 2001. Korean Enneagram Profile. Seoul: Korea Enneagram Education Foundation.
Chang, Chih-Chung and Lin, Chih-Jen. 2011. "LIBSVM: A Library for Support Vector Machines." ACM Transactions on Intelligent Systems and Technology, 2(3): 1-27.
Fan, R.E. et al. 2008. "LIBLINEAR: A Library for Large Linear Classification." Journal of Machine Learning Research. 9, 1871-1874.
Russell, Anne L. 2002. "MBTI Personality Preferences and Diverse Online Learning Experiences." School Libraries Worldwide, 8(1): 25-40.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.