$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 한국어 워드넷에서의 개념 유사도를 활용한 선택형 문항 생성 시스템
A Question Example Generation System for Multiple Choice Tests by utilizing Concept Similarity in Korean WordNet 원문보기

정보처리학회논문지. The KIPS transactions. Part A. Part A, v.15A no.2, 2008년, pp.125 - 134  

김용범 (한림대학교 정보통신공학부) ,  김유섭 (한림대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 난이도를 고려하여 선택형 문항을 자동으로 생성하는 방법을 고안하였으며, 학습자 수준에 적합하도록 동적인 형태로 다양한 문항 제시를 할 수 있는 시스템을 구현하였다. 선택형 문제를 통한 평가에서는 적절한 규모의 문제 은행이 필요하다. 이와 같은 요구를 만족시키기 위해서는 보다 쉽고 빠른 방식으로 다양하고 많은 문제 및 문항을 생성할 수 있는 시스템이 필요한데, 본 논문에서는 문제 및 문항의 생성을 위하여 워드넷이라는 언어 자원을 이용한 자동 생성 방법을 고안하였다. 자동 생성을 위해서는 주어진 문장에서 형태소 분석을 통해 키워드를 추출하고, 각 키워드마다 워드넷의 계층적 특성에 따라 유사한 의미를 가진 후보 단어를 제시한다. 의미 유사 후보 단어를 제시할 때, 기존의 한국어 워드넷의 스키마를 개념간 의미 유사도 행렬을 구할 수 있는 형태의 스키마로 변경한다. 단어의 의미 유사도는 동의어를 의미하는 수준 0에서 거의 유사도가 없다고 볼 수 있는 수준 9까지 다양하게 제시될 수 있으며, 생성될 문항에 어느 정도의 유사도를 가진 어휘를 포함시키느냐에 따라서 출제자의 의도에 따른 난이도의 조정이 가능하다. 후보 어휘들의 의미 유사도 측정을 위해서, 본 논문에서는 두 가지 방법을 사용하여 구현하였다. 첫째는 단순히 두 어휘의 워드넷 상에서의 거리만을 고려한 것이고 둘째는 두 어휘가 포함되어 있는 트리 구조의 크기까지 추가적으로 고려한 것이다. 이러한 방법을 통하여 실제 출제자가 기존에 출제된 문제를 토대로 더 다양한 내용과 난이도를 가진 문제 또는 문항을 더 쉽게 출제할 수 있는 시스템을 개발할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

We implemented a system being able to suggest example sentences for multiple choice tests, considering the level of students. To build the system, we designed an automatic method for sentence generation, which made it possible to control the difficulty degree of questions. For the proper evaluation ...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 연구에서는 자동으로 생성되는 문항의 유사도를 조절함으로써 문제의 난이도를 조절할 수 있도록 하였다. 기존의 [5] 연구에서도 워드넷(WordNet)[6]을 한국어로 번역한 한국어 워드넷[7]을 사용하여 유사한 문항을 동적으로 생성할 수 있었으나, 본 연구에서는 이러한 한국어 워드넷의 구조를 보다 적극적으로 이용하여 유사도를 조절함으로써 보다 다양한 난이도의 문제를 출제할 수 있도록 한다.
  • 따라서 본 연구에서는 자동으로 생성되는 문항의 유사도를 조절함으로써 문제의 난이도를 조절할 수 있도록 하였다. 기존의 [5] 연구에서도 워드넷(WordNet)[6]을 한국어로 번역한 한국어 워드넷[7]을 사용하여 유사한 문항을 동적으로 생성할 수 있었으나, 본 연구에서는 이러한 한국어 워드넷의 구조를 보다 적극적으로 이용하여 유사도를 조절함으로써 보다 다양한 난이도의 문제를 출제할 수 있도록 한다. 선택형 문제에서 오답은 문제의 난이도 및 학습자의 대상 어휘에 대한 이해도 평가에 중요한 역할을 한다[8].
  • 선택형 문제에서 오답은 문제의 난이도 및 학습자의 대상 어휘에 대한 이해도 평가에 중요한 역할을 한다[8]. 따라서 본 연구에서는 정답 문항의 어휘와 새로이 만들어지는 오답 문항의 어휘의 유사도를 워드넷에서 제공하는 Synset, Hypernym, Hyponym 과 같은 계층적 특성을 이용하여 조절함으로써 새로이 생성되는 문제의 난이도를 조절할 수 있도록 하였다. 어휘간 개념 유사도의 측정을 위해서, 본 논문에서는 [9], [10]에서 제시된 측정방법을 구현하여 사용자가 이들 두 가지 방법 중에서 본인의 의도에 더 적합한 방법을 선택할 수 있도록 하였다.
  • 그러나 (그림 2)의 한국어 워드넷의 기본 구조는 많은 정보를 표현하기 위하여 어휘 개념 유사도 행렬 구성에는 필요하지 않은 데이터 필드를 가지고 있으며, 또한 데이터가 지나치게 세분화되어 유사도 행렬을 구성할 때 오버헤드를 유발시켜 성능을 저하시키는 문제를 가지고 있다. 따라서 본 논문에서는 이러한 문제를 해결하기 위하여 주어진 한국어 워드넷의 기본 구조를 유사도 행렬 구성에 맞추어 재구성하였다.
  • 문제의 난이도는 기존 문항의 어휘를 유사도를 토대로 대체함으로써 조절한다. 본 논문에서는 난이도를 상향 조절하는 것을 실험하였다. 난이도를 높이기 위해서 정답을 토대로 오답을 구성하거나, 역시 정답을 토대로 정답을 재구성하는 방법을 이용하였다.
  • 본 실험은 자동 생성 시스템을 통하여 실제 문제의 난이도를 얼마나 높일 수 있었는가에 대한 평가 실험이다. 먼저 본 실험을 위하여 컴퓨터 활용 능력 2급 필기 문제[15] 중에서 난이도를 고려하여 20문제를 선택하였다.
  • 본 연구에서는 한국어 워드넷의 계층 구조를 이용하여 주어진 문항을 가지고 원하는 정도의 유사도를 가진 새로운 문항을 생성하는 시스템을 구현하였다. 본 시스템은 대체어의 선택시 단순히 주어진 어휘의 동의어 또는 하위어만을 고려하는 부분과 워드넷의 계층 구조상에서의 유사도를 고려하여 대체어를 선택하는 부분으로 이루어진다.
  • 마지막으로 시험의 성격을 반영한 시스템의 구축이 진행되어야 할 것이다. 본 연구에서 활용한 시험은 그 성격상 전문 지식의 인지 여부를 물어보는 시험이다. 이러한 시험의 경우에는 많은 문항들이 특정 용어 및 수치로 이루어진다.

가설 설정

  • 따라서 두 유형의 결과 값의 차이가 0인지를 검정하는 paired t-검정을 적용하였다. 검정시 기본가설은 원문 유형과 변경문 유형간 점수 차이가 없다는 것이며, 대립가설은 두 유형간 점수 차이가 통계적으로 유의하게 차이난다는 것이다. (H0:A-B=0 vs H1:A-B≠0) 다음에 검정 결과가 정리되어 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
한국어 워드넷의 선택형 문제에서 오답은 어떤 역할을 하는가? 기존의 [5] 연구에서도 워드넷(WordNet)[6]을 한국어로 번역한 한국어 워드넷[7]을 사용하여 유사한 문항을 동적으로 생성할 수 있었으나, 본 연구에서는 이러한 한국어 워드넷의 구조를 보다 적극적으로 이용하여 유사도를 조절함으로써 보다 다양한 난이도의 문제를 출제할 수 있도록 한다. 선택형 문제에서 오답은 문제의 난이도 및 학습자의 대상 어휘에 대한 이해도 평가에 중요한 역할을 한다[8]. 따라서 본 연구에서는 정답 문항의 어휘와 새로이 만들어지는 오답 문항의 어휘의 유사도를 워드넷에서 제공하는 Synset, Hypernym, Hyponym 과 같은 계층적 특성을 이용하여 조절함으로써 새로이 생성되는 문제의 난이도를 조절할 수 있도록 하였다.
최근 워드넷은 어디에 활용되고 있는가? 워드넷[6]은 1985년 프린스톤(Princeton)대학 인지과학연구실에서 연구되어 발전된 것으로써, 최초에는 어휘들의 연관성을 나타내기 위하여 고안되었으며 최근에는 언어처리, 정보검색 등의 분야에서 매우 활발하게 활용, 연구되고 있다[12].
한국어 워드넷이 다시 한글 변환이 필요한 이유는? 한국어 워드넷은 영문을 기준으로 의미의 계층이 이루어지기 때문에 키워드의 영문 변환 후에 유사도를 측정하여야 하며 유사도에 따른 후보단어 확장 이후 다시 한글 변환이 필요하다. 한국어 워드넷에서 동의어를 추출하기 위해서는 키워드의 한국어 워드넷 상에서의 offset을 계산하고 이와 같은 offset을 가지는 단어들을 후보단어로 추출하며, 하위어를 추출할 때에는 키워드에 연결된 하위어들의 인덱스를 이용하여 hypernym table에서 추출하여 후보단어를 추출한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Educational Testing Service, http://www.ets.org 

  2. 황대준, “사이버 스페이스상의 상호참여형 실시간 원격교육 시스템에 관한 연구”, 한국정보처리학회 제4권 3호, 1997. 5 

  3. 조은순, “원격교수-학습을 위한 사고의 전환: 하드웨어에서 소프트웨어로”, 한국정보처리학회 제4권 3호, 1997. 5 

  4. 원대희, 강태호, 김원진, 방훈, 이재영, “임의 추출 분할 방식을 이용한 동적 문제 출제 시스템”, 한국정보과학회 추계학술대회, 2001 

  5. 오정석, 추승우, 조우진, 김유섭, 이재영, “한글 워드넷을 이용한 동적 문제 출제 시스템 설계”, 한국정보기술학회 논문지 4권 5호 pp.37-44, 2006 

  6. G. A. Miller, "WordNet: An On-Line Lexical Database," International Journal of lexicography, 1990 

  7. 이은령 임성신, “WordNet2.0의 한국어 번역 작업과 결과물”, 부산대학교 한국어정보처리연구실 

  8. 최수일, 임지희, 최호섭, 옥철영, “사용자 어휘지능망과 자동문제생성기술을 이용한 한국어 어휘학습시스템”, 제 18회 한글 및 한국어 정보처리 학술대회 논문집, pp.15-21, 2006 

  9. Graeme Hirst and David St-Onge, “Lexical chains as representations of context for the detection and correction or malapropisms,” In Fellbaum, pp.305-332, 1998 

  10. Claudia Leacock and Martin Chodorow, “Combining local context and WordNet similarity for word sense identification,” In Fellbaum, pp.265-283, 1998 

  11. 강승식, 범용 형태소 분석기 “HAM Ver 6.0.0”, 국민대학교 자연언어 정보 검색 연구실, http://nlp.kookmin.ac.kr 

  12. Wikipedia, http://en.wikipedia.org/wiki/WordNet 

  13. Budanitsky, A., and G. Hirst, “Semantic Distance in WordNet: An Experimental Application-oriented Evaluation of Five Measures“, Workshop on WordNet and Other Lexical Resources, in the North American Chapter of the Association for Computational Linguistics (NAACL-2001), Pittsburgh, PA, June, 2001 

  14. Date, C. J., “An Introduction to Database Systems: 7th edition,” Addison Wesley Longman, 1999 

  15. 대한상공회의소 감정사업단, http://www.passon.co.kr 

  16. Goulden, C. H., “Methods of Statistical Analyssi 2nd ed.,” New York: Wiley, pp.50-55, 1956 

저자의 다른 논문 :

LOADING...

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로