$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

영작문 자동평가를 위한 비속어 검출과 미등록어 분류
Swear Word Detection and Unknown Word Classification for Automatic English Writing Assessment 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.3 no.9, 2014년, pp.381 - 388  

이경호 (충남대학교 정보통신공학과) ,  김성권 (안전행정부) ,  이공주 (충남대학교 정보통신공학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 중 고등 수준 단문형 영어 작문시험의 자동채점 시스템을 위한 사전 미등록어 분류기 구현에 대해 다룬다. 영어 자동채점 과정에서 발생하는 사전 미등록어의 유형을 정의하고 각 유형에 대한 검출 방법에 대해 논의하였다. 또한 영작문 답안에서 나타날 수 있는 비속어의 유형을 정의하고 검출 방법에 대해 연구하였다. 영작문 자동평가 시스템의 모듈로서 비속어 검출 기능이 포함된 미등록어 분류기를 구현하였다. 미등록어 분류와 비속어 검출 방법에 대한 성능을 실제 시험 데이터에 적용하여 그 성능을 평가하였다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we deal with implementation issues of an unknown word classifier for middle-school level English writing test. We define the type of unknown words occurred in English text and discuss the detection process for unknown words. Also, we define the type of swear words occurred in students...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 중⋅고등 수준 단문형 영어 작문시험의 자동채점 시스템에서 사용하는 미등록어 유형 분류기에 대하여 연구하였다.
  • 본 논문에서는 중⋅고등학교 학생들을 대상으로 주어진 상황에 맞는 단문(1∼2문장) 영작문 능력을 측정하는 시험※의 자동채점 프로그램에서 생길 수 있는 문제를 해결하기 위한 미등록어 분류기를 연구하였다.
  • 사전에 등록되어 있지 않은 미등록어가 실제로 사용하는 단어이지만 사전에 포함되어 있지 않은 단어인지 아니면 오류나 노이즈단어인지를 인식하기 위한 연구가 진행된 바 있다. 이 연구에서는 웹문서를 기반으로 출현빈도를 계산하여 사전에 등록되지 않은 미등록어를 인식하는 방식을 연구하였다[2]. 이 연구에서는 미등록어 처리를 위해 단계별 접근을 취하고 있다.
  • 본 논문의 구성은 다음과 같다. 이어지는 2절에서 미등록어 분류기와 관련된 관련 연구를 소개한다. 3절에서는 본 논문에서 연구한 미등록어 분류기의 시스템 구성에 대해 설명하고 분류기의 성능을 측정하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
본 논문에서 제안한 미등록어 분류기의 특징은 무엇인가? 1) 입력된 미등록어를 7가지 유형으로 분류 2) 중⋅고등학교 학생들의 어휘수준을 고려 3) 비속어에 대한 강력한 검출 4) Aspell을 이용한 시스템 구성
본 논문에서 제안한 미등록어 분류기는 어떻게 비속어 검출을 수행하는가? 1) 비속어 사전의 단어와 일치여부 (Fig. 2의 2단계) 2) 비속어 사전의 단어와 edit distance 차이 비교 (Fig. 2의 6단계) 3) 단어 내의 substring으로 포함된 비속어 검출 (Fig. 2의 7단계)
본 논문에서 제안한 미등록어 분류기는 미등록어를 어떻게 분류하는가? 본 논문의 분류기는 입력으로 들어온 미등록어를 7가지 유형(철자오류, 대소문자오류, 공백오류, 고유명사, 비속어, 노이즈단어, 기타)으로 분류한다. 분류된 미등록어와 그 유형은 자동채점 단계에서 채점요소로 각 유형별로 다르게 반영된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (7)

  1. Tetsuji Nakagawa, Taku Kudoh, and Yuji Matsumoto, "Unknown Word Guessing and Part-of-Speech Tagging Using Support Vector Machines", in Proc. of the 6th NLPRS, pp.325-331, 2010. 

  2. Park So-Young, "Phase-based Model Web Documents for Korean Unknown Word Recognition", in Journal of the Korea Institute of Information and Communication Engineering, pp.1898-1904, 2009. 

  3. Atkinson, Kevin, "Gnu aspell 0.60. 4", 2006. 

  4. Philips, Lawrence, "Hanging on the metaphone," Computer Language 7.12, Dec., 1990. 

  5. Kukich, Karen, "Techniques for automatically correcting words in text," ACM Computing Surveys (CSUR) Vol.24, No.4, pp.377-439, 1992. 

  6. Bahl, L., Baker, J., Jelinek, E., and Mercer, R., "Perplexity-a measure of the difficulty of speech recognition tasks," In Program, 94th Meeting of the Acoustical Society of America 62:$63, Suppl. No.1, 1997. 

  7. Jia, Zhongye, Peilu Wang, and Hai Zhao, "Grammatical Error Correction as Multiclass Classification with Single Model," CoNLL-2013 p.74, 2013. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로