$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

한국어 오류 교정 시스템의 구현
Implementation of Korean Error Correction System 원문보기

컴퓨터교육학회논문지 = The Journal of Korean Association of Computer Education, v.3 no.2, 2000년, pp.115 - 127  

최재혁 (신라대학교 컴퓨터교육과) ,  김권양 (경일대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

기존 워드프로세서의 맞춤법 검사기는 여러 오류 단어 후보군 중에서 1개를 선택하는 오류 작업의 불편함과 60%대의 낮은 교정률 그리고 늦은 처리 속도 등의 단정을 갖고 있다. 본 연구에서는 이러한 단점들을 해결하기 위하여 1개의 교정 단어와 페이지 단위의 일괄 교정으로 교정의 불편함을 해소하고, 높은 오류 교정률과 빠른 처리 속도를 가능하게 하는 방안을 제시한다. 이를 위하여 형태소 분석 시 처리 속도를 향상시키기 위한 방법으로 양방향 최장일치법을 적용하며, 교정 시의 정확성보장과 처리 속도의 향상을 위한 사전과 여러 알고리즘(복합명사 분리, 보조용언 분리, 오타 교정 등) 등을 개발하여 적용하였다. 특히 한국어에서 모호성이 많이 발생되는 의존명사 및 접미사와 조사/어미의 구분 방안, "로써/로서, 되다" 등의 구분 처리 방안을 제시하여 교정 시스템의 신뢰성을 높였다.

Abstract AI-Helper 아이콘AI-Helper

Korean error detectors of word processors have defects such as inconvenience that users choose one of error groups, lower detecting rate of 60%, and slow processing time. In this study, I proposed a resolution method of these defects. For these, I applied bidirectional longest match strategy for mor...

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 우리가 사용하는 일반 문서에서 띄어쓰기가 잘못된 단어에 대한 교정과 오류 단어에 대한 교정을 행하기 위하여, 띄어쓰기 교정 및 오류 단어 교정 시스템의 개발 시 교정 정확률 및 처리 속도를 높이기 위해 본 시스템에서 구축한 각종 오류 교정 방안을 제시하였다. 특히 선택 오류를 처리할 수 있는 교정 방안을 제시하였다.
  • 본 시스템은 기존의 맞춤법 검사기의 단점인 오류 수정 작업과 처리 시간을 감소시키면서, 높은 오류 교정의 정확률을 보장하는 자동 오류 교정 시스템의 개발을 위한 첫 단계로써 한국어 오류의 80% 이상을 차지하는 띄어쓰기 오류에 대한 자동 교정 시스템이다. 본 시스템은 오류 어절에 대해 한 개의 교정 결과만을 제시하고 사용자에게 페이지 단위로 교정 결과를 보여준 후 일괄 처리하였으며, 확인된 결과는 그 다음부터는 출력되지 않고 그 파일이 끝날 때까지 자동 교정되도록 하여 매번 오류 단어가 나타나는 것을 방지하였다.
  • 본 연구는 위의 오류 사전과 '从한국어의 조사나 어미에 나타나는 글자의 빈도 수와 한국어 조사나 어미의 첫 글자에만 나타나는 글자 등을 이용하여 오류가 있는 어절에서 조사■/어미 분류를 가능하게 하였다.
  • 본 연구는 정확한 띄어쓰기 교정을 하면서도 이러한 사전참조 횟수를 줄여 전체적인 처리 속도를 향상시키는 것을 가장 큰 목표로 두고 띄어쓰기 교정 시스템을 개발하였으며, 이를 위해 아래의 연구 결과를 적용한다.<표 1>은 띄어쓰기 교정 시스템에서 교정 가능한 띄어쓰기 오류 세부 유형을 제시한다.
  • 특히 교정률은 60%대에 머물고 있으며, 오류단어를 오류가 아닌 단어로 인식되어 오류 교정을 행하지 않는 단어가 전체 오류단어의 약 20% 가까이 되고, 워드프로세서마다 복합명사 및 보조용언의 분리 방법에 일정한 규칙이 없어 교정의 신뢰성에 의문을 가지게 되어 실제적으로 워드프로세서의 사용자가 많이 이용하지 않고 있다[1]. 연구에서는 기존의 맞춤법 검사기의 단점인 오류 수정 작업의 불편함을 각각의 오류 어절에 대해 1개의 교정 단어를 페이지 단위로 제시함으로써 어느 정도 해소시키면서, 오류 수정을 위한 처리 시간의 감소 및 높은 오류 교정의 정확률을 보장하는 것을 주목표로 하였다. 본 연구에서는 자연어 처리 시 처리 속도에 결정적으로 영향을 미치는 사전 참조 횟수의 감소를 꾀하여 시스템의 처리 속도를 향상시키고자 한다.
  • 본 연구에서는 기존의 맞춤법 검사기의 단점인 오류 수정 작업의 불편함을 각각의 오류 어절에 대해 1개의 교정 단어를 페이지 단위로 제시함으로써 어느 정도 해소시키면서, 오류 수정을 위한 처리 시간의 감소 및 높은 오류 교정의 정확률을 보장하는 것을 주목표로 하였다. 연구에서는 자연어 처리 시 처리 속도에 결정적으로 영향을 미치는 사전 참조 횟수의 감소를 꾀하여 시스템의 처리 속도를 향상시키고자 한다. 이를 위하여 한국어 형태소 분석시의 가장 사전 참조 횟수가 적은 양방향 최장일치법을 적용하몌2], 교정을 위해서도 정확성을 보장히면서 사전 참조 횟수를 감소시키는 여러 알고리즘(복합명사 분리 보조용언 분리, 오타교정 등)을 개발하여 적용하였다[3, 4].
  • 예를 들어, '로써/ 로서', '(음으로/므로 등의 의존형태소는 그 선행요소가 문장내에서 어떤 의미로 사용되었는가에 따라 구별이 되며, '반드시/반듯이', '지그시/지긋이'와 같은 자립형태소는 그 문장의 다른 성분들과의 구문관계에 따라 하나를 선택해야 하는 것이다. 한국어는 조사나 어미와 같은 기능어가 발달되어 있으므로 의존형태소 오류가 자립형태소오류보다 더 빈번히 발생하기 때문에 본 논문에서는 철자 오류 중에서 의존형태소 오류의 교정 방법을 제시하고자 한다.
  • 한국어의 조사 로서와, 로써', '음으로와 으므로'를 구분할 수 있는 방안을 마련하고자 한다. 이는 한국어를 사용하는 대부분의 사람이 잘 모르고 사용하는 것이 대부분으로 오류의 상당한 부분을 차지한다.

가설 설정

  • 끊임없는 투쟁만이 있을 뿐이다.
  • 너 갈 대로 가라.
  • 유일하게 살아남은 사람은 그뿐이다. ③ 그녀를 연상할 만큼 닮았다.
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로