최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보처리학회논문지. The KIPS transactions. Part B. Part B, v.16B no.5, 2009년, pp.427 - 434
이세희 (강원대학교 컴퓨터정보통신공학) , 김학수 (강원대학교 컴퓨터정보통신공학)
With the rapid evolution of the Internet and mobile environments, text including spelling errors such as newly-coined words and abbreviated words are widely used. These spelling errors make it difficult to develop NLP (natural language processing) applications because they decrease the readability o...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
생성된 여러 교정 후보들 중 정답에 가장 가까운 단어를 선택하여 교정하는 방법의 단점은 무엇인가? | 그리고 생성된 여러 교정 후보들 중 정답에 가장 가까운 단어를 선택하여 교정하는 방법이다. 이러한 일반 사전 기반의 방법은 모든 철자 오류 후보 단어들을 미리 구축해야 하는 단점이 있으며, 용언의 활용이 많은 한국 어의 경우에는 어휘의 기본형을 찾는데 따르는 비용이 클 뿐만 아니라 잘못된 기본형을 찾을 가능성이 높다는 단점이 있다. 형태소 분석 결과를 이용한 방법은 형태소분석기에서 분석이 실패한 어절은 철자 오류가 포함된 오류어절로 판단한다. | |
철자 오류에 관한 기존 연구는 무엇이 있는가? | 철자 오류에 관한 기존 연구로는 일반 사전을 사용한 방법[2-4], 형태소 분석결과를 이용한 방법[5], 자소 단위 철자 오류 교정 방법[6], 교정사전을 사용한 방법[7] 등이 있었다. 일반 사전을 사용한 철자 교정은 주로 영어권 국가들이 사용하는 방법으로 모든 입력문장의 각 단어들을 일반 사전에서 검색한 후, 일반 사전에 존재하지 않는 단어는 철자 오류라고 가정한다. | |
형태소 분석기를 사용하는 방법의 단점은 무엇인가? | 오류어절에 대해 교정규칙정보와 말뭉치통계정보를 적용하여 철자 오류를 교정한다. 형태소 분석기를 사용하는 방법은 형태소 분석기의 성능에 의존적이며 철자 오류 교정 문제에 형태소 분석 문제가 추가되어 복잡도가 증가하는 단점이 있다. 자소 단위 철자 오류 교정 방법은 자소 단위의 변환확률을 이용한다. |
조동욱, 이현경, "인터넷 상에서 쓰이는 통신 언어에 대한 분석 및 문제점 해결 방안", 한국콘텐츠학회/한국통신학회 2003 추계 종합학술대회 논문집, 제1권 제2호, pp.79-83, 2003.
Johannes Schaback "Multi-Level Feature Extraction for Spelling Correction", IJCAI-2007 Workshop on Analytics for Noisy Unstructured Text Data, pp.78-86, 2007.
H. L. Lou, "Implementing the Viterbi Algorithm, Fundamental and real-time issues for processor designers", IEEE Signal Processing Magazine, pp.42-52, 1995.
조오현, 김경용, 박동근, "통신언어의 실태와 개선 방안", 통신 언어 어휘집, 문화관광부, 2001
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.