$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

코사인 유사도 알고리즘을 이용한 한국어 철자오류 교정방법
Method for Spelling Error Correction in Korean Using a Cosine Similarity Algorithm 원문보기


박승현 (조선대학교 산업기술융합대학원 소프트웨어융합공학과 국내석사)

초록
AI-Helper 아이콘AI-Helper

계산기에서 발전하여 탄생하게 된 컴퓨터는 인간이 직접 계산하는데 시간이 오래 걸리는 문제들을 빠른 시간 내에 처리할 수 있도록 개발되어졌다. 초기의 컴퓨터는 방 하나를 차지할 정도로 크기가 거대하였고, 거대한 크기만큼 개인이 함부로 소유할 수 없을 정도로 구매 비용이 막대하였다. 하지만 기술이 발전함에 따라 컴퓨터의 크기는 점점 더 소형화 되어졌으며 그로 인해 컴퓨터의 가격이 하락하면서 일반인들도 쉽게 구매할 수 있도록 사용화 되어졌다. 기존에 사람들은 문서를 작성하기 위하여 종이와 볼펜 같은 필기도구를 이용하여 문서를 작성하였으나, 컴퓨터가 상용화 된지 오랜 시간이 지난 현재에는 컴퓨터를 이용하여 문서를 작성하는 경우가 많아졌다. 컴퓨터를 이용하여 문서를 작성하는 방식은 필기도구를 이용하여 문서를 작성하는 방식에 비해 문서의 작성 속도가 월등히 빠르며 손에 가해지는 피로 또한 적기 때문에 작성에 시간이 오래 걸리는 장문의 문서를 작성할 경우 사람들은 일반적으로 필기도구를 이용하기보다 컴퓨터를 이용하여 문서를 작성하는 경우가 많다. 하지만 컴퓨터를 이용해 문서를 작성하는 방식은 작성자가 팬을 이용해 철자를 그리는 형태의 직접적인 방식이 아닌, 키보드의 자판을 누름으로서 철자를 입력하는 간접적인 방식으로 문서를 작성하기 때문에 철자오류가 발생할 확률이 높다. 보통 철자오류는 문서를 작성하는 작성자의 눈에 쉽게 발견되기 때문에 발생 즉시 교정되어진다. 하지만 철자오류의 종류에 따라 쉽게 발견하기 힘든 부류의 철자오류가 존재하며, 또한 작성자의 지식부족으로 인해 발생한 철자오류도 존재하기 때문에 철자오류가 존재하지 않는 문서는 작성하기 어렵다. 철자오류가 발생할 경우 문장의 내용을 곡해할 수 있기 때문에 작성이 완료된 문서는 읽는 대상에게 정확한 내용을 전달 위하여 반복적으로 철자오류 교정을 수행하지만, 그럼에도 불구하고 철자오류가 존재하는 경우가 많다. 철자오류는 문장의 내용을 곡해할 뿐만이 아니라 논문이라 사업 제안서와 같은 중요 문서에서 발견될 경우 문서와 연관된 연구나 실험 혹은 사업에 대한 신뢰도를 하락시키는 문제를 발생시킬 수 있다. 문제 발생을 막기 위해 철자오류는 철저히 교정되어야 하지만 철자오류를 완벽히 교정하는 것은 교정 지식이 풍부한 교열 전문가들 또한 수행하기 어렵다. 철자오류 교정은 교정 지식이 미비한 일반인들이 수행하기에는 큰 어려움을 겪고 있으며, 더군다나 일반인들이 철자오류를 완벽히 교정한다는 것은 불가능에 가깝다. 일반인들의 철자오류 교정을 보조하고자 문서를 작성하기 위해 제작된 워드프로세서와 같은 문서 작성 프로그램은 작성자의 철자오류 교정 보조 시스템을 제공하고 있으나, 문서 작성 프로그램에서 제공하는 한국어 철자오류 교정 시스템은 사전을 기반으로 하여 규칙에 맞지 않는 철자오류를 교정하고 사전에 존재하지 않는 단어들을 표시할 뿐 문맥에 맞지 않는 철자오류는 교정하지 못하고 있다. 이 때문에 문서 작성 프로그램 사용 중 발생한 철자오류의 일부는 교정 시스템에 발견되지 못한 채 문서에 남는 경우가 존재한다. 이와 같은 문제를 해결하기 위하여 철자오류 교정 시스템에 대한 추가적인 연구가 필요하다.
본 논문은 철자오류 교정을 수행하기 위해 기존의 ...

Abstract AI-Helper 아이콘AI-Helper

Long time has passed since computers which used to be a means of research were commercialized and available for the general public. People used writing instruments to write before computer was commercialized. However, today a growing number of them are using computers to write instead. Computerized ...

주제어

#자연어처리 철자오류 

학위논문 정보

저자 박승현
학위수여기관 조선대학교 산업기술융합대학원
학위구분 국내석사
학과 소프트웨어융합공학과
지도교수 김판구
발행연도 2016
총페이지 11, 42p
키워드 자연어처리 철자오류
언어 kor
원문 URL http://www.riss.kr/link?id=T14431451&outLink=K
정보원 한국교육학술정보원
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로