$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 형태소 및 구문 모호성 축소를 위한 구문단위 형태소의 이용
Using Syntactic Unit of Morpheme for Reducing Morphological and Syntactic Ambiguity 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.27 no.7, 2000년, pp.784 - 793  

황이규 (전북대학교 컴퓨터과학과) ,  이현영 (전북대학교 컴퓨터과학과) ,  이용석 (전북대학교 컴퓨터과학과)

초록
AI-Helper 아이콘AI-Helper

기존의 한국어 형태소 해석은 한국어의 교착어 특성상 다양한 형태론적 모호성을 가진다. 이러한 형태론적 모호성은 많은 구문 모호성을 만들어 내어 올바른 의미를 가지는 파스트리의 선택을 어렵게 한다. 한국어에서 이런 형태론적 모호성의 대부분이 보조용언이나 의존 명사와 관련이 있다. 보조용언이나 의존명사는 주위의 형태소들과 강한 결합 관계를 가지고 있으며, 대부분 자립성이 없는 기능형태소이다. 결합된 형태소들은 문장 내에서 하나의 기능적 역할이나 구문적 역할을 수행한다. 우리는 품사 태깅된 20 만 어절 크기의 말뭉치로부터 이 형태소열을 찾아 이를 3가지 유형으로 분류하였다. 그리고, 이를 구문 형태소로 정의하고 구문 형태소를 구문 분석의 기본 입력 단위로 간주하였다. 본 논문에서는 구문 형태소가 아래와 같은 문제의 해결에 있어서 효율적인 방법임을 제안한다: 1) 형태소 해석의 축소, 2) 구문 해석 도중 불필요한 부분 파스트리의 배제, 3) 구문 모호성의 축소. 마지막으로, 실험 결과를 통해 구문단위 형태소가 형태소 및 구문 모호성을 축소하기 위해 반드시 필요함을 보인다.

Abstract AI-Helper 아이콘AI-Helper

The conventional morphological analysis of Korean language presents various morphological ambiguities because of its agglutinative nature. These ambiguities cause syntactic ambiguities and they make it difficult to select the correct parse tree. This problem is mainly related to the auxiliary predic...

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 또한, [기과 [8] 에서는 구문해석 전에 간단한 구구조 규칙을 이용하는 부분 파싱 과정이 필요하지만, 본 연구는 기능적 단위의 형태소만을 결합 단위로 간주하여 일관성을 유지하였다. 또한 [이와 [1 이의 경우, 본용언과 보조용언의 기능형태소에 대한 결합의 필요성을 주장하였는데, 본 논문에서는 이를 일반화하여 한국어 문장에서 나타날 수 있는 여러 형태의 기능 형태소 결합을 살펴보고 이들을 하나의 단위로 처리하는 방법에 대해 기술하였다.
  • 기존 연구에서는 태깅 시스템을 이용하여 이러한 형태소 모호성을 해결하고자 하였지만 이 방법이 반드시 100% 올바른 결과를 찾아내는 것은 아니다. 본 논문에서는 구문 형태소를 구문 해석의 기본 단위로 묶어주는 구문형태소 생성기를 이용하여 구문 해석에 도움올 주는 방법을 보였다. 구문 형태소 생성기는 강한 결합을 가지는 기능 형태소들을 하나의 형태소로 간주하며, 이들 사이의 결합 관계를 이용하여 형태소 모호성을 축소할 수 있다.
  • 이러한 연구의 특징은 단순히 형태론적 모호성의 축소에 초점을 맞추었다. 연구에서는 구문 해석의 관점에서 어떠한 구문형태소들이 반드시 기능적 단위로 결합되어야 하며, 이 구문 형태 소가 문장에서 어떠한 기능을 하고, 이들을 어떠한 구문적 단위로 보고 문장을 해석해야 하는지에 초점을 맞추었다.
  • 특히 한국어나 일본어와 같은 교착어의 특성을 가지는 언어일수록 이러한 현상이 빈번하게 발생한다. 본 연구에서는 한국어에서 형태소 과생성을 유발하는 복합 동사구와 의존 명사 등을 포함하는 어절에 대해 구문 형태소 단위의 처리를 제안하였다. 기존 연구에서는 태깅 시스템을 이용하여 이러한 형태소 모호성을 해결하고자 하였지만 이 방법이 반드시 100% 올바른 결과를 찾아내는 것은 아니다.
  • 이 논문에서는 기능형태소 해석 결과에 있는 형태소 모호성을 줄여 구문 해석의 부담을 줄이는 방안으로 여러 형태소가 결합하여 하나의 구문적 단위나 의미적 단위를 가질 수 있는 형태소들을 구문 형태소로 정의하고, 한국어에 어떠한 형태소열들이 구문적 형태소 단위를 이루고 있는지 살펴본다.

가설 설정

  • 가) 먹는 줄 알았다

  • 다) 먹는 것이 좋다
본문요약 정보가 도움이 되었나요?

참고문헌 (17)

  1. Eugene Charniak, Curtis Hendrickson, Neil Jacobson, Mike Perkowitz, 'Equations for Part-Of- Speech Tagging,' Proc. of the 11th National Conference on Artificial Intelligence (AAAI), pp.784-789, 1993 

  2. 임희석, 언어 지식과 통계 정보를 이용한 한국어 품사 태깅 모델, 고려대학교 대학원 컴퓨터학과 박사학위논문, 1997 

  3. 고영근, 국어 형태론 연구, 서울대학교 출판부, 1989 

  4. KIBS : Korean Information Base System, http://kibs.kaist.ac.kr/ 

  5. 이희자, '현대 국어 관용구의 결합 관계 고찰', 제6회 한글 및 한국어 정보처리 학술대회, p.333-352, 1994 

  6. 강승식, 음절 정보와 복수어 단위 정보를 이용한 한국어 형태소 분석, 서울대학교 대학원 컴퓨터공학과 박사학위 논문, 1993 

  7. 김창제, 정천영, 김영훈, 서영훈, '부분적인 어절 결합을 이용한 효율적인 한국어 구문 분석기', 제22회 정보과학회 가을 학술발표 논문집, pp. 597-600, 1995 

  8. 박상규, 정창민, 조준모, 이상조, '최장 묶음을 이용한효과적인 한국어 구문분석기', 제22회 정보과학회 춘계 학술발표 논문집, Vol. 21, No. 1, pp. 961-964,1995 

  9. 안미정, 옥철영, '한국어 구문 구조 분석을 위한 복수동사 처리', 제21회 정보과학회 추계 학술발표 논문집, Vol. 21, No. 2, pp. 625-628, 1994 

  10. 송연정, 배우정, 이기오, 이용석, '형태소 분석의 자질구조 생성에 관한 연구', 제21회 정보과학회 춘계 학술발표 논문집, pp. 817-820, 1994 

  11. 박혜준, 윤준태, 송만석, '말뭉치 품사 꼬리달기 시스템', 제21회 정보과학회 춘계 학술발표 논문집, pp. 829-832, 1994 

  12. 김재훈, 오류-보정 기법을 이용한 어휘 모호성 해소, 한국과학기술원 전산학과 대학원 박사학위 논문, 1996 

  13. K. J. Lee, J. H. Kim, G. Ch. Kim, 'Probabilistic Language Model for Analyzing Korean Sentences,' Proceedings of the 17th International Conference on Computer Processing of Oriental Languages (ICCPOL'97), HongKong, pp. 392-395, 1997 

  14. 이공주, 언어 특성에 기반한 한국어의 확률적 구문분석, 한국과학기술원 전산학과 대학원 박사학위 논문, 1998 

  15. G. O. Lee, et al., 'Multi-Path LR Parsing for Nonsegmental Words Using Interactive Strategy,' The 3rd Pacific Rim International Conference on AI, Vol. 2, pp. 668-672, 1994 

  16. Bresnan, J.(Ed.), The Mental Representation of Grammatical Relations, Cambridge Mass.: MIT Press, 1982 

  17. 양승원, 박영진, 이용석, '조건 단일화 기반 PATRII를 이용한 한국어 구문분석', 한국정보과학회 논문지, 제 22권, 4호, pp. 653-662, 1995 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로