[보고서]한국어 제목의 어휘 의미표현을 위한 부분언어 기법 적용에 관한 연구

맹성현

한국어 제목의 어휘 의미표현을 위한 부분언어 기법 적용에 관한 연구
Constructing Lexico-Semantic Representation of Korean Titles Using Sublanguage Analysis 원문보기

보고서 정보
주관연구기관	충남대학교 Chungnam National University
연구책임자	맹성현
발행국가	대한민국
언어	한국어
발행년월	1997-04
주관부처	과학기술부
사업 관리 기관	충남대학교 Chungnam National University
등록번호	TRKO200200017238
DB 구축일자	2013-04-18
키워드	부분언어.개념그래프.어휘 의미.관계성.관계성 발현 패턴.복합명사처리.sub-language analysis.conceptual graph.lexico-semantic relation.relation revealing pattern.processing of compound nouns.

초록 ▼

부분 언어 분석 기법의 요지는 공통적인 목적을 가지고 있는 특정한그룹의 사람들이 만들어 낸 텍스트가 그 나름대로의 어휘적, 통사적, 의미적 특성을 가지고있다는 이론에 기반을 두고 있다. 본 연구에서는 부분언어 분석 기법을 적용하여 한국어문서 제목의 구조와 의미 분석을 시도하였다. 영어권에서는 이 기법의 적용에 관한 연구가많이 이루어져 있고 실제 응용한 사례도 많이 보고 되었으나, 한국어 처리에 있어서는 적용사례가 거의 없다. 이 연구에서는 문서 제목을 개념 그래프 형태로 변형하는데 목표를 두고 다양한 부분언어 분석을 함으로써 전 과정을 자동화하는데 필요한 기반을 마련하였다.본 연구를 통해서 얻은 주요 성과는 다음과 같다. 첫째, 한국어 처리를 위해 부분언어 분석기법을 도입하여 그 가능성을 제시하였고, 부분언어 분석 과정이 하나의 방법론으로서 다양한 분야에 사용될 수 있는 계기를 마련하였다.둘째, 논문의 제목에 존재하는 개념간의 의미적 관계성을 자료 분석을 통해 추출하였고이들을 개념 카탈로그 형태로 정리하였다. 이 분석은 정보검색의 응용을 염두에 두고 행해졌는데, 개념에 기반을 둔 정보검색 연구에 중요한 기반을 제공하리라 기대된다.셋째, 각 관계성에 대해 관계성 발현 패턴(relation revealing pattern)을 도출하고 규칙화한 후, 이를 사용하여 관계성 뿐만 아니라 대상이 되는 개념의 범위(scope)를 자동으로 추출하는 프로그램을 개발하여 규칙들의 실효성을 시험하였다. 차트 파싱(chart parsing) 방법을 사용하였는데, 비교적 간단한 문법 규칙을 사용하였음에도 불구하고 약 80%의 성공률을보였다.넷째, 한국어처리에 중요한 부분이 되어 있는 복합명사처리를 위해 복합명사 분리 방법을설계 구현하였고, 복합명사를 구성하고 있는 단순명사간에 존재하는 의미적 관계성의 자동추출을 위한 기초연구를 하여 유용한 의미적 패턴을 추출하여 정리하였다. 도출된 결과는구성 명사의 형태적, 의미적 제약 조건을 통해 구성 명사간에 생략된 서술 형태를 복원하는방법으로 격(case) 정보를 이용하여 개념 그래프를 자동 생성할 수 있는 기반을 제공하였다.본 연구에서 장기적인 목표로 설정한 것은 문서 제목을 개념 그래프로 자동 변환하는 기법을 개발하는 것으로 이를 위해서는 많은 연구가 필요하다. 본 연구에서 도출한 결과를기반으로 한 효율적인 알고리즘과 필요한 언어 자원이 동시에 개발이 되어야 한다. 예를들어, 본 연구에서 제시한 구문 분석기보다 효과적이면서도 초소한의 계산자원(computational resource)를 사용하는 알고리즘이 개발되어야 하고 복합 명사간의 관계성 추출을 위해서는 구성 명사의 의미정보를 가지고 있는 사전이 구축되어야 한다. 또한 도출한관계성이 정보검색과 같은 응용에서 어떤 역할을 하는지 규명하여야 하고, 특정 관계성의효과가 분명하지 않을 때는 이를 추상화하던지 구체화하여 그 유용성을 높이는 작업도 필요하다.

Abstract ▼

The sublanguage analysis methodology is based on the theory thattexts generated by a group of people possess their own lexical, syntactic, and semanticcharacteristics. The main thrust of the research reported here is to apply themethodology to Korean document titles, reflecting the fact that there has been littleresearch in applying the methodology for the Korean language although much researchhas been done with English texts. The research had the goal of finding a way toconvert document titles to a set of conceptual graphs representing the meaning, and haslaid out a firm ground for automating the entire process by developing necessarycomponents and analyzing the liguistic phenomena.The main accomplishments are as follows. First, we showed the possibility ofsuccessfully applying the methodology for a variety of Korean texts. This is likely togive a momentum to use the methodology for a number of practical problems.Second, we extracted a number of lexico-semantic relations between concepts existingin document titles with intellectual analysis, which have been all organized into a formof conceptual catalog. This analysis was done with the inention of using the result forinformation retrieval. It is execpted that the result will provide a good basis forbuilding an information retrieval system based on concepts.Third, for each relation, we generated relation revealing patterns that became rules bywhich a program can extract not only relations but concepts connected by a relation.We used a relatively simple chart parsing algorithm together with the rules to test theefficacy of the rules, and achieved about 80% accuracy.Fourth, we also tackled the problem of processing compound nouns, one of theimportant problems in processing Korean texts. Specifically, we developed an algorithmby which a concatenated compound noun can be segmented into component nouns. Inaddition, we analyzed many examples to generate a set of rules by which the conceptualrelationship between two more more component nouns can be identified. The methodwe devised is an attempt to recover the omitted particles in the process of generating acompound noun, and eventually construct a conceptual graph representing the piece oftext.

목차 Contents

목 차...6
1. 서론...7
1.1 연구의 배경...7
1.2. 연구의 목적...7
1.3. 연구의 범위...8
2. 연구 방법 및 이론...10
2.1. 텍스트 자원 (resource) 및 도구의 수집과 개발...10
2.2. 문장 처리에 필요한 형태소 분석...11
2.3. 관계성 추출 규칙의 생성...11
2.4. 규칙을 기반으로 한 관계성 추출...13
2.4.1. 구문 분석의 이용...13
2.4.2. LEX를 이용한 패턴 추출...15
2.5. 복합 명사 분석...16
2.5.1. 복합 명사 분리...18
2.5.2. 의미적 관계성 파악...18
3. 결 과...20
3.1. 문서 제목의 구조적 특성...20
3.2. 관계성 정의...21
3.3. 관계성 자동 추출...26
3.3.1. LEX를 사용한 패턴 추출 방법...26
3.3.2. 구문 분석 이용 방법...27
3.4. 중심 명사(Head Noun) 위치 추정...29
3.5. 복합 명사에 존재하는 의미적 관계성 분석...30
4. 고 찰...33
5. 결 론...35
6. 인용문헌...36
연구수행관련 논문발표목록서...37
자체평가서...38

참고문헌 (25)

내보내기 메뉴

내보내기 구분

파일저장
인쇄
메일전송

구성항목

기본정보
상세정보

관리번호, 제목(한글), 저자명(한글), 발행일자, 전자원문, 초록(한글), 초록(영문)

저장형식

Text(ASCII format)
Excel format

메일정보

받는사람 (필수): @
보내는사람 (선택): @
제목
내용: KISTI 검색결과 이메일 서비스

안내

총 건의 자료가 검색되었습니다.

다운받으실 자료의 인덱스를 입력하세요. (1-10,000)

검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다.

데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요)

다운로드 파일은 UTF-8 형태로 저장됩니다.
파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오.

Text(ASCII format)
Excel format

AI-Helper ※ AI-Helper는 을 사용합니다.

AI-Helper

안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

과제명(ProjectTitle) :	-
연구책임자(Manager) :	-
과제기간(DetailSeriesProject) :	-
총연구비 (DetailSeriesProject) :	-
키워드(keyword) :	-
과제수행기간(LeadAgency) :	-
연구목표(Goal) :	-
연구내용(Abstract) :	-
기대효과(Effect) :	-

연합인증

한국어 제목의 어휘 의미표현을 위한 부분언어 기법 적용에 관한 연구
Constructing Lexico-Semantic Representation of Korean Titles Using Sublanguage Analysis 원문보기