언어 장애인에게 기존의 키보드에 의한 문자입력 방법보다 원활하고 편리한 의사전달 환경을 제공하기 위한 아이콘 언어 인터페이스를 설계한다. 이를 위하여 활용성이 높은 대화 영역으로부터 구축한 원시 말뭉치를 대상으로 어휘 구사 경향과 특성을 분석하고 형태소, 구문, 의미 분석을 적용하여 아이콘에 부여되는 한국어의 어휘와 의미를 추출한다. 사용자가 직관적으로 인지하고 전달할 수 있는 아이콘 영역을 선별하고 추출한 한국어의 어휘와 의미를 정합시킨다. 이웃하는 아이콘간의 연결로부터 전달하고자 하는 의미적 상황을 만들어내기 위하여, 아이콘 언어의 어휘와 품사, 문법 규칙, 의미체계를 정의하여 아이콘 언어를 설계한다. 아이콘 언어에서 나타날 수 있는 언어적 애매성을 해결하기 위한 방법으로 범용의 한국어 의미사전과 술어 중심의 하위범주화사전으로부터 아이콘 언어에 대한 상황중심의 의미 데이터를 구축한다. 이를 바탕으로 아이콘 언어 인터페이스로부터 한국어를 의미적인 범주에서 생성한다.
언어 장애인에게 기존의 키보드에 의한 문자입력 방법보다 원활하고 편리한 의사전달 환경을 제공하기 위한 아이콘 언어 인터페이스를 설계한다. 이를 위하여 활용성이 높은 대화 영역으로부터 구축한 원시 말뭉치를 대상으로 어휘 구사 경향과 특성을 분석하고 형태소, 구문, 의미 분석을 적용하여 아이콘에 부여되는 한국어의 어휘와 의미를 추출한다. 사용자가 직관적으로 인지하고 전달할 수 있는 아이콘 영역을 선별하고 추출한 한국어의 어휘와 의미를 정합시킨다. 이웃하는 아이콘간의 연결로부터 전달하고자 하는 의미적 상황을 만들어내기 위하여, 아이콘 언어의 어휘와 품사, 문법 규칙, 의미체계를 정의하여 아이콘 언어를 설계한다. 아이콘 언어에서 나타날 수 있는 언어적 애매성을 해결하기 위한 방법으로 범용의 한국어 의미사전과 술어 중심의 하위범주화사전으로부터 아이콘 언어에 대한 상황중심의 의미 데이터를 구축한다. 이를 바탕으로 아이콘 언어 인터페이스로부터 한국어를 의미적인 범주에서 생성한다.
The iconic language interlace is designed to provide more convenient environments for communication to the target system than the keyboard-based interface. For this work, tendencies and features of vocabulary are analyzed in conversation corpora constructed from the corresponding domains with high d...
The iconic language interlace is designed to provide more convenient environments for communication to the target system than the keyboard-based interface. For this work, tendencies and features of vocabulary are analyzed in conversation corpora constructed from the corresponding domains with high degree of utilization, and the meaning and vocabulary system of iconic language are constructed through application of natural language processing methodologies such as morphological, syntactic and semantic analyses. The part of speech and grammatical rules of iconic language are defined in order to make the situation corresponding the icon to the vocabulary and meaning of the Korean language and to communicate through icon sequence. For linguistic ambiguity resolution which may occur in the iconic language and for effective semantic processing, semantic data focused on situation of the iconic language are constructed from the general purpose Korean semantic dictionary and subcategorization dictionary. Based on them, the Korean language generation from the iconic interface in semantic domain is suggested.
The iconic language interlace is designed to provide more convenient environments for communication to the target system than the keyboard-based interface. For this work, tendencies and features of vocabulary are analyzed in conversation corpora constructed from the corresponding domains with high degree of utilization, and the meaning and vocabulary system of iconic language are constructed through application of natural language processing methodologies such as morphological, syntactic and semantic analyses. The part of speech and grammatical rules of iconic language are defined in order to make the situation corresponding the icon to the vocabulary and meaning of the Korean language and to communicate through icon sequence. For linguistic ambiguity resolution which may occur in the iconic language and for effective semantic processing, semantic data focused on situation of the iconic language are constructed from the general purpose Korean semantic dictionary and subcategorization dictionary. Based on them, the Korean language generation from the iconic interface in semantic domain is suggested.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
.명사나 부사로 전성이 가능한 용언 성분으로 강조의 의미를 나타내기 위해 아이콘 어휘가 두 번 연속으로 나타나는 형태가 가능하도록 하였다.
.수사와 단위 명사로 구성된 단어에 대해서는 아이콘으로 표현 가능한 어휘가 제한적이기 때문에 단일 수사로만 표현이 가능하도록 하였다.
본 논문에서는 아이콘 언어를 구현하기 위하여 아이콘에 대해 어휘와 문법 체계를 정의하고 자연언어체계의 개념을 적용하였기 때문에 하나의 독립적인 의미 기반 언어체계를 갖추며, 이로 인하여 제한적인 아이콘으로부터 다양한 한국어 표현을 생성하는 것이 가능하다. 또한, 언어장애인의 언어 활동의 특성을 고려하여 적용 영역을 선정하고 어휘를 수집, 분석하였기 때문에 언 어 장애인에게 범용적인 응용이 가능하도록 하였다.
아이콘 언어는 한국어와 수화 등에서 공통적으로 나타나는 실질 형태소에 그림이 연결되어 표현이 되도록 설계하는 것이 중요하다. 본 논문에서 설계하고자 하는 아이콘 언어는 하나의 아이콘에 다양한 품사와 어휘를 할당하고 조합되는 이웃 아이콘이 무엇인지에 따라 문장의 생성과 의미를 달리할 수 있도록 적응적인 형태의 제 어 언어를 설계하고자 함이다. 이를 위해서는 각 아이콘이 문장 내에서 어떤 속성으로 존재하는지를 구분하여야 할 필요가 있다.
그러므로 대상 영역이 한정되는 효과가 있어 사용자의 연령이나 장애 정도, 장소나 화제 등 상황에 따라 서로 다른 영역으로 구분이 가능하고 이에 사용되는 어휘의 범위를 한정할 수 있어 언어보조 통신에 적합한 모델링 언어라 할 수 있다. 본 논문에서는 다음과 같은 과정으로 아이콘 언어를 설계하였다.
본 논문에서는 언어장애인이 아이콘 언어를 편리하게 실생활에 활용하기 위한 인터페이스를 (그림 3)과 같이 구현하였다. 아이콘 언어 인터페이스는 (그림 3)의 오른쪽과 같이 사용자가 생성시키고자 하는 범주를 먼저 선택할 수 있도록 하였다.
본 논문에서는 언어장애인이나 일시적 언어장애가 있는 사람들이 간단한 조작만으로도 한국어 문장을 생성하여 의사소통을 편리하게 할 수 있는 통신보조 시스템을 구현하고 자 한다. 언어장애인의 경우, 의사소통은 주로 수화를 이용 하는데 수화는 일반인들과의 대화에서 정확한 의미를 전달 하기 어렵기 때문에 다른 의사소통 방법이 필요하다.
아이콘 인터페이스에 대한 훈련을 통해 아이콘 어휘의 위치와 내용을 파악하는 것이 중요하다. 본 논문에서는 활용성 평가를 위하여 다양한 장애 특성을 지닌 장애인에게 아이콘 인터페이스 시스템을 훈련시키고 다양한 환경에서 실전 적용을 통해 검증을 실시하였다. 인천에 소재한 청각장애인협회와 특수교육 기관인 은 광학교의 지체장애인을 대상으로 상당기간 아이콘 언어 인터페이스를 교육시키고 실전 상황에 적용하여 검증하였다.
표층 문에서 통상 격표지로 표현되는 구문적 의존관계뿐만 아니라 보어가 갖는 의미 정보가 부착되어 있어, 시소러스의 의미 표지와 연동이 가능하도록 설계하였다 [15]. 본 논문에서도용언 아이콘에 대하여 하위 범주화의 개념을 적용하여 한국어 생성을 위한 의미적 중심 구조 분석에 활용하고자 하였다. 아이콘 말 뭉치로부터 술어 아이콘과 이에 의존하는 명사 아이콘의 어휘의 의미적 관계를 기구축된 하위범주화사전[13]의 정보로 정합하고 비교분석하여 구축하는 시간과 노력을 줄일 수 있었다.
용언 아이콘에 의존할 수 있는 수많은 명사 아이콘 중에서 필수적인 성분만을 구문적, 의미적으로 미리 지정해주는 것이기 때문이다. 본 논문에서의 표준 문형패턴은 기존에 세분화된 패턴을 대표할 수 있도록 정의하여, 계산 처리가 용이하고 한국어 문장의 생성 시, 다양한 어휘로 자연스러운 표현이 가능하도록 하였다. 또한 문형 패턴의 정의는 일관성 있는 한국어 생성 측면에서 바람직하다고 생각된다.
언어장애를 유발할 수 있는 특성으로 청각장애, 신체장애, 정신장애, 발달장애로 나누었다. 신체장애자가 반드시 언어장애를 갖는 것은 아니지만 언어장애인이 두 가지 이상의 장애를 가지고 있는 경우가 많고 신체장애를 수반하는 경우 아이콘을 효율적으로 선택하여 아이콘 열을 구성하기 위한 인터페이스를 설계하는 데 참고하고자 함께 고려하였다. 그리고 언어장애가 없는 사람들을 통해 같은 범주에서 사용하는 대화를 수집하여 비교하였다.
이에 본 논문에서 구현하고자 하는 아이콘 언어는 심볼만을 선택하여 정적인 문장만을 생성하였던 기존의 연구와는 다르게 하나의 아이콘에 다양한 품사와 어휘 정보를 저장하여 자연 언어와 같이 중의성을 갖도록 구성하였다. 이러한 특징은 하나의 아이콘의 쓰여지는 상황과 이웃하는 아이콘 열에 따라 다른 어휘 특성을 나타내게 되어 동적인 다양한 문장을 생성이 가능하도록 한다. 본 논문에서는 아이콘 언어를 구현하기 위하여 아이콘에 대해 어휘와 문법 체계를 정의하고 자연언어체계의 개념을 적용하였기 때문에 하나의 독립적인 의미 기반 언어체계를 갖추며, 이로 인하여 제한적인 아이콘으로부터 다양한 한국어 표현을 생성하는 것이 가능하다.
본 논문에서 제시한 아이콘 언어는 단순히 그림을 정의하고 어휘만 부여했던 기존의 연구와는 달리 아이콘이라는 그림과 어휘가 조합된 단위를 정의하고 여기에 언어적 체계를 갖추었다는 데 의의가 있다. 이를 구현하기 위하여 본 논문에서는 아이콘 언어의 문법적 체계를 정의하였다. 그리고 적용하고자 하는 도메인의 담화 표본을 수집하고 여기에 아이콘 언어의 문법을 적용한 아이콘 말 뭉 치를 구축하였다.
이상에서 아이콘 언어의 설계 및 구축에 대해 논의하였다. 아이콘 언어는 키보드로부터 문자를 입력받아 제어하는 자연 언어 인터페이스보다 직관적이며 사용이 용이한 그림에 어휘 속성이 부여되어 있어 언어장애인이 아이콘의 조합으로 의사를 쉽고 편리하게 전달할 수 있도록 설계된 언어 보 조 인터페이스이다.
이에 본 논문에서는 자연 언어의 중의성을 아이콘에 적용하여 설계함으로써, 아이콘 열이 이루는 정보에 따라 다양한 표현이 가능하도록 하고자 한다. 언어의 중의성이란 문장을 구성하는 구조, 어휘의 의미와 품사 정보가 다양하게 나타날 수 있는 특성을 말한다.
또한, 현재 음성인식 등의 기술을 활용하는 시스템 개발도 많은 주목을 받고 있지만, 수화 등을 통해서만 대화가 가능한 청각장애인들에게는 역시 전혀 도움을 기대할 바가 되지 못한다. 이에 본 논문에서는 자연 언어의 특성을 반영하면서 언어장애인에게 편리한 의사소통 환경을 제공할 아이콘 기반의 언어를 구현하였다.
인천에 소재한 청각장애인협회와 특수교육 기관인 은 광학교의 지체장애인을 대상으로 상당기간 아이콘 언어 인터페이스를 교육시키고 실전 상황에 적용하여 검증하였다. 장애인의 프로그램 사용 현황을 파악하기 위하여 프로그램에 사용자가 아이콘을 누르는 내용을 기록하는 모니터링 프로그램을 추가하여 결과 파악에 용이하도록 하였다.
제안 방법
.원시 발화문장에서 공통적으로 나타나는 효율적인 축약 어휘로서의 역할이 가능한 대표적인 핵심 어휘를 추출하고 아이콘으로 표현되면서 나타날 수 있는 의미와 품사적 애매성을 고려하여 다양한 어휘 형태와 대응하는 품사를 부여하였다.
.한국어 생성 시 아이콘 언어의 각품사는 한국어의 중심적 의 의미를 나타내는 어휘의 품사에 대응될 수 있도록 설계하였다.
용언과 보어 성분은 문장을 이루는 중심 구조로써 이를 하위 범주화사전, 시소러 스와의 비교를 통해 분석하였지 만 세부적인 관형어와 복합어는 이웃하는 아이콘 간 이루는 어휘적 특성이므로 분석되지 못한 아이콘에 대하여 관용어 사전을 이용하여 결합제약 분석을 수행한다. 각 아이콘이 이루는 결합 특성을 문법적으로 정의하고 이 관계를 통해 관용어 사전을 탐색하여 빠르게 관련 어휘를 나타내도록 하였다.<표 6>에 아이콘 간 문법 관계를 정리하였다.
아이콘 언어의 품사 표지중, 명사에서는 수사를 분리하여 별도의 품사 표지로 정의하였는데, 숫자는 일상생활에서 가장 많이 사용하는 빈도가 높은 어휘이기 때문이다. 그리고 부정형 품사표지를 새롭게 추가하였는데 특정 아이콘의 반의어를 나타내고 싶을 때, 해당 아이콘을 찾는 것보다 NOT 기호를 연결하면 쉽게 관련 어휘를 생성하도록 하였다. 이러한 기능을 위해서 부정형 품 사 표지는 아이콘에 특정 아이콘의 부정형이라는 정보를 부여할 때 사용된다.
신체장애자가 반드시 언어장애를 갖는 것은 아니지만 언어장애인이 두 가지 이상의 장애를 가지고 있는 경우가 많고 신체장애를 수반하는 경우 아이콘을 효율적으로 선택하여 아이콘 열을 구성하기 위한 인터페이스를 설계하는 데 참고하고자 함께 고려하였다. 그리고 언어장애가 없는 사람들을 통해 같은 범주에서 사용하는 대화를 수집하여 비교하였다. 아이콘 언어를 통해 생성되는 한국어는 언어 장애 인이 언어 장애가 없는 사람에게 전달될 가능성이 높기 때문이다.
이를 구현하기 위하여 본 논문에서는 아이콘 언어의 문법적 체계를 정의하였다. 그리고 적용하고자 하는 도메인의 담화 표본을 수집하고 여기에 아이콘 언어의 문법을 적용한 아이콘 말 뭉 치를 구축하였다. 또한 이로부터 아이콘에 부여될 어휘와 의미 기반의 한국어 생성을 위한 사전을 구현하고 구조 모델을 설계하고 효율을 검증하였다.
<표 3>에 아이콘품사부여 말뭉치의 예를 보였다. 그리고 한국어 생성 시에 문형 패턴을 참고하기 위하여 아이콘 말뭉 치 뿐만 아니라 한국어에 대해서도 형태소 분석기와 수작업을 병행하여 품사 부여 말뭉치를 구축하였다. 아이콘품사부 여 말뭉치로부터 아이콘에 나타날 어휘 추출 시 장소에 구애받지 않고 널리 쓰이며 공통적으로 나타나는 핵심 어휘와 특정 장소에서 자주 사용되는 주변 어휘로 나누어 분류하였다.
그리고 적용하고자 하는 도메인의 담화 표본을 수집하고 여기에 아이콘 언어의 문법을 적용한 아이콘 말 뭉 치를 구축하였다. 또한 이로부터 아이콘에 부여될 어휘와 의미 기반의 한국어 생성을 위한 사전을 구현하고 구조 모델을 설계하고 효율을 검증하였다.
본 논문에서는 적용 대상 범위를 언어 장애인에게 있어 목적성이 분명한 [교통], [쇼핑], [학교], [가정], [병원]으로 결정하였다. 또한, 각 활용 영역에서 발생할 수 있는 대화 샘플을 작업자의 직관력과 어휘의 빈도를 고려하여 공통적으로 많이 나타나는 문장을 수집하여 원시 말 뭉치를 구축하였다. 활용범주을 대표하는 원시말 뭉치를 구축하기 위해서는 여러 작업자가 모든 정의된 영역에 대하여 상황별 발화문장을 수집하여 활용도의 균형을 고려하여 구축하였고 언어장애인에게 적용 가능한지를 파악하기 위하여 청각장애인으로부터 수집한 수화어휘와 비교, 분석하였다.
한국어 명사 시소러스의상의어 계층을 적용 범주에 맞도록 재정의하고 아이콘품사부여 말뭉치에서 추출한 명 사 어휘를 등록하였다. 본 논문에서 구축한 명사 아이콘 시 소러스는 각 어휘의 속성을 큰 범주로 나누어 포함시킴으로써 시스템 적용에 용이하도록 하였으며 아이콘이 나타내는 다양한 의미를 동적으로 구성할 수 있도록 설계되었다. 계층을 너무 깊고 세부적으로 나누게 되면 실제 시스템 적용에서 어휘의 각 의미속성을 결정하는데 오히려 많은 중의성을 유발시키는 문제점이 나타나게 된다.
이러한 특징은 하나의 아이콘의 쓰여지는 상황과 이웃하는 아이콘 열에 따라 다른 어휘 특성을 나타내게 되어 동적인 다양한 문장을 생성이 가능하도록 한다. 본 논문에서는 아이콘 언어를 구현하기 위하여 아이콘에 대해 어휘와 문법 체계를 정의하고 자연언어체계의 개념을 적용하였기 때문에 하나의 독립적인 의미 기반 언어체계를 갖추며, 이로 인하여 제한적인 아이콘으로부터 다양한 한국어 표현을 생성하는 것이 가능하다. 또한, 언어장애인의 언어 활동의 특성을 고려하여 적용 영역을 선정하고 어휘를 수집, 분석하였기 때문에 언 어 장애인에게 범용적인 응용이 가능하도록 하였다.
본 논문에서는 원시 말 뭉치를 구축하는 데 있어, 언어 장 애를 유발하는 요인에 따라 언어장애인의 특성을 분류하고 각 특성에 따른 언어장애인이 정의한 적용범주에서 사용하는 대화를 수집하였다. 언어장애를 유발할 수 있는 특성으로 청각장애, 신체장애, 정신장애, 발달장애로 나누었다.
그리고 이 범주에서 쓰임새가 높은 문장을 수집하고 특징을 추출해야 한다. 본 논문에서는 적용 대상 범위를 언어 장애인에게 있어 목적성이 분명한 [교통], [쇼핑], [학교], [가정], [병원]으로 결정하였다. 또한, 각 활용 영역에서 발생할 수 있는 대화 샘플을 작업자의 직관력과 어휘의 빈도를 고려하여 공통적으로 많이 나타나는 문장을 수집하여 원시 말 뭉치를 구축하였다.
본 논문에서는와 같이 구축된 아이콘의 어휘 간 관용어 사전을 구축하고 활용한다.
사용자가 입력한 아이콘 열에 대하여 먼저 명사 아이콘시소러 스와 하위 범주화 사전을 기반으로 선택제 약(selectional restriction)을 적용하여 술어와 보어 성분간의 미적 중심 구조를 분석하고 선택제약으로 의존되지 못한 기타 아이콘은 이웃한 아이콘간의 관계 분석을 통해 세부적인 어휘구조를 파악하였다.
즉, 하나의 아이콘 보어 성분에 대하여 시소러스내에 해당 어위가 등록되어 있는지를 파악한다. 시소러스 내에 등록된 단어라면 하위범주화 사전의 후보 패턴 내에 존재하는 의미와 비교하여 상하위 관계가 존재하는지를 분석한다. 상하위 관계가 존재한다면 이 보어 성분에 대해서는 어휘의 의미를 분석한 것으로 판별한다.
아이콘 언어가 실생활에서 활용이 용이한가를 평가하기 위하여 청각장애인과 지체장애인에게 적용하여 검증하였다. 실제 상황에 적용함에 있어 가장 중요한 것은 빠른 시간 내에 정확한 표현의 생성이라 할 수 있다.
아이콘 언어의 조합으로부터 한국어를 생성할 때, 보다 정확한 의사 표현을 전달하기 위해서는 종결 문형, 시제, 양태 등을 고려해 주어야 한다. 아이콘 언어에는 종결, 시제, 존칭 등을 나타내는 어미 등의 문말 정보가 없이 중심적 어휘로만 구성이 되기 때문에 추가적인 아이콘을 정의하여 문말 정보를 부여하도록 할 수 있도록 하였다.
아이콘에 부여될 어휘를 추출하기 위하여 원시 말 뭉치의 각 문장에 대하여 상황을 나타내는 예시 문장으로 간주하고 작업자가 적당한 체언, 용언 등의 중심어에 정의된 품사 표지를 부여한 아이콘 품사부여 말뭉치를 구축하였다. 아이콘 품사부여 말뭉치를 구축하는 이유는 아이콘 후보 어휘 추출을 위한 빈도와 핵심 어휘의 범주별 분석 및 축약 어휘를 구성하는 대표 어휘 구성을 파악하기 위함이다.
그리고 한국어 생성 시에 문형 패턴을 참고하기 위하여 아이콘 말뭉 치 뿐만 아니라 한국어에 대해서도 형태소 분석기와 수작업을 병행하여 품사 부여 말뭉치를 구축하였다. 아이콘품사부 여 말뭉치로부터 아이콘에 나타날 어휘 추출 시 장소에 구애받지 않고 널리 쓰이며 공통적으로 나타나는 핵심 어휘와 특정 장소에서 자주 사용되는 주변 어휘로 나누어 분류하였다. 이렇게 분류하는 이유는 사용자가 특정 장소에서나 또는 자주 발생하는 상황에서 쉽게 이용할 수 있기 때문이다.
본 논문에서는 원시 말 뭉치를 구축하는 데 있어, 언어 장 애를 유발하는 요인에 따라 언어장애인의 특성을 분류하고 각 특성에 따른 언어장애인이 정의한 적용범주에서 사용하는 대화를 수집하였다. 언어장애를 유발할 수 있는 특성으로 청각장애, 신체장애, 정신장애, 발달장애로 나누었다. 신체장애자가 반드시 언어장애를 갖는 것은 아니지만 언어장애인이 두 가지 이상의 장애를 가지고 있는 경우가 많고 신체장애를 수반하는 경우 아이콘을 효율적으로 선택하여 아이콘 열을 구성하기 위한 인터페이스를 설계하는 데 참고하고자 함께 고려하였다.
용언과 보어 성분은 문장을 이루는 중심 구조로써 이를 하위 범주화사전, 시소러 스와의 비교를 통해 분석하였지 만 세부적인 관형어와 복합어는 이웃하는 아이콘 간 이루는 어휘적 특성이므로 분석되지 못한 아이콘에 대하여 관용어 사전을 이용하여 결합제약 분석을 수행한다. 각 아이콘이 이루는 결합 특성을 문법적으로 정의하고 이 관계를 통해 관용어 사전을 탐색하여 빠르게 관련 어휘를 나타내도록 하였다.
위의 결과는 청각장애인 3명의 평균 데이터로 표본 상황 50개에 대해 언어장애인이 조합하여 만들어낸 문장의 의미를 판별하여 결정하였다. (그림 6)은 아이콘 조합을 구성하는 데 소요된 시간을 단위 일별로 나타내었다.
이러한 문제점을 보안하기 위하여 사용자가 많이 사용하는 아이콘 조합은 저장한 후 유사한 조합이 발생할 경우 우선적으로 후보를 보여주는 기법을 추가하였다. 핸드폰 가게에서 핸드폰 가격을 물어볼 때도 이 같은 문제로 "핸드폰” 명사를 찾지 못하여 "물건”이라는 통합적 명사를 사용하였다.
아이콘 언어를 통해 생성되는 한국어는 언어 장애 인이 언어 장애가 없는 사람에게 전달될 가능성이 높기 때문이다. 이러한 여러 가지 특성을 고려하여 각 범주마다 500개씩, 모두 2, 5閃개의 문장으로 이루어진 원시 말 뭉치를 구 축하였다.
아이콘 언어체계는 사용자가 입력한 여러 아이콘 간 관계를 분석하고 재구성하여 한국어 생성에 적합한 대응 모델을 도출할 수 있어야 한다. 이를 위해 서 명사 아이콘의 의미 관계를 계층화하여 나타낸 시소러스와 아이콘 간 의존 관계 분석 및 용언 아이콘에 필수적으로 의존되는 명사 아이콘의 의미적 관계를 나타내는 하위범주화 사전, 그리고 아이콘 어휘의 관용어 사전을 구축하였다.
이에 본 논문에서 구현하고자 하는 아이콘 언어는 심볼만을 선택하여 정적인 문장만을 생성하였던 기존의 연구와는 다르게 하나의 아이콘에 다양한 품사와 어휘 정보를 저장하여 자연 언어와 같이 중의성을 갖도록 구성하였다. 이러한 특징은 하나의 아이콘의 쓰여지는 상황과 이웃하는 아이콘 열에 따라 다른 어휘 특성을 나타내게 되어 동적인 다양한 문장을 생성이 가능하도록 한다.
아이콘이 내포된 어휘와 의미를 얼마나 잘 전달하느냐가 원활한 한국어의 생성에 중요한 요소이기 때문이다. 자연언어의 어휘가 갖는 중의성과 다의성을 고려하고 직관적인 표현과 효율적인 아이콘의 배열이라는 사용자 인터페이스 측면의 분석을 통해 대상 영역별로 아이콘을 정의하였다.
3개의 아이콘 후보 어휘 열을 얻을 수 있었다. 작업자가 예문으로부터 문장 자체의 분석이 아닌 상황예시로 간주하여 아이콘으로 구성이 가능한 어휘열를 나열하였기에 한 문장으로부터 여러 아이콘 후보 어휘 열을 추출하였다. 각 아이콘 후보 어휘 열로부터 약 2.
용언 아이콘의 위치는 용언 아이콘의 앞뒤에서 지배되는 보어 아이콘 성분을 분석하는 기준이 되기 때문이다. 중심 구조 분석에서는 용언의 위치정보가 저장된 배열 공간에서 용언를 선택하고 이를 하위범주화 사 전에 등록된 용언정보와 비교하여 해당 용언의 후보 패턴을 추출하고 어휘 성분을 중심으로 일치를 수행한다. 즉, 하나의 아이콘 보어 성분에 대하여 시소러스내에 해당 어위가 등록되어 있는지를 파악한다.
중심 구조 분석에서는 용언의 위치정보가 저장된 배열 공간에서 용언를 선택하고 이를 하위범주화 사 전에 등록된 용언정보와 비교하여 해당 용언의 후보 패턴을 추출하고 어휘 성분을 중심으로 일치를 수행한다. 즉, 하나의 아이콘 보어 성분에 대하여 시소러스내에 해당 어위가 등록되어 있는지를 파악한다. 시소러스 내에 등록된 단어라면 하위범주화 사전의 후보 패턴 내에 존재하는 의미와 비교하여 상하위 관계가 존재하는지를 분석한다.
하위범 주화란 보어의 어휘 개념이 명시된 술어와 보어간 의존관계를 정의하는 중요한 언 어 정보로서구문 및 의미 분석 등에 폭넓게 활용되는 언어자원이다. 표층 문에서 통상 격표지로 표현되는 구문적 의존관계뿐만 아니라 보어가 갖는 의미 정보가 부착되어 있어, 시소러스의 의미 표지와 연동이 가능하도록 설계하였다 [15]. 본 논문에서도용언 아이콘에 대하여 하위 범주화의 개념을 적용하여 한국어 생성을 위한 의미적 중심 구조 분석에 활용하고자 하였다.
이러한 한계를 극복하면서 빠르고 정확한 구축을 위하여 기 구축된 범용적인 한국어 명사 시소러스[13, 14]를 이용하였다. 한국어 명사 시소러스의상의어 계층을 적용 범주에 맞도록 재정의하고 아이콘품사부여 말뭉치에서 추출한 명 사 어휘를 등록하였다. 본 논문에서 구축한 명사 아이콘 시 소러스는 각 어휘의 속성을 큰 범주로 나누어 포함시킴으로써 시스템 적용에 용이하도록 하였으며 아이콘이 나타내는 다양한 의미를 동적으로 구성할 수 있도록 설계되었다.
또한, 각 활용 영역에서 발생할 수 있는 대화 샘플을 작업자의 직관력과 어휘의 빈도를 고려하여 공통적으로 많이 나타나는 문장을 수집하여 원시 말 뭉치를 구축하였다. 활용범주을 대표하는 원시말 뭉치를 구축하기 위해서는 여러 작업자가 모든 정의된 영역에 대하여 상황별 발화문장을 수집하여 활용도의 균형을 고려하여 구축하였고 언어장애인에게 적용 가능한지를 파악하기 위하여 청각장애인으로부터 수집한 수화어휘와 비교, 분석하였다.
대상 데이터
[교통], [쇼핑], [학교], [가정], [병원]에 대하여 활용도가 높은 문장으로 각 500개씩, 2, 500여 문장을 원시 말 뭉치로 구축하였다. 각 문장으로부터 약 2.
(그림 10)을 살펴보면 표본문장 50개에 대하여 지체장애 인이 조합한 문장의 의미를 판별하여 결정하였다. 그리고 언 어 장애인 3명의 평균 데이터이다. y축은 문장의 개수이고 X축 은 프로그램 훈련 기간이다.
(그림 9)는 평가 문장 하나에 대한 평균 아이콘 조합 시간이다. 그리고 지체장애인 3명의 평균 데이터이다. y축은 분(min) 단위 시간이고 X축은 프로그램 훈련 기간이다.
이러한 일련의 과정에서 여러 문장 후보들이 생성될 수 있는데, 아이콘 열중 용 언 성분을 할당받은 아이콘어 여려 개 있을 수 있고, 각 용언에 대하여 여러 하위범주 패턴 이 일치되어 나타날 수 있기 때문이다. 여러 분석 후보 중 하위범주화사전과 가장 많은 일치 성분을 가지고 있는 후보를 선택한다. 후처리에서는 앞서 정의된 문말 표지를 분석하여 시제, 종결형, 기타문형정보를 선택된 한국어 기본문장에 적용하여 자연스러운 한국어 생성이 가능하도록 한다.
아이콘 언어는 실질형태 소로만 구성되어 있기 때문에 이 중에서 명사 아이콘 어휘에 대해서는 한국어 생성시 적절한 조사를 복원해주어야 한다. 한국어문장의 기본구조를 파악하기 위해 위에서 조사를 바탕으로 형성되는 문 형 표준 패턴 64개(동사 :47개, 형용사 :17개)를 정하였다. 용언 아이콘의 문형 패턴은 아이콘 조합의 한국어 번역을 위해서 매우 중요한 문장 생성의 표준화 수단이다.
이론/모형
명사 아이콘시소러스를 구축하는 일은 상당한 노력과 경험을 필요로 하고 대부분을 수작업에 의존해야 하는 문제가 있다. 이러한 한계를 극복하면서 빠르고 정확한 구축을 위하여 기 구축된 범용적인 한국어 명사 시소러스[13, 14]를 이용하였다. 한국어 명사 시소러스의상의어 계층을 적용 범주에 맞도록 재정의하고 아이콘품사부여 말뭉치에서 추출한 명 사 어휘를 등록하였다.
성능/효과
아이콘 언어는 키보드로부터 문자를 입력받아 제어하는 자연 언어 인터페이스보다 직관적이며 사용이 용이한 그림에 어휘 속성이 부여되어 있어 언어장애인이 아이콘의 조합으로 의사를 쉽고 편리하게 전달할 수 있도록 설계된 언어 보 조 인터페이스이다. 본 논문에서 제시한 아이콘 언어는 단순히 그림을 정의하고 어휘만 부여했던 기존의 연구와는 달리 아이콘이라는 그림과 어휘가 조합된 단위를 정의하고 여기에 언어적 체계를 갖추었다는 데 의의가 있다. 이를 구현하기 위하여 본 논문에서는 아이콘 언어의 문법적 체계를 정의하였다.
본 논문에서도용언 아이콘에 대하여 하위 범주화의 개념을 적용하여 한국어 생성을 위한 의미적 중심 구조 분석에 활용하고자 하였다. 아이콘 말 뭉치로부터 술어 아이콘과 이에 의존하는 명사 아이콘의 어휘의 의미적 관계를 기구축된 하위범주화사전[13]의 정보로 정합하고 비교분석하여 구축하는 시간과 노력을 줄일 수 있었다.
이 과정에서 명사 아이콘 어휘는 12,000여개, 용언 아이콘 어휘는 10, 300여개를 얻을 수 있었으며, 이중 명사 아이콘 어휘 600여개, 고빈도 용언 아이콘 어휘 250여개를 약 700여개의 아이콘을 정의하여 정합하고 아이콘 언어를 구축하였다. 아이콘 1개당 2.
후속연구
핸드폰 가게에서 핸드폰 가격을 물어볼 때도 이 같은 문제로 "핸드폰” 명사를 찾지 못하여 "물건”이라는 통합적 명사를 사용하였다. 다른 시각에서 본다면 쇼핑에 관련한 수많은 단어들을 모두 데이터베이스에 입력할 수 없으므로 어쩌면 "물건”, 명사를 사용하는 것이 당연할 수 있겠지만 프로그램에서 제시하는 어휘를 빠르게 검색할 수 있는 다양한 방법이 필요할 것으로 생각된다.
그리고 장소에 따라 분류된 어휘는 어휘의 한계가 설정되기 때문에 어휘 예측의 신뢰성을 좀 더 높일 수 있을 것이다. 특히 언어장애인이 주된 사용자라는 점에서 기존의한 국어 처리 연구와는 다른 각도에서 어휘를 추출하고 분류할 필요가 있다.
아이콘은 다중적 의미 및 어휘에 대한 품사 등 많은 애매성을 나타내기 때문에 이로부터 효율적인 한국어 생성을 위해서는 아이콘 언어의 문법 체계를 보다 강건하게 보완해야 한다. 그리고 현재 본 논문에서 논의된 아이콘 언어로부터 출력된 중심적인 어휘구조 모델에 한국어 생성을 위한 규칙을 정의하고 적용하는 연구와 아이콘을 효율적으로 나타내어 빠르게 어휘를 조합할 수 있는 효율적인 인터페이스 연구가 진행 중에 있으므로 언어장애인이 이용할 수 있는 편리한 언어 보조 인터페이스 시스템 개발을 기대해 볼 수 있으리라 생각된다.
그 밖에도 현재 널리 활용되고 있는 안내시스템 예약시스템 등 터치스크린 인터페이스를 가진 아이콘시스템들의 개발에도 기술적 발전을 제공할 수 있다. 아이콘으로 문장을 구성하는 시스템 구현은 어린이들의 어휘 향상을 돕는 학습용으로도 쓰일 수 있을 것이다. 학습용으로 적절한 이유는 그 어휘를 가장 잘 표현한 아이콘과 연관시켜 문장을 구성하고, 직접 음성으로도 들을 수 있게 하기 때문이다.
Eunsil Lee et al, 'Sentence Generation by Symbols for People with language disorder', ICEIC'98, pp37-40, 1998
Jongshill Lee et al, 'Real-Time Tracking and Recognition of Human Hands from a Sing-Language Image Sequence', ICEIC'98 pp.165-168, 1998
Kathleen F. McCoy and Patrick Dernasco, 'Some Applications of Natural Language Processing to the Field of Augmentative and Alternative Communication' In Proceedings of the IJCAI-95 Workshop on Developing AI Applications for People with Disabilities, Montreal, Canada, August, 1995
Elman, J. L. In R.F. Port & T. van Gelder(Eds.), 'Language as a dynamical system', Mind as Motion: Explorations in the Dynamics of Cognition. Cambridge, MA: MIT Press. pp195-223, 1995
Kathleen F. McCoy, 'Simple NLP Techiques for Expanding Telegraphic Sentences', In Proceedings of Natural Language Processing for Communication Aids, an ACL/EACL '97 Workshop, Madrid, Spain, July 12, 1997
※ AI-Helper는 부적절한 답변을 할 수 있습니다.