최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기인지과학 = Korean journal of cognitive science, v.22 no.3, 2011년, pp.327 - 345
In this paper, a new approach to Korean POS (Part-of-Speech) tagging is proposed. In previous works, a Korean POS tagger was regarded as a post-processor of a morphological analyzer, and as such a tagger was used to determine the most likely morpheme/POS sequence from morphological analysis. In the ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
품사 부착 혹은 품사 태깅이란? | 하나의 단어가 여러 가지 품사로 사용될 수 있지만, 문맥이 주어지면 여러 가지 가능한 품사 중에서 하나의 품사로 고정할 수 있는 경우가 보통이다. 품사 부착 혹은 품사 태깅(POS tagging)은 여러 가지 가능한 품사열 중에서 주어진 문맥에 가장 잘 맞는 것 하나를 선택하는 것을 말한다. 이는 음성 인식, 음성 합성, 자연어 처리, 정보 검색 등 여러 분야에서 응용할 수 있는 가장 기본적인 도구이다. | |
한국어에서 품사 태거란? | 이러한 문제가 있기 때문에 한국어에 대한 품사 태깅은 어절을 형태소 단위로 분해하고 문맥에 가장 잘 맞는 형태소 조합을 선택하는 방법으로 이루어진다. 즉, 한국어에서 품사 태거(POS tagger)란 형태소 분석기와 결합하여 사용되는 일종의 보조 시스템으로 간주된다[4, 5]. 때문에 한국어 품사 태거는 특정 형태소 분석기에 종속적이며, 다른 종류의 품사 집합을 사용하는 타 형태소 분석기와 함께 사용하기가 곤란하다. | |
영어권에서와 같이 형태소 분석을 하지 않고 어절 단위로 직접 품사 태깅을 하는 경우에 심각한 자료 부족문제가 발생하는 이유는? | 반면, 교착어에 속하는 한국어는 체언과 용언이 각각 조사, 어미와 자유롭게 결합되어 사용될 수 있으므로 하나의 체언이나 용언으로부터 파생될 수 있는 어절의 수가 매우 많다. 이 때문에 영어권에서와 같이 형태소 분석을 하지 않고 어절 단위로 직접 품사 태깅을 하는 경우에는 [3, 4]에서도 지적된 바와 같이 심각한 자료 부족(data sparseness) 문제가 발생한다. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.