최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국음향학회지= The journal of the acoustical society of Korea, v.27 no.8, 2008년, pp.435 - 442
신중휘 (고려대학교 컴퓨터학과) , 박재현 (고려대학교 컴퓨터학과) , 이정태 (고려대학교 컴퓨터.전파통신공학과) , 임해창 (고려대학교 컴퓨터.전파통신공학과)
The n-gram model is appropriate for languages, such as English, in which the word-order is grammatically rigid. However, it is not suitable for Korean in which the word-order is relatively free. Previous work proposed a twoply HMM that reflected the characteristics of Korean but failed to reflect wo...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
n-gram 모델는 어떤 언어의 적용에 적합한가? | n-gram 모델은 영어와 같이 어순이 문법적으로 제약을 받는 언어에 적합하다. 그러나 어순이 비교적 자유로운 한국어에는 적합하지 않다. | |
언어모델이 하는 역할은? | 언어모델은 문장이 나타날 확률로 다음 단어를 예측하거나 중의성을 해소하는 등의 역할을 한다. 따라서 언어모델은 음성인식 [1], 기계번역 [2] 등 다양한 자연어처리 분야에서 이용된다. | |
n-gram 모델 적용에 적합하지 않은 언어는? | n-gram 모델은 영어와 같이 어순이 문법적으로 제약을 받는 언어에 적합하다. 그러나 어순이 비교적 자유로운 한국어에는 적합하지 않다. 기존 연구는 어절 간 어순의 고려가 어려운 한국어의 특성을 반영한 twoply HMM을 제안했으나, 인접 어절 간 어순 구조를 반영하지 못하였다. |
F. Jelinek, "Self-organized language modeling for speech recognition", Readings in Speech Recognition, A. Waibel and K. F. Lee, eds., Morgan Kaufmann, 450-506, 1990
P. F. Brown, S. A. Della Pietra, V. J. Della Pietra, F. Jelinek, J. D. Lafferty, R. L. Mercer, and Roossin, P.S. "A statistical approach to machine translation", Computational Linguistics, 16(2), 79-85, 1990
D. Jurafsky and J. H. Martin, Speech and Language Processing (Prentice Hall, 2007) Chap.4, pp.83-121
김진동, 임희석, 임해창, "Twoply HMM: 한국어의 특성을 고려한 형태소 단위의 품사 태깅 모델", 정보과학회논문지 (B), 24 (12), 1502-1512, 1997
L. Rabiner and B. Juang, "An Introduction to hidden Markov models", ASSP Magazine IEEE Signal Processing, 3(1), 4-16, 1986
E. Arisoy and M. Saraclar, "Lattice extension and rescoring based approaches for LVCSR of turkish", in INTERSPEECH, 1025-1028, 2006
J. Gao, H. Suzuki, and Y. Wen, "Exploiting headword dependency and predictive clustering for language modeling", in EMNLP-2002, 248-256, 2002
M. Creutz, T. Hirsimaki, M. Kurimo, A. Puurula, J. Pylkkonen, V. Siivola, M. Varjokallio, E. Arisoy, M. Saraclar, and A. Stolcke, "Morph-based speech recognition and modeling of out-of-vocabulary words across languages", ACM TSLP, 5(1), 2007
O. Kwon and J. Park, "Korean large vocabulary continuous speech recognition with morpheme-based recognition units", Speech Communication, 39(3-4), 287-300, 2003
N. Hideki, Corpus-based approaches to sentence structures (John Benjamins Pub Co., 2005), Chap.3, pp.51-76
S. M. Katz, "Estimation of probabilities from sparse data for the language model component of a speech recognizer", IEEE Transactions on Acoustics, Speech and Signal Processing, 35, 400-401, 1987
A. Stolcke, "SRILM-an extensible language modeling toolkit", in ICSLP-2002, 901-904, 2002
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.