$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

한국어 발화음성에서 중점단어 탐색을 위한 기본주파수에 대한 연구
A Study of Fundamental Frequency for Focused Word Spotting in Spoken Korean 원문보기

정보처리학회논문지. The KIPS transactions. Part B. Part B, v.15B no.6, 2008년, pp.595 - 602  

권순일 (한국과학기술연구원 지능인터랙션연구센터) ,  박지형 (과학기술연합대학원대학교 HCI 및 로봇응용공학) ,  박능수 (건국대학교 정보통신대학 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

각 문장 별 중점단어는 발화음성을 인식하고 그 의미를 이해하는데 도움을 준다. 발화된 음성신호로부터 중점단어를 탐색할 수 있는 방법을 찾기 위한 노력의 일환으로 실험을 통하여 문장 내에서 중점단어와 그 외의 단어들의 기본주파수의 평균과 분산, 그리고 평균 에너지를 분석해 보았다. 한국어로 된 100개의 발화문장의 음성데이터를 가지고 실험을 한 결과 중점단어는 그 외의 단어들에 비해 대부분 상대적으로 높은 기본주파수의 평균값을 나타내거나 상대적으로 높은 기본주파수의 분산 값을 나타냈다. 이 연구 결과를 이용하면 한국어의 구어문장에서 운율적 특성을 알 수 있을 뿐만 아니라, 자연어 처리를 이용한 핵심어를 추출하는 데에도 도움이 될 것이다.

Abstract AI-Helper 아이콘AI-Helper

The focused word of each sentence is a help in recognizing and understanding spoken Korean. To find the method of focused word spotting at spoken speech signal, we made an analysis of the average and variance of Fundamental Frequency and the average energy extracted from a focused word and the other...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 한국어 발화음성에 있어서 화자의 초점이 맞추어져 있는 문장 내의 중점단어를 구분해 내기 위해 유용하게 사용될 수 있는 운율적 특징들을 분석하고 패턴을 찾아보았다. 기본 주파수의 단어별 평균과 분산의 상댓값을 계산하여 이를 동시에 활용하는 것이 중점단어와 그 외의 단어를 구분 짓는 데에 유용한 것으로 나타났다.
  • 이에 비해 에너지는 어떤 일관된 패턴을 찾기 힘들었다. 우리는 이러한 점들에 착안하여 한국어의 발화음성에 있어서 중점단어는 그 외의 단어들과 기본주파수와 에너지의 변화에 있어서 개별적으로 또는 상호작용하는 가운데 어떻게 다른지 실험을 통해 그 패턴을 분석하고 앞선 관찰결과를 검증해 보려한다.
  • 이는 화자가 한 문장 안에서 가장 강조하고자 한 단어이면서 전체적인 대화의 흐름 및 토픽을 추출하는데 도움을 줄 수 있는 부가 정보가 될 수 있다. 이 논문에서는 중점단어를 찾기 위해 필요한 비언어적인 요소들 중에서 음성신호로부터 추출되는 운율적 특징요소들을 분석해 보려한다. 이번 연구에서 실시하는 실험적 분석을 통해 얻게 되는 결과를 이용하여 한 문장 안에서 말하는 사람이 가장 강조하고 하려고 한 단어가 무엇인지, 즉 중점단어(Focused Word)가 어느 것인지를 찾아낼 수 있다면, 이는 사람들 간의 대화로부터 핵심어 및 주제를 추출하는데 도움이 될 것이다 [3-6].
  • 이 실험의 결과를 볼 때, 세 가지 특성 중 한가지만을 사용한다면 기본주파수의 단어별 평균의 상댓값으로 중점단어와 그 외의 단어들을 구분하는 것이 가장 좋은 결과를 가져다 줄 것으로 분석할 수 있다. 이 실험 결과를 바탕으로 기본주파수의 평균, 분산, 그리고 에너지 평균의 상댓값들을 짝을 이루어 활용할 경우 중점단어 탐색에 도움을 줄 수 있는지를 추가적으로 실험해 보았다.
  • 또한, 문장단위의 상대적 중점단어를 찾아내기 위해 운율적 특징들의 패턴을 음소/음절 단위가 아닌 단어 단위로 관찰하고 분석하고 있는데, 그 이유는 한국어가 다른 외국어들에 비해 음소 내지는 음절 별 강세의 정도가 뚜렷하지 못하여 측정하기 힘들 뿐만 아니라 패턴을 찾아내기도 힘들다. 이와 더불어 한 문장 안에서 화자가 강조하고자 하는 의미를 담고 있는 최소한의 단위는 음절보다 큰 단어 단위 이상으로 추측되고 있으며, 이번 연구 결과를 자연어 처리결과로 얻어질 수 있는 문장 별 핵심어와 비교 분석을 하고자 하는 목적이 있다.

가설 설정

  • 예를 들자면, 방 안의 책상위에 파란색 색연필, 빨간색 유성펜이 놓여 있다. 화자가 도화지에 파란색 색칠을 하기위해 자신 보다 책상에 가까이 있는 친구에게 파란색 색연필을 가져다 달라고 부탁한다고 가정해 보자. 화자는 상대방에게 ‘파란색 색연필 좀 가져다 줘’ 라고 말할 때, 자연스럽게 ‘파란색’ 이라는 단어를 가장 강조하여 말하게 된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
음성을 이해하기 위해서 대체로 어떻게 시스템이 구성되어 있나요? 사람들 간의 대화 또는 회의의 내용이나 주제를 파악하기 위해서는 단순한 음성인식이 아닌 음성을 이해하는 시스템에 대한 연구가 필요하다. 음성을 이해하기 위해서 대체로 음성인식을 통해 음성신호를 문자화 하고, 이후 자연어 처리를 통해 그 의미를 파악하는 순으로 시스템이 구성되어 있다. 하지만 자연어 처리의 대상은 대체로 신문이나 책, 논문 등 각종 문자화 되어있는 정보, 다시 말해 문자로만 이루어진 정보 문장들이다.
비언어적인 요소란 무엇을 의미하나요? 반면 사람들 간의 대화와 같은 발화된 구어의 경우 그 의미를 이해하는데 있어서는 언어적인 요소 못지않게 비언어적인 요소를 활용된다고 한다. 비언어적인 요소란 대화 시에 사용되는 얼굴표정, 몸동작, 말소리의 크기, 말의 속도 등을 의미 하며, 사람들은 이러한 요소들을 복합적으로 활용하여 상대방 대화의 정확한 의미를 이해하게 된다 [1,2,7,10,14]. 또한 사람들 간의 대화에 있어서는 문자와 화자의 발성을 통한 음성신호가 합쳐져 있기 때문에 문자가 지니고 있는 의미 정보와 함께 발성을 하면서 포함된 화자의 의도가 포함되어 있다.
중점단어는 어떤 단어이면서 어디에 도움을 줄 수 있는 부가 정보가 될 수 있나요? 화자가 발화시에 표현하는 정보 중의 하나는 중점단어(Focused Word) 이다. 이는 화자가 한 문장 안에서 가장 강조하고자 한 단어이면서 전체적인 대화의 흐름 및 토픽을 추출하는데 도움을 줄 수 있는 부가 정보가 될 수 있다. 이 논문에서는 중점단어를 찾기 위해 필요한 비언어적인 요소들 중에서 음성신호로부터 추출되는 운율적 특징요소들을 분석해 보려한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. S. Ananthakrishnan and S. Narayanan, “Automatic Prosody Labeling using Acoustic, Lexical, and Syntactic Evidence,” IEEE Transactions on Speech, Audio and Language Processing, 16(1), pp.216-228, Jan., 2008 

  2. D. Baron, E. Shriberg and A. Stolcke, “Automatic punctuation and disfluency detection in multi-party meetings using prosodic and lexical cues,” In Proc. of International Conference on Spoken Language Processing (ICSLP), pp. 949-952, 2002 

  3. S.-A. Jun and H.-J. Lee, “Phonetic and phonological markers of contrastive focus in Korean,” In Proc. International Conference on Spoken Language Processing (ICSLP), pp.1295-1298, 1998 

  4. S.-A. Jun, “Intonational Phonology of Seoul Korean Revisited,” Japanese-Korean Linguistics 14 , Stanford: CSLI [Also printed in UCLA Working Papers in Phonetics, #104, pp.14-25, 2005], 2006 

  5. S.-A. Jun and H.-S. Kim, “VP Focus and Narrow Focus in Korean,” In Proc. of ICPhS, Saarbruecken, Germany, 2007 

  6. S. Kang and S. Speer, “Prosody and clause boundaries in Korean,” Proc. of International conference on Speech Prosody, pp.419-422, 2002 

  7. E.-S. Kim and B. Scassellati, “Learning to refine behavior using prosodic feedback,” In Proc. of IEEE 6th International Conference on Development and Learning, pp.205-210, 2007 

  8. H.-S. Kim, S.-A. Jun, H.-J. Lee, and J.-B. Kim, “Argument Structure and Focus Projection in Korean,” Proc. of International conference on Speech Prosody, Dresden, Germany, 2006 

  9. B. Secrest and G. Doddington, “An integrated pitch tracking algorithm for speech systems,” Proc. of International Conference on Acoustics, Speech, and Signal Processing, pp.1352-1355, Apr., 1983 

  10. K. Sonmez, E. Shriberg, L. Heck, and M. Weintraub, “Modeling Dynamic Prosodic Variation for Speaker Verifi cation,” Proc. of International Conference on Spoken Language Processing, Sydney, Australia, Vol.7, pp.3189-3192, 1998 

  11. Speech Filing System [Online]. Available: http://www.phon.ucl.ac.uk/resource/sfs 

  12. F. Tamburini, “Automatic prosodic prominence detection in speech using acoustic features: an unsupervised system,” In Proc. of Eurospeech, pp.129-132, 2003 

  13. D. Wang and S. Narayanan, “A multi-pass linear fold algorithm for sentence boundary detection using prosodic cues,” In Proc. of International Conference on Acoustics, Speech, and Signal Processing, pp.525-528, May, 2004 

  14. D. Wang and S. Narayanan, “An Acoustic Measure For Word Prominence In Spontaneous Speech,” IEEE Transactions on Speech, Audio and Language Processing, 15(2), pp.690-701, Feb., 2007 

  15. 구희산, “영어와 한국어 낱말 운율의 음성학적 연구”, 응용언어학, 제8호, pp.123-140, 1995년 2월 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로