$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

발음열 자동 생성기를 이용한 한국어 음운 변화 현상의 통계적 분석
Statistical Analysis of Korean Phonological Variations Using a Grapheme-to-phoneme System 원문보기

한국음향학회지= The journal of the acoustical society of Korea, v.21 no.7, 2002년, pp.656 - 664  

이경님 (서강대학교 컴퓨터학과 음성언어처리연구실) ,  정민화 (서강대학교 컴퓨터학과 음성언어처리연구실)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 한국어 발음열 자동 생성기를 이용하여 한국어의 음운 규칙에 대한 통계적 분석을 수행하였다. 실험에 사용한 발음열 자동 생성기는 한국어 음운 변화 현상에 대해 형태음운론에 기반 한 언어학적 분석과 문교부 표준어 규정의 표준 발음법에서 유도된 필수 및 수의적 음소 변동 규칙과 변이음 규칙의 단계적 적용 모델을 사용해서 구현되었으며, 특히 연속음성 인식을 위한 학습용 발음열과 인식용 발음사전 생성의 최적화를 목표로 하였다. 본 논문에서는 대어휘 연속음성 인식기의 음향 모델을 구축하기 위해 만들어진 삼성 PBS(Phonetically Balanced Sentence) 음성 데이터 베이스의 60,000문장에 적용된 발음열 생성기의 음소 변동규칙들의 분포 및 그 통계를 사용해서 한국어 음운 변화 양상을 분석하였다. 적용된 빈도수를 기준으로 분석한 결과, 필수음소 변동규칙의 경우는 연음법칙, 경음화, 격음화, 장애음의 비음화순으로, 수의적 음소 변동규칙의 경우는 초성 ㅎ 탈락, 중복 자음화, 동일 조음위치 자음탈락 순으로 음운 변화가 발생하였다. 이러한 적용 규칙들의 통계적 자료를 기반으로 한국어 음운 변화 양상을 파악할 수 있었으며, 나아가 본 논문의 연구 결과는 음성 인식 시스템을 개발하는데 유용하게 사용할 수 있을 것이다.

Abstract AI-Helper 아이콘AI-Helper

We present a statistical analysis of Korean phonological variations using a Grapheme-to-Phoneme (GPT) system. The GTP system used for experiments generates pronunciation variants by applying rules modeling obligatory and optional phonemic changes and allophonic changes. These rules are derived form ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 특히 형태소 내부와 형태소 경계에서 발생하는 현상이 다를 뿐만 아니라 음소 문맥에 따라 발생 가능한 네트워크만을 확장하는 것이 효율적이므로 이 논문에서 소개된 자료를 활용하여 인식기의 성능을 향상시킬 수있다.의 연구에서는 이러한분석 자료를 이용하여 트리 구조의 인식 네트워크의 공유 효율을 높이고 이로 인해 네트워크의 크기를 줄일 수 있도록 인식 중에 음소 문맥을 이용해 인식 네트워크에 음운 변화 현상을 적용시키는 방법을 제안하였다.
  • 부사 . 관형사 (default), 복합어로 분리하여 수행된 결과를 분석하였다. 표 8은 규칙 적용 범위에 따라 분류된 음소변동 규칙 오토마타를 참조하여 얻은 결과로 명사 프로세스의 경우 입력 형태소중34.
  • 해당 음소 문맥에 의해 하나의 음소가 다른 음소로 바뀌거나 탈락, 첨가되는 양상을 규칙화한 것을 음소 변동 규칙이라 정의하고, 표준 발음 생성을 위한 필수음소 변동 규칙과 비표준 발음을 포함하여 화자의 습관 및 환경에 따라 발생 가능한 수의적 음소 변동 규칙을 단계 별로 적용하였다. 마지막으로 하나의 음소가 음성 환경 말의 속도와 스타일에 따라서 여 러 가지 음가를 가지는 변이음 생성 규칙을 적용하였다.
  • 구축된 문장에 대한 형태소 분석 결과는 표 6과 같다. 문장 분석은 형태소 분석 결과에 품사 태그가 부착된 형태를 기준으로 하였다.
  • 본 논문에서 사용된 발음열 자동 생성기 알고리즘은 한국어의 음운 변화 규칙을 다음과 같이 3단계로 나누어 진행된다. 해당 음소 문맥에 의해 하나의 음소가 다른 음소로 바뀌거나 탈락, 첨가되는 양상을 규칙화한 것을 음소 변동 규칙이라 정의하고, 표준 발음 생성을 위한 필수음소 변동 규칙과 비표준 발음을 포함하여 화자의 습관 및 환경에 따라 발생 가능한 수의적 음소 변동 규칙을 단계 별로 적용하였다.
  • 본 논문에서는 기존의 발음열 자동 생성 시스템囲에서는 고려되지 않았던 표준화 규정의 일부 음운 변화 현상을 시스템에 추가 반영하고, 성능 평가 및 안정화 작업을 선행하였다. 이 생성 시스템을 활용하여 발음열 생성 과정에서 적용된 음소 변동규칙들의 통계적 자료를 기반으로 한국어 음운 변화 현상에 대한 분석을 수행하였다 [3】 을 포함하여 기존 연구들은 한글 철자에 대한 통계적 분석이 대부분이며, [기의 경우 발음사전에 기재된 약 66만개의 표제어에 대한 발음(음운)을 조사하여 음소와 음절들의 빈도수를 조사 분석한 통계 자료를 제시하였으나, 실제 문장에서 발생하는 형태소 및 어절 경계의 음운 변화 현상은 반영되지 않았으며 적용된 규칙에 대한 정보를알 수 없다는 한계점이 있었다.
  • 이 때 문자열에 대한올바른 발음열을 생성하기 위해서는 해당 언어의 음운 현싱에 대한 체계적이고, 정확한 분석이 필요하다. 본 시스템에서는 음성학과 음운론 연구[5, 11]을 기반으로 한국어에서 발생하는 음운 변화현상을 정리하고, 문교부에서 제정한 표준어 규정[6]의제 2부 표준 발음법을 참고하여 한국어의 대표적인 음소변동 규칙 중 표 1과 같이 20개의 음소 변동 규召을 채택하여 적용하였다. 기존 생성기[4]에서는 적용 대상에서 제외된 모음 관련 규칙을 추가하였다.
  • 비교적 적다. 수의적 음소 변동은 형태소 경계 정보에 따라 발화 현상이 달라지지는 않으나, 경계에 따라 빌음사전에 기재되는 음소열이 변화하므로 분류하여 분 巴하였다. 다만 모음화 규칙 18, 19, 20은 음절의 중성변화 규칙으로 형태소 경계에서는 발생하지 않는다.
  • 갖는 문장들의 집합이다. 실험 분석은 본 논문에서 정의한 음소 변동 규칙에 따른 발생 빈도수와 음소의 경계 위치에 따른 적용 양상에 대하여 초점을 맞추었다. 적용된 음소 변동 규칙들의 통계적 자료를 기반으로 한국어 음운 변화 현상의 양상을 파악할 수 있었으며, 나아가 이 러한 분석을 이용하여 음성 인식기 의 성능을 향상시 키기 위한 분석자료로 활용할 수 있을 것이다
  • 정의된 음소 변동 규칙들이 실제 적용되는 현상을 분석하기 위하여 트라이폰 기반의 PBS 60, 000 문장에 발음열 자동 생성 기를 적용하여 나온 결과를 통계적으로 분석하였다. 실험은 음소변동을 모델링한 분류에 따른 빈도수와음소의 경계 위치에 따른 적용양상에 대하여 초점을 맞추었다. 적용된 음소 변동 규칙들의 통계적 자료를 기반으로 한국어 음운 변화 현상 양상을 파악할 수 있었으며, 나아가 이러한 분석을 이용하여 음성 인식기의 성능을 향상시키기 위한 자료로 활용할 수 있을 것이다.
  • 생성하였다. 정의된 음소 변동 규칙들이 실제 적용되는 현상을 분석하기 위하여 트라이폰 기반의 PBS 60, 000 문장에 발음열 자동 생성 기를 적용하여 나온 결과를 통계적으로 분석하였다. 실험은 음소변동을 모델링한 분류에 따른 빈도수와음소의 경계 위치에 따른 적용양상에 대하여 초점을 맞추었다.
  • 정확한 발음열을 생성하기 위해 한국어가 가지는 언어학적 지식과 문교부 제정 표준어 규정을 기반으로 음운변화 규칙을 분석하고, 이를 통해 정의된 음소 변동 규칙과 변이음 규칙을 다단계로 적용하여 가능한 모든 발음열을 생성하였다. 정의된 음소 변동 규칙들이 실제 적용되는 현상을 분석하기 위하여 트라이폰 기반의 PBS 60, 000 문장에 발음열 자동 생성 기를 적용하여 나온 결과를 통계적으로 분석하였다.
  • 해당 음소 문맥에 의해 하나의 음소가 다른 음소로 바뀌거나 탈락, 첨가되는 양상을 규칙화한 것을 음소 변동 규칙이라 정의하고, 표준 발음 생성을 위한 필수음소 변동 규칙과 비표준 발음을 포함하여 화자의 습관 및 환경에 따라 발생 가능한 수의적 음소 변동 규칙을 단계 별로 적용하였다. 마지막으로 하나의 음소가 음성 환경 말의 속도와 스타일에 따라서 여 러 가지 음가를 가지는 변이음 생성 규칙을 적용하였다.
  • 횡태소, 어절, 언절 또는문장등의 다양한형태의 입력에 대해 발음열을 생성하도록 구성하였다. 표 3은 "신발을 신고”라는 입력 언절에 대해 다양한 출력한 결과로서 이를 이용하여 학습용 발음열과 발음사전을 구성한다.

대상 데이터

  • 명시된 예제를 사용하였다. '붙임'과 '다만' 항목을 포함하여 총 364개의 언절을사용하였으며, 이 중 수의적으로 적용되는 예제가 16개였다.
  • 본 논문에서는 발생 가능한 모든 음운 현상을 포함하며, 가능한 다양한 트라이폰 모델을 포함하도록 설계된 삼성 PBS (Phone Balanced Sentence) 음성 데이터 베이스의 문장을 실험에 사용하였다. 구축된 문장에 대한 형태소 분석 결과는 표 6과 같다.
  • 본 실험에 사용된 분석 대상은 트라이폰 기준으로 균형된 음소 집합을 갖도록 구축된 PBS 60, 000문장으로 다양한 음운환경을 포함하며 음소열의 중복이 적고 고른 확률분포를 갖는 문장들의 집합이다. 실험 분석은 본 논문에서 정의한 음소 변동 규칙에 따른 발생 빈도수와 음소의 경계 위치에 따른 적용 양상에 대하여 초점을 맞추었다.

이론/모형

  • 한국어에서 빈번히 발생하는 음운 변화 현상을 테스트하기 위한 대상으로 표준어 규정 ⑹ 의 제 2부 표준 발음법에 명시된 예제를 사용하였다. '붙임'과 '다만' 항목을 포함하여 총 364개의 언절을사용하였으며, 이 중 수의적으로 적용되는 예제가 16개였다.
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로