[논문]대화형 코퍼스의 설계 및 구조적 문서화에 관한 연구

강창규; 남명우; 양옥렬

문제 정의

각 연구소, 업체마다 서로 다른세그먼트 규칙과 전사 규칙을 적용하고 외국어를 기준으로 한 규칙도 한국어의 어휘 문맥과 틀려 적용하기어렵다. 따라서 본 논문에서 대화음성에 적용하기 위해세그먼트 규칙과 전사 규칙을 정의하고 이를 구조적 문 서인 XML DTD를 이용하여 표준화하고자 한다. 다음 [그림 5]와 같은 절차로 정의했다.
본 논문에서는 대화 영역을 텔레뱅킹으로 한정하여코퍼스를 구축, 특징정보의 레이블링, 마지막으로 이를 표준화된 레이블링 데이터로 사용하기 위해 TEI를 기반으로 한 구조적 문서화가 기능하도록 대화코퍼스 정보 표준 DTD를 설계하였다. 또한 설계된 DTD를 기준으로 대화음성 특징 정보를 XML 기반 구조적 문서로 저장할 수 있는 저장 스키마를 설계하여 정확하고 효율적으로 관리할 수 있는 저장 시스템 구조를 설계하였다.
본 논문에서는 대화코퍼스의 주석 정보를 효과적으로 사용하기 위해 XML로 표준화하여 대화코퍼스를 구조 적 문서화하는 방법을 검토하고자 한다. 이를 위해 주석 정보의 추가 및 삭제 등의 확장 가능한 형태의 DTD를 설계하여 주석정보를 표준화하고 XML을 통한 구조적 문서의 웹 서비스가 가능하도록 설계한다.
본 논문에서는 텔레뱅킹의 시나리오를 설계하여 제작 하였다. 제작된 시나리오를 기반으로 자연스러운 음성 을 수집하기 위해 2-Channel 방식의 수집 시스템을 구 성하였다.

제안 방법

LDC의 Transcriber 전사 시스템을 사용하여 수집된 대화음성을 전사하였다. 전사 과정은 그림 6과 같다.
구조화된 대화코퍼스 정보 초기에 header와 text, 그리고 text의 서브 노드 front body, back의 부분으로 구분하였으나, 부분적 DOM 트리 생성이 가능하기 위해서 모든 트리의 노드를 재 색인화 하였다. 이 색인에는 엘리먼트 이름, 엘리먼트 속성 이름, 속성 인스턴스 등의 정보로 구성하였다.
수집된 대화음성의 전사 자료는 시스템 발화 음성과사용자 발화 음성을 각각 전사하였다. 구축된 전사 자료 는 시스템 발화 음성과 사용자 발화 음성을 전사해서 한 대화에서 7회 전사하였으며 이를 총 5회 반복 하였다. 따라서 35개의 전사파일을 생성하였다.
대화코퍼스 DTD 전체적인 구조는 header DTD와 text DTD로 분류하여 구조화하였다. header DTD에 는 화자 정보 및 대화 코퍼스 제목 정보를 나타내며 text DTD는 실제 전사 정보를 나타낸다.
대화코퍼스의 다양한 주석 정보를 의미태그로 선정하여 표기 방안을 표준화 하였다. 또한 이를 표현을 위해 XML을 사용하였다.
기존의 대화음성 수집 시스템의 방식은 인간과 기계 (Wizard of Oz) 시뮬레이션을 이용한 방법은 대화가 제약되어 자연스러운 대화음성이 수집되지 못했다. 따라서 본 논문에서는 2-Channel 방식의 수집 시스템을 구성하여 자연스러운 대화음성을 수집하였다. 위의 표 5 는 두 수집 방식을 비교한 예이다.
본 논문에서는 대화 영역을 텔레뱅킹으로 한정하여코퍼스를 구축, 특징정보의 레이블링, 마지막으로 이를 표준화된 레이블링 데이터로 사용하기 위해 TEI를 기반으로 한 구조적 문서화가 기능하도록 대화코퍼스 정보 표준 DTD를 설계하였다. 또한 설계된 DTD를 기준으로 대화음성 특징 정보를 XML 기반 구조적 문서로 저장할 수 있는 저장 스키마를 설계하여 정확하고 효율적으로 관리할 수 있는 저장 시스템 구조를 설계하였다.이러한 저장시스템을 통해 각 문서에서 가지고 있는 공 통적으로 나타나는 특징 정보의 검색이 가능하여, 대화 음성 특징연구에 매우 유익한 정보 추출이 가능하다.
본 논문에서는 대화음성 데이터의 내용을 기술하기 위해 2개의 전사 규칙(철자전사, 발음전사)으로 구분하여 정의하였다.
대화음성 자료는 시스템 발화와 사용자 발화가 자연스 럽게 이루어지도록 생성하였다. 생성된 대화음성 자료는 시스템 발화 음성과 사용자 발화 음성, 각 89개의 텔레뱅 킹 문장을 발화하였다. 한 대화에서 7개의 시나리오로 구분하여 발성해 7개의 웨이브 파일을 생성하였다.
수집된 대화음성의 전사 자료는 시스템 발화 음성과사용자 발화 음성을 각각 전사하였다. 구축된 전사 자료 는 시스템 발화 음성과 사용자 발화 음성을 전사해서 한 대화에서 7회 전사하였으며 이를 총 5회 반복 하였다.
따라서 텔레뱅킹 영역에서 필요한 정보 아이템과 이들의 순서가 상황에 맞게 설계되어야 한다[5]. 수집된 아이템을 중심으로 4개의 서브 도메인을 아래와 같이 분류하고 서브 도메인별로 세부 정보 아이템을 정의하였다.
시나리오는 실제 텔레뱅킹의 흐름에 맞게 작성해서 제작하였다. 시나리오의 서브 도메인은 공과금 납부, 신 용카드 조회, 분실 신고, 서비스로 분류하여 구성하였다.
시나리오의 서브 도메인은 공과금 납부, 신 용카드 조회, 분실 신고, 서비스로 분류하여 구성하였다.시나리오에서의 대화는 상호 주도의 방법을 사용하여한 발화에 적당한 정보 아이템의 수와 순서를 고려하여 발화하도록 하였다.
시나리오는 실제 텔레뱅킹의 흐름에 맞게 작성해서 제작하였다. 시나리오의 서브 도메인은 공과금 납부, 신 용카드 조회, 분실 신고, 서비스로 분류하여 구성하였다.시나리오에서의 대화는 상호 주도의 방법을 사용하여한 발화에 적당한 정보 아이템의 수와 순서를 고려하여 발화하도록 하였다.
제작된 시나리오를 기반으로 자연스러운 음성 을 수집하기 위해 2-Channel 방식의 수집 시스템을 구 성하였다. 위 과정에서 시나리오의 설계 및 제작 단계에 서는 대화 유형의 특성을 반영하여 적용하였다. 시나리 오는 텔레뱅킹에서 사용되는 다양한 단어들과 언어 구 성물을 포함하도록 해야 한다.
전사과정은 수집된 대화음성에 세그먼트 규칙을 적용하여 발성 구간을 세그먼트로 구분하고 전사 규칙을 적 용해서 전사하였다. 위와 같은 방법으로 텔레뱅킹 영역 에서 대화코퍼스를 구축하고 대화음성 및 언어 자료를 생성하였다.
이렇게 구성된 구조화 된 문서는 기능별로 저장 및 색 인이 가능하고 문서 정보, 엘리먼트 정보, 깊이 정보와 구조적 관계에 대한 표현이 가능하며 이를 중심으로 대 화 음성 정보의 구조화된 문서 저장 시스템을 설계한다.
본 논문에서는 대화코퍼스의 주석 정보를 효과적으로 사용하기 위해 XML로 표준화하여 대화코퍼스를 구조 적 문서화하는 방법을 검토하고자 한다. 이를 위해 주석 정보의 추가 및 삭제 등의 확장 가능한 형태의 DTD를 설계하여 주석정보를 표준화하고 XML을 통한 구조적 문서의 웹 서비스가 가능하도록 설계한다.
셋째, 전사 시스템을 이용하여 대화음성을 전사한다. 이와 같은 절차로 수집되어진 대화음성 정보 및 언어 정보를 포함하는 대화코퍼스를 구축하고, 이상의 결과를 사용자가 손쉽게 활용하고 정보 검색에 이용할 수 있도록 XML DTD를 기반으로 하여 문서를 구조화한다.
세부 모듈로 구성된 구조적 문서는 D0M을 통해 트 리 형태로 구조화되어 DB에 저장한다. 저장된 구조적 문서는 Schema Extractor에서 질의를 통해 입력된 파 라미터 및 테이블 정보를 분석한다. 이를 통해 얻어진 노드별 색인 정보는 XML Repository에 전달되고 여기서 해당정보를 DB에 저장하게 된다.
전사과정은 수집된 대화음성에 세그먼트 규칙을 적용하여 발성 구간을 세그먼트로 구분하고 전사 규칙을 적 용해서 전사하였다. 위와 같은 방법으로 텔레뱅킹 영역 에서 대화코퍼스를 구축하고 대화음성 및 언어 자료를 생성하였다.
본 논문에서는 텔레뱅킹의 시나리오를 설계하여 제작 하였다. 제작된 시나리오를 기반으로 자연스러운 음성 을 수집하기 위해 2-Channel 방식의 수집 시스템을 구 성하였다. 위 과정에서 시나리오의 설계 및 제작 단계에 서는 대화 유형의 특성을 반영하여 적용하였다.
따라서 본 논문의 목적은 다음과 같다. 첫째, 텔레뱅킹영역에서 자연스러운 대화음성을 수집한다. 둘째, 전사규칙을 정의해서 대화음성의 전사 기준으로 적용한다.
대화코퍼스의 화자 정보와 주석 정보의 의미 태그는 TEKText Encoding Initiative) 와 LDC(Linguistic Data Consortium)의 기준을 기반으로 작성하였다[7]. 현재 구성된 DTD는 화자, 텍스트, 전사 등 3개의 정보만을 의미태그와 속성으로 분류하였다.

대상 데이터

대화음성의 자료 수집 환경은 잡음이 없는 방음 시설 을 갖춘 두 개의 부스를 이용하였다. 화자의 지나치게 크거나 작은 발성, 구강 노이즈, 어색한 발성 등은 관리 실에서 시스템 관리자가 통제를 했다.
구축된 전사 자료 는 시스템 발화 음성과 사용자 발화 음성을 전사해서 한 대화에서 7회 전사하였으며 이를 총 5회 반복 하였다. 따라서 35개의 전사파일을 생성하였다.
본 논문에서는 텔레뱅킹이라는 엄격한 영역 제한성 아래에서 코퍼스를 수집한다[3].

이론/모형

대화음성의 수집 작업을 수행하기 위한 시스템의 구 성이 필수적이다. 대화음성 수집 시스템은 2-Channel 방식을 사용했고 수집 시스템은 다음 그림 4와 같다.
주석 정보를 XML로 표기하기 위해서는 먼저 의미 태그를 선정하고 DTD를 정의해야 한다. 대화코퍼스의 화자 정보와 주석 정보의 의미 태그는 TEKText Encoding Initiative) 와 LDC(Linguistic Data Consortium)의 기준을 기반으로 작성하였다[7]. 현재 구성된 DTD는 화자, 텍스트, 전사 등 3개의 정보만을 의미태그와 속성으로 분류하였다.

후속연구

향후 연구 과제로는 저장시스템의 구축을 통한 검색 이 가능한 웹서비스와 대화코퍼스에 나타나는 특성 및 레이블링 정보의 확대뿐만 아니라 효율적으로 이용할 수 있는 응용 프로그램에도 적용할 수 있도록 해야 할 것이다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

대화형 코퍼스의 설계 및 구조적 문서화에 관한 연구
A Study in Design and Construction of Structured Documents for Dialogue Corpus 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

후속연구

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

대화형 코퍼스의 설계 및 구조적 문서화에 관한 연구 A Study in Design and Construction of Structured Documents for Dialogue Corpus 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

후속연구

이 논문을 인용한 문헌

저자의 다른 논문 :

남명우 (16) 양옥렬 (8)

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

대화형 코퍼스의 설계 및 구조적 문서화에 관한 연구
A Study in Design and Construction of Structured Documents for Dialogue Corpus 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper