$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

CosmoScriBe 2.0: 한국어 전사 도구의 개발
CosmoScriBe 2.0 : The development of Korean transcription tools 원문보기

한국지능시스템학회 논문지 = Journal of Korean institute of intelligent systems, v.24 no.3, 2014년, pp.323 - 329  

곽선동 (서경대학교 전자컴퓨터공학과) ,  장문수 (서경대학교 컴퓨터과학과)

초록
AI-Helper 아이콘AI-Helper

구어 연구에서는 음성 데이터를 문자로 옮기는 전사(Transcription)라는 과정이 필요하다. 전사 작업을 보조하는 프로그램을 전사도구라고 하는데, 발화 내용을 비롯하여, 발화 시간, 화자 정보 등의 많은 정보를 기록하는 다양한 기능을 제공한다. 이로 인하여 컴퓨터 사용에 익숙하지 않은 사용자는 숙지하는데 어려움이 있다. 또한 전사 도구는 국내에서 개발된 것이 거의 없어서 한국어 환경에 적합하지 않는 경우가 많다. 본 논문에서는 효율적인 한국어 전사를 지원하면서 비숙련자도 도구를 쉽고 빠르게 적응할 수 있는 전사 도구를 제안한다. 이를 위해 비숙련자를 위한 사용자 친화적인 인터페이스 환경을 제공한다. 또한 전사 과정에서 발생할 수 있는 실수를 최소화하기 위해 전사 지원 기능을 제공한다. 마지막으로 데이터 신뢰성을 위한 시스템 구조를 제공한다. 제안하는 도구에 대해 전사 경험의 유무에 따라 사용성 평가를 하였으며, 평가결과는 전체적으로 전사 속도 향상 및 전사 지원 기능이 편리한 것으로 나타났다.

Abstract AI-Helper 아이콘AI-Helper

In spoken language research, transcription process needs to be carried out to translate voice data into text. Transcription tool, support program of transcription, offers various information such as content and time of utterance and speaker information. For this reason, inexperienced computer users ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 한글을 지원하고, 사용자가 쉽게 접할 수 있는 인터페이스를 제안하여 도구에 익숙해지는 시간을 최소화하고자 한다. 그리고 전사 작업에 유용한 텍스트 자동 완성, 헤더 자동완성 등의 전사 작업 지원 기능을 도입하여 편리한 전사 환경을 제공하고자 한다. 또한 자동 저장 및 마크업 데이터 구조를 제안하여 전사 과정에서의 데이터 보호와 구축된 데이터의 신뢰성을 향상시킨다.
  • 검토 작업을 위해 매번 데이터를 변환하는 것은 사용자에게 매우 번거로운 일이다. 본 논문에서는 검토 작업에 필요한 코퍼스 분석 기능을 전사도구에 포함시켜, 보다 편리하게 이차 전사 작업을 할 수 있게 한다. 그림 5는 코퍼스 분석 기능을 추가함으로써 간략해진 검토 작업을 순서도로 표현한 것이다.
  • 또한 저장된 데이터가 손상된 경우에 시스템에서 확인할 방법이 필요하다. 본 논문에서는 마크업 언어 형식의 데이터 구조를 사용하여 다양한 정보를 구조화하여 한 파일에 저장하고 저장된 데이터에서 태그 값을 이용해 오류가 있는 데이터인지 판단한다. 그림 9는 발화 정보의 일부를 마크업 언어 형식으로 표현한 데이터이다.
  • 최근의 문서 편집기는 자동 저장 기능이 포함되어 있어서 문서 작업 도중 비정상 종료가 일어나더라도 데이터를 보존할 수 있다. 본 논문에서는 문서편집기의 자동 저장과 유사한 기능을 구현하기 위하여 자동 저장 알고리즘을 개발한다.
  • 본 논문에서는 사용자가 쉽게 접할 수 있는 텍스트 박스 방식의 입력 인터페이스를 사용하여 보다 쉽게 도구에 적응할 수 있도록 한다. 그림 1는 제안하는 입력 인터페이스를 적용한 도구의 화면으로, 메모장이나 워드와 유사한 편집 기능이 구현되어 있다.
  • 작업하는 도중에 손이 키보드와 마우스를 번갈아 이동하게 되면 집중하는데 방해가 되어 작업 효율이 떨어지고 작업자의 피로감이 커지게 된다. 본 논문에서는 이것을 개선하기 위하여 전사 과정에서 주로 사용하는 미디어 제어 명령을 키보드 단축키로 구현하여 텍스트 인터페이스 상에서 미디어 제어가 가능하도록 한다. 표 1은 제안하는 미디어 제어 관련 단축키들을 나타낸다.
  • 본 논문에서는 이차 전사를 보조하는 코퍼스 분석 기능으로 다음과 같은 기능들을 제안한다.
  • 본 논문에서는 편리한 한국어 전사 도구를 개발하면서 비숙련자도 쉽게 사용할 수 있는 전사 도구의 개발을 제안하고 있다. 이를 위하여 본 논문에서는 전사 도구를 사용자 친화적인 인터페이스, 전사 작업 지원 기능, 안정적인 시스템 구조와 같은 세 가지 영역에서 특화시켰다.
  • 본 논문에서는 한글을 지원하고, 사용자가 쉽게 접할 수 있는 인터페이스를 제안하여 도구에 익숙해지는 시간을 최소화하고자 한다. 그리고 전사 작업에 유용한 텍스트 자동 완성, 헤더 자동완성 등의 전사 작업 지원 기능을 도입하여 편리한 전사 환경을 제공하고자 한다.
  • 본 논문은 비숙련자도 쉽게 적응할 수 있는 전사 도구를 제안하고 있다. 제안하는 시스템의 유용성 및 편리성을 검증하기 위하여 본 논문에서는 실제 전사 작업을 하는 작업자들을 대상으로 사용자 만족도 실험을 실시하였다.
  • 또한 작업이 완료된 후에도 검토 작업이 필요하다. 본 절에서는 헤더 마법사, 자동입력 기능, 코퍼스 분석 도구를 통해 실수를 최소화하고 검토 작업을 간편하게 하는 전사 작업 지원 기능을 제안한다.
  • 본 논문에서 정의하는 사용자에게 편리한 도구란 작업 효율을 향상시키는 다양한 기능들을 구비하고, 이 기능들이 직관적인 인터페이스로 표현되어 쉽고 빠르게 적응할 수 있는 도구를 의미한다. 전사 도구에서 편리한 도구를 개발하기 위해 본 논문에서는 UI(User Interface), 전사 지원 기능, 시스템 구조의 세 가지 측면에서 아이디어를 제안한다.
  • 본 논문은 비숙련자도 쉽게 적응할 수 있는 전사 도구를 제안하고 있다. 제안하는 시스템의 유용성 및 편리성을 검증하기 위하여 본 논문에서는 실제 전사 작업을 하는 작업자들을 대상으로 사용자 만족도 실험을 실시하였다. 실험에서는 21명의 작업자를 대상으로 하였으며, 전사 도구를 사용한 경험의 유무에 따라 두 그룹으로 나누어 실험을 실시하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
CosmoScriBe 1.0이 가진 특징은? CosmoScriBe 1.0은 한 화면에서 비디오, 오디오의 재생과 텍스트 입력이 가능하다는 특징이 있다. 비디오와 오디오의 싱크 조절 기능, 미디어 속도 조절, 구간 반복 기능 등 미디어 컨트롤의 편리성에 특화되어 있다.
전사란 무엇인가? 구어(spoken language)의 기본 데이터는 음성이지만, 분석을 위해서는 정보가 문자로 표현되어 있어야 한다. 따라서 구어자료로 수집한 음성 데이터를 문자로 옮기는 작업이 필요하다. 이 과정을 전사(Transcription)라고 한다.
EXMaRaLDA의 특징은 무엇인가? EXMaRaLDA는 티어 또는 발화자별 입력 기능이 제공된다. 음성 데이터 제어가 가능하고 전사에 필요한 다양한 기능들을 제공하고 있다. 특히 레이블링된 데이터의 분할, 통합이 가능하다. 한글은 정상적으로 저장은 되지만 도구에서 불러왔을 때 일부 컨트롤러에서 한글이 깨지는 현상이 있다. 이 도구는 다양한 기능을 제공하지만 인터페이스가 복잡하여 비숙련자가 사용하기에는 상당히 복잡한 구조로 되어 있다. Transcriber는 비교적 단순한 인터페이스를 사용하는 것이 특징이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (6)

  1. Hetherington, L. & McCandless, M. "SAPPHIRE: an extensible speech analysis and recognition tool based on Tcl/Tk," In Proceedings of ICSLP'96, pp. 1942-1945, 1996. 

  2. Claude Barras, Edouard Geoffrois, Zhibiao Wu, and Mark Liberman, "Transcriber: development and use of a tool for assisting speech corpora production," Speech Communication - Special issue on speech annotation and corpus tools, Vol. 33, No. 1-2, pp. 5-22, 2001. 

  3. Thomas Schmidt, "EXMARaLDA and the FOLK tools - two toolsets for transcribing and annotating spoken language," Proceedings of LREC, pp. 236-240, 2012. 

  4. Moon-Soo Chang, "Korean transcription support tools developed Ver.1.0", Proceedings of the 2nd KASA & KSHA joint conference, O-2, pp.32-34, 2011. 

  5. Brian MacWhinney, "The CHILDES Project - Tools for analyzing talk, Part 1: The CHAT Transcription Format,", Available: http://childes.psy.cmu.edu/manuals/CHAT.pdf, 2013, [Accessed: September 10, 2013]. 

  6. Kim nam-don, "A Study on devices of Korean grammar in premodern era through using both the corpus of new novels and Kamchaksae program," Korean language and literature, Vol. 143, pp.123-157, 2006. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로