본 논문은 음절 발화 속도와 한국어 유창성의 관계를 분석하고, 나아가 음절 발화 속도의 한국어능력시험(TOPIK) 말하기 평가 구인으로서의 가치와 말하기 자동 평가의 실현 가능성을 제고하고자 하였다. 이를 위해 시중에 출시된 음성인식 기술에 기반을 둔 자동 전사 도구를 활용하여 TOPIK 모의시험에서 수합된 음성 파일을 자동 전사했고 동일한 음성 파일에 대한 한국어 모어 화자의 전사 결과와의 비교·대조분석을 수행하였으며, 이를 통해 얻은 결론은 다음과 같다. 연구가 수행된 2018년을 기준으로 음성인식 기술은 상당히 발달해 있어 음절 수 측정 등의 도구로 활용되기에 부족함이 없었으며, 필자가 직접 전사한 것과 비교했을 때 음절 수의 차이가 크게 나타나지 않았다. 덧붙여 필자 전사본과 자동전사본에 대한 문서 ...
본 논문은 음절 발화 속도와 한국어 유창성의 관계를 분석하고, 나아가 음절 발화 속도의 한국어능력시험(TOPIK) 말하기 평가 구인으로서의 가치와 말하기 자동 평가의 실현 가능성을 제고하고자 하였다. 이를 위해 시중에 출시된 음성인식 기술에 기반을 둔 자동 전사 도구를 활용하여 TOPIK 모의시험에서 수합된 음성 파일을 자동 전사했고 동일한 음성 파일에 대한 한국어 모어 화자의 전사 결과와의 비교·대조분석을 수행하였으며, 이를 통해 얻은 결론은 다음과 같다. 연구가 수행된 2018년을 기준으로 음성인식 기술은 상당히 발달해 있어 음절 수 측정 등의 도구로 활용되기에 부족함이 없었으며, 필자가 직접 전사한 것과 비교했을 때 음절 수의 차이가 크게 나타나지 않았다. 덧붙여 필자 전사본과 자동전사본에 대한 문서 유사도 측정을 통해 음절 수뿐만 아니라 내용상으로도 유의미한 수준의 유사도가 도출되었다. 나아가 두 전사본 간에 나타난 차이점을 분석함으로써 전사과정에서 한국어 모어 화자의 직관이 개입될 수 있는 부분, 외국인 한국어 학습자 응답자의 발화 오류, 그리고 자동 전사에서 나타나는 오류의 유형을 단계적으로 분석하여 자동 전사 도구의 신뢰도를 질적으로 검증하였다. 자동 전사 도구의 신뢰도를 양적·질적으로 검증한 후, 숙련된 평가자를 통해 평가된 한국어 말하기 숙달도와 자동 전사 도구를 통해 도출된 음절 수를 대상으로 회귀분석을 수행해 한국어 말하기 숙달도와 발화 속도 간에 정비례 관계가 존재함을 밝혀냈다. 나아가 말하기 과제의 난이도와 발화 속도 간의 관계를 분석해 과제의 난이도와 평균 발화 속도 사이에 반비례 관계가 나타난다는 것도 확인했다. 이와 같은 작업을 통해 결론적으로 발화 속도가 한국어 말하기 평가의 평가 구인으로 활용될 수 있다는 것을 검증하였으며, 나아가 자동 전사 도구가 한국어 자동 평가 도구로서 유효하다는 것을 확인하였다. 본고는 현재까지 개발된 음성인식 및 자동 전사 모듈 중 하나만을 분석한 것으로, 모든 음성인식 모듈을 도구로 활용했을 시 같은 결과가 도출되지 않을 우려가 있다. 필자가 직접 전사한 결과가 필자 이외의 한국어 모어 화자의 직관을 통해 검증되지 않아 객관성을 획득하지 못했다는 한계를 지닌다. 이와 같은 일반화 가능성의 한계에도 불구하고 본고는 음성인식 도구를 활용한 한국어교육 연구가 부족한 상황에서 평가 구인 및 말하기 평가의 자동화, 그리고 수업 도구 개발 연구에 참고가 될 수 있는 자료가 된다는 점에서 의의를 지닌다.
본 논문은 음절 발화 속도와 한국어 유창성의 관계를 분석하고, 나아가 음절 발화 속도의 한국어능력시험(TOPIK) 말하기 평가 구인으로서의 가치와 말하기 자동 평가의 실현 가능성을 제고하고자 하였다. 이를 위해 시중에 출시된 음성인식 기술에 기반을 둔 자동 전사 도구를 활용하여 TOPIK 모의시험에서 수합된 음성 파일을 자동 전사했고 동일한 음성 파일에 대한 한국어 모어 화자의 전사 결과와의 비교·대조분석을 수행하였으며, 이를 통해 얻은 결론은 다음과 같다. 연구가 수행된 2018년을 기준으로 음성인식 기술은 상당히 발달해 있어 음절 수 측정 등의 도구로 활용되기에 부족함이 없었으며, 필자가 직접 전사한 것과 비교했을 때 음절 수의 차이가 크게 나타나지 않았다. 덧붙여 필자 전사본과 자동전사본에 대한 문서 유사도 측정을 통해 음절 수뿐만 아니라 내용상으로도 유의미한 수준의 유사도가 도출되었다. 나아가 두 전사본 간에 나타난 차이점을 분석함으로써 전사과정에서 한국어 모어 화자의 직관이 개입될 수 있는 부분, 외국인 한국어 학습자 응답자의 발화 오류, 그리고 자동 전사에서 나타나는 오류의 유형을 단계적으로 분석하여 자동 전사 도구의 신뢰도를 질적으로 검증하였다. 자동 전사 도구의 신뢰도를 양적·질적으로 검증한 후, 숙련된 평가자를 통해 평가된 한국어 말하기 숙달도와 자동 전사 도구를 통해 도출된 음절 수를 대상으로 회귀분석을 수행해 한국어 말하기 숙달도와 발화 속도 간에 정비례 관계가 존재함을 밝혀냈다. 나아가 말하기 과제의 난이도와 발화 속도 간의 관계를 분석해 과제의 난이도와 평균 발화 속도 사이에 반비례 관계가 나타난다는 것도 확인했다. 이와 같은 작업을 통해 결론적으로 발화 속도가 한국어 말하기 평가의 평가 구인으로 활용될 수 있다는 것을 검증하였으며, 나아가 자동 전사 도구가 한국어 자동 평가 도구로서 유효하다는 것을 확인하였다. 본고는 현재까지 개발된 음성인식 및 자동 전사 모듈 중 하나만을 분석한 것으로, 모든 음성인식 모듈을 도구로 활용했을 시 같은 결과가 도출되지 않을 우려가 있다. 필자가 직접 전사한 결과가 필자 이외의 한국어 모어 화자의 직관을 통해 검증되지 않아 객관성을 획득하지 못했다는 한계를 지닌다. 이와 같은 일반화 가능성의 한계에도 불구하고 본고는 음성인식 도구를 활용한 한국어교육 연구가 부족한 상황에서 평가 구인 및 말하기 평가의 자동화, 그리고 수업 도구 개발 연구에 참고가 될 수 있는 자료가 된다는 점에서 의의를 지닌다.
This study analyzes the relationship between syllable utterance speed and Korean fluency to improve the value and realization possibility of syllable utterance speed as a test construct in Korean language ability. For this purpose, 679 audio files were collected from a TOPIK (Test of Proficiency in ...
This study analyzes the relationship between syllable utterance speed and Korean fluency to improve the value and realization possibility of syllable utterance speed as a test construct in Korean language ability. For this purpose, 679 audio files were collected from a TOPIK (Test of Proficiency in Korean) simulation tests and transcribed using an automatic transcription tool for speech recognition, which is available on the market, to compare and contrast it to a Korean native speaker, whose audio file was also transcribed. The following conclusions can be drawn. Since 2018, when this research was being conducted, major technological advances in speech recognition made it possible to be utilized as a tool for syllable number measurement and other features that there were few syllable number differences between the automatic transcription and transcription of a Korean native speaker. In addition, the degree of similarity was found not only in the number of syllables but also in the content of the text, which measured the document similarity between auto-manual transcriptions. Furthermore, by analyzing the differences between the two versions of the transcription, this study analyzes the types of errors that frequently occur in the automatic transcription. Through this process, the reliability of the automatic transcription tool was qualitatively verified. Through quantitative and qualitative analysis of the data, it reveals the correlation between the oral proficiency in Korean evaluated by skilled evaluators and the number of syllables derived from the automatic transcription to offer proof that it exists. In sum, this research verifies that assessing speech rate can be used as an evaluation criterion for the Korean oral proficiency test. For this study, only one of the speech recognition and automatic transcription modules that have been developed so far is analyzed. As a result, the conclusions of this study should not be over-normalized. In addition, the transcription of the Korean native speaker has been validated through the intuition of the author, and thus the objectivity should be taken into consideration. In spite of the limitation of generalization, this study is important because it shows how data can be utilized as a reference for the oral proficiency test as well as show new possibilities for teaching tool development projects using speech recognition tool.
This study analyzes the relationship between syllable utterance speed and Korean fluency to improve the value and realization possibility of syllable utterance speed as a test construct in Korean language ability. For this purpose, 679 audio files were collected from a TOPIK (Test of Proficiency in Korean) simulation tests and transcribed using an automatic transcription tool for speech recognition, which is available on the market, to compare and contrast it to a Korean native speaker, whose audio file was also transcribed. The following conclusions can be drawn. Since 2018, when this research was being conducted, major technological advances in speech recognition made it possible to be utilized as a tool for syllable number measurement and other features that there were few syllable number differences between the automatic transcription and transcription of a Korean native speaker. In addition, the degree of similarity was found not only in the number of syllables but also in the content of the text, which measured the document similarity between auto-manual transcriptions. Furthermore, by analyzing the differences between the two versions of the transcription, this study analyzes the types of errors that frequently occur in the automatic transcription. Through this process, the reliability of the automatic transcription tool was qualitatively verified. Through quantitative and qualitative analysis of the data, it reveals the correlation between the oral proficiency in Korean evaluated by skilled evaluators and the number of syllables derived from the automatic transcription to offer proof that it exists. In sum, this research verifies that assessing speech rate can be used as an evaluation criterion for the Korean oral proficiency test. For this study, only one of the speech recognition and automatic transcription modules that have been developed so far is analyzed. As a result, the conclusions of this study should not be over-normalized. In addition, the transcription of the Korean native speaker has been validated through the intuition of the author, and thus the objectivity should be taken into consideration. In spite of the limitation of generalization, this study is important because it shows how data can be utilized as a reference for the oral proficiency test as well as show new possibilities for teaching tool development projects using speech recognition tool.
주제어
#한국어능력시험 구어 유창성 말하기 평가 음성인식 자동 전사 자동 채점 발화 속도 문항 난이도 문서 유사도 학습자 말뭉치 Test Of Proficiency In Korean(TOPIK) oral fluency spoken language evaluation speech recognition automatic transcription automatic grading speech rate task difficulty document similarity learners corpus
학위논문 정보
저자
유종혁
학위수여기관
연세대학교 대학원
학위구분
국내석사
학과
국어국문학과
지도교수
원미진
발행연도
2019
총페이지
vii, 78장
키워드
한국어능력시험 구어 유창성 말하기 평가 음성인식 자동 전사 자동 채점 발화 속도 문항 난이도 문서 유사도 학습자 말뭉치 Test Of Proficiency In Korean(TOPIK) oral fluency spoken language evaluation speech recognition automatic transcription automatic grading speech rate task difficulty document similarity learners corpus
※ AI-Helper는 부적절한 답변을 할 수 있습니다.