TV홈쇼핑을 통한 상품 구매 과정에서, 전화망을 통한 배송지 정보의 확보는 필수적인 과정이며 동시에, 서비스 운영 효율을 높이기 위한 주요한 자동화 적용 대상 과정이다. 본 연구는 음성으로 기록된 배송지 정보를 자동으로 인식 및 검증하려는 방법을 제안한다. 본 제안 방법은 음성 기반의 주소 정보를 처리하는 데 필요한 다음의 세 가지 기능을 포함한다. 첫 번째 기능은 한글 발화문으로 부터 원래 주소의 표기 형태로 올바르게 변환하는 것이고, 두 번째 기능은 음성 녹취 과정에서 주소의 구성 요소별 순서 변화 혹은 동일 구성 요소의 중복 발화 같은 주소 잡음을 처리하는 것이며, 마지막 기능은 띄어쓰기 처리를 통한 최종 주소의 가독성을 보장할 수 있는 기능이다. 제안된 방법을 구현하기 위해 우정사업본부 주소 DB와 행정안전부의 주소 DB를 사용하였으며, 통화에서 획득한 주소 발화로부터 도로명 주소를 도출하고, 도출된 주소의 유효성을 검증하였다. 또한 제안 방법의 구현 결과물은 STT를 통한 발화 인식 결과뿐만 아니라, 키보드를 이용한 표준 입출력으로도 입력 채널을 확장하여, 주소 검증이 필요한 비음성 기반의 서비스에서도 활용될 수 있도록 하였다. 제안 방법은 주소 구성 요소의 위치 변화 잡음에 강건하게 동작했지만, 요소 생략의 경우 오작동 경향이 존재했다. 이는 생략된 요소에 의해 하위 요소의 지역을 명시하지 못하는 경우 처리하지 못한 모호함 때문이었다.
TV홈쇼핑을 통한 상품 구매 과정에서, 전화망을 통한 배송지 정보의 확보는 필수적인 과정이며 동시에, 서비스 운영 효율을 높이기 위한 주요한 자동화 적용 대상 과정이다. 본 연구는 음성으로 기록된 배송지 정보를 자동으로 인식 및 검증하려는 방법을 제안한다. 본 제안 방법은 음성 기반의 주소 정보를 처리하는 데 필요한 다음의 세 가지 기능을 포함한다. 첫 번째 기능은 한글 발화문으로 부터 원래 주소의 표기 형태로 올바르게 변환하는 것이고, 두 번째 기능은 음성 녹취 과정에서 주소의 구성 요소별 순서 변화 혹은 동일 구성 요소의 중복 발화 같은 주소 잡음을 처리하는 것이며, 마지막 기능은 띄어쓰기 처리를 통한 최종 주소의 가독성을 보장할 수 있는 기능이다. 제안된 방법을 구현하기 위해 우정사업본부 주소 DB와 행정안전부의 주소 DB를 사용하였으며, 통화에서 획득한 주소 발화로부터 도로명 주소를 도출하고, 도출된 주소의 유효성을 검증하였다. 또한 제안 방법의 구현 결과물은 STT를 통한 발화 인식 결과뿐만 아니라, 키보드를 이용한 표준 입출력으로도 입력 채널을 확장하여, 주소 검증이 필요한 비음성 기반의 서비스에서도 활용될 수 있도록 하였다. 제안 방법은 주소 구성 요소의 위치 변화 잡음에 강건하게 동작했지만, 요소 생략의 경우 오작동 경향이 존재했다. 이는 생략된 요소에 의해 하위 요소의 지역을 명시하지 못하는 경우 처리하지 못한 모호함 때문이었다.
Obtaining delivery addresses from calls is one of the most important processes in TV home shopping business. By automating this process, the operational efficiency of TV home shopping can be increased. In this paper, a method of recognizing and validating road name address, which is the address syst...
Obtaining delivery addresses from calls is one of the most important processes in TV home shopping business. By automating this process, the operational efficiency of TV home shopping can be increased. In this paper, a method of recognizing and validating road name address, which is the address system of South Korea, from speech oriented text is proposed. The speech oriented text has three challenges. The first is that the numbers are represented in the form of pronunciation. The second is that the recorded address has noises that are made from repeated pronunciation of the same address, or unordered address. The third is that the readability of the resulted address. For resolving these problems, the proposed method enhances the existing address databases provided by the Korea Post and Ministry of the Interior and Safety. Various types of pronouncing address are added, and heuristic rules for dividing ambiguous pronunciations are employed. And the processed address is validated by checking the existence in the official address database. Even though, this proposed method is for the STT result of the address pronunciation, this also can be used for any 3rd party services that need to validate road name address. The proposed method works robustly on noises such as positions change or omission of elements.
Obtaining delivery addresses from calls is one of the most important processes in TV home shopping business. By automating this process, the operational efficiency of TV home shopping can be increased. In this paper, a method of recognizing and validating road name address, which is the address system of South Korea, from speech oriented text is proposed. The speech oriented text has three challenges. The first is that the numbers are represented in the form of pronunciation. The second is that the recorded address has noises that are made from repeated pronunciation of the same address, or unordered address. The third is that the readability of the resulted address. For resolving these problems, the proposed method enhances the existing address databases provided by the Korea Post and Ministry of the Interior and Safety. Various types of pronouncing address are added, and heuristic rules for dividing ambiguous pronunciations are employed. And the processed address is validated by checking the existence in the official address database. Even though, this proposed method is for the STT result of the address pronunciation, this also can be used for any 3rd party services that need to validate road name address. The proposed method works robustly on noises such as positions change or omission of elements.
TV홈쇼핑은 TV 방송을 통해 제품소개를 받은 고객이 전화망을 통해 구매 의사를 전달하고, 결제정보와 배송지 정보를 등록하면, 이후 상담사가 해당 정보를 확인 후, 해피콜을 통해 구매를 확정하는 과정으로 이루어진다. 본 제안 방법은 기존의 전화망을 통해 등록한 고객의 음성 정보를 판매 관리 시스템에 수작업으로 등록하는 과정의 효율을 높이려는 요구에 맞춰 배송지 정보를 자동으로 검증하기 위한 기능 개발을 목표로 한다.
녹취된 주소 정보 전사와 그 주소 정보의 검증 과정을 자동화할 수 있다면, TV홈쇼핑의 업무 효율을 획기적으로 높일 수 있다. 이를 위해 본 연구에서는 음성으로 저장된 고객의 배송지 정보를 분석하여, 주소 구조에 따른 태깅 작업을 수행하기 위한 알고리즘의 개발 및 그 구현을 목표로 한다.
가설 설정
녹취된 고객의 배송지 정보를 검증하기 위해, STT를 통한 텍스트 변환이 우선 수행되는 것을 가정하며, 이는 동시에, 제안 방법의 입력이 STT의 결과가 아닌, 키보드 등을 통한 표준 입력장치를 통해 획득된 텍스트 입력도 가능하다. 하지만, 본 제안 방법은 음성 기반의 주소 정보를 STT를 통해 변환하여 검증하는 것을 기본 목표로 하고 있기에, STT 결과의 제약 요소를 처리하는 것을 주요 기능으로 한다.
제안 방법
본 구현은 Java 13을 기준으로 개발되었고, 행정안전부의 주소 검색 솔루션의 PC용 주소 검색기를 사용해 주소 목록 및 우편번호 검색을 위해 사용하고, 건물 목록을 검색하기 위해, 동일 주소 DB를 이용한 Django 기반의 RESTful 서비스를 구현하였다. 주소 발화 결과의 한글 표현을 숫자로 변화시키기 위해서는 우정사업본부의 주소 DB를 토대로, Sqlite를 이용해, 내부 데이터베이스로 변경 및 확장하여 사용하였다.
상세주소를 확인하기 위해서는 동/층/호 정보를 먼저 추출하고, 추출된 정보를 제외한 나머지 정보를 건물명으로 가정한 뒤, 건물 번호를 제외한 도로명 주소를 바탕으로, 해당 지역의 건물 목록을 얻어온 뒤, 얻어온 건물 목록과 상세주소에서 추출한 건물 이름을 비교하여, 동일 이름의 존재 여부를 확인한다. 건물 이름이 일치한다면, 건물 번호를 확인하고, 해당 주소의 지번과 우편번호를 확정한다.
녹취된 고객의 배송지 정보를 검증하기 위해, STT를 통한 텍스트 변환이 우선 수행되는 것을 가정하며, 이는 동시에, 제안 방법의 입력이 STT의 결과가 아닌, 키보드 등을 통한 표준 입력장치를 통해 획득된 텍스트 입력도 가능하다. 하지만, 본 제안 방법은 음성 기반의 주소 정보를 STT를 통해 변환하여 검증하는 것을 기본 목표로 하고 있기에, STT 결과의 제약 요소를 처리하는 것을 주요 기능으로 한다.
대상 데이터
STT 모듈을 통해 획득된 주소 정보는 AddressManager에 의해서, <시도, 시군구, 구, 읍면, 도로명, 상세주소>로 분리되고 검증된다. AddressManager는 주소 검증을 위해서, 실제 유효 주소 목록을 검색하기 위한 Address Searcher와 해당 지역 내 건물 이름을 검색하기 위한 Building Na me Searcher를 참조하고, 주소 데이터베이스는 우정사업본부의 주소 DB와 행정안전부의 주소 데이터베이스를 사용하였다.
본 제안 방법의 성능 검증을 위해 다음과 같은 테스트를 수행하였다. 우선, 우정사업부 주소 데이터베이스에서 무작위로 200개의 도로명 주소를 선정하였다. 각 주소는 <시도, 시군구, 구, 읍면, [도로명, 건물번호], 상세주소>의 개별 요소로 분리된 뒤, 상세주소의 위치를 제외한 다른 요소의 순서를 무작위로 섞었다.
본 구현은 Java 13을 기준으로 개발되었고, 행정안전부의 주소 검색 솔루션의 PC용 주소 검색기를 사용해 주소 목록 및 우편번호 검색을 위해 사용하고, 건물 목록을 검색하기 위해, 동일 주소 DB를 이용한 Django 기반의 RESTful 서비스를 구현하였다. 주소 발화 결과의 한글 표현을 숫자로 변화시키기 위해서는 우정사업본부의 주소 DB를 토대로, Sqlite를 이용해, 내부 데이터베이스로 변경 및 확장하여 사용하였다.
데이터처리
이를 위한 전화망 연결 솔루션은 ㈜ CNAI의 컨택센터 솔루션 중 실시간 음성 통화 인식 모듈인 NACS와 C&ASR을 이용하였다.
이상의 과정을 통해 생성된 테스트 데이터에 대해서, 본 제안 방법과 CNAI의 기존 주소 변환 어플리케이션의 결과를 비교하였다. 테스트 결과는 다음과 같다.
성능/효과
테스트 결과는 다음과 같다. 제안 방법은 정형 주소에 대해서는 올바르게 동작하였고, 구성 요소의 위치가 바뀐 경우에도 올바르게 동작하였지만, 어느 요소가 변경되었는지에 따라 동작 시간이 2~4배가 추가로 소요되었다. 이는 해당 노이즈 패턴을 해결하기 위해 사용된 요소 검증 방식이, 정형 순서를 따라갈 때에 비해, 하위 요소를 먼저 검색한 뒤, 상위 요소를 판단하는 과정의 검색 복잡도가 높기 때문이었다.
하지만, 실제 환경에서 도로명과 건물번호가 분리되어 섞이는 경우는 확인되지 않았으며, 상세주소는 항상 주소의 끝부분에 위치하는 것으로 확인되었기에, 테스트 노이즈를 추가하는 과정에서 이런 노이즈는 재현하지 않았다. 최종적으로, 100개의 정형 주소, 50개의 구성 요소의 위치가 변경된 주소, 그리고 50개의 요소가 무작위로 생략된 주소를 대상으로 STT 결과를 생성하였다. STT 변환 과정에서의 인식 오류는 수작업으로 수정을 하였으며, STT 변환 결과의 오류는 가정하지 않았다.
후속연구
TV홈쇼핑 분야에서, 전화망을 통해 구매를 원하는 고객의 요구에 빠르게 대응하는 것은 매출을 결정짓는 중요한 요소들 중에 하나다. 1995년 첫 서비스가 시작된 이후, 주문에 소요되는 시간을 줄이기 위한 다양한 노력들 이 진행되어 왔고, 현재는 해당 상품의 방송 중 빠르게 주문을 수집하고, 방송 후 주문 정보를 일괄 처리하는 흐름으로 안착되었으나, 주문과 해피콜(주문이 완료되었음을 확인하기 위한 후 처리 보고 전화) 사이의 대기 시간을 줄일 수 있다면, 고객 만족도 향상뿐만 아니라, 업무 효율의 증대를 기대할 수 있다. 특히, 배송 주소 검증은 인적 자원을 많이 요구하는 업무인 만큼, 자동화를 통한 업무 효율을 높일 수 있는 주요 분야이다.
이러한 발화 자동처리 기술은 특정 단어를 분석하여 그 단어의 빈도수를 파악하는 분야에도 활용 되어 질 수 있는데, 이는 문장 내에 사용된 지시대명사의 사용 빈도 파악과 같은 고령자의 인지 저하와 관련된 지표를 측정하는 응용으로도 적용이 가능하다. 또한, 입력 채널을 전화망에서 분리하여 키보드 등의 표준 입출력과 연결하여 동작할 수 있으며, 해당 기술은 고령자의 인지 중 기억력을 평가하기 위한 질문 중 하나인 거주지 주소에 대한 고령자의 발화를 분석하고 간접적으로 고령자의 인지를 검사하는 응용과 같이 주소 검증이 필요한 다양한 분야에 적용되어 활용 가능하다.
특히, 배송 주소 검증은 인적 자원을 많이 요구하는 업무인 만큼, 자동화를 통한 업무 효율을 높일 수 있는 주요 분야이다. 본 제안 방법은 일괄 처리 및 실시간 처리 과정 모두에서, 고객의 배송지 발화를 자동으로 처리해 줄 수 있기 때문에, TV홈쇼핑 업무의 효율을 높이기 위한 주요 수단으로 활용될 수 있다. 이러한 발화 자동처리 기술은 특정 단어를 분석하여 그 단어의 빈도수를 파악하는 분야에도 활용 되어 질 수 있는데, 이는 문장 내에 사용된 지시대명사의 사용 빈도 파악과 같은 고령자의 인지 저하와 관련된 지표를 측정하는 응용으로도 적용이 가능하다.
본 제안 방법은 일괄 처리 및 실시간 처리 과정 모두에서, 고객의 배송지 발화를 자동으로 처리해 줄 수 있기 때문에, TV홈쇼핑 업무의 효율을 높이기 위한 주요 수단으로 활용될 수 있다. 이러한 발화 자동처리 기술은 특정 단어를 분석하여 그 단어의 빈도수를 파악하는 분야에도 활용 되어 질 수 있는데, 이는 문장 내에 사용된 지시대명사의 사용 빈도 파악과 같은 고령자의 인지 저하와 관련된 지표를 측정하는 응용으로도 적용이 가능하다. 또한, 입력 채널을 전화망에서 분리하여 키보드 등의 표준 입출력과 연결하여 동작할 수 있으며, 해당 기술은 고령자의 인지 중 기억력을 평가하기 위한 질문 중 하나인 거주지 주소에 대한 고령자의 발화를 분석하고 간접적으로 고령자의 인지를 검사하는 응용과 같이 주소 검증이 필요한 다양한 분야에 적용되어 활용 가능하다.
참고문헌 (8)
S. Gwak, J. Lee, and E. Choi. "Forecast and Present Condition of Domestic TV Homeshopping Industry market" Journal of The Korean Data Analysis Society, vol. 20, no. 3, pp. 1369-1380, 2018. https://doi.org/10.37727/jkdas.2018.20.3.1369
J. Oak, and M. Cho. "Challenges for Settlement of Road Name Address". issues & tests, (241), pp. 1-26, August 2016. https://www.gri.re.kr/%ec%9d%b4%ec%8a%88-%ec%a7%84%eb%8b%a8/?brno5719&prno5182
D. KIM, D. S. Yoon, J. W. Kim and J. S. Park, "Postal automated sorting technology for Letter based on new Postcode scheme", Electronics and Telecommunications Trends., vol. 30, no. 5, pp. 89-98, October 2015. http://doi.org/10.22648/ETRI.2015.J.300510
A. Brakensiek and R. Gerhard. "Handwritten address recognition using hidden Markov models." Reading and Learning. Springer, Berlin, Heidelberg, pp. 103-122. 2004. https://doi.org/10.1007/978-3-540-24642-8_7
A. Singh, A. Sangwan and J. Hansen. "Improved parcel sorting by combining automatic speech and character recognition". In 2012 IEEE International Conference on Emerging Signal Processing Applications. pp. 52-55, 2012. https://doi.org/10.1109/ESPA.2012.6152444
E. Yaman and K. Krdzalic-Koric. "Address Entities Extraction using Named Entity Recognition." In 2019 7th International Conference on Future Internet of Things and Cloud Workshops. IEEE, pp. 13-17, 2019. https://doi.org/10.1109/FiCloudW.2019.00016
HG. Kim, and HS. Kim, "Effective Integration of Automatic Word Spacing and Morphological Analysis in Korean". In 2020 IEEE International Conference on Big Data and Smart Computing, pp. 275-278. February 2020. https://doi.org/10.1109/BigComp48618.2020.00-62
H. Song, and S. Park, "Korean Part-of-speech Tagging Based on Morpheme Generation". ACM Transactions on Asian and Low-Resource Language Information Processing, vol. 19, no. 3, pp. 1-10. 2020. https://doi.org/10.1145/3373608
※ AI-Helper는 부적절한 답변을 할 수 있습니다.