[논문]임베디드 연산을 위한 잡음에서 음성추출 U-Net 설계

김현돈

doi:10.14372/iemek.2020.15.5.227

임베디드 연산을 위한 잡음에서 음성추출 U-Net 설계
Design of Speech Enhancement U-Net for Embedded Computing 원문보기

대한임베디드공학회논문지 = IEMEK Journal of embedded systems and applications, v.15 no.5, 2020년, pp.227 - 234

김현돈 (Korea Polytechnic)

Abstract ▼ AI-Helper

In this paper, we propose wav-U-Net to improve speech enhancement in heavy noisy environments, and it has implemented three principal techniques. First, as input data, we use 128 modified Mel-scale filter banks which can reduce computational burden instead of 512 frequency bins. Mel-scale aims to mimic the non-linear human ear perception of sound by being more discriminative at lower frequencies and less discriminative at higher frequencies. Therefore, Mel-scale is the suitable feature considering both performance and computing power because our proposed network focuses on speech signals. Second, we add a simple ResNet as pre-processing that helps our proposed network make estimated speech signals clear and suppress high-frequency noises. Finally, the proposed U-Net model shows significant performance regardless of the kinds of noise. Especially, despite using a single channel, we confirmed that it can well deal with non-stationary noises whose frequency properties are dynamically changed, and it is possible to estimate speech signals from noisy speech signals even in extremely noisy environments where noises are much lauder than speech (less than SNR 0dB). The performance on our proposed wav-U-Net was improved by about 200% on SDR and 460% on NSDR compared to the conventional Jansson's wav-U-Net. Also, it was confirmed that the processing time of out wav-U-Net with 128 modified Mel-scale filter banks was about 2.7 times faster than the common wav-U-Net with 512 frequency bins as input values.

주제어

표/그림 (10)

그림 그림 1. wav-U-Net 구조 Fig. 1 Structure of wav-U-Net
그림 그림 2. 전처리용 ResNet Fig. 2 Structure of pre-processing ResNet
그림 그림 3. 제안한 wav-U-Net 구조 Fig. 3 Structure of proposed wav-U-Net
표 표 1. 학습용 데이터셋 구성 Table 1. Contents of Training Dataset
그림 그림 4. 실내잡음 (진공청소기)에서 추정음성 파형 Fig. 4 Estimated speech plots on Indoor noise
표 표 2. 잡음제거 비교평가 결과 Table 2. The results of performance
표 표 3. 평가데이터 셋 잡음제거 수행 시간 Table 3. Total execution time for evaluation
그림 그림 5. 실외잡음 (사이렌)에서 추정음성 파형Fig. 5 Estimated speech plots on Outdoor noise
그림 그림 6. 음성잡음 (고양이)에서 음성추정 파형 Fig. 6 Estimated speech plots on Vocal noise
그림 그림 7. 음악잡음 (전자음악)에서 음성추정 파형 Fig. 7 Estimated speech plots on Music noise

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

이 논문에서는 임베디드 연산을 위해서 첫째로 저주파수에 주요 특징값을 보이는 음성신호 분리를 목적으로 128개 멜 스케일 (Mel-scale) 필터뱅크를 이용한 입력데이터의 주파수 영역 축소로 계산량을 감소시켰다 [7]. 실험결과 기존 512개 주파수 빈을 입력값으로 사용했을 때보다 약 2.
이 논문에서는 임베디드 연산을 위해서 첫째로 저주파수에 주요 특징값을 보이는 음성신호를 분리를 목적으로 선형 멜 스케일 (Mel-scale) 필터뱅크를 이용한 주파수 영역 축소로 계산량을 감소시켰다 [7]. 둘째로 잡음이 섞인 음성신호를 위한 전처리 과정으로 간단한 ResNet을 거치도록 설계하였다 [8].

제안 방법

4개로 분류된 잡음 데이터셋은 각각 음성 (Clean)과 잡음 (Noise)을 81,920초 분량으로 학습데이터 증가시켜 구축하였으며, 자세한 학습데이터 구성은 표 1과 같다.
이 논문에서는 임베디드 연산을 위해서 첫째로 저주파수에 주요 특징값을 보이는 음성신호를 분리를 목적으로 선형 멜 스케일 (Mel-scale) 필터뱅크를 이용한 주파수 영역 축소로 계산량을 감소시켰다 [7]. 둘째로 잡음이 섞인 음성신호를 위한 전처리 과정으로 간단한 ResNet을 거치도록 설계하였다 [8]. 따라서 wav-U-Net을 거치면서 최종 추정되는 음성신호가 명확해지고, 고주파 잡음을 억제하는 효과를 얻을 수 있다.
또한, 원래 음성신호와 비교하여 wav-U-Net을 통과하여 얼마나 잘 음성분리 추정이 되었는지 실내, 실외, 음성, 음악 4종류에 해당하는 대표 잡음을 선별하여 시간영역에서 음원 파평들을 비교하였다 (그림 4-7 참조). 특히, 선별된 혼합신호의 잡음의 크기는 원 음성보다 큰 (SNR 0dB 이하) 조건을 만족 하는 극심한 잡음이 섞인 음원을 분류하였다.
이 논문에서는 하나의 wav-U-Net을 이용하여 다양한 잡음에 대응하여 최적의 음성신호 추출성능을 내도록 학습데이터를 구성하여 학습하였다. 먼저 정체잡음은 실내잡음 (Indoor)과 실외잡음 (Outdoor) 2개로 나누고, 비정체잡음은 음성잡음 (Vocal)과 음악잡음 (Music) 2개로 추가로 나누어서 크게 잡음 카테고리 4개로 구분하여 선별하고 학습하였다.
따라서 wav-U-Net을 거치면서 추정되는 음성신호가 명확해지고 고주파 잡음을 억제하는 효과를 얻을 수 있다. 셋째로 잡음 특성에 따른 4가지의 DB (실내잡음, 실외잡음, 음성잡음, 음악잡음)를 분류하여 구축하였고, 이를 사용하여 신경망을 학습하였다. 따라서 단 채널임에도 불구하고 다양한 잡음환경에 대응이 가능할 뿐만 아니라, SNR 0dB 이하의 극심한 잡음 환경에서도 우수한 음성신호 분리 성능을 보여주었다.
따라서 wav-U-Net을 거치면서 최종 추정되는 음성신호가 명확해지고, 고주파 잡음을 억제하는 효과를 얻을 수 있다. 셋째로 잡음 특성에 따른 4가지의 DB를 사용하여 신경망을 학습하였다. 따라서 단 채널임에도 불구하고 다양한 잡음에 대응하고, SNR 0dB 이하의 극심한 노이즈 환경에서도 우수한 음성신호 분리 성능을 보여준다.
이 논문에서는 마스크를 통해서 추출된 신호를 역 주파수변환을 통해서 신호를 복원해야 하므로 복원 시 신호의 왜곡 (Distortion)이 일어나는 삼각형 (Triangular) 필터뱅크 대신 다음 수식과 같이 정방형 (Rectangular) 필터뱅크를 사용하면서 멜 주파수 스케일만 채용하였다.
이 논문에서는 하나의 wav-U-Net을 이용하여 다양한 잡음에 대응하여 최적의 음성신호 추출성능을 내도록 학습데이터를 구성하여 학습하였다. 먼저 정체잡음은 실내잡음 (Indoor)과 실외잡음 (Outdoor) 2개로 나누고, 비정체잡음은 음성잡음 (Vocal)과 음악잡음 (Music) 2개로 추가로 나누어서 크게 잡음 카테고리 4개로 구분하여 선별하고 학습하였다.
이 논문에서는 학습과 성능평가를 위해서 음원 (Clean)과 잡음 (Noise) 데이터셋을 임의로 섞어서 사용했기 때문에 E_interf = 0 및 E_artif = 0 이 되므로 SDR 지표를 사용해서 평가하였다.
또한, 원래 음성신호와 비교하여 wav-U-Net을 통과하여 얼마나 잘 음성분리 추정이 되었는지 실내, 실외, 음성, 음악 4종류에 해당하는 대표 잡음을 선별하여 시간영역에서 음원 파평들을 비교하였다 (그림 4-7 참조). 특히, 선별된 혼합신호의 잡음의 크기는 원 음성보다 큰 (SNR 0dB 이하) 조건을 만족 하는 극심한 잡음이 섞인 음원을 분류하였다.
평가는 3가지 알고리즘를 대상으로 잡음이 섞인 신호에서 음성 (Speech enhancement)을 추출하는 성능을 비교 평가하였다. 고전적인 단채널 잡음제거 알고리즘인 MMSE-STSA [3, 4], Jansson 등이 제안한 연주음과 노래소리 분리 wav-U-Net [5], 그리고 이 논문에서 제안한 다양한 잡음이 섞인 신호에서 음성신호를 추출하는 wav-U-Net에 대한 성능 비교평가를 하였다.

대상 데이터

학습용 데이터셋은 음악 잡음의 경우 DS100[11], CCmixer [12], MIR-1K [13] 데이터를 사용하였다. 그 외 잡음의 경우 Kaggle 웹사이트에서 ESC50, Urbansound8k, Cats and dogs, British birdsong, Snoring, Emergency vehicle siren, DEMAND 공개 데이터를 사용하였다. 잡음 학습을 위한 clean 음성데이터는 interspeech2020 Deep Noise Suppression Challenge를 위해 공개된 데이터를 사용하였다.
음성잡음은 동물 (개, 고양이, 돼지 등) 소리, 사람이 내는 잡음 (기침, 웃음소리, 코골이 등), 곤충과 새소리등 21개 잡음으로 구성되었다. 마지막으로 음악잡음은 260곡의 연주음을 사용하였다.
입력값은 제안된 멜 필터뱅크 변환을 거친 128개 행과 128프레임 열, 그리고 1차원 깊이의 3차원 형태이다. 입력값은 바로 U-Net에 제공되지 않고 사전 전처리로 그림 2와 같이 입력값을 출력값에 더해주는 간단한 ResNet을 거친 후 입력된다.
평가용 잡음은 Interspeech2020 Deep Noise Suppression Challenge 공개 데이터을 사용하였다[14]. 잡음 (Noise)은 65,303개 잡음 데이터셋에서 300개를 선택하였고, 음성 (Clean)은 1948명 음성 데이터셋에서 학습 (Training)용 1648화자를 제외한 300명분의 음성을 사용하였다. 최종 평가용 데이터셋은 선별된 잡음과 음성을 섞은 300개 음원을 생성하여 사용하였다.
그 외 잡음의 경우 Kaggle 웹사이트에서 ESC50, Urbansound8k, Cats and dogs, British birdsong, Snoring, Emergency vehicle siren, DEMAND 공개 데이터를 사용하였다. 잡음 학습을 위한 clean 음성데이터는 interspeech2020 Deep Noise Suppression Challenge를 위해 공개된 데이터를 사용하였다. 총 1,948명 화자 중 1648명을 학습 (Training)용으로 300명을 평가용 (Evaluation)으로 사용하였다 [14].
제안된 wav-U-Net을 위한 데이터는 16kHz 샘플링된 음원으로서, FFT 주파수변환을 위한 윈도우 (Window) 크기는 1024을 사용한다. 한번에 입력되는 데이터 조건은 윈도우 호핑 (Hopping) 크기 128, 프레임 크기 128을 가지고 있다.
제안한 입력 형태는 128개의 멜 필터 뱅크 (Mel filterbank)를 사용하여 512개의 주파수 빈 개수를 128개로 축소하여 연산효율을 높였다. 여기서는 사람의 음성신호 추출이 목적이므로 멜 필터 뱅크 사용에 의한 성능 하락은 미비하다.
잡음 학습을 위한 clean 음성데이터는 interspeech2020 Deep Noise Suppression Challenge를 위해 공개된 데이터를 사용하였다. 총 1,948명 화자 중 1648명을 학습 (Training)용으로 300명을 평가용 (Evaluation)으로 사용하였다 [14].
잡음 (Noise)은 65,303개 잡음 데이터셋에서 300개를 선택하였고, 음성 (Clean)은 1948명 음성 데이터셋에서 학습 (Training)용 1648화자를 제외한 300명분의 음성을 사용하였다. 최종 평가용 데이터셋은 선별된 잡음과 음성을 섞은 300개 음원을 생성하여 사용하였다.
평가용 잡음은 Interspeech2020 Deep Noise Suppression Challenge 공개 데이터을 사용하였다[14]. 잡음 (Noise)은 65,303개 잡음 데이터셋에서 300개를 선택하였고, 음성 (Clean)은 1948명 음성 데이터셋에서 학습 (Training)용 1648화자를 제외한 300명분의 음성을 사용하였다.
학습용 데이터셋은 음악 잡음의 경우 DS100[11], CCmixer [12], MIR-1K [13] 데이터를 사용하였다. 그 외 잡음의 경우 Kaggle 웹사이트에서 ESC50, Urbansound8k, Cats and dogs, British birdsong, Snoring, Emergency vehicle siren, DEMAND 공개 데이터를 사용하였다.

데이터처리

평가는 3가지 알고리즘를 대상으로 잡음이 섞인 신호에서 음성 (Speech enhancement)을 추출하는 성능을 비교 평가하였다. 고전적인 단채널 잡음제거 알고리즘인 MMSE-STSA [3, 4], Jansson 등이 제안한 연주음과 노래소리 분리 wav-U-Net [5], 그리고 이 논문에서 제안한 다양한 잡음이 섞인 신호에서 음성신호를 추출하는 wav-U-Net에 대한 성능 비교평가를 하였다. 또한, 본 논문에서 제안한 128개의 멜 스케일 필터뱅크를 사용하지 않고 일반적인 512 주파수 빈을 입력으로 동일한 조건으로 학습한 wav-U-Net과의 성능도 비교평가 하였다.
고전적인 단채널 잡음제거 알고리즘인 MMSE-STSA [3, 4], Jansson 등이 제안한 연주음과 노래소리 분리 wav-U-Net [5], 그리고 이 논문에서 제안한 다양한 잡음이 섞인 신호에서 음성신호를 추출하는 wav-U-Net에 대한 성능 비교평가를 하였다. 또한, 본 논문에서 제안한 128개의 멜 스케일 필터뱅크를 사용하지 않고 일반적인 512 주파수 빈을 입력으로 동일한 조건으로 학습한 wav-U-Net과의 성능도 비교평가 하였다. 평가 결과는 표 2와 같다.

이론/모형

또한 Jansson 등이 제안한 음악에서 연주음과 노래소리 분리용 wav-U-Net 모델을 평가할 때 사용된 Normalized SDR (NSDR)을 이용하여 추가로 평가하였으며 수식의 정의는 다음과 같다 [5].
마지막으로 성능 평가를 위한 MATLAB 코드는 공개용 BSS Eval toolkit을 사용하였다 [16].
성능평가 지수로는 Vincent 등에 의해 개발된 SNR (Source to Noise Ratio), SDR (Source to Distortion Ratio), SIR (Source to Interferences Ratio), SAR (Source to Artifacts Ratio)의 4가지 지표를 검토하였다 [15]. 이 측정지수는 음원분리 기법 (Sound Source Separation Method)를 평가할 때 널리 사용되는 지표들이다.
학습 (Training)에 사용되는 최적화 (Optimizer) 함수는 ADAM을, 손실 함수 (Loss function)는 MSE(Mean Squared Error)를 사용하였다. 또한, 정확한 학습의 척도를 검증 (Validation)하기 위한 검증 데이터셋의 비율은 전체 학습 데이터셋에서 20%를 할당하여 학습을 진행하였다.

성능/효과

반면에 우리가 제안한 wav-U-Net에서 분리 추정된 음성신호 파형 (그림 4의 하단)은 원 음성신호 파형과 비교하여 잘 추정한 것을 확인할 수 있다. 더욱이 128개 멜 스케일 주파수와 512개 주파수 빈과 비교했을 때 시간영역에서 음원분리 추정 파형의 차이는 미미함을 알 수 있다.
더욱이 300개의 평가용 데이터 셋에 대해서 전체 음원분리 실행시간을 비교하면 표 3과 같이 제안된 128개 멜 스케일 필터뱅크를 입력으로 사용한 wav-U-Net이 4배나 큰 512 주파수 빈 입력값을 사용한 것에 비해 약 2.7배 적었다. 실행조건은 라이젠 (Ryzen) 3200G, 램 16GB, SSD 저장장치에서 수행된 결과이다.
셋째로 잡음 특성에 따른 4가지의 DB (실내잡음, 실외잡음, 음성잡음, 음악잡음)를 분류하여 구축하였고, 이를 사용하여 신경망을 학습하였다. 따라서 단 채널임에도 불구하고 다양한 잡음환경에 대응이 가능할 뿐만 아니라, SNR 0dB 이하의 극심한 잡음 환경에서도 우수한 음성신호 분리 성능을 보여주었다.
2초 길이 단위로 처리가 된다 [5]. 따라서 본 논문에서 제안한 wav-U-Net이 훨씬 짧은 처리 시간 단위를 가지고 있으므로 임베디드 시스템에서 실시간 처리에 더 효과적이며, 세밀하게 분리 프레임 처리로 인한 손실되는 정보를 최소화 할 수 있다.
실행조건은 라이젠 (Ryzen) 3200G, 램 16GB, SSD 저장장치에서 수행된 결과이다. 따라서 제안한 wav-U-Net이 임베디드 시스템에서 성능 하락이 거의 없으면서도 계산량이 효과적으로 감소했음을 확인하였다.
평가결과에 따르면 기존 단채널 잡음제거 알고리즘인 MMSE-STSA과 비교하여 단채널 wav-U-Net은 압도적인 우수한 성능을 보여준다. 또한 Jansson이 제안한 wav-U-Net과 비교하면 입력 데이터로 512개의 주파수 빈 대신 단채널 128개의 멜 스케일 필터 뱅크를 사용했음에도 SDR은 약 2배 정도, NSDR은 약 5배 정도의 음성분리 성능향상이 있었다. 특히, 표 2의 하단의 결과에서 보듯이 512개 주파수 빈을 사용하는 네트워크는 제안된 wav-U-Net과 동일한 구조와 학습조건으로 생성되었지만, 128개 멜 스케일 필터 뱅크 입력값과 비교해서 4배나 큰 입력값으로 사용함에도 성능차이는 약 1% 정도로 미비함을 알 수 있다.
7배 연산 처리시간이 빨라진 것을 확인할 수 있었다. 또한, 입력 데이터 크기가 4분의 1로 축소되었음에도 실제 1% 정도의 미미한 성능 하락만 있어, 성능은 그대로 유지하면서 계산량을 줄이는 효과를 확인하였다. 둘째로 잡음이 섞인 음성신호를 위한 전처리 과정으로 간단한 ResNet을 거치도록 설계하였다 [8].
이 논문에서는 임베디드 연산을 위해서 첫째로 저주파수에 주요 특징값을 보이는 음성신호 분리를 목적으로 128개 멜 스케일 (Mel-scale) 필터뱅크를 이용한 입력데이터의 주파수 영역 축소로 계산량을 감소시켰다 [7]. 실험결과 기존 512개 주파수 빈을 입력값으로 사용했을 때보다 약 2.7배 연산 처리시간이 빨라진 것을 확인할 수 있었다. 또한, 입력 데이터 크기가 4분의 1로 축소되었음에도 실제 1% 정도의 미미한 성능 하락만 있어, 성능은 그대로 유지하면서 계산량을 줄이는 효과를 확인하였다.
ResNet은 영상의 해상도를 높이는 데 주로 사용되는 네트워크 구조로서 일반적으로 좀 더 깊은 망을 설계할 수 있게 한다 [8]. 제안된 네트워크 구조에서는 입력신호의 고주파 잡음을 억제하고 음성신호를 명확히 해주는 효과를 볼 수 있다.
또한 Jansson이 제안한 wav-U-Net과 비교하면 입력 데이터로 512개의 주파수 빈 대신 단채널 128개의 멜 스케일 필터 뱅크를 사용했음에도 SDR은 약 2배 정도, NSDR은 약 5배 정도의 음성분리 성능향상이 있었다. 특히, 표 2의 하단의 결과에서 보듯이 512개 주파수 빈을 사용하는 네트워크는 제안된 wav-U-Net과 동일한 구조와 학습조건으로 생성되었지만, 128개 멜 스케일 필터 뱅크 입력값과 비교해서 4배나 큰 입력값으로 사용함에도 성능차이는 약 1% 정도로 미비함을 알 수 있다.
평가결과에 따르면 기존 단채널 잡음제거 알고리즘인 MMSE-STSA과 비교하여 단채널 wav-U-Net은 압도적인 우수한 성능을 보여준다. 또한 Jansson이 제안한 wav-U-Net과 비교하면 입력 데이터로 512개의 주파수 빈 대신 단채널 128개의 멜 스케일 필터 뱅크를 사용했음에도 SDR은 약 2배 정도, NSDR은 약 5배 정도의 음성분리 성능향상이 있었다.

후속연구

비록 변형된 멜 주파수 필터 뱅크를 사용해서 입력데이터의 크기를 줄여 기존 wav-U-Net보다 계산량을 줄이긴 했지만, 여전히 네트워크 복잡성에 따른 상당한 계산량은 인공지능 기술을 임베디드에 적용하기 위해 주요 해결과제이다. 따라서 향후에는 연산량을 줄이면서도 성능을 높이기 위하여 다양한 잡음에 따라서 파라미터 가중치가 달라지는 네트워크 구조에 대해서 깊이 고찰해 볼 예정이다.

질의응답

핵심어	질문	논문에서 추출한 답변
	잡음제거 기능은 어떤 역할을 하고 있는가?	잡음제거 기능은 실생활에서 각종 스마트 디바이스를 이용한 음성인식, 음성녹음, 전화통화, 음악감상 등에 주변의 잡음을 제거하고 음성신호를 명확하게 해주는 중요한 역할을 하고 있다. 특히 스마트폰과 AI 스피커 등에 필수적으로 음성비서 기능이 탑재됨에 따라서 음성인식 신뢰도를 높이기 위한 중요한 전처리 요소로 자리 잡았다.
	고전적 잡음제거 방식의 대표적 방식은?	고전적 잡음제거 방식은 여러개의 마이크로폰 어레이를 이용하여 음원과 노이즈의 위상차를 이용한 빔포밍 (Beamforming) 방식이 대표적이다 [1]. 하지만 마이크로폰 수와 배치 간격 그리고 알고리즘의 복잡성이 높을수록 성능이 비례하기 때문에 실용적이지 못하다.
	잡음제거 기능이 음성인식 신뢰도를 높이기 위한 중요한 전처리 요소로 자리잡게 된 배경은?	잡음제거 기능은 실생활에서 각종 스마트 디바이스를 이용한 음성인식, 음성녹음, 전화통화, 음악감상 등에 주변의 잡음을 제거하고 음성신호를 명확하게 해주는 중요한 역할을 하고 있다. 특히 스마트폰과 AI 스피커 등에 필수적으로 음성비서 기능이 탑재됨에 따라서 음성인식 신뢰도를 높이기 위한 중요한 전처리 요소로 자리 잡았다.

참고문헌 (16)

J-M. Valin, J. Rouat, F. Michaud, "Enhanced Robot Audition Based on Microphone Array Source Separation with Post-Filter," In IROS 2004, Sendai, Japan, pp. 2123-2128, 2004.
R. Takeda, S. Yamamoto, K. Komatani, T. Ogata, and H. G. Okuno,"Missing-Feature based Speech Recognition for Two Simultaneous Speech Signals Separated by ICA with a pair of Humanoid Eras," In IROS 2006, Beijing, China, pp. 878-885, 2006.
Y. Ephraim, D. Malah, “Speech Enhancement Using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator,” IEEE Transaction on Acoustics, Speech, and Signal Processing, Vol. ASSP-32, No. 6, pp. 1109-1121, 1984.
H-D. Kim, S-S. Ahn, K. Kim, J. Choi, "Single Channel Particular Voice Activity Detection for Monitoring the Violence Situations", In 2013 IEEE RO-MAN, pp. 412-417, 2013.
A Jansson, E Humphrey, N Montecchio, R Bittner, A Kumar, T Weyde, "Singing Voice Separation with Deep U-net Convolutional Networks," In ISMIR 2017, Suzhou, China, pp. 23-27, 2017.
D. Stoller, S. Ewert, S. Dixon, "Wave-u-net: A Multi-scale Neural Network for End-to-end Audio Source Separation," In ICASSP 2018, Calgary, Canada, pp. 2391-2395, 2018.
Douglas O'Shaughnessy, "Speech Communication: Human and Machine," Addison-Wesley. New York, pp. 150, 1987.
O. Kupyn, V. Budzan, M. Mykhailych, D. Mishkin, J. Matas, "DeblurGAN: Blind Motion Deblurring Using Conditional Adversarial Networks", In IEEE/CVF, Salt Lake City, UT, USA, pp. 8183-8192, 2018.
O. Ronneberger, P. Fischer, T. Brox, "U-Net: Convolutional Networks for Biomedical Image Segmentation", In MICCAI 2015, Springer, Vol. 9351, pp. 234-241, 2015.
W. Wang, K. Yu, J. Hugonot, P. Fua, M. Salzman, "Recurrent U-Net for Resource-Constrained Segmentation", In ICCV 2019, Seoul, South Korea, pp. 2142-2151, 2019.
Z. Rafii, A. Liutkus, F.-R. Stter, S.-I. Mimilakis, R. Bittner, "The MUSDB18 corpus for music separation," 2017.
A. Liutkus, D. Fitzgerald, Z. Rafii, "Scalable audio separation with light kernel additive modelling," In ICASSP 2015, Brisbane, Australia, pp. 76-80, 2015.
C.-L. Hsu, J. R. Jang, “On the Improvement of Singing Voice Separation for Monaural Recordings Using the MIR-1K Dataset,” IEEE Transactions on Audio Speech and Language Processing, Vol. 18, No. 2, pp. 310-319, 2010.

상세보기
C. K. A. Reddy, E. Beyrami, H. Dubey, V. Gopal, R. Cheng, R. Cutler, S. Matusevych, R. Aichner, A. Aazami, S. Braun, P. Rana, S. Srinivasan, J. Gehrke, "The INTERSPEECH 2020 Deep Noise Suppression Challenge: Datasets, Subjective Speech Quality and Testing Framework", 2020.
E. Vincent, R. Gribonval, C. Fevotte, "Performance Measurement in Blind Audio Source Separation," IEEE Transactions on Audio, Speech, and Language Processing, Nol. 14, No. 4, pp. 1462-1469, 2006.

상세보기
E. Vincent, S. Araki, P. Bofill, "The 2008 Signal Separation Evaluation Campaign: A community-based Approach to Large-scale Evaluation," In ICA 2009, Paraty, Brazil, pp 734-741, 2009.

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증