$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

SIMD 구조를 갖는 프로세서에서 FFT 연산 가속화
Acceleration of FFT on a SIMD Processor 원문보기

Journal of the Institute of Electronics and Information Engineers = 전자공학회논문지, v.52 no.2, 2015년, pp.97 - 105  

이주영 (광운대학교 전자통신공학과) ,  홍용근 (광운대학교 전자통신공학과) ,  이현석 (광운대학교 전자통신공학과)

초록
AI-Helper 아이콘AI-Helper

이 논문은 SIMD 구조를 갖는 프로세서에서 FFT 연산을 효과적으로 처리하는 방법에 대한 것이다. FFT는 디지털 신호처리 분야에서 널리 사용되는 범용 알고리즘으로 이의 효과적인 처리는 성능 향상에 있어서 매우 중요하다. Bruun 알고리즘은 반복적인 인수분해를 통해 구현되는 FFT 알고리즘으로, 널리 사용되는 Cooley-Tukey 알고리즘에 비해 복소수 곱셈이 아닌 실수 곱셈으로 대부분의 동작을 수행하는 장점을 가지고 있으나, SIMD 프로세서에서 구현하는 데는 벡터 데이터의 정렬 형태가 복잡하고 연산에 필요한 계수들을 저장할 메모리를 더 필요로 하는 단점이 있다. 실험 결과에 따르면 길이 1024인 FFT 연산을 SIMD 프로세서에서 수행하는데 있어서 Bruun 알고리즘은 Cooley-Tukey 알고리즘에 비해서 약 1.2배의 더 높은 처리성능을 보이지만, 약 4 배 더 큰 데이터 메모리를 필요로 한다. 따라서 데이터 메모리에 대한 제약이 큰 경우가 아니라면 SIMD 프로세서에서 Bruun 알고리즘이 FFT 연산에 적합하다.

Abstract AI-Helper 아이콘AI-Helper

This paper discusses the implementation of Bruun's FFT on a SIMD processor. FFT is an algorithm used in digital signal processing area and its effective processing is important in the enhancement of signal processing performance. Bruun's FFT algorithm is one of fast Fourier transform algorithms base...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 Bruun 알고리즘을 SIMD 구조를 갖는 프로세서에서 구현하기 위한 방법과 그 결과에 대해 살펴보았다. Bruun 알고리즘은 복잡한 복소수 곱셈 대신 간단한 실수 곱셈으로 FFT 동작을 처리하기 위해 고안된 알고리즘이다.
  • 따라서 순차적으로 작업을 처리하는 구조에서 Bruun 알고리즘이 효율적이라고 알려져왔다[12]. 본 논문에서는 Bruun 알고리즘을 SIMD 구조의 프로세서에 적용하는데 있어 주요한 제약요소인 높은 계수 생성과 데이터 정렬의 복잡도를 메모리 추가 사용으로 해결하고자 한다. 연산에 필요한 계수와 데이터 정렬 형태는 메모리에 사전 계산하여 저장할 수 있다.
  • DSP는 ASIC에 비하여 그 처리 성능이 상대적으로 낮기 때문에 DSP의 FFT 알고리즘 처리 성능을 높이는 연구가 계속되어 왔다. 본 논문은 벡터 형태의 연산에 적합한 SIMD 구조의 DSP를 이용해서 FFT 연산을 효과적으로 처리하는 방법에 대해 논한다.
  • 이 논문에서는 이전의 연구들과는 달리 SIMD 구조의 프로세서에서 Bruun 알고리즘을 구현하여 성능을 높이는 방안에 대해 논한다. Bruun 알고리즘은 실수 곱셈이 주를 이루므로 Cooley-Tukey 알고리즘에 비해 곱셈 연산 횟수가 적은 특징을 나타낸다.

가설 설정

  • 두 FFT 알고리즘의 구현 과정에서 i) 벡터 정렬 정보, ii) 조건부 연산 조건 정보, iii) 계수 정보의 저장에 데이터 메모리가 필요하다.
  • 두 FFT 알고리즘을 SIMD 구조의 프로세서에서 구현하였을 때의 성능과 효율성을 비교하기 위해 과 같은 구조의 실험용 SIMD 프로세서를 기준 하드웨어로 가정하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
디지털 신호처리 기술은 어디에 활용되는가? 디지털 신호처리 기술은 무선통신, 멀티미디어, 영상처리 등 많은 분야에 걸쳐 활용되고 있으며, 그 중요성은 점점 더 높아지고 있다. FFT (Fast Fourier transform)는 이산 신호의 주파수 분석을 위한 디지털 신호처리 알고리즘 가운데 하나로, 스펙트럼 분석기, OFDM 변복조기, MRI와 같은 전자기기에 사용된다.
FFT란? 디지털 신호처리 기술은 무선통신, 멀티미디어, 영상처리 등 많은 분야에 걸쳐 활용되고 있으며, 그 중요성은 점점 더 높아지고 있다. FFT (Fast Fourier transform)는 이산 신호의 주파수 분석을 위한 디지털 신호처리 알고리즘 가운데 하나로, 스펙트럼 분석기, OFDM 변복조기, MRI와 같은 전자기기에 사용된다.
Cooley-Tukey 알고리즘과 Bruun 알고리즘이 모두 한단에서 수행되는 연산들을 병렬 처리할 수 있는 이유는? Cooley-Tukey 알고리즘과 Bruun 알고리즘 모두 한단에서 수행되는 연산들을 병렬 처리할 수 있다. 이는 동일한 단에서 수행되는 연산에서 입력으로 사용하는 모든 데이터들 사이에는 상호 의존성이 없기 때문이다. 그러나 한 단이 연산을 수행하기 위해서는 이전 단의 연산 결과가 입력으로 필요하므로 FFT 연산의 단들 사이에는 종속성이 존재한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. James W. Cooley and John W. Tukey, An Algorithm for the Machine Calculation of Complex Fourier Series, Mathematics of computation 19.90, pp.297-301, 1965. 

  2. S. C. Chan and K. L. Ho, On Indexing the Prime Factor Fast Fourier Transform Algorithm, IEEE Transactions on Circuits and Systems, Vol. 38, No, 8, pp.951-953, 1991. 

  3. Georg Bruun, z-Transform DFT Filters and FFT's, IEEE Transactions on Acoustics, Speech, And Signal Processing, Vol. 26, NO. 1, February, 1978. 

  4. Rader, C.M., Discrete Fourier transforms when the number of data samples is prime, IEEE, Proceedings letters, No. 56, pp.1107-1108, 1968. 

  5. Wang Xu, Zhang Yan and Ding Shunying, A High Performance FFT Library with Single Instruction Multiple Data(SIMD) Architecture, IEEE, International Conference on ICECC, pp.630-633, September, 2011. 

  6. Ting Chen, Hengzhu Liu and Botao Zhang, A scalable, fixed-shuffling, parallel FFT butterfly processing architecture for SDR environment, IEICE Electronics Express, Vol.11, No.2, pp.1-9, 2014. 

  7. T. Chen, X. Pan, H. Liu and T. Wu, Rapid Prototype and Implementation of a High-Throughput and Flexible FFT ASIP Based on LISA 2.0, IEEE, 15th International Symposium on ISQED, 2014. 

  8. F. Yu, R. GE and Z. Wang, Efficient Utilization of Vector Registers to Improve FFT Performance on SIMD Microprocessors, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, Vol.E960A, No.7, July, 2013. 

  9. Mittal Shashank. Efficient and High-Speed FFT Architectures for Software Defined Radio, Master Thesis. International Institute of Information Technology Hyderabad, INDIA, 2009. 

  10. Yuhang Wu, New FFT Structures Based on the Bruun Algorithm, IEEE Transactions On Acoustics, Speech. And Signal Processing, Vol. 38. No. 1, pp.188-191, January, 1990. 

  11. Harold S. Stone, Parallel processing with the perfect shuffle, IEEE Transactions on Computers, Vol. 20, No. 2 pp.153-161, 1971. 

  12. Mittal, S., Area Efficient High Speed Architecture of Bruun's FFT for Software Defined Radio, IEEE, GLOBECOM '07, Global Telecommunications Conference, 2007. 

  13. C. Antonio, SSim - A Simple Discrete-Event Simulation Library(2012), Retrieved Febuary, 2012, from http://www.inf.usi.ch/carzaniga/ssim/index.html 

  14. Sehoon Yoo, A Reconfigurable Parallel Processor for Efficient Processing of Mobile Multimedia, Journal of the Institute of Electronics Engineers of Korea SD, Vol. 44, No. 10, pp.23-32, 2007. 

  15. Kyeong-Seob Kim, Yun-Sub Lee, Byung-Cheol Yu, Control Unit Design and Implementation for SIMD Programmable Unified Shader, Journal of the Institute of Electronics Engineers of Korea SD, Vol. 48, No. 7, pp.37-47, 2011. 

  16. Hillery C. Hunter, A new look at exploiting data parallelism in embedded systems, CASES '03 Proceedings of the 2003 international conference on Compilers, architecture and synthesis for embedded systems, pp.159-169, 2003. 

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로