[發明專利]一種支持FFT加速的SIMD向量處理器無效
| 申請號: | 201110393712.0 | 申請日: | 2011-12-02 |
| 公開(公告)號: | CN102495721A | 公開(公告)日: | 2012-06-13 |
| 發明(設計)人: | 李麗;孫敏敏;王佳文;潘紅兵;鄭維山;沙金;李偉 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06F9/34 | 分類號: | G06F9/34 |
| 代理公司: | 南京匯盛專利商標事務所(普通合伙) 32238 | 代理人: | 陳揚 |
| 地址: | 210093 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 支持 fft 加速 simd 向量 處理器 | ||
技術領域
本發明涉及一種支持FFT加速的SIMD向量處理器及其設計方法,具體地說是一種支持可變點數,對FFT/IFFT運算加速效率較高而整體硬件開銷較低的SIMD向量處理器及其設計方法。
背景技術
快速傅里葉變換(Fast?Fourier?Transformation,?FFT)運算一般都通過專用硬件加速器(稱為FFT處理器)或DSP處理器完成。專用硬件加速器能獲得較高的加速效率,但是會占用較多額外資源,包括片上存儲資源和片上計算邏輯資源,特別是當變換的長度極大時,專用硬件加速器所占用的額外資源將無法承受。用DSP處理器軟件編程的方式完成FFT運算雖然不會占用額外的硬件資源且具有很大的靈活性,但是其處理速度相對較慢,滿足不了某些應用的實時性要求。
在一些數字信號處理算法,如距離-多普勒算法中,涉及大量各種長度的向量處理,最長可達到16K甚至更長。對這些向量的處理既包括規則的向量運算(向量加減法、向量乘法等)也包括FFT/IFFT運算。SIMD向量處理器可用來加速規則的向量運算,但是尚未出現同時能夠直接加速FFT運算(加速效率和專用加速器相當)的SIMD向量處理器,在這種情況下,還需要另外使用FFT硬件加速器來加速各種點數的FFT/IFFT運算,額外的片上資源將會被占用。
發明內容
為了加速大點數FFT的運算效率,同時避免使用專門硬件加速器所帶來的額外硬件開銷,本發明的目的是提供一種支持FFT加速的SIMD向量處理器。該SIMD向量處理器能夠直接加速FFT運算,還可提供和專用硬件加速器加速效率相當的FFT運算加速,在保證性能的同時避免額外的硬件開銷。
本發明的目的是通過以下技術方案來實現的:
一種支持FFT加速的SIMD向量處理器,其特征在于:該處理器包括控制單元、計算單元、存儲器子系統、存儲交織單元和地址產生單元;所述計算單元支持各種向量運算的快速處理,所述存儲器子系統包括存放操作數的存儲器組A、存放系數的存儲器組B和存放運算結果的存儲器組C,且存儲器組A、存儲器組B和存儲器組C內的單個存儲體的位寬為一個復數字,支持4路數據并行的復數向量運算和8路數據并行的實數向量運算;計算單元、地址產生單元和存儲交織單元均與控制單元連接;地址產生單元根據運算類型、運算的數據并行度及向量的長度產生所需的操作數地址序列、系數地址序列、結果地址序列;存儲交織單元與地址產生單元和計算單元連接,并實現存儲體的地址映射。?
本發明中,存儲器組A、存儲器組B和存儲器組C均為4個存儲體。存儲交織單元實現存儲器組A、存儲器組B和存儲器組C內部4個存儲體的地址映射,使同時讀取的4個操作數位于4個不同的存儲體,且同時寫入的4個運算結果位于4個不同的存儲體;通過可編程地址映射方法,支持各種長度向量的規則向量運算和FFT/IFFT運算。
所述可編程地址映射方法是可通過軟件編程方式設置向量長度,對于不同的向量長度,地址映射方法也相應變化,且在各向量長度下,均能保證規則向量運算和FFT/IFFT運算無沖突讀寫。
計算單元包括2個復數乘法器和4個復數加法器,支持2路數據并行的復數乘法、卷積運算,4路數據并行的復數加減法、累加運算,4路數據并行的復數模方運算,4路數據并行的FFT/IFFT運算,以及8路數據并行的實數乘法、卷積、加減法、累加運算。對于上述的n路數據并行的向量運算,平均每個時鐘周期處理n個向量單元(不考慮處理每個向量前的流水線填充時間)。其加速效率與專用硬件加速器相當,且支持可變點數,因此在保障系統計算效率的同時,節省了在設計中因使用FFT專用硬件加速單元而帶來的巨額片上存儲資源與邏輯資源開銷。
本發明中的存儲子系統包括三個存儲器組,分別存放操作數、系數和運算結果,每組存儲器分為4個存儲體,存儲體的位寬為一個復數字,以支持4路數據并行的復數向量運算和8路數據并行的實數向量運算。地址產生單元,能夠根據運算類型(規則運算、FFT/IFFT運算)、運算的數據并行度(2、4、8)、向量的長度等產生所需的操作數地址序列、系數地址序列(對某些運算不需要,如累加運算和復數模方運算)、結果地址序列。
?
本發明能夠直接加速FFT運算的SIMD向量處理器,除了能夠加速規則向量運算之外,還可提供和專用硬件加速器加速效率相當的FFT運算加速,在保證性能的同時避免額外的硬件開銷。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.17sss.com.cn/pat/books/201110393712.0/2.html,轉載請聲明來源鉆瓜專利網。





