一、前言
這是前兩天搭建的H7B0單片機(jī)信號采集與計算的模塊,利用它的16比特的ADC采集信號,并進(jìn)行頻譜分析,結(jié)果顯示在OLED屏幕上。計算 2048點的FFT,耗時大約為 10個毫秒左右。下面測試一下,利用 Cortex中的 CMSIS中的 DSP算法庫中的FFT,看是否計算速度能夠得到提高,并對比計算的結(jié)果的精度,下面進(jìn)行測試。
二、添加DSP庫
首先點擊 Keil 編譯環(huán)境中的 Package 按鍵,打開軟件包管理單元。添加 CMSIS 中的 Core以及 DSP 軟件包。確定之后,便可以在工程文件后面看到對應(yīng)的 DSP軟件包了。
在工程選項中,C++設(shè)置頁面,增加 ARM_MATH_CM7 這個常量,表示使用對應(yīng)Cortext-M7 內(nèi)核的DSP算法庫。在應(yīng)用 C 文件中,增加相應(yīng)的頭文件,這里增加兩個頭文件。請注意,如果不增加前面 ARM_MATH_CM7常量的定義,在包含頭文件之后,就會出現(xiàn)編譯出錯。下面就可以應(yīng)用相應(yīng)的DSP函數(shù)了。
三、計算結(jié)果
調(diào)用DSP中的實數(shù)浮點FFT函數(shù),對 長度為 2048 的浮點數(shù)組進(jìn)行初始化,前面四個數(shù)字設(shè)置 1,其他都是0。初始化FFT實例參數(shù),進(jìn)行實數(shù)FFT變換,計算FFT結(jié)果的賦值。進(jìn)行結(jié)果顯示和圖像繪制。
這是進(jìn)行FFT數(shù)據(jù)的波形,在前面 4 個數(shù)據(jù),幅度為 1,其他都是0,變換結(jié)果中,前面一半是數(shù)據(jù)的幅度頻譜,對于實數(shù)來講,它的幅度譜關(guān)于中心店左右對稱,輸出結(jié)果中,只給出了前面一半的結(jié)果,后面一半不是計算的數(shù)據(jù)。這里需要說明的是,F(xiàn)FT計算是即位存儲,也就是最終的結(jié)果存儲在輸入數(shù)據(jù)存儲區(qū)中。輸出結(jié)果只有實際頻譜的前半段,后半段與前半段呈現(xiàn)共軛對稱。
▲ 圖1.3.1 信號的波形
▲ 圖1.3.2 變換后的幅度譜
對比單片機(jī)DSP庫計算得到的幅度譜與 Python 計算的幅度譜,它們是重合的,對應(yīng)的誤差應(yīng)該是反映了單精度浮點數(shù)與雙精度浮點數(shù)之間的差異性。
▲ 圖1.3.3 繪制DSP與Python 計算的結(jié)果
▲ 圖1.3.4 DSP與Python 計算幅度品的誤差
但是,遇到了一個詭異的情況,那就是如果設(shè)置數(shù)據(jù)窗口長度為5,DSP計算的結(jié)果的第一個數(shù)值就會出現(xiàn)較大的誤差。第一個數(shù)字反映了數(shù)據(jù)的直流分量。這是數(shù)據(jù)窗口長度為 7 的時候,也是出現(xiàn)了較大的誤差。這就是了怪了,窗口長度為偶數(shù)的時候是準(zhǔn)確的,是奇數(shù)的時候不準(zhǔn)確,這個問題困擾了我很長時間,不知道誰能夠給出解答。
▲ 圖1.3.5 當(dāng)數(shù)據(jù)窗口寬度為5的時候,計算結(jié)果的第一位,也就是直流分量結(jié)果出現(xiàn)了較大的誤差
繪制出數(shù)據(jù)窗口的寬度從0 到 2048 過程中,DSP算法庫得到的結(jié)果第一個數(shù)據(jù)對應(yīng)的誤差。隨著數(shù)據(jù)的長度增加,誤差減小。誤差與數(shù)據(jù)的長度成反比。對應(yīng)的窗口為偶數(shù)的時候,誤差為0,奇數(shù)的時候出現(xiàn)了差異。這實在令人感到奇怪了。
▲ 圖1.3.6 不同窗口計算出的直流分量的誤差分布
四、計算的速度
為了測量DSP中的FFT計算速度,在FFT函數(shù)調(diào)用前后增加對單片機(jī)端口 的操作,有單片機(jī)端口的高低電平來表示FFT的計算時間,?通過示波器,測量該端口的波形,可以確定 DSP 庫中的FFT的計算速度。單片機(jī)時鐘頻率設(shè)為 280MHz,對于長度為 2048 的 FFT,單片機(jī)計算時間長度為 1.22ms。前兩天自行編寫了 FFT C語言算法,同樣長度,需要大約 10ms的時間。課件 DSP庫中的算法效率還是非常高的。
▲ 圖1.4.1 計算速度
※ 總??結(jié) ※
本文對于STM32H7B0單片機(jī)使用DSP算法庫進(jìn)行 FFT計算進(jìn)行測測試。速度非???,對于2048個數(shù)據(jù)進(jìn)行單精度浮點計算時,耗時大約為 1.2ms,這是內(nèi)核時鐘頻率為 280MHz 的情況下測量的。但也出現(xiàn)了一個令人不解的情況,那就是計算直流量在某些情況下會出現(xiàn)誤差。具體原因現(xiàn)在還不清楚呢。
參考資料
[1]STM32 DSP庫的使用方法: https://blog.csdn.net/u010058695/article/details/112665306
[2]模擬信號的采集并顯示頻譜:STM32H7B0: https://zhuoqing.blog.csdn.net/article/details/136419754
[3]STM32H7B0模塊的電路圖: https://zhuoqing.blog.csdn.net/article/details/136285749