毫米波雷達半精度浮點存儲格式分析

2024-1-25 08:55| 发布者: 闪电| 查看: 1| 评论: 0

摘要: 雷達信號處理需要使用大量內存進行中間結果和最終結果的保存，而內存大小直接影響處理晶片的成本。選擇合適的數據存儲格式，既保留較高的信號解析度和動態範圍，又不占用太大的存儲空間是相當重要的。本文介紹了TC3x ...

雷達信號處理需要使用大量內存進行中間結果和最終結果的保存，而內存大小直接影響處理晶片的成本。選擇合適的數據存儲格式，既保留較高的信號解析度和動態範圍，又不占用太大的存儲空間是相當重要的。本文介紹了TC3xx單片機雷達信號處理單元SPU支持的半精度浮點格式，將其和32bit整型數格式進行比較，分析了兩者的動態範圍及實際處理誤差，發現半精度浮點格式是“性價比”較高的存儲方式。另外，Tricore™ CPU還有專用硬體指令支持半精度和單精度浮點格式的相互轉換，便於信號的後期處理，並縮短數據格式轉換時間。

背景介紹

毫米波雷達在較短時間內（比如50ms每幀）需要處理大量數據，數據量和收發天線個數，每個發波的採樣點數，以及發波個數成正比。下面簡單舉個例子，方便量化數據大小，使大家有感性認識。比如，採樣點數為512，發波個數為128，典型的3T4R前端射頻晶片，採用碼分調製方式，實採樣ADC轉換結果為14bit，但考慮到後期便於信號處理，實際上一般使用16bit（2Byte）內存空間來存儲。表1列出了各處理階段的數據占用內存空間大小，由此可見，雷達信號處理對內存空間的需求較大，而內存大小直接影響晶片成本，所以，能採用一種合理的數據格式，既保留較高的信號解析度和動態範圍，又不占用太大的存儲空間是相當重要。

表1. 各處理階段的數據所占內存空間大小

數據格式

TC3xx單片機的雷達信號處理單元SPU，其輸出支持多種數據格式，包括16位、32位整型複數或實數，16位半精度浮點等。其中16位半精度浮點既能保持數據的精度又不失較寬的動態範圍，並且占用內存相對較少。根據IEEE 754標準【1】，16位半精度浮點數（binary16）的二進制位分為三部分，定義分別如下：

最高一位是符號位。
最高位後面的5位表示2的指數，該值要減去固定值15，才是最終指數。
剩下的10位（位於小數點右側）再補上一位非顯性位（該位在小數點左側第一位）合成的11位是有效數。

以下定義摘自Wikipedia【2】。如果忽略subnormal以及無限數值，半精度浮點有效數值（normal value）為正的最小值是 2^(-14) ≈ 6.10 × 10^(-5)。數值為正的最大值是 (2−2^(-10)) × 2^15 = 65504。

表2. IEEE754 半精度浮點的數值範圍，摘自Wikipedia.

下面我們比較一下32位整型數和16位半精度浮點數的動態範圍，假設兩者符號都為正。

表3. 不同格式數據動態範圍比較

從以上比較發現，兩者的動態範圍差別是3dB，而使用16位半精度浮點占用的內存存儲空間卻是採用32位整型數的一半，對於所選處理器晶片有較強成本優勢。

為了進一步驗證SPU用16位半精度浮點數和32位整型數的實際誤差，用Matlab代碼將半精度浮點格式歸一化處理成32位整型格式，之後和SPU實際計算所得32位數據做比較。圖1所示是(a) 第一維FFT結果和 (b)兩者誤差。兩者最大誤差是0.0021dB，而第一維FFT結果中最大值是78.828dB，該誤差相當小。

圖1. (a) SPU 1st FFT計算結果（dB）；(b) 16位半精度浮點數和32位整型數的結果誤差（dB）

格式轉換

SPU處理完數據後，通常用Tricore™ CPU進行下一階段計算。Tricore™ CPU集成了硬體指令【3】，可以方便進行單精度浮點和半精度浮點數格式之間的轉換。這兩條指令是：

兩款常用編譯器，Tasking 和Hightec Gnuc 編譯器都支持以上數據格式轉換指令。

在Tasking環境中，當指定C編譯選項 --fp-model=-soft，C編譯器會自動生成CPU硬體指令，進行半精度浮點類型（_Float16）和單精度浮點類型（float）之間的格式轉換。
在Hightec Gnuc環境中，__float16 是半精度浮點的格式類型，在編譯時會自動生成格式轉換指令。例如以下代碼：

總結

路过

雷人

握手

鲜花

鸡蛋

收藏分享邀请

上一篇：新能源汽車 BMS 學習筆記篇—BMS 基本定義及分類

		自动登录	找回密码
密码			注册

毫米波雷達半精度浮點存儲格式分析

相关分类