空分復(fù)用MIMO通信系統(tǒng)簡介及FPGA實現(xiàn)
信道矩陣預(yù)處理器確定了空分復(fù)用復(fù)合信號每一層的最佳檢測次序。該預(yù)處理器負(fù)責(zé)計算信道矩陣的偽逆矩陣范數(shù),并根據(jù)這些范數(shù),選擇待處理的下一個傳輸流。偽逆矩陣中范數(shù)最小的行對應(yīng)著最強傳輸流(檢波后噪聲放大最小),而范數(shù)最大的行對應(yīng)著質(zhì)量最差的層(檢波后噪聲放大最大)。我們的實施方案首先檢測最弱的層,然后按最低噪聲放大到最高噪聲放大的次序逐層檢測。對排序過程中的每一步,信道矩陣中相應(yīng)的列隨后會被清空,然后簡化后的矩陣進(jìn)入下一級的天線排序處理流水線。
在預(yù)處理算法中,偽逆矩陣的計算要求最高。這個過程的核心是矩陣求逆,通常通過吉文斯(Givens) 旋轉(zhuǎn)進(jìn)行 QR 分解 (QRD) 來實現(xiàn)。常用的角度估算和平面旋轉(zhuǎn)算法(如 CORDIC)會造成嚴(yán)重的系統(tǒng)時延,對我們的系統(tǒng)來說是不可接受的。因此,我們的目標(biāo)是運用 FPGA 的嵌入式 DSP 資源(比如 Virtex-5 器件中的 DSP48E),找出矢量旋轉(zhuǎn)和相位估算的替代性解決方案。
QRD 的脈動陣列結(jié)構(gòu)由兩種類型的處理單元構(gòu)成——對角線單元或邊界單元和非對角線單元或內(nèi)部單元。邊界單元執(zhí)行矢量函數(shù),可以生成陣列內(nèi)部單元使用的旋轉(zhuǎn)角度。要想得到想要的旋轉(zhuǎn)角度,可以把非對角線單元中的值與對角線單元中的共軛復(fù)數(shù)相乘,然后除以復(fù)數(shù)的倒數(shù)即可。相除實際是用乘法的方式完成的,即在觀察到函數(shù)接近線性的時候,乘以根據(jù)定義的間隔的多項式近似值計算出的倒數(shù)。圖 3 顯示了采用這種近似值在對角線脈動單元中完成這種復(fù)雜旋轉(zhuǎn)的信號流程圖。
圖 3. 對角線脈動單元結(jié)構(gòu)圖
發(fā)送到非對角線單元中的數(shù)據(jù)是旋轉(zhuǎn)矢量的同相部分和正交部分除以相應(yīng)的近似值得出的結(jié)果。我們不僅通過在對角線單元和非對角線單元采用流水線架構(gòu)實現(xiàn)了高數(shù)據(jù)吞吐量,同時還通過對跨5個信道的硬件進(jìn)行時分復(fù)用的方式控制了近似值模塊和復(fù)雜乘法器引起的時延。
對 4x4 矩陣,我們使用了 1 個對角線單元和 7 個非對角線單元。分解單個矩陣所花的處理時間為 4x4=16 個數(shù)據(jù)周期,而該設(shè)計交付數(shù)據(jù)的速度是每三個時鐘周期一個樣本,因此分解單個矩陣的所用的總時長為 3x4x4=48 個時鐘周期(低于可用的 64 個時鐘周期)。我們對分解后的矩陣使用了回代法(back subsTItution),同時以相同的 TDM 方式進(jìn)一步進(jìn)行了重新排序操作。
球形檢測器
球形檢測器采用PED 單元進(jìn)行范數(shù)計算。根據(jù)樹的層次,我們采用了三種不同類型的 PED 單元。根節(jié)點 PED 模塊負(fù)責(zé)計算所有可能的 PED。二級 PED 模塊針對上一級計算得出的 8 個幸存路徑計算出 8 個可能的 PED。這樣在樹的下一級索引中,我們就有 64 個生成的 PED。第三種類型的PED模塊用于其它樹級,負(fù)責(zé)計算上一級計算出的所有 PED 的最鄰近的節(jié)點 PED。
球形檢測器 (SD) 的流水線架構(gòu)可以在每個時鐘周期中處理數(shù)據(jù)。其結(jié)果就是樹的每級只需要一個 PED 模塊。因此,對 4x4 64-QAM 系統(tǒng)而言,PED 單元的總數(shù)為 8,與樹的級數(shù)相等。
SD 可以采用硬解碼和軟解碼兩種類型的解碼技術(shù)。硬解碼能夠用貫穿樹的各級的最小距離矩陣度量次序;軟解碼,用對數(shù)似然比來代表輸出的每個比特。對數(shù)似然比一般被當(dāng)作優(yōu)先輸入值提供給信道解碼器,比如 turbo 解碼器。
評論