ADSP2106x中DMA的應用
摘 要: 直接內存存?。―MA)是DSP芯片中用于快速數(shù)據(jù)交換的重要技術,對AD公司的浮點系列芯片ADSP2106x中的DMA的應用進行了詳細介紹,并給出實際應用中的一些例子。
本文引用地址:http://cafeforensic.com/article/241582.htm關鍵詞: DMA 浮點系列芯片ADSP2106x
1 DMA概述
直接內存存?。―MA)對計算機系統(tǒng)是非常重要的。它可以使CPU在運行指令的同時,系統(tǒng)能實現(xiàn)從外部存儲器或設備中存取數(shù)據(jù),也可以在CPU不參與的情況下,由專用的DMA設備存取數(shù)據(jù)。
對于浮點DSP芯片來講,DMA的作用更是重要。眾所周知,DSP芯片主要是面向實時的信號處理,其核心的運算部件具有很高的運算速度,常以MFLOPS(每秒百萬次浮點運算)來衡量。ADSP2106x為120MFLOPS,但該速度是以存儲在芯片內部存儲器中的程序和數(shù)據(jù)為前提的。在DSP內部往往采用多總線的哈佛結構,數(shù)據(jù)總線和程序總線相互獨立,即指令的存取和數(shù)據(jù)的存取并行不悖;另外在ADSP2106x內部還有各種接口總線,用以提高數(shù)據(jù)的流通能力。但在芯片的外部,所有的總線都合并在一起了。因此為了發(fā)揮DSP核心運算單元的高速運算能力,首先必須把程序和數(shù)據(jù)傳輸?shù)叫酒膬却嬷?,這通常需要DMA操作來實現(xiàn)。
另一方面,DSP系統(tǒng)總要與各種外部信號打交道,它從外部輸入數(shù)字信號,經(jīng)過各種算法的處理后,再輸出給其他設備。不僅如此,對于浮點DSP系統(tǒng),數(shù)據(jù)的輸入和輸出常常是連續(xù)不斷的。試想,如果用DSP的核心部件來完成數(shù)據(jù)的輸入和輸出,它高速的運算能力又如何發(fā)揮得出來呢?所以,浮點系列的DSP芯片大都把DMA控制部分直接集成到了芯片上,用DMA來完成數(shù)據(jù)的輸入和輸出。
高效的DSP系統(tǒng)通常采用圖1所示的結構。在內存中開辟出四塊緩存區(qū),兩個作為輸入緩存,兩個作為輸出緩存,用來實現(xiàn)輸入、輸出的乒乓切換。核心處理單元直接從輸入緩存中取數(shù)運算,然后把運算結果寫入輸出緩存;而數(shù)據(jù)從外部接口的輸入和輸出則完全由DMA來實現(xiàn),不需核心處理單元的參與。只要核心處理單元的運算速度和DMA的數(shù)據(jù)率滿足要求,圖1所示的結構就可以完成連續(xù)的數(shù)據(jù)流輸入和輸出。當然,從外部看,數(shù)據(jù)的輸入和輸出是連續(xù)的,但在芯片內部卻是分段處理的。分段處理雖然帶來一些誤差,但只要緩存的數(shù)據(jù)足夠長,就可以使誤差降到允許的范圍。因為間隔越長,前后數(shù)據(jù)間的相關性越小,相互間的影響就越小,故分段處理是可行的。由于分段處理,也給DSP芯片的結構帶來了一個重要影響,那就是盡可能地增加其內部存儲器的容量。對于ADSP21060,其內部的SRAM容量達4Mbit,可以滿足大多數(shù)分段處理的需要。
下面首先對ADSP2106x中的DMA做概要介紹,然后對幾種典型的DMA操作進行詳細分析。
2 ADSP2106x中的DMA
ADSP2106x中的片內DMA控制器可以同時控制10個通道的DMA,完成下列類型的數(shù)據(jù)傳輸操作:
·內存外存或外部存儲器映射設備
·內存其他ADSP2106x的內存
·內存主機接口
·內存串行口
·內存Link口
·內存外部設備
·外存外部設備
豐富的數(shù)據(jù)流向可以使ADSP2106x實現(xiàn)對各種外設的接口;另外,由于ADSP2106x的內存是雙口SRAM,因此在進行上述DMA操作的同時,核心處理單元仍可以讀寫內存,使DMA操作與內部運算處理達到高度的并行性。當然,應盡量避免二者同時對同一內存地址進行讀寫。
每個DMA通道都有一個(或兩個)用FIFO實現(xiàn)的數(shù)據(jù)緩存器,最大的緩沖深度為6級,用以提高DMA數(shù)據(jù)傳輸率。所有的DMA數(shù)據(jù)傳輸都是通過這10個數(shù)據(jù)緩存器來完成的,這些緩存器如表1所示。其中通道1、3、6、7都是兩個緩存器共用一個DMA通道。所有數(shù)據(jù)緩存器作為I/O寄存器被映射到內存的前256個地址中。
DMA的編程是通過內部核心處理單元或外部主機對片內有關的I/O寄存器設置來實現(xiàn)的,這些I/O口寄存器也被映射到內存的前256個地址上。與DMA操作有關的I/O寄存器除了前面的數(shù)據(jù)緩存器外,主要還包括:
·DMA控制寄存器:DMAC6~9,LCTL,STCTL0~1,SRCTL0~1。
·地址-計數(shù)寄存器:II0~9,IM0~9,C0~9,EI6~9,EM6~9,EC6~9。
·鏈式操作指針寄存器:CP0~9。
·二維操作寄存器(也可作DMA通用寄存器):GP0~9,DA0~5,DB0~5。
·DMA狀態(tài)寄存器:DMASTAT。
DMA設置傳輸過程一般如下:
(1)設置對應通道的地址-計數(shù)寄存器。
(2)設置對應通道的DMA控制寄存器,并將其中的DMA使能位設為有效。
(3)開始DMA數(shù)據(jù)傳輸。
(4)DMA傳輸結束后,產生對應的中斷,程序對中斷進行處理。
3 幾種常用的DMA操作
在基于ADSP2106x的DSP系統(tǒng)的開發(fā)過程中,最常用到以下幾種DMA操作:內存與外存、內存與主機、內存與外設、內存與Link口間的數(shù)據(jù)交換。
3.1 內存與外存間的DMA
內存與外存間的DMA傳輸可用DMA通道6~9這四個通道中的任一個。這里用一個例子來說明,假如要把內存地址0x26000~0x263ff中的1024個數(shù)用DMA通道6傳送到外存0x400000~4003ff中,可用下面的編程來實現(xiàn):
/*設置內存地址-計數(shù)寄存器*/
R0=0x26000;
DM(II6)=R0; /*設置內存起始地址*/
R0=1
DM(IM6)=R0; /*設置內存地址增加值*/
R0=1024;
DM(C6)=R0 /*設置內存讀數(shù)次數(shù)*/
/*設置外存地址-計數(shù)寄存器*/
R0=0x400000;
DM(E16)=R0; /*設置外存起始地址*/
R0=1;
DM(EM6)=R0; /*設置外存地址增加值*/
R0=1024;
DM(EC6)=R0; /*設置外存寫數(shù)次數(shù)*/
R0=0x0205;
DM(DMAC6)=R0;;/*設置DMA控制寄存器
DMAC6*/
/*設置為Master和從內存讀數(shù)方
式,并使能DMA*/
/*DMA通道6開啟DMA傳數(shù)操作*/
這里需要說明兩點:(1)I/O寄存器不能用立即數(shù)來直接賦值,而要通過通用寄存器R0~15或USTAT0~1來賦值;(2)在ADSP2106x中,由于數(shù)據(jù)的寬度有8、16、32和48幾種方式,通過DMA傳輸時,內存和外部接口上的寬度可以不同,因此對應的讀寫次數(shù)可能不同,故內部計數(shù)器和外部計數(shù)器要分別設置。
對于外部存儲器映射設備,其接口地址是固定的,此時內存與該外設間DMA的編程更加簡單。比如某外設的地址設在0x400000,要把內存0x26000~0x263ff中的1024個數(shù)用DMA通道6傳送到該外設接口上,只需把上面程序中的EM6設為0即可。
3.2 內存與主機間的DMA
在ADSP2106x芯片上包含了一個主機(host)接口,可以使其方便地與通用16位或32位計算機相連接,此時,通用計算機就作為ADSP2106x的主機,它可對ADSP2106x的片內存儲器進行訪問。通常情況下,為了減少主機對ADSP2106x尋址的地址線根數(shù),以降低硬件復雜性,主機往往只對ADSP2106x的I/O寄存器(有256個)尋址,尋址的地址線只需8根1。BittWare公司的ADSP2106xEZ-LAB開發(fā)板即采用了此種方式。在這種情況下,主機與ADSP2106x內存間的數(shù)據(jù)交換大多是通過DMA完成的。下面通過運行在微機上的一段C語言程序來說明,此時EZ-LAB板插入微機的ISA總線插槽上,微機作為ADSP2106x的主機,ADSP2106x的I/O寄存器可由微機通過ISA總線上的I/O口來訪問。該程序把數(shù)據(jù)d[1024]通過DMA通道6加載到ADSP2106x內存0x26000~0x263ff中。具體程序如下:
#injcludeconio.h
#include def21060.h /*ADSP I/O寄存器地址定義文件*/
#include :stdio.h
#define ADDR 0X402 /*定義ADSP地址線對應
的ISA總線I/O口地址*/
#define DATA 0x404 /*定義ADSP數(shù)據(jù)線對應
的ISA總線I/O口地址*/
main()
{int n,d[1024];
/*設置ADSP中DMA通道6的地址-計數(shù)寄存器及控制寄存器*/
outpw(ADDR,II6); /*尋址起始地址寄存器II6*/
outpw(DATA,0x6000);/*設置II6的低16位*/
outpw(DATA,0x2); /*設置II6的高16位*/
outpw(ADDR,IM6); /*尋址地址增加寄存器IM6*/
outpw(DATA,1); /*設置IM6的低16位*/
outpw(DATA,0); /*設置IM6的高16位*/
outpw(ADDR,C6); /*尋址計數(shù)寄存器C6*/
outpw(DATA,1024); /*設置C6的低16位*/
outpw(DATA,0); /*設置C6的高16位*/
outpw(ADDR,DMAC6); /*尋址DMA控制寄存器
DMAC6 */
outpw(DATA,0x41);/*設置DMAC6的低16位*/
outpw(DATA,0); /*設置DMAC6的高16位*/
/*ADSP的DMA通道6設為16/32位模式,
并開啟就緒,等待微機傳數(shù)*/
/*微機向DMA通道6的數(shù)據(jù)緩存器EPB0中連續(xù)寫入數(shù)據(jù)d[.]*/
outpw(ADDR,EPB0); /*尋址DAM通道6的數(shù)
據(jù)緩存器EPB0*/
for(n=0;n<1024;n++)
{outpw(DATA,d[n]); /*寫數(shù)據(jù)d[n]*/
outpw(DATA,0); /*高16位寫0*/
}
}
對以上程序需要說明的有兩點:(1)ADSP2106x的地址線和數(shù)據(jù)線是通過ISA總線上兩個I/O口地址(ADDR和DATA)來訪問的;(2)ISA總線為16位,而ADSP2106x的I/O寄存器和內存的數(shù)據(jù)都為32位,因此微機要用高、低16位分別傳輸,同時把DMA6設置為16/32位模式。關于EZ-LAB的詳細情況可參見文獻[1]。
3.3 內存與外設間的DMA
對于某些外部設備,其輸入或輸出是與某個外部時鐘同步的,而與ADSP2106x的讀寫時鐘不相干。當這樣的設備與ADSP2106x接口時,通常的做法是在接口端加FIFO或雙口RAM,把ADSP2106x的讀寫與該外設的輸入或輸出時鐘隔離開來。但ADSP2106x芯片本身提供了更靈活、更高效的方式,即DMA通道7和8的握手DMA方式(Handshake),可以完全省去FIFO或RAM,其典型應用電路如圖2所示。
圖中以8位數(shù)據(jù)線寬度為例,以DMA通道7為輸出,對應的握手信號為DMAR1和DMAG1;以DMA通道8為輸入,對應的握手信號為DMAR2和DMAG2。整個電路只用到了最常用的74273和74374芯片,外設的讀寫時鐘最高可達40MHz。在這種握手DMA方式中,外設不占用ADSP2106x的外部地址總線。關于上面電路的詳細情況,在此不再贅述。
下面給出設置握手DMA的對應程序。這里假設要從外設2中輸入1024個數(shù)據(jù)到內存0x26000~0x264ff中,則需對DMA通道8進行如下編程:
/*設置內存地址-計數(shù)寄存器*/
R0=0x26000;
DM(II8)=R0; /*設置內存起始地址*/
R0=1;
DM(IM8)=R0; /*設置內存地址增加值*/
R0=1024;
DM(C8)=R0; /*設置內存寫數(shù)次數(shù)*/
/*設置外存計數(shù)寄存器*/
R0=1;
DM(EM8)=R0; /*設置外存地址增加值*/
R0=1024;
DM(EC8)=R0; /*設置外存輸入次數(shù)*/
R0=0x401;
DM(DMAC8)=R0; /*設置DMA控制寄存器
DMAC8*/
/*設置為Handshake和向內存寫數(shù)方式,并使能DMA*/
/*DMA通道8開啟,等待外設的輸入時鐘,每接 收到一個時鐘,輸入一次*/
對上面程序需要說明的是:雖然電路中沒有用到外存地址,但外存計數(shù)寄存器EM7和EC7也必須設置。
如果要向外設1中輸入數(shù)據(jù),則需要對DMA7進行類似的編程。
3.4 內存與Link口間的DMA
ADSP2106x具有很強的并行工作能力,不需加任何外部仲裁電路,6片ADSP2106x和一個主機就可以很方便連在一起并行工作。它們之間的數(shù)據(jù)交換既可以通過共享的外部數(shù)據(jù)、地址總線來實現(xiàn),也可采用點對點的Link口來完成。6個Link口是ADSP2106x芯片所獨有的高速數(shù)據(jù)接口;每個Link口包含4根數(shù)據(jù)線、一個時鐘線和一個應答信號線,最高的數(shù)據(jù)傳輸率為40Mbyte/s。
用Link口進行片間數(shù)據(jù)交換,通常情況下都要采用DMA方式,這樣才能將其優(yōu)點充分發(fā)揮。在使用DMA方式進行Link口通訊時,除了要進行地址-計數(shù)寄存器的設置外,還要進行傳輸速率選擇寄存器(LCOM)和緩存-口配對寄存器(LAR)的設置;最后設置DMA控制寄存器LCTL,并開啟DMA操作。
假設有兩片ADSP2106x,它們相互間用Link5口相連;我們要把第一片內存0x26000~0x263ff中的1024個數(shù)用Link5口傳輸?shù)降诙膬却?x23000~0x23fff處,則兩片ADSP2106x的DMA編程設置如下:
/*第一片*/
r0=0X3f000;
dm(LCOM)=r0; /*把Link口設為2x clock*/
r0=0xfff7f;
dm(LAR)=r0; /*link port5--> link buffer2,
對應DMA通道4*/
r0=0X26000;
dm(II4)=r0; /*設置起始地址*/
r0=1024;
dm(C4)=r0; /*設置讀數(shù)次數(shù)*/
r0=1;
dm(IM4)=r0; /*設置地址增加值*/
r0=0Xb00;
dm(LCTL)=r0; /*enable output DMA*/
/*第二片*/
r0=0X3f000;
dm(LCOM)=r0; /*把Link口設為2x clock*/
r0=0xfff7f;
dm(LAR)=r0; /*link port5-->link buffer 2,對
應DMA通道4*/
r0=0x23000;
dm(II4)=r0; /*設置起始地址*/
r0=1024;
dm(C4)=r0; /*設置讀數(shù)次數(shù)*/
r0=1;
dm(IM4)=r0; /*設置地址增加值*/
r0=0x300;
dm(LCTL)=r0; /*enable input DMA*/
對于上面的兩段程序,應分別加載到兩片ADSP2106x中。需要說明的是:Link Buffer 2對應DMA通道4。如果把其他的Link Buffer與Link口5配對,則需設置與該Buffer對應的DMA通道。
ADSP2106x中DMA操作功能強大,形式多樣,除了本文所介紹的部分外,還有鏈式DMA、二維DMA等,因此要全部掌握并熟練應用是有一定難度的。通過對各種DMA的應用,可以使數(shù)據(jù)進出芯片變得更加流暢,也可以使其核心處理單元的運算能力發(fā)揮到極致
評論