在電信、電力、國(guó)防等應(yīng)用領(lǐng)域中,經(jīng)常要求其所用設(shè)備有極高的實(shí)時(shí)性。當(dāng)需要在各個(gè)設(shè)備間進(jìn)行大容量的信息交換時(shí),傳統(tǒng)的網(wǎng)絡(luò)包交換模式已不能很好地滿足實(shí)時(shí)性的要求。而借助于CPCI總線,兩個(gè)設(shè)備可以互訪對(duì)方的內(nèi)存,具有傳輸速度快、傳輸容量大和高可靠性等特點(diǎn),非常適合大容量的信息傳遞。國(guó)家數(shù)字交換系統(tǒng)工程技術(shù)研究中心承擔(dān)的國(guó)家863計(jì)劃項(xiàng)目――“中國(guó)第三代移動(dòng)通信系統(tǒng)”CDMA2000系統(tǒng)集成就選擇基于CPCI總線的多SBC平臺(tái)。各個(gè)SBC間的通信效率直接決定了整個(gè)系統(tǒng)性能的高低。目前常用的實(shí)時(shí)操作系統(tǒng)如VxWorks、Lynx等,都針對(duì)CPCI總線實(shí)現(xiàn)了消息隊(duì)列,可用于SBC間的消息通信。但VxWorks、Lynx中消息傳遞的實(shí)現(xiàn)方式很不靈活,一般是通過(guò)在一個(gè)特定的SBC(通常為system board)中開(kāi)啟一塊共享內(nèi)存,其他各個(gè)SBC(通常為non system board)通過(guò)對(duì)共享內(nèi)存的讀寫交換信息;每完成一次兩個(gè)non system SBC間的信息交換,都要進(jìn)行一次PCI讀寫操作,效率不高。另外VxWorks、Lynx中的消息長(zhǎng)度都有一個(gè)最大值,當(dāng)要進(jìn)行大數(shù)據(jù)量(如1GB的內(nèi)存數(shù)據(jù)庫(kù))的信息傳輸時(shí),操作系統(tǒng)提供消息傳遞機(jī)制也無(wú)能為力。而以上這些問(wèn)題,都可以通過(guò)任意兩個(gè)SBC間的直接內(nèi)存訪問(wèn)得到解決。本文首先介紹了PCI Bridge的工作原理;然后以Motorola公司提供的CPX8000系列工控機(jī)為例,討論了兩個(gè)SBC是如何基于背板(Backplane)上的CPCI總線,并利用PCI Bridge的地址映射機(jī)制,通過(guò)互訪內(nèi)存的方式最終實(shí)現(xiàn)雙機(jī)通信;最后介紹了實(shí)際應(yīng)用時(shí)應(yīng)注意的性能優(yōu)化問(wèn)題。
1 PCI Bridge的工作原理
在簡(jiǎn)單的計(jì)算機(jī)系統(tǒng)中,其擁有的外部設(shè)備較少,單級(jí)總線結(jié)構(gòu)便能滿足系統(tǒng)的需要。但是由于單個(gè) PCI總線可支持的 PCI 設(shè)備數(shù)量有電氣限制,對(duì)擁有大量外設(shè)的計(jì)算機(jī)系統(tǒng)而言,單級(jí)總線結(jié)構(gòu)已不能滿足系統(tǒng)的要求,因此便產(chǎn)生了橋接設(shè)備。通過(guò)PCI-to-PCI Bridge可擴(kuò)展出新的PCI總線,通過(guò)PCI-to-ISA Bridge可擴(kuò)展出ISA總線。借助PCI Bridge這些特殊的PCI設(shè)備,系統(tǒng)中各級(jí)總線被粘和在一起,使整個(gè)系統(tǒng)成為一個(gè)有機(jī)整體。
每個(gè)PCI設(shè)備都有自己的PCI I/O空間、PCI內(nèi)存空間和PCI配置空間(configuration space)。PCI設(shè)備的設(shè)備驅(qū)動(dòng)程序?qū)CI配置空間進(jìn)行初始化設(shè)置后,各個(gè)智能控制器如CPU、DMA控制器等,可以對(duì)PCI設(shè)備的PCI I/O空間、PCI內(nèi)存空間進(jìn)行訪問(wèn)。在圖1中,CPU若要訪問(wèn)網(wǎng)卡,首先會(huì)在PCI Bus0上生成一個(gè)物理地址,這個(gè)地址經(jīng)PCI-to-PCI Bridge的過(guò)濾及轉(zhuǎn)換后,在PCI Bus1上產(chǎn)生一PCI Bus地址,網(wǎng)卡通過(guò)地址譯碼,響應(yīng)對(duì)這個(gè)地址的訪問(wèn)。
圖1 基于PCI的系統(tǒng)
從這個(gè)過(guò)程可以了解到,PCI-to-PCI Bridge有兩種基本的功能:
(1)地址映射功能。雖然同是對(duì)網(wǎng)卡進(jìn)行訪問(wèn),但PCI Bus0與PCI Bus1上的地址意義是不同的。兩個(gè)地址分屬各自的地址空間,通過(guò)PCI-to-PCI Bridge實(shí)現(xiàn)兩個(gè)地址的映射。根據(jù)這兩個(gè)地址是否相同,可將PCI-to-PCI Bridge區(qū)分為兩種類型:
?PCI-to-PCI Transparent Bridge。PCI Bridge不對(duì)PCI Bus0上的地址進(jìn)行轉(zhuǎn)換,直接將其映射到PCI Bus1上。PCI Bus0與PCI Bus1上的地址是相同的。
?PCI-to-PCI Non Transparent Bridge。PCI Bus0上的地址必須經(jīng)過(guò)PCI Bridge的轉(zhuǎn)換,才能映射到PCI Bus1上。PCI Bus0與PCI Bus1上的地址是不同的。
(2)地址過(guò)濾功能。PCI Bridge在把PCI Bus0上的地址向下游總線(ISA Bus、PCI Bus1)傳遞時(shí),具有選擇性。在圖1中,CPU在PCI Bus0上所產(chǎn)生的地址,只有對(duì)SCSI和
Ethernet的訪問(wèn),PCI-to-PCI Bridge才予以接收;而對(duì)于PCI Bus0的其他地址,PCI-to-PCI Bridge均不予響應(yīng)。每一個(gè)PCI Bridge所響應(yīng)的地址范圍,可形象地稱其為此PCI Bridge的地址窗口,只有當(dāng)上游總線的地址落進(jìn)PCI Bridge的地址窗口中,PCI Bridge才響應(yīng)此地址并向下游總線傳遞。
2 雙機(jī)通信的具體實(shí)現(xiàn)
本節(jié)以Motorola公司提供的CPX8000系列工控機(jī)為例,介紹了如何通過(guò)CPCI總線實(shí)現(xiàn)雙機(jī)間的通信。如圖2所示,兩個(gè)SBC通過(guò)背板上的CPCI總線實(shí)現(xiàn)了物理上的連接。如果兩個(gè)SBC能夠互相訪問(wèn)對(duì)方的內(nèi)存,就可實(shí)現(xiàn)兩者間的數(shù)據(jù)交流。以系統(tǒng)處理機(jī)板(System Processor Board,又稱主機(jī)板)訪問(wèn)非系統(tǒng)處理機(jī)板(Non-system Processor Board, 又稱子機(jī)板)內(nèi)存為例,介紹雙機(jī)通信的具體實(shí)現(xiàn)。本方案已在Lynx及VxWorks實(shí)時(shí)操作系統(tǒng)上實(shí)現(xiàn)。
在圖2中,主機(jī)板CPU若要訪問(wèn)子機(jī)板中的1MB內(nèi)存單元,必須將這塊內(nèi)存映射到主機(jī)板CPU的虛擬地址空間中,可以通過(guò)對(duì)主機(jī)板、子機(jī)板、主機(jī)板與子機(jī)板的接口配置來(lái)達(dá)到目的。此1MB的內(nèi)存單元可被映射到不同的地址空間(如CPU虛擬地址空間、物理地址空間、本地PCI地址空間、系統(tǒng)CPCI地址空間等),映射地址也各不相同。在圖2中,對(duì)于此1MB內(nèi)存的起始單元在不同地址空間中的映射地址,分別用符號(hào)A1、A2、…A7表示。
圖2 數(shù)據(jù)通信原理圖
2.1 子機(jī)板的配置
(1)調(diào)用內(nèi)核內(nèi)存分配函數(shù)申請(qǐng)1MB的內(nèi)核虛擬地址空間,得到申請(qǐng)空間的開(kāi)始地址A7。
(2)根據(jù)操作系統(tǒng)的內(nèi)存映射關(guān)系,得到虛擬地址A7的物理映射地址A6。
(3)Raven ASIC是一個(gè)Host-to-PCI Bridge,因?yàn)镻rocessor Bus不是一個(gè)標(biāo)準(zhǔn)總線,所以通過(guò)Raven將其轉(zhuǎn)換為PCI總線,以掛接各類PCI設(shè)備。CPU和Raven一起構(gòu)成了一組套片(chipset),配合使用。根據(jù)Raven的設(shè)置,獲得物理地址A6在Local PCI Bus的映射地址A5。
(4)21554是一PCI-to-PCI Non Transparent Bridge,并可進(jìn)行雙向數(shù)據(jù)傳遞。通過(guò)其內(nèi)部的兩個(gè)配置寄存器,將其地址窗口的大小設(shè)為1MB;地址窗口的起始地址在Local PCI Bus端設(shè)為A5。
2.2 主機(jī)板的配置
(1)申請(qǐng)大小1MB的內(nèi)核虛擬地址空間,得到其開(kāi)始地址A1。
(2)根據(jù)操作系統(tǒng)的內(nèi)存映射關(guān)系,得到虛擬地址A1的物理映射地址A2。
(3)根據(jù)Raven的設(shè)置,得到物理地址A2在Local PCI Bus上的映射地址A3。
(4)21154是一PCI-to-PCI Transparent Bridge,它也可以在兩個(gè)方向上進(jìn)行數(shù)據(jù)訪問(wèn)。設(shè)置其內(nèi)部的兩個(gè)配置寄存器,將其地址窗口的大小設(shè)為1MB;地址窗口的起始地址設(shè)置為A3。由于21154的透明性,地址A3與其在System CPCI Bus端的映射地址A4的值是相同的。
2.3 主機(jī)板與子機(jī)板的接口配置
在主機(jī)板端對(duì)子機(jī)板進(jìn)行配置,設(shè)置21554的配置寄存器,將其在System CPCI Bus端的地址窗口開(kāi)始地址設(shè)為A4。由于在Local PCI Bus端的地址窗口起始地址已設(shè)為A5,所以將地址A4映射到了地址A5。可以看到,由于21554的非透明性,使主機(jī)板與子機(jī)板的地址空間相互隔離,各自可獨(dú)立分配,并在System CPCI Bus級(jí)實(shí)現(xiàn)了對(duì)接。在主機(jī)板CPU看來(lái),整個(gè)子機(jī)板與主機(jī)板網(wǎng)卡一樣,都是掛在主機(jī)板Local PCI Bus下的一個(gè)外設(shè)。對(duì)子機(jī)板的訪問(wèn)與對(duì)主機(jī)板網(wǎng)卡的訪問(wèn)方式是一樣的,沒(méi)有什么不同。
2.4 地址轉(zhuǎn)換流程
當(dāng)所有的配置完成后,主機(jī)板CPU只對(duì)地址A1進(jìn)行讀寫操作,便可實(shí)現(xiàn)對(duì)子機(jī)板1MB內(nèi)存起始單元的訪問(wèn);對(duì)1MB內(nèi)存中其他單元的訪問(wèn),只要將地址A1加上相應(yīng)的偏移量即可。通過(guò)下面的地址轉(zhuǎn)換流程,可以清楚地看到各級(jí)地址是如何通過(guò)一級(jí)級(jí)映射,最終命中指定單元的。
主機(jī)板CPU給出虛擬內(nèi)存訪問(wèn)地址A1→主機(jī)板物理地址A2→主機(jī)板Local PCI Bus地址A3→System CPCI Bus地址A4→子機(jī)板Local PCI Bus地址A5→子機(jī)板物理地址A6→經(jīng)Falcon Memory Controller譯碼后,選中所申請(qǐng)的1MB內(nèi)存的起始單元。
從上述介紹可以看出,要想實(shí)現(xiàn)雙機(jī)的內(nèi)存互訪,關(guān)鍵是要進(jìn)行正確的地址映射。當(dāng)要實(shí)現(xiàn)多個(gè)SBC間的相互訪問(wèn)時(shí),地址的映射會(huì)更復(fù)雜,需要對(duì)操作系統(tǒng)的地址空間分配、各個(gè)SBC的PCI-to-PCI Bridge設(shè)置、System CPCI Bus地址空間分配等進(jìn)行通盤考慮。
圖3 在兩SBC間進(jìn)行讀操作時(shí)的時(shí)間圖
圖4 在兩SBC間進(jìn)行寫操作時(shí)的時(shí)間圖
3 性能優(yōu)化
圖3、圖4是用VMETRO的總線分析儀截獲的數(shù)據(jù)。分別是在兩個(gè)SBC間進(jìn)行讀寫訪問(wèn)時(shí),連續(xù)進(jìn)行100 Byte傳輸?shù)臅r(shí)間圖。
從圖3可以看出,每進(jìn)行一次4Byte的讀操作,要花費(fèi)956.8+4×149.5+179.4=1734.2ns,這相當(dāng)于1734.2ns/29.9ns=58 PCI clock cycles。
從圖4可以看到,第一個(gè)4Byte的寫操作花費(fèi)了159.5ns,接著是兩次猝發(fā)傳送,隨后一個(gè)4Byte寫操作花費(fèi)了119.6ns。進(jìn)行一次4Byte的寫操作平均花費(fèi)(159.5ns+2×29.9ns+119.6ns)/(4×29.9ns)=11 PCI clock cycles。
對(duì)比讀寫兩種訪問(wèn)方式可以看出,寫操作比讀操作的效率要高得多。這主要有以下一些原因:
(1)當(dāng)PCI上的一個(gè)主設(shè)備發(fā)起對(duì)一個(gè)目標(biāo)設(shè)備的訪問(wèn)時(shí),讀和寫操作的完成時(shí)間差別很大。目前的PCI設(shè)備中一般都有一個(gè)用于存儲(chǔ)器寫的轉(zhuǎn)發(fā)(post)緩沖器。若要進(jìn)行寫操作(如圖2中主機(jī)板對(duì)子機(jī)板的寫操作),主設(shè)備只需將其寫緩沖區(qū)數(shù)據(jù)復(fù)制到目標(biāo)設(shè)備的轉(zhuǎn)發(fā)緩沖器中,便認(rèn)為操作完成。例如在圖2中,主機(jī)板的Raven只要將數(shù)據(jù)發(fā)給21154,便認(rèn)為寫操作完成,后續(xù)的數(shù)據(jù)傳輸由21154驅(qū)動(dòng)完成。可以看到,寫操作在目的總線上(子機(jī)板的Process Bus)完成之前可以先在源總線上(主機(jī)板的Local PCI Bus)完成,實(shí)際上是寄存器對(duì)寄存器的操作。而要實(shí)現(xiàn)一個(gè)讀操作,則必須經(jīng)過(guò)存儲(chǔ)器本身的訪問(wèn)和各級(jí)PCI接口的邏輯延遲才可完成。與寫操作相比,讀操作在源總線上完成之前必須先在目的總線上完成,這導(dǎo)致了讀操作的效率很低。
(2)從圖3、圖4中可以看到,PCI設(shè)備還可進(jìn)行寫操作的猝發(fā)操作,但讀操作則無(wú)法進(jìn)行。這是由于猝發(fā)操作只有在前一事務(wù)是寫事務(wù)時(shí)才能實(shí)現(xiàn)。猝發(fā)傳送取消了FRAME#、AD、C/BE#、IRDY#、TRDY#、DEVSEL#等總線信號(hào)的周轉(zhuǎn)周期,實(shí)現(xiàn)了每一個(gè)PCI clock cycle進(jìn)行一次數(shù)據(jù)傳送。
(3)猝發(fā)傳送操作不可能無(wú)限制地進(jìn)行下去。連續(xù)進(jìn)行猝發(fā)傳送的次數(shù)與轉(zhuǎn)發(fā)緩沖器的大小、Latency Timer的取值、總線的繁忙狀況都有關(guān)系。
由于以上原因,在兩個(gè)SBC間進(jìn)行數(shù)據(jù)傳送時(shí),應(yīng)該采用如下方式:
(1)提供數(shù)據(jù)的SBC應(yīng)將數(shù)據(jù)直接寫到消費(fèi)數(shù)據(jù)的SBC內(nèi)存中;而不是提供者將數(shù)據(jù)放在本地內(nèi)存,再由消費(fèi)者經(jīng)過(guò)PCI讀操作來(lái)實(shí)現(xiàn)。也就是說(shuō),總是進(jìn)行PCI寫操作。
(2)當(dāng)需要在多個(gè)SBC間進(jìn)行數(shù)據(jù)互傳時(shí),要合理地設(shè)置Latency Timer的取值,以使各SBC公平使用PCI總線資源。
考慮兩個(gè)子機(jī)板間的通信實(shí)現(xiàn)。若采用操作系統(tǒng)提供的消息傳遞機(jī)制,數(shù)據(jù)提供者必須先將數(shù)據(jù)寫到主機(jī)板,數(shù)據(jù)消費(fèi)者再?gòu)闹鳈C(jī)板讀取數(shù)據(jù)。對(duì)一個(gè)4 Byte的數(shù)據(jù)傳輸來(lái)說(shuō),平均要花費(fèi)58+11=69 PCI clock cycles。若采用本文提供的方法,提供數(shù)據(jù)的SBC將數(shù)據(jù)直接寫到消費(fèi)數(shù)據(jù)的(接上頁(yè)) SBC內(nèi)存中,則傳輸一個(gè)4 Byte的數(shù)據(jù),平均只需11 PCI clock cycles。可知,后者比前者快了69/11≈6.3倍,極大提高了傳輸效率。
參考文獻(xiàn)
1 Motorola.MCP750 Series Single Board Computer Programmer’s Reference Guide. Motorola, 2001
2 Motorola. CompactPCI Single Board Computer Programmer’s Reference Guide. Motorola, 2001
3 Intel.21554 PCI-to-PCI Bridge for Embedded Applications Hardware Reference Manual. Intel,1998
4 Intel. 21154 PCI-to-PCI Bridge Configuration Application Note. Intel,1998
5 Wind River.VxWorks Programmer´s Guide. Wind River Sys-tems Inc,1998
6 Lynx. Lynx Device Driver Service Manual. Lynx, 2000
7 T.Shanley, D.Anderson. PCI System Architecture(4th Edition).USA: Addison Wesley Longman,1999