0 引言
時(shí)延是遙操作系統(tǒng)中主要問(wèn)題之一,時(shí)延對(duì)系統(tǒng)最大的影響是使連續(xù)遙操作閉環(huán)反饋控制系統(tǒng)變得不穩(wěn)定[1]。為了有效減小時(shí)延對(duì)遙操作系統(tǒng)的擾動(dòng)影響,基于虛擬現(xiàn)實(shí)技術(shù)的遙操作[2-4]成為主要研究方向之一。然而虛擬現(xiàn)實(shí)技術(shù)需要準(zhǔn)確獲得現(xiàn)場(chǎng)環(huán)境的幾何學(xué)、動(dòng)力學(xué)等模型的各種參數(shù),這極大削弱了虛擬現(xiàn)實(shí)技術(shù)的應(yīng)用效果。近年來(lái)將臨場(chǎng)感方式、虛擬現(xiàn)實(shí)方式與自主式智能系統(tǒng)相結(jié)合成為克服時(shí)延影響的一種新方法[5]。自主式智能系統(tǒng)體系結(jié)構(gòu)的主要任務(wù)是如何把感知、規(guī)劃、決策、行動(dòng)等各種模塊有機(jī)的結(jié)合起來(lái),從而形成具有一定特色的智能系統(tǒng)。當(dāng)前主要體系結(jié)構(gòu)形式有:Saridis[6]基于三級(jí)模型構(gòu)造的分層遞階式結(jié)構(gòu);MIT的Rodney Brooks[7]基于水平分片模式的包容式體系結(jié)構(gòu);分布式人工智能(DAI)中的多智能體系統(tǒng)(MAS)體系結(jié)構(gòu)[8 ]。目前,多智能體系統(tǒng)(MAS)體系結(jié)構(gòu)的應(yīng)用最為廣泛,國(guó)外已將MAS技術(shù)應(yīng)用于多智能體機(jī)器人的合作、柔性制造系統(tǒng)、協(xié)調(diào)專(zhuān)家系統(tǒng)、并行工程、交通控制、企業(yè)及社會(huì)經(jīng)濟(jì)系統(tǒng)、Internet網(wǎng)絡(luò)等[9-14]。在國(guó)內(nèi),上海交通大學(xué)以及浙江大學(xué)等也進(jìn)行了多智能體系統(tǒng)智能機(jī)器人的研制。
時(shí)延是遙操作系統(tǒng)中主要問(wèn)題之一,時(shí)延對(duì)系統(tǒng)最大的影響是使連續(xù)遙操作閉環(huán)反饋控制系統(tǒng)變得不穩(wěn)定[1]。為了有效減小時(shí)延對(duì)遙操作系統(tǒng)的擾動(dòng)影響,基于虛擬現(xiàn)實(shí)技術(shù)的遙操作[2-4]成為主要研究方向之一。然而虛擬現(xiàn)實(shí)技術(shù)需要準(zhǔn)確獲得現(xiàn)場(chǎng)環(huán)境的幾何學(xué)、動(dòng)力學(xué)等模型的各種參數(shù),這極大削弱了虛擬現(xiàn)實(shí)技術(shù)的應(yīng)用效果。近年來(lái)將臨場(chǎng)感方式、虛擬現(xiàn)實(shí)方式與自主式智能系統(tǒng)相結(jié)合成為克服時(shí)延影響的一種新方法[5]。自主式智能系統(tǒng)體系結(jié)構(gòu)的主要任務(wù)是如何把感知、規(guī)劃、決策、行動(dòng)等各種模塊有機(jī)的結(jié)合起來(lái),從而形成具有一定特色的智能系統(tǒng)。當(dāng)前主要體系結(jié)構(gòu)形式有:Saridis[6]基于三級(jí)模型構(gòu)造的分層遞階式結(jié)構(gòu);MIT的Rodney Brooks[7]基于水平分片模式的包容式體系結(jié)構(gòu);分布式人工智能(DAI)中的多智能體系統(tǒng)(MAS)體系結(jié)構(gòu)[8 ]。目前,多智能體系統(tǒng)(MAS)體系結(jié)構(gòu)的應(yīng)用最為廣泛,國(guó)外已將MAS技術(shù)應(yīng)用于多智能體機(jī)器人的合作、柔性制造系統(tǒng)、協(xié)調(diào)專(zhuān)家系統(tǒng)、并行工程、交通控制、企業(yè)及社會(huì)經(jīng)濟(jì)系統(tǒng)、Internet網(wǎng)絡(luò)等[9-14]。在國(guó)內(nèi),上海交通大學(xué)以及浙江大學(xué)等也進(jìn)行了多智能體系統(tǒng)智能機(jī)器人的研制。
MAS的結(jié)構(gòu)類(lèi)似于網(wǎng)絡(luò)的形式,其中基本節(jié)點(diǎn)為智能體(Agent),它們具有獨(dú)立的知識(shí)、工作模型和專(zhuān)門(mén)的輸入輸出結(jié)構(gòu),從網(wǎng)上獲得所需要的輸入數(shù)據(jù),通過(guò)加工之后送回網(wǎng)絡(luò)。網(wǎng)絡(luò)提供了智能體之間信息交流的通道,凡是相互有關(guān)的節(jié)點(diǎn)均有相應(yīng)的通道。與一般的網(wǎng)絡(luò)結(jié)構(gòu)不同的是,MAS還有一個(gè)被稱(chēng)為協(xié)調(diào)機(jī)構(gòu)的環(huán)節(jié)實(shí)現(xiàn)網(wǎng)絡(luò)的管理和運(yùn)行,它負(fù)責(zé)任務(wù)的劃分、智能節(jié)點(diǎn)的組織安排和工作時(shí)的動(dòng)態(tài)協(xié)調(diào);此外還提供共享信息和節(jié)點(diǎn)間交流的工具;其中協(xié)調(diào)機(jī)構(gòu)是MAS的核心。基于多智能體系統(tǒng)(MAS)體系結(jié)構(gòu),本文提出一種自主遙操作系統(tǒng)框架,并以實(shí)例說(shuō)明其有效性。
1 遙操作系統(tǒng)構(gòu)成與工作原理
遙操作系統(tǒng)常采用主從控制,主要由操作者、控制端、通信環(huán)節(jié)、執(zhí)行端和環(huán)境構(gòu)成(如圖1所示)。

由于通訊時(shí)延的影響,操作者不能實(shí)時(shí)地感受到執(zhí)行端與環(huán)境的交互信息,因此在操作者處,通常應(yīng)用虛擬現(xiàn)實(shí)技術(shù),建立虛擬的執(zhí)行端和環(huán)境,由虛擬的執(zhí)行端和環(huán)境提供給操作者以實(shí)時(shí)的虛擬力反饋。但是在環(huán)境參數(shù)未知或不準(zhǔn)確的時(shí)候虛擬現(xiàn)實(shí)技術(shù)不能很好的發(fā)揮作用,這時(shí)結(jié)合自主智能系統(tǒng)能取得不錯(cuò)的效果;執(zhí)行端在遠(yuǎn)地控制器的自主控制下仍可按既定策略完成某些特定的作業(yè)任務(wù)或具有某些自主功能。以下將詳細(xì)介紹基于MAS體系結(jié)構(gòu)的自主操作。
2 基于Multi-Agent System(MAS)的遙操作
基于MAS的遙操作系統(tǒng),把各個(gè)功能模塊作為有一定獨(dú)立工作能力的智能體,使之能按需要與任何其他智能體進(jìn)行點(diǎn)對(duì)點(diǎn)的通信。每個(gè)智能體具有圖2所示的結(jié)構(gòu),其核心是工作模式庫(kù),可以存放多種功能程序。狀態(tài)信號(hào)可以起到內(nèi)部功能的切換作用,同時(shí)也起到引導(dǎo)系統(tǒng)各功能模塊之間的信息流向,從而改變系統(tǒng)組織結(jié)構(gòu)的作用。由于狀態(tài)是變化的,因而結(jié)構(gòu)是動(dòng)態(tài)可變的。

圖2 功能模塊智能體的構(gòu)造
各個(gè)智能體相互通訊、彼此協(xié)調(diào),共同完成復(fù)雜的任務(wù)。系統(tǒng)不僅具備一般分布式系統(tǒng)所具有的資源共享、易于擴(kuò)張的特點(diǎn),而且克服了建立一個(gè)龐大知識(shí)庫(kù)所造成的知識(shí)管理的困難,具有很強(qiáng)的靈活性和可靠性,適合于實(shí)時(shí)要求較高的作業(yè)任務(wù)[10]。我們?cè)O(shè)計(jì)了一個(gè)基于MAS的遙操作系統(tǒng)模型(圖3)。圖3顯示的是一個(gè)利用黑板系統(tǒng)作為協(xié)調(diào)機(jī)構(gòu)的自主式系統(tǒng)的結(jié)構(gòu)框圖。黑板系統(tǒng)記錄當(dāng)前各智能體的工作狀態(tài)、全局性的數(shù)據(jù)和產(chǎn)生的假說(shuō),各智能體的交互通過(guò)黑板系統(tǒng)進(jìn)行。
各個(gè)智能體相互通訊、彼此協(xié)調(diào),共同完成復(fù)雜的任務(wù)。系統(tǒng)不僅具備一般分布式系統(tǒng)所具有的資源共享、易于擴(kuò)張的特點(diǎn),而且克服了建立一個(gè)龐大知識(shí)庫(kù)所造成的知識(shí)管理的困難,具有很強(qiáng)的靈活性和可靠性,適合于實(shí)時(shí)要求較高的作業(yè)任務(wù)[10]。我們?cè)O(shè)計(jì)了一個(gè)基于MAS的遙操作系統(tǒng)模型(圖3)。圖3顯示的是一個(gè)利用黑板系統(tǒng)作為協(xié)調(diào)機(jī)構(gòu)的自主式系統(tǒng)的結(jié)構(gòu)框圖。黑板系統(tǒng)記錄當(dāng)前各智能體的工作狀態(tài)、全局性的數(shù)據(jù)和產(chǎn)生的假說(shuō),各智能體的交互通過(guò)黑板系統(tǒng)進(jìn)行。

圖3 基于MAS的遙操作系統(tǒng)模型
在執(zhí)行端活動(dòng)過(guò)程中,所需感知的信息量非常大,而且必須能夠迅速處理許多動(dòng)態(tài)信息。先進(jìn)的傳感儀器,例如CCD、雷達(dá)測(cè)距儀、紅外探測(cè)儀等,具有精確度高、環(huán)境適應(yīng)性強(qiáng)、感知范圍廣等優(yōu)點(diǎn),并且還可以監(jiān)測(cè)執(zhí)行端本身的信息。傳感技術(shù)的應(yīng)用大大拓寬和延伸了執(zhí)行端對(duì)環(huán)境的感知能力。在設(shè)計(jì)環(huán)境感知系統(tǒng)時(shí),還要充分考慮控制端的作用,盡量把適合于人感知的任務(wù)交給控制端去完成,把適合于機(jī)器去感知的任務(wù)交給執(zhí)行端自己去做,從而實(shí)現(xiàn)控制端與執(zhí)行端的合理分工和密切協(xié)作。
系統(tǒng)主動(dòng)利用機(jī)器環(huán)境感知得到的信息建立環(huán)境模型,對(duì)執(zhí)行端的運(yùn)行狀態(tài)進(jìn)行評(píng)價(jià)預(yù)測(cè),并根據(jù)危險(xiǎn)程度做出行為決策。評(píng)價(jià)決策任務(wù)由多智能體和黑板系統(tǒng)聯(lián)合完成,如圖3所示。環(huán)境感知的變化可以看作為事件,黑板系統(tǒng)根據(jù)事件的發(fā)生協(xié)調(diào)各智能體的工作方式、決定總體對(duì)策,使系統(tǒng)轉(zhuǎn)入不同的狀態(tài)。
由于環(huán)境事件是隨機(jī)的離散事件,這種“事件―狀態(tài)”模型稱(chēng)之為離散事件狀態(tài)(DES)控制模型。為了引出DES的定義,我們先給出幾個(gè)基本概念。
定義1 消息數(shù)據(jù)。
一個(gè)消息是指一個(gè)功能模塊的一個(gè)輸入或輸出,所有同種類(lèi)型的消息組成一個(gè)消息數(shù)據(jù)。消息數(shù)據(jù)往往與某一個(gè)功能模塊有關(guān)(例如輸出結(jié)果),因而它有固定的數(shù)據(jù)格式。
對(duì)于遙操作系統(tǒng)來(lái)說(shuō),所有的消息均可分為m0,m1,m2三大類(lèi)。其中,m0為總體輸入消息集,是指那些輸入環(huán)境感知功能模塊的輸入消息類(lèi),例如傳感器的輸入,它們構(gòu)成了整個(gè)系統(tǒng)的輸入集合;m1為總體輸出消息集,是指產(chǎn)生一定行為的消息類(lèi),由控制外部設(shè)備的功能模塊輸出,它們構(gòu)成了整個(gè)系統(tǒng)的輸出集合;m2為內(nèi)部消息集,是指功能模塊之間的互為輸入輸出的數(shù)據(jù)集合。
定義2 事件是功能模塊對(duì)每次工作結(jié)果的定性描述。
它可以是處理結(jié)果的簡(jiǎn)潔的結(jié)論;也可以指功能模塊本身工作狀態(tài)的描述。事件可簡(jiǎn)單的由字符串或編碼表示。
定義3 狀態(tài)是對(duì)當(dāng)前整個(gè)系統(tǒng)的內(nèi)外現(xiàn)狀的一種表述。
它是對(duì)系統(tǒng)內(nèi)部和外部環(huán)境形勢(shì)評(píng)估的結(jié)論,可用來(lái)作為指導(dǎo)各功能模塊工作的依據(jù)。與事件一樣,它可用符號(hào)串或編碼來(lái)表示。
據(jù)此,我們可以給出DES的定義如下。
定義4 DES是一種描述自主式智能系統(tǒng)工作機(jī)構(gòu)的自動(dòng)機(jī)。
它規(guī)定了系統(tǒng)的信息處理構(gòu)造形勢(shì)和工作方式,由七倍體組成:DES=(M,E,S,F(xiàn),C,so,se)
它規(guī)定了系統(tǒng)的信息處理構(gòu)造形勢(shì)和工作方式,由七倍體組成:DES=(M,E,S,F(xiàn),C,so,se)

協(xié)調(diào)機(jī)構(gòu)C是一個(gè)特殊的工作模塊。它根據(jù)由各個(gè)功能模塊上報(bào)的事件集合 和當(dāng)前的狀態(tài) ,變換出新的狀態(tài) 。這里, 是當(dāng)前各子系統(tǒng)工作情況的總結(jié),描述了系統(tǒng)外部環(huán)境和內(nèi)部各部分的總體形勢(shì),因此可以說(shuō)狀態(tài)的變換是基于對(duì)系統(tǒng)的總體形勢(shì)的評(píng)估和判斷。這樣,由于 決定了個(gè)功能模塊的功能選擇,而它的設(shè)置又取決于全局的形勢(shì),因此DES是事件驅(qū)動(dòng)―行為決策方式的自主式智能控制系統(tǒng)。
3 MAS結(jié)構(gòu)在無(wú)人直升機(jī)自主著陸中的應(yīng)用分析
這里以無(wú)人直升機(jī)作為執(zhí)行端說(shuō)明其在遙操作系統(tǒng)中的具體實(shí)現(xiàn)。
功能模塊F:按機(jī)構(gòu)和功能分為三大類(lèi):(1)傳感模塊:包括路徑識(shí)別、圖像理解、超聲測(cè)障、定位估計(jì)等模塊;(2)決策模塊:包括信息融合、全局規(guī)劃、局部路徑規(guī)劃、環(huán)境建模、狀態(tài)評(píng)估等模塊;(3)執(zhí)行模塊: 包括自主避障、緊急響應(yīng)、跟蹤著陸等模塊。
協(xié)調(diào)機(jī)構(gòu)C:采用黑板式控制,有記錄黑板、知識(shí)庫(kù)及推理引擎三個(gè)部分組成。其中記錄黑板收集各個(gè)功能模塊送來(lái)的事件報(bào)告,知識(shí)庫(kù)存放事件―狀態(tài)轉(zhuǎn)換模型,以及協(xié)調(diào)功能模塊工作時(shí)序和直升機(jī)空間關(guān)系的導(dǎo)航模型。
M集合:由三維圖像、距離圖像、超聲信號(hào)、目標(biāo)特征、障礙區(qū)域、局部地形、局部路徑、全局路徑、行動(dòng)命令等多個(gè)結(jié)構(gòu)化數(shù)據(jù)構(gòu)成。
E集合:由直道、發(fā)現(xiàn)障礙、發(fā)現(xiàn)疑似目標(biāo)、超過(guò)目標(biāo)、彎道等多種符號(hào)組成。
S集合:由平飛狀態(tài)、后飛狀態(tài)、側(cè)飛狀態(tài)、垂直升降狀態(tài)、懸停狀態(tài)、初始化狀態(tài)、終點(diǎn)狀態(tài)、遙操作狀態(tài)等組成。
其主要狀態(tài)轉(zhuǎn)換及事件關(guān)系如圖4所示。

圖4 遙操作系統(tǒng)狀態(tài)轉(zhuǎn)換圖
下面以垂直升降為例說(shuō)明遙操作系統(tǒng)中的相關(guān)狀態(tài)轉(zhuǎn)化過(guò)程:從初始狀態(tài) 出發(fā),各功能模塊進(jìn)入初始化工作狀態(tài),然后進(jìn)入自主狀態(tài),各個(gè)智能體一方面對(duì)輸入的消息進(jìn)行加工,另一方面對(duì)處理進(jìn)行評(píng)價(jià),形成事件 直接上報(bào)給黑板。黑板的調(diào)度推理機(jī)根據(jù)事件、全局情況、事件狀態(tài)轉(zhuǎn)換規(guī)則決定新的狀態(tài) ,若 就是垂直升降狀態(tài)時(shí),緊急響應(yīng)模塊執(zhí)行垂直升降避障,否則通過(guò)消息通知各智能代理在新的狀態(tài) 下工作。
4 結(jié)論
本文對(duì)遙操作系統(tǒng)的時(shí)延問(wèn)題進(jìn)行了分析,并建立了一個(gè)基于多智能體系統(tǒng)(MAS)的遙操作系統(tǒng)模型。在動(dòng)態(tài)實(shí)時(shí)的環(huán)境下,由于存在著嚴(yán)格的時(shí)間約束,將臨場(chǎng)感方式、虛擬現(xiàn)實(shí)方式與自主智能系統(tǒng)相結(jié)合是一種克服時(shí)延影響的更為有效的方法;采用自主式智能系統(tǒng)輔助監(jiān)視和控制處理,通過(guò)一定形式的人機(jī)交互作用,把人和機(jī)器的智能結(jié)合起來(lái),是遙操作系統(tǒng)的重要發(fā)展方向之一。
[1] 李成,梁斌. 空間機(jī)器人的遙操作. 宇航學(xué)報(bào),2001,22 (1):95-98
[2] 莊駿,邱平,孫增圻. 大時(shí)延環(huán)境下的分布式遙操作系統(tǒng). 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2000,40(1):80-83
[3] 陳衛(wèi)東,席裕庚,蔡鶴皋. 虛擬現(xiàn)實(shí)系統(tǒng)中的手部跟蹤和力覺(jué)再現(xiàn)技術(shù)研究. 測(cè)控技術(shù), 1999,18(6):18-21
[4] 曾慶軍, 陳善隆, 黃惟一. 力覺(jué)臨場(chǎng)感遙控作業(yè)虛擬現(xiàn)實(shí)系統(tǒng)研究. 東南大學(xué)學(xué)報(bào), 1999,29(2):1-5
[5] 李華忠, 楊維萍, 柳長(zhǎng)安. 基于虛擬現(xiàn)實(shí)的空間機(jī)器人共享控制系統(tǒng)及其仿真. 宇航學(xué)報(bào), 2000,21(3):100-105
[6] Saridis G N.Toward the Realization of Intelligent of Controls.Proc.of the IEEE,1979,67(8):1115-1133
[7] Brook R.A Robust Layered Control System for Mobile Robot.IEEE J Robotics and Automation,1986,2(1):14-23
[8] Dunin-Keplicz B etc.Compositional Formal Specification of Multi-Agent Systems.Lecture Notes in AI, 1994
[9] V R Lesser,D D Corkill.The distributed vehicle monitoring tested. Artificial Intelligence,1983,4:63-109
[10] L Gasser,C Braganza,N Herman.MACE:A flexible tested for distributed AI research in distributed artificial intelligence,1989,119-153
[11] G Vernazza,R Zunino.A distributed intelligent methodology for railway traffic control.IEEE Trans on Vehicular Technology,1990,39(3):263-270
[12] G Q Huang.An agent-based framework for cooperating expert system s in concurrent engineering.Engineering Application of Artificial Intelligence,1994,7(6):685-693
[13] N R Jennings,L Z Varga, R P Aarnts. Transforming standalone expert systems into a community of cooperating agents.Artificial Intelligence,1993,6(4):317-331
[14] P Faruk,S Shakhar.Distributed conflict resolution among cooperating expert systems.Expert Systems,1993,10(4):227-236
[15] 劉金琨,王樹(shù)青. 復(fù)雜實(shí)時(shí)動(dòng)態(tài)環(huán)境下的多智能體系統(tǒng). 控制與決策,1998(7):385-407