在公共交通中,公交專用道作為重要的交通設(shè)施,能夠在保證高速、高效、高質(zhì)量的同時(shí),減少城市交通擁堵,提高公共交通的服務(wù)質(zhì)量和運(yùn)營(yíng)效率。本文針對(duì)間歇式公交專用道與下游信號(hào)交叉口的信號(hào)控制協(xié)調(diào)優(yōu)化需求,提出了涵蓋公交專用道Agent、公交車Agent和交通信號(hào)燈Agent的多類型多智能體(Multi-TypeMulti-Agent)混合控制模型,并采用Q學(xué)習(xí)和SARSA兩種強(qiáng)化學(xué)習(xí)方法對(duì)傳統(tǒng)間歇式公交專用道、移動(dòng)間歇式公交專用道兩種控制場(chǎng)景進(jìn)行了參數(shù)設(shè)計(jì),提出了TLS-IBL-QL、TLS-IBL-SARSA、TLS-MBL-QL和TLS-MBL-SARSA優(yōu)化模型。實(shí)驗(yàn)結(jié)果表明,TLS-IBL-SARSA算法的性能優(yōu)于TLS-IBL-QL算法,TLS-MBL-QL的性能優(yōu)于TLS-MBL-SARSA算法,兩類控制算法均明顯優(yōu)于傳統(tǒng)的TLS-DBL公交專用道控制。