在公共交通中,公交專用道作為重要的交通設施,能夠在保證高速、高效、高質量的同時,減少城市交通擁堵,提高公共交通的服務質量和運營效率。本文針對間歇式公交專用道與下游信號交叉口的信號控制協調優化需求,提出了涵蓋公交專用道Agent、公交車Agent和交通信號燈Agent的多類型多智能體(Multi-TypeMulti-Agent)混合控制模型,并采用Q學習和SARSA兩種強化學習方法對傳統間歇式公交專用道、移動間歇式公交專用道兩種控制場景進行了參數設計,提出了TLS-IBL-QL、TLS-IBL-SARSA、TLS-MBL-QL和TLS-MBL-SARSA優化模型。實驗結果表明,TLS-IBL-SARSA算法的性能優于TLS-IBL-QL算法,TLS-MBL-QL的性能優于TLS-MBL-SARSA算法,兩類控制算法均明顯優于傳統的TLS-DBL公交專用道控制。