在公共交通中,公交專用道作為重要的交通設(shè)施,能夠在保證高速、高效、高質(zhì)量的同時,減少城市交通擁堵,提高公共交通的服務(wù)質(zhì)量和運營效率。本文針對間歇式公交專用道與下游信號交叉口的信號控制協(xié)調(diào)優(yōu)化需求,提出了涵蓋公交專用道Agent、公交車Agent和交通信號燈Agent的多類型多智能體(Multi-TypeMulti-Agent)混合控制模型,并采用Q學(xué)習(xí)和SARSA兩種強化學(xué)習(xí)方法對傳統(tǒng)間歇式公交專用道、移動間歇式公交專用道兩種控制場景進行了參數(shù)設(shè)計,提出了TLS-IBL-QL、TLS-IBL-SARSA、TLS-MBL-QL和TLS-MBL-SARSA優(yōu)化模型。實驗結(jié)果表明,TLS-IBL-SARSA算法的性能優(yōu)于TLS-IBL-QL算法,TLS-MBL-QL的性能優(yōu)于TLS-MBL-SARSA算法,兩類控制算法均明顯優(yōu)于傳統(tǒng)的TLS-DBL公交專用道控制。
本文在分析智能制造對PID整定的新需求及PID整定面臨的挑戰(zhàn)難題的基礎(chǔ)上,將自動化的建模、控制與優(yōu)化和人工智能的深度學(xué)習(xí)與強化學(xué)習(xí)深度融合與協(xié)同,提出了自適應(yīng)與自主的PID整定的智能優(yōu)化方法,包括端邊云協(xié)同的PID控制過程數(shù)字孿生模型和強化學(xué)習(xí)與數(shù)字孿生模型相結(jié)合的PID整定算法。
本文基于深度強化學(xué)習(xí)的前沿技術(shù),系統(tǒng)地介紹了深度強化學(xué)習(xí)的基本理論和其應(yīng)用于交通信號控制系統(tǒng)的發(fā)展現(xiàn)狀,包括基于深度強化學(xué)習(xí)的單交叉口和多交叉口信號控制模型和研究成果。本文最后討論了深度強化學(xué)習(xí)在智能交通信號控制應(yīng)用中的主要挑戰(zhàn)和待解決的技術(shù)難題。
到第 頁
友情鏈接
電話:010-62669087 控制網(wǎng)版權(quán)所有未經(jīng)許可不得轉(zhuǎn)載
地址:北京市海淀區(qū)上地十街輝煌國際5號樓1416室(100085)
版權(quán)所有 控制網(wǎng) 京ICP備14036844-2號 北京市公安局海淀分局備案號:11010802023656號