本文基于深度強(qiáng)化學(xué)習(xí)的前沿技術(shù),系統(tǒng)地介紹了深度強(qiáng)化學(xué)習(xí)的基本理論和其應(yīng)用于交通信號(hào)控制系統(tǒng)的發(fā)展現(xiàn)狀,包括基于深度強(qiáng)化學(xué)習(xí)的單交叉口和多交叉口信號(hào)控制模型和研究成果。本文最后討論了深度強(qiáng)化學(xué)習(xí)在智能交通信號(hào)控制應(yīng)用中的主要挑戰(zhàn)和待解決的技術(shù)難題。