基于Transformer注意力機制的遮擋行人重識別算法框架
近日,中國科學院沈陽自動化研究所機器人視覺研究組在遮擋行人重識別領域取得新進展,提出了一種遮擋行人重識別算法。該研究成果在線發表于工業信息領域國際期刊IEEE Transactions on Industrial Informatics(中國科學院一區Top類,IF:12.3)。
行人重識別指通過非重疊攝像頭檢索同一個行人目標,是行人檢測和行人跟蹤的重要環節,可用于視頻監控、交通管理、智能安防、刑事偵查、多機協同檢測等。然而,大多數現有的行人重識別方法都基于目標在圖像中完整可見的假設,由于真實場景中存在汽車、廣告牌、樹木等遮擋物,導致識別目標難以匹配。
科研人員針對這一問題提出了一種基于Transformer注意力機制的遮擋行人重識別算法。研究中發現在利用Transformer提取行人特征時,淺層網絡提取的特征分布在局部目標區域;中間層網絡的注意力集中在可見行人部分;高層網絡的注意力聚焦全局行人特征。基于這一發現,研究團隊提出了跳連接聚合Transformer網絡(SCAT),利用中間層特征、高層特征和細粒度局部特征來增加特征多樣性,提升遮擋行人目標的重識別精度。在多個數據集上驗證了所提方法的有效性,包括遮擋數據集、部分數據集和全身數據集。
研究成果得到了國家自然科學基金委員會、中國科學院青年創新促進會和機器人學國家重點實驗室的大力支持。(機器人學研究室)
論文鏈接:https://ieeexplore.ieee.org/document/10098924
來源:中國科學院沈陽自動化研究所