道路提取是遙感圖像中信息提取的一個研究熱點,不僅具有理論價值也具有很廣闊的應用前景。道路與人們生活休戚相關,而手工提取的方法遠遠不能滿足地理信息系統(GIS)數據獲取與更新的需要,因此從遙感圖像自動提取道路的研究就顯得尤為迫切。本文從遙感圖像的道路特征描述出發,對道路提取的基本思想和方法進行了探討,對近年來道路提取的研究狀況進行了分析和總結,并對道路提取的進一步發展提出了分析和展望。
1 道路提取的基本思想
1.1 道路的基本特征
道路的特征主要包括物理與幾何的,其基本特征主要有以下幾種。
(1)幾何特征。道路呈長條狀,其長度大于寬度,在較大范圍內道路的寬度變化比較小,曲率也有限制;
(2)輻射特征。道路一般有明顯的邊緣,路面灰度均勻,與相鄰區域灰度差比較大;
(3)拓撲特征。道路從拓撲結構看是相連的,可以形成網絡狀;
(4)上下文特征。上下文特征指的是道路相關的特征與信息,如道路旁的建筑物和樹,這是局部上下文,全局上下文提供全局信息,如圖像區域是城市還是鄉村。
1.2 道路提取的模型與策略
常見的道路提取的模型與策略有很多。線段模型常用在中低分辨率下道路的建模中,對于主干道的檢測這個模型是足夠的。在高分辨率下,道路常用平行的邊線來建模,相對線段模型來說,陰影或干擾將對道路提取產生很大影響。道路網絡的組成離不開連接點與交叉點,對交叉點的精確檢測與建模將有助于道路提取結果的改善。全局的拓撲性質應該與局部的上下文及幾何特征有效的結合。
2 半自動道路提取方法
半自動的道路提取與全自動方法不同在于其需要人機交互,按交互的方式不同又可以分為兩類。一類僅給定初始點和初始方向利用跟蹤的方法[1][2][3]來提取道路;另一類方法則給定一系列分散的種子點,利用主動輪廓模型[4],模擬退火[5],和動態規劃[6]等方法曲線擬合提取道路中心線。前者運用的主要是局部的特征,后者往往求的是全局的能量最小。
跟蹤的方法會給定初始點和初始道路的方向,要通過跟蹤的方法得到道路的中心線和邊線。要解決的問題包括如何通過已檢測到信息預測下一點處道路的參數(位置,寬度,曲率,方向),利用圖像信息選擇最佳預測點并修正預測模型,確定停機準則(連續出現預測誤差很大或是已經檢測到的部分道路已經得到驗證)。
在文獻[1]中,預測利用了卡爾曼濾波方法,修正利用的是截面匹配的方法。截面匹配是指道路為狹長區域,在垂直于道路方向的相近的截面具有極大的相似性,根據這一特點,可以在預測到道路中心點后找到下一截面的位置,從而確定道路寬度和方向。卡爾曼濾波中假設系統是線性的,系統的觀察也是固有狀態的線性函數,系統和測量中的噪聲是高斯白噪聲。文章中把道路的曲率當成常量,真實的形狀與模型的偏差被認為是系統噪聲。模型的狀態變量有道路的位置(兩個參量),道路的方向,曲率。方法優點是當截面匹配由于暫時的干擾(如陰影)失敗時能繼續迭代,而不離開道路。連續的截面匹配的失敗也可以當成是道路交叉點或道路終點的標志。缺點是方法把噪聲當成是高斯分布的,與實際情況有偏差。文獻[7]也運用卡爾曼濾波和截面匹配的方法做道路提取,而且提供了用戶在半自動道路提取過程中人機交互的接口。
文獻[3]提出了一種Jetstream的方法認為跟蹤道路的邊線可以看成是隨機過程,隨機過程由內部的動力和統計數據模型驅動。先驗動力模型用來保存已提取的曲線的屬性并依此求出下一候選點的位置,數據模型用來驗證預測點是否在邊線上,以此選擇最佳的候選點。動力模型用來預測下一點位置,有兩個參數,步長和轉角。數據模型給出點在邊緣和點不在邊緣上觀測值概率分布情況,這里主要利用統計的手段。非邊緣點和邊緣點分別采用了與梯度幅值和角度相關的統計量。確定了模型后計算中采用了連續重要性采樣的蒙特卡羅方法。邊緣跟蹤可以用于圖像分割中,用在道路提取時要增加一個寬度變量,同時跟蹤兩條邊線。Jetstream方法很有特色的地方在于它對邊緣的描述是用統計的辦法,另一方面粒子濾波處理非正態分布比卡爾曼濾波更有優勢,在監控中做人體和車輛的跟蹤技術已經應用比較成熟,在道路提取方面用的還較少。文獻[8]中運用了與Vosselman的卡爾曼濾波中用的模型也使用了道路截面信息,主要不同點就是使用粒子濾波代替卡爾曼濾波做預測。
半自動方法中的第二類主要有動態規劃和Snake模型方法。動態規劃方法導出了道路的一般參數模型,將其表達成種子點之間的代價函數,以動態規劃作為確定種子點之間最優路徑的計算工具。比較早的有Gruen and Li 的文章[9],主要用在低分辨率圖像道路提取方法中。Dal Poz等[10]對Gruen 的方法中的代價函數做了修改,增加了道路邊緣梯度反向平行的約束條件,將動態規劃的方法拓展到高分辨率圖像的道路提取中。動態規劃種子點的選取需要手工,較繁,同時此方法要很大的存儲量。Snake模型方法是一種有效的目標輪廓提取方法,在道路提取中運用非常廣泛。Snake模型方法根據對道路特征的抽象確定不同的道路模型,將道路特征與幾何約束用能量函數表示出來,通過求能量函數最小值得到目標輪廓。Snake模型的形式有很多,已經運用到道路提取中的有LSB-Snake[11],ziplok snake[12],Ribbon snake[13],multi-resolution snake[14]。
3 全自動道路提取方法
全自動提取無疑是遙感圖像中道路提取的最終目標,但是由于遙感圖像的復雜性和多樣性,道路的自動提取涉及到計算機視覺、人工智能、模式識別等諸多領域。全自動提取方法因其復雜性,往往是多種方法的綜合運用,主要有多尺度多分辨率、統計學習及幾何概率模型方法。
Hinz等[15]報道了一種全自動基于多尺度,Snake模型和上下文信息的道路提取方法。該方法應用于農村道路的自動提取中效果很好。
農村道路的提取分成了三部分,顯著道路,不顯著道路和交叉口的提取。顯著道路是指道路寬度基本恒定且對應區域灰度均勻的路段;不顯著道路是道路網絡中受陰影或干擾的路段,或者可以認為是顯著道路間的間隔部分;交叉口一般包括十字路口,三叉口等。
對顯著道路的提取采取了多尺度的方法:在低分辨率條件下檢測線[16],在高分辨率下檢測邊緣再利用判決準則進行融合[17],非顯著道路提取運用了Ribbon snake的方法[13]。交叉點由于拓撲關系的復雜用簡單約束連接肯定會導致錯誤,故必須對交叉點進行檢測。單純的道路交叉點的提取是很復雜的,但利用已有的顯著道路和非顯著道路的知識,可以大大縮小搜索空間。在低分辨率圖像中進行線檢測時基于尺度空間分析可以對交叉點進行檢測,在非顯著道路提取時大多數由交叉點造成的顯著道路間的間隔可以由帶狀蛇方法連接起來。已知這兩點的情況下,交叉點位置可以近似獲取,交叉點的檢測難度大大降低了。而且所選擇的策略不受交叉段的形狀與拓撲結構的影響。
前面提出的方法是以局部特性為基礎,文獻[18]提出了一種全局的辦法,主要利用道路的拓撲特性。這種方法在低層的處理中與文獻[13]中的方法是一致的,都是先找到顯著的路段。不同的地方在之后的分組和連接,建立道路網絡的過程。這種方法主要的思想是把已檢測的道路路段用有權無向圖表示出來,每一段用一個結點表示,結點之間的權重用模糊數的與運算決定。這些模糊值由路段間的絕對距離,相對距離,和是否在同一直線上來確定,超過某一閾值取1,低于另一閾值取0。模糊數定下來后,整個無向圖就建立了。道路的拓撲性質決定道路不是孤立的,應形成網絡,而且通常重要的地點間一定是有路可通且有最短路徑。找最短路徑的方法可以用迪杰斯特拉算法,重要地點在無向圖上也就是重要結點的選取需要從低層處理中得到,比如可以選擇較長的路段或者選邊界處作為初始點。最主要的步驟依次為建立無向圖,選擇重要結點,尋找最短路徑,最后是驗證。
總的來講,這類全自動的多尺度多分辨率的方法取得了不錯的效果,但是仍然有錯誤,需要后續的編輯,需要人工方法處理或者其它數字高程模型(DEM)對已經提取的道路進行校正。
多尺度的方法還有文獻[19]中運用小波變換提取道路中心線的方法。其主要思想是針對道路的交叉點和中心線在小波變換后小波系數呈現的規律提取交叉點和中心線。Pak zad等[20][21][22]發表了多篇關于多尺度多分辨率道路檢測的方法。主要的思想是建立一個道路的語義網絡,同時實現道路提取的尺度自適應的策略。
統計學習也越來越多地應用到了道路提取算法中,Bacher等[23]提出了一種用IKONOS圖像的全自動道路檢測方法。先從各個光譜通道提取線作為初始的道路假設,把這些線作為產生訓練區域的基礎,訓練區域的產生與前面的多尺度下的方法相似也要找滿足存在平行邊緣與已檢測線非常靠近且平行邊緣間灰度值變化小的區域。在訓練區域基礎上對圖像進行有監督模糊聚類,應用分類結果及線的幾何特征提出道路猜想。驗證道路假設得用模糊邏輯進行融合,形成道路網絡。文獻[24 ]在提取道路中運用了支持矢量機(SVM)的方法。
基于幾何統計模型[25]的方法對道路作了一些假設,要求道路寬度變化小、方向變化緩、局部灰度變化小、道路與背景差異大、道路較長等。基于這些假設,根據道路寬度和灰度分布等特點,建立道路的幾何模型,將圖像分成小塊,通過使用Gibbs分布和Gauss分布等概率模型,建立道路檢驗窗口,計算后驗概率,進行比較,從而達到進行搜索道路的目的。該方法具有較高的穩定性,但是需要的參數較多。
道路提取新的進展與發展趨勢
從遙感圖像中提取道路已取得很多研究成果,但由于現實中道路的復雜性,已經有的方法與實際應用要求還有差距,在提取的自動化程度、提取算法的準確性方面還有許多工作有待解決,主要有:
(1)提取算法的表現關鍵在于特征的選擇。衛星圖像通常有三到四個光譜頻段,有較好的輻射特性,但是分辨率稍差,充分利用光譜特性可以彌補在分辨率方面的劣勢。而且在高分辨率圖像中,道路具有豐富的紋理特征,紋理信息的應用可以提高算法的準確性。文獻[26][27]都運用了多光譜圖像提取道路中心線的方法。基本的思路都是先由聚類得到道路區域,再由道路區域產生道路中心線。文獻[27]認為提取算法結果的好壞與初始聚類有很大關系,分類的精確程度不取決于有監督還是無監督的,更重要的在于與其它光譜特征相似物體如停車場和房屋的誤分的問題。因此在粗分類后用形狀描繪子來消除停車場及房屋等造成的誤分,在道路中心線提取方面作者用雷頓變換提取中心線,比文獻[26]中用最小生成樹的方法結果要好。 在特征的選擇相關的還有尺度問題。傳統的道路提取方法一般采用像素級檢測方法,僅利用了像素的光譜信息作為道路提取的依據,無法利用圖像的空間信息。文獻[28]中提出的面向對象的圖像分析方法將圖像對象作為圖像分析的基本單元,圖像對象是指圖像分割后若干同質像素的集合。分割后獲取的對象利用對象的光譜、幾何和空間關系建立知識庫,再利用知識庫中的規則來提取圖像中的道路。面向對象方法引入了空間特征可有效利用對象間的語義關系,有助于指導圖像分析。最后是拓撲特征與上下文特征的利用。拓撲與上下文特征是道路相對穩定的特征,尤其是在城市道路中,但是目前的算法中利用得還不多。在上下文信息利用中,文獻[29]中用行道樹的信息來提取主干道。與拓撲特征相關的有道路交叉點的檢測,一方面道路提取的最終目標主要是GIS數據的更新,道路變化的檢測離不開交叉點的檢測;道路交叉點的檢測有利于道路精確提取。相關的文章有文獻[30][31]。
(2)用多種特征的多證據融合框架。目前,大部分道路提取算法只利用道路的一種或幾種基本特征,模型還比較簡單。文獻[32]中提出了一種基于D-S證據理論的航拍圖像道路提取方法。由于D-S證據理論為目標識別提供了一個既考慮根據各種特征進行分類的不確定性,又考慮多種特征共同作用的框架,這種方法優于只根據某一特征進行識別的方法,具有較好的實用性和魯棒性。同時,這一方法還具有良好的擴展性,如果有新的道路特征,可以直接形成新的證據與其他特征共同作用,以提高識別的正確率。
除此之外,熵與互信息理論也可以用來構建獨立于特征的證據融合的框架。
(3)評價方法。由于道路網絡的多變性,道路提取的普遍有效的評價準則還不多。主要評價方法可見文獻 [33][34]。目前的評價方法針對半自動方法的還很少,幾乎是沒有,已有的完全基于全局的評價是遠遠不夠的,應該有一些非全局的評價方法。
參考文獻
[1] Vosselman, G., and de Knecht, J. 1995.