1 模式識別
所謂的模式識別是指自動模式識別或計算機模式識別。在模式識別問題中,人們必須首先通過測量來獲得數據。例如,為了應用模式識別方法識別特體表面的特征,必須先測量物體表面上多點的反射光。為了模式識別問題獲得數據,不但可能通過物理測量的方式,還可有其它的方式,如經濟數據。從廣義上講,測量是把現實世界的情況映射到參數域,依據這種定義,上述后一種方式獲得數據也是通過測量獲得的,因此可以說模式識別是從某種測量開始的,而測量一般來說又是以傳感器開始的。圖1是模式識別的模型。在模式識別中,有時可用常規或通用的傳感器,例如,語音識別中測量聲壓的麥克風或反射光測量中用的光傳感器等。然而,在很多情況下,必須改進現有傳感器或開發新的傳感器才能產生適當的模式識別信號,從這種意義上講,模式識別刺激了傳感器的開發并因此推動了儀器測量的發展。
測量的目的可以是確定某個變量的數值以驗證某個物理假設,如石油綜合測井中的油氣顯示。測量數據還可被處理并與其它數據結合和比較,以便獲得一個特定的結論。這種結論也可以是簡單的二元決策(是或否),如工業的質量控制或醫學檢查。這種結論可以劃分成很多類,這種多類決策有很多,如醫學診斷(哪種病?)、粒子物理(產生這種軌跡的粒子是哪種?)或石油測井(哪個深度有石油生成?)等。在這些例子中,測量的目的不僅是獲得變量的具體數值,而是生成對變量有意義的解釋。在較為復雜的情況下,需要使用模式識別的方法才能使測量獲得這種解釋,因此,模式識別是測量中的關鍵步驟之一。模式識別與儀器測量關系密切,模式識別依靠測量又是測量過程中的一部分。在模式識別中,除了分類外,還可給出數值估計或者把類的成員的數值或概率加到分類結果中,這更說明模式識別與儀器測量是緊密相關的。儀器測量和模式識別通常看成是兩上不販研究領域,每個領域都有自己的方法、傳統、雜志和學術會議,然而在很多情況下,跨領域的方法會很有用,應加以鼓勵,如某種模式識別算法需要與之匹配的測量(如合適的傳感器等),這時就需要這兩個領域的專家的密切配合才能獲得成功。
2 模式識別中模式的可變性
通過對模式識別的問題的分析,可以把包含一至多個模式的復雜的輸入數據通過系統的處理在系統的輸出端映射成相應模式的類,因此輸出結果相當簡單。某特定模式也未必只映射成一類,可用模糊方法映射成多個類,每個類有自己特定的數值或概率。另外,一個類可以代表多個完全不同的輸入情況,這是多對一的映射,可以舉個明顯的例子,字母A的書寫方法是各種各樣的,但都屬于同一類,即字母“A”。屬于同一類的各個模式的可變性的起源和內容是不相同的,存在于“文化”模式(如文字、汽車、房屋等)中的可變性與人類的習慣有關。“自然”模式是與生物有關的實體(如染色體、血細胞、心電圖等),它們的可變性由自然界決定的。不管是自然模式還是文化模式,實驗環境和方法及傳感器的不同特性又為它們產生更多的可能性。人們希望測量是使這種附加的可變性盡可能小。
應注意到,類的定義通常由人的意愿或傳統所左右,這就影響了哪些不同類型的輸入應該結合在一起形成一個特定的類。類的定義還與具體的分類目標有關,例如,人們可能對一個景象中的動物或交通工具的識別感興趣,等等。選擇了形成一個類(具有一個特定模式)的輸入集以后,這個集合就構成了所謂的“學習集”。模式識別系統必須既能識別這個學習集的一個樣本還能識別所有等效的樣本。與上述識別過程相反的是一種無監督模式識別問題,即對于給定的類沒有學習集,因此這樣的系統必須能借助“簇分析”的技術教會自己,以便在輸入的數據中能識別出目標較為復雜的場合,不過這里說的復雜的場合與簡單的場合之間僅存在一個“模糊”的邊界,是很難明確區分的。
3 模式識別與標定測量
標定測量常常被認為是最基本的沒量方式,在有關測量的教材中是在開始時就介紹的。一般來說,這是把未知的實體與參照實體的標準集比較。顏色的比較是一個傳統的例子,如把下一年的小汽車的顏色作為標準集,未知顏色就可獲得標準參照集中相同的(或幾乎相同)顏色的名稱。這個過程看起來確實很簡單,只需與標準參照集比較,找出相同(或幾乎相同)的實體,這種比較是無序的并且不必下具體數值映射。
可以把標定測量過程描述成一個分類過程,即把輸入數據映射到參照集的某個上。如果在參照集中找不到等價的實體,那么這種映射就被放棄。這種標定測量與模式識別的相似性是顯然的。不過標定測量中,比較過程是由人完成的,在模式識別中,這種比較分類過程是借助測量和很復雜的方法來完成的。并且在模式識別中,一個定義好的參照實體的標準集是不存在的,而需要使用學習集才能識別所有的類或模式。在前面描述標定時用了“幾乎相同”的概念,這與模式識別中的可變性的概念是相似的。
4 模式識別方法
由于在一維、二維、三維甚至多維空間中要識別的模式的種類如此繁多,又由于可能存大很大的可變性,因此存在眾多的模式識別的方法,包括一些特別的專用方法,這是不足為奇的。下面介紹兩種常用的方法,兩種方法都需要先確定“特征”,但關于特征性質的描述,這兩種方法又完全不同。通過處理從傳感器輸入的數據,并盡可能地壓縮數據,可以提取特征。人們希望特征的值能夠反映模式的特征,依靠特征來進行數據壓縮,在幾乎所有的模式識別的方法是必須的,這是因為輸入的傳感器的數據通常很復雜且含有很多不相關的冗余數據。在模式識別的問題中常用到二維圖像,假如一格含有512×512個象素,用8個比特表示每個象素,這樣就是2百萬個比特還多,因此必須進行數據壓縮,這需要至少兩步完成,即先生成特征數據,再根據特征數據通過實施決策過程找到測量數據中包含的類。
高質量的特征數據的選擇要求有關于模式的大量的先驗知識,如果沒有這種先驗知識,就需要采用嘗試的方法,與統計等方法結合使用,這需要一個很大的學習集。通常模式識別方法有以下兩種: 1 統計方法 它利用了作為特征的一些參數的數值,如交通工具的高度和長度、曲線上特征點的坐標、染色體的大小和位置。這些值可以通過直接測量獲得,但常常需要進行大量的數據處理。如果選到了K個特征值,那么在K維維持特征空間中,要用K個值來表示一個點。模式的可變性引起了每個模式的學習集的樣點的分散,這就導致每個模式擁有一個樣點簇。好的特征和完全不同的模式使每個模式的樣點簇分散減小,使不同模式的樣點簇分散減小,并且使不同模式的樣點簇之間的距離相對增大。如果樣點簇間不疊加,那么就可構建判別平面,完全把樣點簇分開。如果示知模式的特征空間的樣點靠近樣點簇,就可以做出正確的分類決策。不過,通常樣點特征值擴散很大并且樣點簇間的距離很小,樣點簇常常是疊加的。在這種情況下,需要尋找決策算法來構建某種最優的判別平面,這需要有關于樣點簇的概率密度的統計知識。 2語言符號法 這種方法是基于把模式分解成基本部分或元素,例如拼在幾何圖形中的直線和曲線段。元素及其位置和它們間的關系有時可用一種語法來表達,這與自然語言中的語法相似。人們為模式識別已經提出了很多不同種類的語法,包括隨機過程語法,這種語法考慮了模式的可變性。在模式識別過程中,先確定元素、它們的位置和關系,然后通過決策即語法分解確定哪種模式識別語法可以通過先驗知識獲得,也可以從學習集中獲得。根據語法的類型和現有的先驗知識,人們已經開發出了很多決策算法。 5 模式識別問題求解中的傳感器和處理器
由于大部分模式識別算法都采用數字法表示,因此在模擬傳感器后總是跟著模/數轉換器。在圖象處理中,對于具有很多象素的圖象,要求采用快速模/數轉換器,并且要配備專用存儲器和處理器。除了光學圖象外,還有很多其它種類的圖象,如通過核測量、X射線和超聲波、核磁共振或石油測井的各種成象。
通過對這些圖象的處理可以獲得光學圖象不能提供的不透光實體的內部結構。 模式識別問題中應用的某些光掃描器與傳統的掃描器有著密切的聯系,如電視、光陣列掃描器等。飛機或衛星遙感中的掃描器生成的數據的波長極窄,可以依靠這些數據識別地質、農業、地理或石油等方面的模式,通過實體視覺方法可以從一個二維圖象中獲得三維的信息,或通過層析成象的方法從多個以不同方向透射產生的圖象中獲得這樣的三維的信息。對于處理有限個三維目標的機器人系統,使用與某軸平行的平面光可以在目標中產生特別的光照效果,根據目標表面反射的激光束的傳播時間也可獲得關于第三維的數據信息。
傳感器獲得測量數據的同時也帶來失真,因此在進行模式識別的處理之前需要通過預處理恢復測量數據。預處理方法包括反向濾波、線形最小均方濾波和保邊沿濾波等。為了使特征提取更容易,也可故意在圖象中加入失真,即圖象的增強,如側面高頻濾波可以增強圖象的邊緣,這點對于形狀識別很重要。對于這樣的預處理及特征提取,常規的計算機常常速度太慢,因此有些傳感器常需配備專用的處理器或預處理器,并采用專用軟件、更快的硬件及并行處理等。智能傳感器和處理器(預處理器)的結合為實用系統構建快速經濟的組件提供了廣闊的前景。
傳感器的發展,(預)處理、特征提取和決策算法的發展使人們可以期望看到模式識別和電子儀器在實際中的應用不斷地增長。