1 引言
近年來(lái)隨著Internet和多媒體技術(shù)的發(fā)展,圖像已成為一種重要的信息資源。各種數(shù)字圖像中包含了大量有用的信息,然而由于它們無(wú)序的分布在世界各地,圖像中所包含的信息無(wú)法被有效的訪問(wèn)和使用。這就要求有一種能夠迅速而準(zhǔn)確查找和訪問(wèn)用戶所需要的圖像信息的技術(shù),即圖象檢索技術(shù)。
20世紀(jì)70年代以來(lái),圖像檢索技術(shù)已逐步成為一個(gè)非常活躍的領(lǐng)域,其推動(dòng)力主要來(lái)源于數(shù)據(jù)庫(kù)系統(tǒng)和計(jì)算機(jī)視覺(jué)這兩大研究領(lǐng)域。圖像的索引和檢索目前有多種方法,總得來(lái)看分為兩種,一種是傳統(tǒng)的基于文本的圖像檢索方法,另一種是近年來(lái)已逐漸成為國(guó)內(nèi)外研究熱點(diǎn)的―基于內(nèi)容的圖像檢索方法。
傳統(tǒng)的基于文本的圖像檢索方法利用自然語(yǔ)言的優(yōu)勢(shì),將圖像作為數(shù)據(jù)庫(kù)中存儲(chǔ)的對(duì)象,用關(guān)鍵字或自由文本對(duì)其進(jìn)行描述。檢索以查詢和圖像文本描述之間的相似性為基礎(chǔ),采用常規(guī)的信息檢索技術(shù)(IR)。但是這種技術(shù)存在以下缺點(diǎn):一是在基于這種技術(shù)的系統(tǒng)中,必須輸入文本描述或使用現(xiàn)有的標(biāo)題,目前的計(jì)算機(jī)視覺(jué)和人工智能技術(shù)都無(wú)法對(duì)圖像自動(dòng)進(jìn)行文本標(biāo)注,而必須依賴人工對(duì)圖像作出標(biāo)注;二是文本描述可能不完備,或者主觀,不同的人對(duì)同一幅圖像有不同的理解方法,這種主觀理解的差異將導(dǎo)致圖像檢索中的失配,此外,圖像中所包含的豐富的視覺(jué)特征(顏色、紋理或形狀等)往往無(wú)法用文本進(jìn)行客觀地描述。
基于內(nèi)容的圖像檢索系統(tǒng)(Content Based Image Retrivel,簡(jiǎn)稱為CBIR)融合了圖像理解、模式識(shí)別、計(jì)算機(jī)視覺(jué)等技術(shù),將圖像的視覺(jué)特征作為特征向量進(jìn)行提取,然后將示例圖像的特征向量與系統(tǒng)中存儲(chǔ)圖片的特征向量進(jìn)行相似度比較,按相似度大小排列返回給用戶。與傳統(tǒng)基于文本的圖像檢索系統(tǒng)相比,CBIR從更深層次對(duì)圖像媒體進(jìn)行理解和控制,索引和檢索過(guò)程可以自動(dòng)完成而且易于實(shí)現(xiàn),還可以通過(guò)可視化界面與用戶進(jìn)行交互,便于方便的構(gòu)造查詢、評(píng)估和改進(jìn)檢索結(jié)果。實(shí)踐已證明該方法能夠產(chǎn)生相當(dāng)好的檢索性能。
2 系統(tǒng)總體模型
基于內(nèi)容特征的圖像檢索系統(tǒng)涉及到圖像處理、圖象識(shí)別、數(shù)據(jù)庫(kù)三個(gè)領(lǐng)域的技術(shù),主要包括:接口技術(shù),即查詢者與系統(tǒng)之間的交互方式,查詢者以何種方式提出查詢的內(nèi)容,系統(tǒng)如何解釋接受,對(duì)系統(tǒng)給出的結(jié)果,查詢者如何給出正確的反饋,進(jìn)行再次查詢;匹配技術(shù),即圖像相似性的度量準(zhǔn)則;數(shù)據(jù)庫(kù)技術(shù),包括圖像存儲(chǔ)的技術(shù),圖像的高維索引技術(shù)。
基于內(nèi)容的圖像檢索系統(tǒng)一般由兩個(gè)系統(tǒng)構(gòu)成,即數(shù)據(jù)庫(kù)生成子系統(tǒng)和數(shù)據(jù)查詢子系統(tǒng),每個(gè)子系統(tǒng)由相應(yīng)的功能模塊組成,其基本結(jié)構(gòu)如圖1 所示。
圖1 CBIR系統(tǒng)構(gòu)成
3 系統(tǒng)關(guān)鍵技術(shù)
3.1 特征向量的提取以及相似度計(jì)算
基于內(nèi)容的圖像檢索系統(tǒng)中最關(guān)鍵的技術(shù)是特征向量的提取以及相似度計(jì)算,選擇提取何種特征作向量和相應(yīng)的相似度算法對(duì)最終檢索系統(tǒng)的效率有著極其重要的影響。就目前情況來(lái)看,特征向量的提取以及相應(yīng)的相似度算法主要有以下三種情況。
(1) 基于顏色特征的檢索
顏色特征是圖像檢索中所使用的最直觀的視覺(jué)特征,是彩色圖像最顯著的特征,它對(duì)圖像本身的尺寸、方向、視角的依賴性較小,具有較高的穩(wěn)健性。因此基于顏色的圖象檢索技術(shù)是基于內(nèi)容的圖像檢索技術(shù)最常用最基本的方法。
Swainhe和Ballard[1]于1991年提出用顏色直方圖作為圖象索引,顏色直方圖在基于內(nèi)容的圖像檢索系統(tǒng)中得到廣泛關(guān)注。其主要思想是:首先計(jì)算出用戶所給的示例圖像的顏色直方圖,然后與圖像特征矢量數(shù)據(jù)庫(kù)中存儲(chǔ)的直方圖進(jìn)行相似度計(jì)算,最后按相似度的大小排列返回檢索結(jié)果,相似度最大的為最為匹配的圖像。直方圖描述了圖像顏色(灰度)空間的統(tǒng)計(jì)分布和基本色調(diào)。具體地說(shuō),對(duì)于一幅圖像I,其顏色(灰度)由L級(jí)(C1,C2……Cl)組成,Ci為第i級(jí)顏色值。在整幅途中,具有Ci值的像素個(gè)數(shù)有hi個(gè),則一組像素的統(tǒng)計(jì)值h1,h2,……h(huán)l就稱為該圖像的顏色直方圖,用H(h1,h2,……h(huán)l)表示。關(guān)于直方圖的距離量度有絕對(duì)值距離(L1度量法)、二次距離度量法、歐幾里德距離等方法。其中絕對(duì)值距離絕對(duì)值距離(L1度量法)形式如下:
其中,H為示例圖像的顏色直方圖,I為索引庫(kù)中的圖像顏色直方圖,和
分別為示例圖像和庫(kù)中圖像第i種顏色像素的頻數(shù)。
顏色直方圖雖然能較好的反映出圖像中各種顏色的頻率分布情況,但忽略了顏色的空間分布信息,使得不同的圖像可能具有相同的顏色特征。Pass等人提出圖像的顏色聚合矢量CCV(Color Coherence Vector) [2] 來(lái)作為圖像索引,是圖像直方圖的一種演變。其核心思想是將圖像中在感知上相似顏色的像素所占據(jù)的連續(xù)區(qū)域的面積大于系統(tǒng)所給定的閥值時(shí),該區(qū)域中的像素為聚合像素,否則為不聚合像素,這樣統(tǒng)計(jì)圖像所包含的每種顏色的聚合像素和不聚合像素的比率稱為該圖像的顏色聚合矢量。將顏色聚合矢量作為特征向量提取的檢索方法比直方圖的檢索精度要高。 為了能夠在大規(guī)模圖像數(shù)據(jù)集中進(jìn)行快速地搜索,Smith和Chang等人提出了顏色集的概念。
研究者對(duì)顏色作為特征向量的索引方法已經(jīng)有了很多的研究,目前存在的主要問(wèn)題是顏色空間的選擇不統(tǒng)一。有人使用RGB顏色空間,因?yàn)樗涗浟藞D像本質(zhì)的顏色特性。但更多的人選擇了HSV、MUSHELL顏色模型,它們與人的視覺(jué)特性比較接近,這樣就給對(duì)各種檢索方法進(jìn)行評(píng)價(jià)帶來(lái)一定困難。顏色特征僅僅是基于內(nèi)容檢索技術(shù)中的一個(gè)種方法,在實(shí)際應(yīng)用中可與其它檢索方法結(jié)合,可取得更佳效果。
(2) 基于紋理特征的檢索
紋理特征是一個(gè)重要的圖像特征,它是物體表面具有的內(nèi)在特征,包含了關(guān)于表面結(jié)構(gòu)安排及周圍環(huán)境的關(guān)系,被定義為“一種反映一個(gè)區(qū)域中像素灰度級(jí)的空間分布的屬性”。
目前基于紋理的算法主要分兩類:一種是結(jié)構(gòu)分析法,即從圖像結(jié)構(gòu)組成上探索紋理的規(guī)律或者直接去探求紋理構(gòu)成的結(jié)構(gòu)規(guī)律;一種是統(tǒng)計(jì)分析法,即從圖像有關(guān)屬性的統(tǒng)計(jì)分析出發(fā)的。前者將圖像中非常具有結(jié)構(gòu)規(guī)律的特征加以分析,后者對(duì)圖像中的色彩強(qiáng)度的空間分布信息進(jìn)行統(tǒng)計(jì)。現(xiàn)在比較常用的是后者。Haralick等人從數(shù)學(xué)角度研究了圖像紋理中灰度級(jí)的空間依賴關(guān)系,根據(jù)圖像中像素之間的方位和距離關(guān)系構(gòu)造了一個(gè)共生矩陣(comatrix)[3],然后從中提取有意義的統(tǒng)計(jì)特征作為紋理特征的表達(dá),使用的特征主要有能量、熵、相關(guān)性和慣量,該方法的最大缺點(diǎn)是這些統(tǒng)計(jì)特征沒(méi)有和人在視覺(jué)對(duì)紋理特征鑒別之間建立對(duì)應(yīng)關(guān)系。
Tamura等人在對(duì)計(jì)算機(jī)視覺(jué)進(jìn)行研究的基礎(chǔ)上,進(jìn)行了大規(guī)模的心理測(cè)試,使紋理描述盡可能地接近人的感知,由此提出了到目前為止最好的紋理規(guī)范,這六個(gè)紋理特征分別為:粗糙性(coarseness)、對(duì)比度(contrast)、方向性(directionality)、線條相似性(linelikeness)、規(guī)則性(regularity)和光滑性(roughness)。其中前三個(gè)特征對(duì)于圖像檢索尤為重要,大多數(shù)基于紋理的圖像檢索系統(tǒng)都只使用前3個(gè)特征來(lái)描述紋理特征。例如在QBIC系統(tǒng)中,紋理由粗糙性、對(duì)比度和方向性來(lái)描述。
近年來(lái)隨著小波(wavelet)變換在圖像分析中的廣泛應(yīng)用,許多研究者開(kāi)始將小波變換運(yùn)用于紋理特征表示中,采用小波變換后的系數(shù)作為圖像的索引。如Smith和Chang從小波子波段中提取統(tǒng)計(jì)特征作為圖像的紋理表示[4],取得了較好的效果。Chang和Kuo 則采用樹(shù)結(jié)構(gòu)小波變換來(lái)進(jìn)一步提高圖像分類能力的準(zhǔn)確度[5]。Ma和Manjunath評(píng)價(jià)了各種小波變換形式后,發(fā)自案給予Gabor小波變換的檢索效果最佳。
(3) 基于形狀特征的檢索
形狀特征是圖像中重要的中層特征,與顏色或紋理等特征不同的是,表達(dá)形狀特征是基于對(duì)圖像的分割。當(dāng)前技術(shù)無(wú)法對(duì)圖像做到準(zhǔn)確而穩(wěn)健的自動(dòng)分割,因此基于形狀的檢索使用某些可能是半自動(dòng)化的方法把圖像分割成單個(gè)的對(duì)象。在對(duì)圖像進(jìn)行分割后,其關(guān)鍵問(wèn)題就在于如何對(duì)形狀進(jìn)行表示和如何進(jìn)行形狀之間的相似性度量。形狀特征表示的一個(gè)重要準(zhǔn)則是要求對(duì)位移、旋轉(zhuǎn)、縮放的不變性,通常形狀特征表示可以分為全局特征和局部特征。全局特征包括圖中整個(gè)物體的圓度、環(huán)狀度、中心矩、離心率以及矩不變量等。局部特征包括形狀的外邊界,比較成功的表達(dá)式傅立葉描述符,用經(jīng)傅立葉變換后的邊界作為形狀特征,這樣用較少的參數(shù)就包括比較復(fù)雜的邊界。
形狀特征也稱為輪廓特征,指圖像中子圖像的邊緣特征。采用形狀特征進(jìn)行檢索時(shí),用戶可以粗略的勾畫出一個(gè)形狀或是輪廓,從圖像庫(kù)中檢索出形狀相似的圖像。基于形狀檢索的難點(diǎn)在于尋找能夠檢索與大小、方向及扭曲伸縮無(wú)關(guān)的方法。為此,可同時(shí)采用三個(gè)特征作為形狀特征,即長(zhǎng)/短軸比、2周長(zhǎng)/面積比、最近與最遠(yuǎn)點(diǎn)的連線間的夾角。這三個(gè)特征對(duì)形狀的大小變化與旋轉(zhuǎn)都不變,其中長(zhǎng)短軸分別定義為形狀質(zhì)心到形狀邊緣最遠(yuǎn)點(diǎn)或最近點(diǎn)的連線。
實(shí)際上常用的辦法是采用全局特征和局部熱爭(zhēng)相結(jié)合來(lái)進(jìn)行形狀的相似檢索。如Eakins等人提出了一組重畫規(guī)則并對(duì)形狀輪廓等用線段和圓弧進(jìn)行簡(jiǎn)化表達(dá)[6],然后定義形狀的鄰接族和形族兩種分族函數(shù)對(duì)形狀進(jìn)行分類。鄰接族主要采用了形狀的全局特征,如其邊界信息等,而形狀族主要采用的形狀的局部特征。在形狀進(jìn)行匹配的時(shí)候,除了每個(gè)族中形狀差異外,還比較每個(gè)族中質(zhì)心和周長(zhǎng)的差異,以及整個(gè)形狀的位置特征矢量的差異,查詢判斷距離是這些差異的加權(quán)和。
3.2 系統(tǒng)評(píng)價(jià)方法
基于內(nèi)容的圖像查詢系統(tǒng)涉及到很多不同的檢索算法,需要對(duì)各種算法的檢索結(jié)果進(jìn)行優(yōu)劣比較。從現(xiàn)在的研究情況來(lái)看,對(duì)檢索效果的評(píng)價(jià)更多的放在對(duì)檢索結(jié)果的正確與否,主要使用的是查準(zhǔn)率(precision)和查全率(recall)這兩項(xiàng)。
查準(zhǔn)率是指在查詢過(guò)程中,用戶所查到的相關(guān)圖像數(shù)目與數(shù)據(jù)庫(kù)中的所有圖像數(shù)目的比率,查全率是指在查詢過(guò)程中,用戶所查到的相關(guān)圖像數(shù)目與數(shù)據(jù)庫(kù)中相關(guān)的圖像數(shù)目之間的比率。查準(zhǔn)率和查全率越高,則說(shuō)明該查詢系統(tǒng)的性能越優(yōu)。
4 典型的基于內(nèi)容的圖像檢索系統(tǒng)介紹
基于內(nèi)容的圖像檢索技術(shù)自20世紀(jì)90年代提出至今,國(guó)內(nèi)外已研制出了不少成功的系統(tǒng)原型,均大致包括以下功能:圖象分類瀏覽功能、按示例圖檢索功能、按手繪草圖檢索功能、用戶反饋等。下面介紹一個(gè)典型基于內(nèi)容的圖像檢索系統(tǒng)。
(1) QBIC系統(tǒng)
QBIC(Query By Image Content)系統(tǒng)[7]是由IBM公司的開(kāi)發(fā)的第一個(gè)商業(yè)化的基于內(nèi)容的圖像檢索系統(tǒng)。QBIC系統(tǒng)(如圖2所示)分為兩個(gè)子系統(tǒng):數(shù)據(jù)庫(kù)生成(Data population)子系統(tǒng)和數(shù)據(jù)庫(kù)查詢(Database query)子系統(tǒng)。數(shù)據(jù)庫(kù)生成子系統(tǒng)的主要功能是對(duì)圖像的特征向量進(jìn)行提取,包括圖像的顏色、紋理、形狀等特征。數(shù)據(jù)庫(kù)查詢子系統(tǒng)的主要功能是完成基于內(nèi)容的圖像檢索技術(shù),負(fù)責(zé)對(duì)用戶查詢輸入的圖像進(jìn)行同樣的特征提取并把特征信息輸入匹配引擎,檢索出具有相似性特征的圖像,這部分提供了完整的用戶界面,可以選擇各種特征(顏色、紋理、輪廓、對(duì)象運(yùn)動(dòng)方式、視場(chǎng)運(yùn)動(dòng)方式等)進(jìn)行檢索。由查詢接口、結(jié)果瀏覽器、檢索引擎三個(gè)模塊組成。
圖2 QBIC系統(tǒng)模型
QBIC系統(tǒng)支持基于示例圖像的查詢方式和手繪草圖的圖像索引方法。在此系統(tǒng)中,顏色特征的表達(dá)采用了平均色和色彩直方圖,紋理特征的表達(dá)采用了紋理的粗糙度、對(duì)比度和方向性3者的綜合,形狀特征的表達(dá)采用了形狀的面積、圓形率、離心率、主軸方向以及一組變換無(wú)關(guān)矩等描述方式。草圖特征以其邊界信息為基礎(chǔ)。在圖像相似性計(jì)算過(guò)程中考慮了顏色二值數(shù)之間的感知相似性。
QBIC的基于圖像內(nèi)容的檢索技術(shù)已制成獨(dú)立的產(chǎn)品,如IBM數(shù)字圖書(shū)館、超媒體管理器、DB2數(shù)據(jù)庫(kù)的圖像擴(kuò)展等工具軟件。
(2) PhotoBook系統(tǒng)
PhotoBook是一套瀏覽、檢索圖像的交互式工具,由MIT媒體實(shí)驗(yàn)室開(kāi)發(fā)。它包含三個(gè)子系統(tǒng),分別提取形狀、紋理和人臉特征,用戶可以分別做基于上述特征中的任何一種檢索。在PhotoBook最新版本FourEyes中,Picard等提出將人也包括在圖像的標(biāo)注和檢索過(guò)程中。
(3) Image Rover系統(tǒng)
Image Rover系統(tǒng)是基于萬(wàn)維網(wǎng)的圖像導(dǎo)航系統(tǒng),用戶使用點(diǎn)擊小圖標(biāo)的方法查詢到自己所需要的圖文信息。Image Rover系統(tǒng)成功的運(yùn)用了基于內(nèi)容的查詢技術(shù),特點(diǎn)是通過(guò)HTML文件將可視化信息和文本信息統(tǒng)一起來(lái)。它由文件采集子系統(tǒng)和圖像檢索系統(tǒng)兩部分組成。它使用的視覺(jué)特征有顏色、邊界定向、紋理和形狀。它和其他系統(tǒng)的主要區(qū)別在于使用了相關(guān)反饋。相關(guān)反饋可使用戶通過(guò)相關(guān)項(xiàng)目的說(shuō)明迭帶地提煉出一個(gè)查詢,以取得更好的搜索性能。
(4) WebSEEK系統(tǒng)
WebSEEK是哥倫比亞大學(xué)開(kāi)發(fā)的基于內(nèi)容的視覺(jué)查詢?cè)拖到y(tǒng),是基于WWW方式的文本/圖像搜索引擎。在WebSEEK中,使用兩種獨(dú)立的自動(dòng)化過(guò)程對(duì)圖像進(jìn)行分析。第一個(gè)過(guò)程抽取和索引顏色直方圖和紋理等視覺(jué)特征。第二個(gè)過(guò)程分析相關(guān)的文本并把圖像分類成定制圖像類別中的主題類。目前已分類的圖像有66萬(wàn)多幅,形成了一個(gè)極富創(chuàng)新性的圖像目錄。
WebSEEK的一個(gè)主要特征是綜合了視覺(jué)特征和文本,該方法的可行性通過(guò)一個(gè)大的基于萬(wàn)維網(wǎng)的實(shí)驗(yàn)臺(tái)來(lái)演示。所用到的視覺(jué)特征有顏色集、紋理特征的小波變換。為加快檢索過(guò)程,還開(kāi)發(fā)出了基于二叉樹(shù)的索引算法。該系統(tǒng)的一個(gè)主要特征是用到了圖區(qū)域的空間關(guān)系查詢和直接從壓縮數(shù)據(jù)中提取視覺(jué)特征。
(5) MARS
MARS(Multimedia Analysis and Retrieval System)系統(tǒng)[8]是美國(guó)UIUC(University of Illinois at Urabana Champaign)大學(xué)所開(kāi)發(fā)的,運(yùn)用計(jì)算機(jī)視覺(jué)、數(shù)據(jù)庫(kù)管理系統(tǒng)和信息檢索等領(lǐng)域的知識(shí)。MARS系統(tǒng)與其它系統(tǒng)的區(qū)別在于它的重點(diǎn)不是在于尋找單個(gè)的最佳特征表示,而在于如何將不同的視覺(jué)特征組織成有意義的檢索體系,以動(dòng)態(tài)地適應(yīng)不同的用戶及應(yīng)用場(chǎng)合。MARS系統(tǒng)是正式提出相關(guān)反饋的系統(tǒng),它將相關(guān)反饋技術(shù)集成到檢索的不同層次過(guò)程中。
(6) Virage系統(tǒng)
Virage[9]是一個(gè)商業(yè)公司開(kāi)發(fā)的視頻系統(tǒng)原型,成功地應(yīng)用在多個(gè)美國(guó)機(jī)構(gòu)的視頻數(shù)據(jù)庫(kù)中。其數(shù)據(jù)庫(kù)包括索引數(shù)據(jù)庫(kù)和視頻數(shù)據(jù)庫(kù),數(shù)據(jù)把編輯管理部分和客戶訪問(wèn)部分分離。其特色在于一個(gè)強(qiáng)大編輯器,計(jì)算機(jī)首先對(duì)視頻進(jìn)行預(yù)處理,通過(guò)語(yǔ)音識(shí)別和文字識(shí)別獲取圖像中的文本信息,進(jìn)行鏡頭切割,使得編輯人員可以很方便地修改和添加注釋,從而獲得較為全面的描述信息。
5 結(jié)語(yǔ)
基于內(nèi)容的圖像檢索技術(shù)是一種綜合的集成技術(shù),其中一些關(guān)鍵技術(shù)涉及到特征提取、圖像分割、相似度計(jì)算等。目前國(guó)際上在基于內(nèi)容的圖像檢索領(lǐng)域的諸多研究已經(jīng)取得了很大進(jìn)展,但仍存在很多不完善的地方,仍需進(jìn)一步深入研究。
(1) 綜合多特征的檢索:圖像具有不同的特征表示方法,不同的特征提取對(duì)應(yīng)著不同的相似性算法。采用多種特征相結(jié)合的方法來(lái)提高系統(tǒng)效率,是需要解決的問(wèn)題。例如在顏色、紋理、形狀等幾種查詢特征中,選擇兩種或者兩種以上進(jìn)行綜合查詢。在進(jìn)行綜合查詢時(shí),如何設(shè)置各個(gè)特征向量的權(quán)重是關(guān)鍵問(wèn)題。在不同的應(yīng)用系統(tǒng)中,權(quán)重應(yīng)據(jù)實(shí)際需要而定。
(2) 與數(shù)據(jù)庫(kù)技術(shù)的融合:基于內(nèi)容的圖像數(shù)據(jù)庫(kù)把圖像處理、圖像識(shí)別、數(shù)據(jù)庫(kù)三個(gè)領(lǐng)域的技術(shù)成果結(jié)合起來(lái),是一個(gè)有前途的發(fā)展方向。當(dāng)上千萬(wàn)的圖像數(shù)據(jù)集出現(xiàn)時(shí),數(shù)據(jù)庫(kù)將成為圖像檢索系統(tǒng)的一個(gè)重要部分,而且這對(duì)圖像特征的表達(dá)能力、計(jì)算速度以及層次可達(dá)性都將產(chǎn)生重大影響。
(3) 基于內(nèi)容的編碼:現(xiàn)在使用的媒體,其格式和編碼沒(méi)有考慮到內(nèi)容,只是針對(duì)顏色、像素來(lái)編碼,因此從這些數(shù)據(jù)中抽取內(nèi)容非常困難。如果在對(duì)媒體數(shù)據(jù)編碼時(shí)就考慮到媒體的內(nèi)容,即媒體包含其表示內(nèi)容的信息,這樣對(duì)這些數(shù)據(jù)的內(nèi)容進(jìn)行檢索就會(huì)更有效和準(zhǔn)確。目前在這方面的工作已經(jīng)取得很大進(jìn)展,例如即將成為國(guó)際標(biāo)準(zhǔn)的基于內(nèi)容的編碼標(biāo)準(zhǔn)MPEG-4 和多媒體數(shù)據(jù)內(nèi)容表示國(guó)際標(biāo)準(zhǔn)MPEG-7。
參考文獻(xiàn):
[1] Swain M J, Ballard B H, Color indexing[J].International Journal of Computer Vision.1997, 7(1):11-32.
[2] 唐立軍, 段立娟, 高文. 基于內(nèi)容的圖像檢索系統(tǒng)[J]. 計(jì)算機(jī)應(yīng)用, 2000, 10(7): 41-45 [3]. 李向陽(yáng), 魯東明, 潘云鶴. 基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J]. 計(jì)算機(jī)研究與發(fā)展, 2001, 38(3): 344-354.
[4] Smith J R, Chang S F, Transform feature for texture class: fication and discrimination in large image database.In:Proc of IEEE Int