1.MFD特征與高層視圖
1.1 面向?qū)ο髷?shù)據(jù)模型
多媒體數(shù)據(jù)挖掘(MDM)要求其特征庫具有復(fù)雜的數(shù)據(jù)結(jié)構(gòu),長時間的事務(wù),能定義面向特定應(yīng)用的非標(biāo)準(zhǔn)操作,高效檢索.MFD采用面向?qū)ο髷?shù)據(jù)模型,支持基于對象標(biāo)識的關(guān)聯(lián)存取和導(dǎo)航機制.O-O方法提供的類、對象、繼承、代碼重用和數(shù)據(jù)封裝機制,均有助于MDM的設(shè)計與實現(xiàn).MFD的數(shù)據(jù)模型和數(shù)據(jù)類型不僅支持關(guān)鍵字和精確匹配,且支持圖像查詢,支持基于內(nèi)容的相似匹配,能滿足MDM的需要.
1.2 支持多種特征查詢
MFD數(shù)據(jù)類型較之GIS等領(lǐng)域的數(shù)據(jù)庫模型,提供了一個多邊形類來定義任意的感興趣的形狀對象,解決了新加對象需要增加新符號的問題,而且,充分考慮了各種圖像特征,包括形狀、空間、顏色、紋理等.MFD用復(fù)合形狀定義內(nèi)部輪廓,并設(shè)計了基本形狀,如:圓、正方形、橢圓等,使查詢結(jié)果更為精確,搜索可限制為所希望的形狀類型.這些都是多數(shù)圖像數(shù)據(jù)庫所不能支持的.MFD支持空間關(guān)系;支持復(fù)合對象;一個對象可根據(jù)不同的觀察點,具有不同的形狀;可由用戶定義查詢的相似度閾值;支持的查詢語言MOQL,語義豐富,能作為一種結(jié)構(gòu)化的表達(dá)方式由查詢引擎來實現(xiàn);允許用戶在請求中指定如顏色、形狀和紋理等不同的特征,輸入方式更為靈活.
1.3 相關(guān)的特征類型
如何通過內(nèi)容對對象進行搜尋和檢索主要依賴于對象內(nèi)容的表示法,即選擇的特征表示及使用的相似度標(biāo)準(zhǔn).常用特征有紋理、顏色、形狀和空間特征,可分別用于不同的具體應(yīng)用.紋理特征:紋理是識別不同圖像的最重要的特征之一.可用于不同表面和其它信息,包括形狀和運動等的區(qū)分,并反映一些抽象概念,如:均勻性,密度,粗糙程度,規(guī)則性,方向、頻率等.可用圖像處理方法抽取和描述圖像的紋理特征.顏色特征:顏色使對象識別變得簡單而強有力的特征.有多種顏色模式,如RGB和HIS模式.形狀和空間特征:對象形狀表述是模式識別的一個重要問題.當(dāng)一些對象的顏色和紋理極其相似時,形狀特征尤為重要.空間特征說明了對象的空間位置和對象之間的空間關(guān)系,如方向關(guān)系、相鄰,重疊和對兩個或多個對象的包含等.空間特征可用符號化的串表示,如2D串,串可反應(yīng)一些上述關(guān)系.
1.4 數(shù)據(jù)類型的高層視圖
應(yīng)用的重要對象稱為顯著對象,顯著對象分為邏輯顯著對象LSO和物理顯著對象PSO.LSO和PSO有1∶n的對應(yīng)關(guān)系.利用O-O設(shè)計的繼承機制,使LSO類定義在由超類和子類組成的繼承中,一個子類可繼承其超類的屬性和方法.顯著對象特征描述的建立:先用特征抽取法得到特征,后進行對象識別,建立對象模型,進行語義辨認(rèn),從而對對象語義建模,獲取LSO和PSO及其相互對應(yīng)關(guān)系.語義性視覺模版,使用戶與系統(tǒng)交互,通過一系列查詢,得到用戶個人觀念的模版,從而將視覺特征與語義特征相聯(lián)系.特征庫MFD基于內(nèi)容的數(shù)據(jù)類型,支持?jǐn)?shù)據(jù)的存儲和基于內(nèi)容查詢的執(zhí)行.傳統(tǒng)E-R模型數(shù)據(jù)庫系統(tǒng)使用精確匹配,基于內(nèi)容的數(shù)據(jù)庫系統(tǒng)支持近似匹配,使用距離函數(shù)來比較目標(biāo)圖像和數(shù)據(jù)庫圖像.本文的數(shù)據(jù)類型通用,針對圖像數(shù)據(jù)庫中支持顏色、形狀、紋理、空間關(guān)系和傳統(tǒng)的關(guān)鍵字的絕大多數(shù)情況,可用于不同的具體應(yīng)用.數(shù)據(jù)類型的高層視圖如圖1.最小范圍框MB類定義空間特征,幾何對象類定義形狀特征.類PSO是訪問其他類的橋梁.每個PSO實例具有對象標(biāo)識Oid,它與相應(yīng)的LSO,MB、幾何對象、紋理組、顏色組和圖像實例相連.以PSO為中心的星型結(jié)構(gòu),使應(yīng)用系統(tǒng)在不實現(xiàn)某些特征時,仍保持其他特征的完整性.某些應(yīng)用可能允許一個對象的形狀,以類似于人眼在不同距離觀察事物的方式而變化,故MFD允許一個PSO對應(yīng)多個形狀,如圖中1到n的對應(yīng)關(guān)系.多媒體數(shù)據(jù)挖掘之媒體特征庫措施
2. MFD的空間特征
2.1 MFD的空間位置
MFD空間特征包括對象的空間位置和兩個對象間的空間關(guān)系[2].空間位置是對象的特征,也反映圖像的布局,可用最小范圍框MB表示.構(gòu)造對象MB的方法:以圖像的左上角為原點,將圖像放在X-Y坐標(biāo)中,畫一與X軸平行的最小包圍該對象的長方形.MB由此長方形的左上角(Xmin,Ymin)和右下角(Xmax,Ymax)定義.
2.2 MFD的空間關(guān)系定義
當(dāng)出現(xiàn)多個對象時,產(chǎn)生空間關(guān)系.空間關(guān)系指對象間距離、方向關(guān)系和拓?fù)潢P(guān)系.距離:計算兩個對象的質(zhì)心,一個對象的質(zhì)心定義如下,其中n為組成對象的像素數(shù).xv=∑ni=1xin yv=∑ni=1yin(1) 拓?fù)潢P(guān)系:包括相離、相切、重合、相交、內(nèi)含、內(nèi)含于(與內(nèi)含相對)、覆蓋、被覆蓋(與覆蓋相對)等.方向關(guān)系:兩個相離或相切的對象具有方向關(guān)系,其余方向關(guān)系為其拓?fù)潢P(guān)系.方向關(guān)系包括:左、右、上、下、前、后;東、南、西、北、西北、東北、西南、東南;前、后也可與其他方向關(guān)系組合,如:左前等.
2.3 空間關(guān)系的計算
為了有效計算空間關(guān)系,定義MB方法和方向、定義拓?fù)潢P(guān)系.用MB確定對象間的空間關(guān)系,計算簡單,且能有效存儲.兩個對象間的拓?fù)潢P(guān)系通過比較兩個MB的Xmax,Xmin,Ymax和Ymin來測量.MB適合于均勻分布的形狀,為了得到正確的結(jié)果,還應(yīng)考慮多對拓?fù)潢P(guān)系.MB測定方向的方法,或者用日常人們辨識八個方向的測量方法,或者用角度數(shù)測量的方法.為推導(dǎo)出兩個MB間的拓?fù)浠蚍较蜿P(guān)系,要分別計算MB的x,y坐標(biāo)或間段.通過分別比較X、Y軸的坐標(biāo),MB可用X-間段(X-i)和Y-間段(Y-i)來表示,且兩個MB間的空間關(guān)系也可通過分別比較它們的X-間段和Y-間段來判定.對間段類,作者給出了7種基本的間段比較函數(shù).如:before(),equal(),start(),finish(),meet(),overlap(),during().函數(shù)的返回值為T或F.這些函數(shù)的某一集合的真值反映了兩個對象的拓?fù)浜头较蜿P(guān)系.
3.結(jié)束語
本文介紹了MFD數(shù)據(jù)模型的特征和數(shù)據(jù)類型,詳細(xì)討論了以圖像為例的若干特征表示,包括:空間、顏色、形狀、紋理及其它特征.其中:空間特征分為空間位置和空間關(guān)系,關(guān)系包括距離、拓?fù)潢P(guān)系和方向關(guān)系,距離由對象的質(zhì)心確定,拓?fù)浜头较蜿P(guān)系用MB或間段確定;顏色表示可用RGB、HIS模式;形狀分為原子形狀和復(fù)合形狀,用多線類和多邊形類表示任意形狀;紋理用多個維,如:光滑度、方向性等.視頻可看作是離散的圖像序列加時間規(guī)范特征.故MFD能支持復(fù)雜對象和基于多種特征的媒體查詢,滿足MDMP系統(tǒng)挖掘知識的需要.