論文開題報(bào)告舉例
開題日期:
一、選題的背景、意義(所選課題的歷史背景、國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢)
1.1背景:
在當(dāng)今的信息化時代,隨著現(xiàn)代電子技術(shù)、計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)通信技術(shù)和多媒體技術(shù)的迅猛發(fā)展,大量的數(shù)字媒介被用來記錄信息,數(shù)字圖像是其中一種用以記錄真實(shí)世界景象的重要方式。在各行各業(yè),包括在人們的社會生活中,各種內(nèi)容的大規(guī)模數(shù)字圖像庫不斷出現(xiàn)。有效的建立、管理和充分利用圖像信息庫資源,一直是國內(nèi)外科技工作者關(guān)注的問題。能夠有效的在龐大的圖像數(shù)據(jù)庫中搜索到需要的圖像信息,是進(jìn)行數(shù)字圖像管理和分析的關(guān)鍵技術(shù)。
早在上個世紀(jì)七十年代,由于數(shù)據(jù)庫管理系統(tǒng)的發(fā)展,人們就借助于傳統(tǒng)的數(shù)據(jù)庫管理技術(shù)對圖像進(jìn)行檢索。這時候圖像檢索的一個典型框架是,首先對圖像用文本進(jìn)行注解,然后用基于文本的數(shù)據(jù)庫管理系統(tǒng)來進(jìn)行圖像檢索。這樣一來對圖像的插敘就變成了基于標(biāo)簽的查詢。這種方法雖然簡單,但有幾個根本的問題影響對圖像信息的有效使用:首先,由于圖像內(nèi)容很難用文字標(biāo)簽完全表達(dá),所以這種方法在查詢圖像中常會出現(xiàn)錯誤。其次,文字描述是一種特定的抽象,如果描述的標(biāo)準(zhǔn)改變,則標(biāo)簽也得從新制作才能適合新查詢的要求。話句話說,特定的標(biāo)簽只適合特定的查詢要求。最后,目前這些文字標(biāo)簽是靠觀察者選出來才加上去的,因此受主觀因素影響很大,不同的觀察者或同一觀察者在不同條件下對同一幅圖像可能給出不同的描述,因而不夠客觀,沒有統(tǒng)一標(biāo)準(zhǔn),常會自相矛盾。
圖像數(shù)據(jù)庫的核心技術(shù)是圖像檢索。圖像檢索則是近年來海量是、信息處理面臨的“瓶頸”;趦(nèi)容的檢索最具有本質(zhì)性,已經(jīng)成為當(dāng)前國內(nèi)外研究的熱點(diǎn)。圖像檢索技術(shù)的兩大關(guān)鍵圖像特征的提取和相似性度量。在人類視覺屬性中,紋理作為基本的視覺特征之一,分布十分廣泛。針對紋理的研究研究經(jīng)歷了相當(dāng)長的時間,但對紋理的明確定義直至目前尚未出現(xiàn),紋理應(yīng)用于圖像檢索的時間也是相對短暫的。基于紋理特征的圖像檢索是基于內(nèi)容的圖像檢索研究中的前沿技術(shù)。
下面先來介紹一下基于內(nèi)容的圖像檢索
基于內(nèi)容的圖像檢索技術(shù)是一種綜合集成技術(shù),涉及到認(rèn)識科學(xué)、人工智能、模式識別、圖像處理、信息檢索等多個領(lǐng)域。其中一些關(guān)鍵技術(shù)如特征提取、圖像分割、對象提取、高維索引等一直都是一個懸而未決的問題。
基于內(nèi)容的圖像檢索(CBIR)技術(shù)由機(jī)器自動提取包含圖像內(nèi)容的可視化特征:顏色、
紋理、形狀、輪廓、對象的位置和相關(guān)關(guān)系等,對數(shù)據(jù)庫中的是、圖像和查詢樣本圖像在特征空間進(jìn)行相似匹配,檢索出與樣本相似的圖像。
1.2意義:
目前,各種數(shù)據(jù)庫中存在大量的圖像,少則幾十上百,多則成千上萬。并且這些圖像數(shù)據(jù)庫的研究對多媒體數(shù)據(jù)旅游景點(diǎn)、衛(wèi)星遙感圖像、地理信息系統(tǒng)等提供了有力的支持。
多媒體技術(shù)、Internet網(wǎng)絡(luò)的迅速發(fā)展,使圖像在人們的日常生活中的應(yīng)用日益廣泛。公安部門的迅速破案,需要大量的罪犯圖像信息作為輔助;天氣預(yù)報(bào)的準(zhǔn)確預(yù)測,離不開大量衛(wèi)星圖像的支持。各種各樣的應(yīng)用的出現(xiàn),使圖像信息的使用也逐漸滲入到社會上的每一個角落,圖像已成為大眾化數(shù)字信息的一種重要形式。如何組織、表達(dá)、存儲、查詢、管理和檢索這些海量的圖像數(shù)據(jù),是對傳統(tǒng)數(shù)據(jù)庫技術(shù)的一個重大挑戰(zhàn)。因此,如何將數(shù)字圖像處理,建立高效的圖像檢索機(jī)制已成為目前迫切需要解決的問題。
1.3國內(nèi)外研究動態(tài)及發(fā)展趨勢:
近十年來,每年都有相關(guān)的國際會議召開,國際上重要的雜志也都對此發(fā)表了相關(guān)的?:芏嗟难芯繖C(jī)構(gòu)進(jìn)行了相關(guān)的工作,取得了很多令人矚目的成就,如IBM公司的QBIE系統(tǒng),virage公司的VIR圖像工程系統(tǒng)等。
與國外相對成熟的技術(shù)而言,目前國內(nèi)研究部寬,主要集中在基于圖像的顏色、紋理等的查詢部分。
二、研究的基本內(nèi)容與擬解決的主要問題
提出一種多特征(顏色、紋理、形狀、輪廓、對象的位置和相關(guān)關(guān)系等)融合的圖像檢索方法。該方法能充分利用人類的視覺感知,將圖像的多種低層特征相互結(jié)合,并通過適合的相似性度量將數(shù)據(jù)庫中的圖像與待查詢圖像進(jìn)行比較,用以檢索出與待查詢圖像相似的圖像。該方法在包含從INTERNET下載的風(fēng)景圖像數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),以驗(yàn)證其可行性和有效性。
三、研究的方法與技術(shù)路線、研究難點(diǎn),預(yù)期達(dá)到的目標(biāo)
3.1研究的方法:
3.1.1 基于顏色的檢索
人們普遍認(rèn)為顏色并不是刻劃一個物體的關(guān)鍵特征,因而在傳統(tǒng)的注重幾何特征的計(jì)算機(jī)視覺研究中,顏色未能得到充分的重視。然而相對于各種幾何特征,顏色具有大小、方向、位置不變性,同時它也是描述圖像最有效的特征之一。如果客戶只希望從庫存中查到所有紅色衣服的樣本圖像,則使用其它檢索方式很難達(dá)到要求。QBIC系統(tǒng)將基于顏色的檢索作為缺省的檢索方式。
基于顏色檢索主要采用顏色直方圖的方法。顏色直方圖代表3個顏色頻道強(qiáng)度的聯(lián)合概率,描述全局的顏色分布,對旋轉(zhuǎn)以及位置變化不敏感。1990年,Swain和Ballard提出了直方圖交的算法,從而為顏色檢索奠定了基礎(chǔ)。圖像相似度采用如下公式計(jì)算:
顏色直方圖能夠反映圖像的平均顏色信息·,但不考慮空間位置信息。例如,在一幅全家福合影中,你站在父母的左邊、右邊,還是中間,并不會影響整幅圖像的顏色分布,得到的顏色直方圖也是類似的。采用純粹的基于顏色直方圖的檢索,并不能很好地區(qū)分這些在人眼看來非常不同的圖像。同時,要把每幅圖像的顏色直方圖信息存儲下來,需要較大的空間。為解決這個問題,Mehtre提出了一種參考顏色表的方法。該方法是一種有損壓縮,并不能從壓縮直方圖中恢復(fù)圖像固有的信息。
為解決顏色直方圖不能描述空域信息的缺陷,需要引入空域信息。對于全局空域信息的引入,先用Canny算子得到邊界圖,然后對邊緣點(diǎn)建立方向直方圖。歸一化后的方向直方圖可在一定程度上做到尺度不變和旋轉(zhuǎn)不變。如果圖像位置簡單,還可做到與目標(biāo)位置無關(guān)。對于局部空域信息,將圖像固定分為5個區(qū)域,對每個區(qū)域求其顏色直方圖的前三階矩。該法只對圖像的.微小旋轉(zhuǎn)有不變性,不適應(yīng)圖像大的變化。也可采用類似紋理分析中灰度共生矩陣方法,該法對視點(diǎn)變換、背景變化及焦距遠(yuǎn)近均不敏感。
其它基于顏色的方法還有許多,如顏色相關(guān)向量法、顏色相關(guān)圖法、顏色集方法、顏色聚類法等等。顏色相關(guān)向量法(CCV方法)是Greg Pass提出的,將各顏色區(qū)段像素點(diǎn)總數(shù)分 為相關(guān)和不相關(guān)兩類,包含一定的空間信息。顏色相關(guān)圖法是Jing Huang提出的由顏色對組成的表,表的第k個人口即顏色i在距離為k的范圍內(nèi)找到顏色j的像素點(diǎn)的概率。該方法對 圖像旋轉(zhuǎn)、位置變換敏感。顏色集法由John R.Smith和shihFu Chang提出,它將圖像的RGB
空間轉(zhuǎn)換為HSV一維空間,因?yàn)镠SV空間比較符合人類的視覺感知特征。通過閾值過濾, 大于閾值的為l,小于閾值的為O。該法可以保留圖像的顯著信息,便于索引的構(gòu)造。W.Y.Ma提出的顏色聚類法(GLA)將庫中圖像顏色聚類,在預(yù)定誤差范圍內(nèi),將三維顏色空間量化為最小數(shù)目的一維,使用顏色所占比例反映分割區(qū)域顏色分布。
人類肉眼一般對主色調(diào)比較敏感,因此有人提出了基于主色調(diào)的檢索方法。通過系統(tǒng)提供的調(diào)色板選擇顏色值,指定某種主色調(diào)進(jìn)行檢索。然而,人類肉眼的分辨率畢竟有限,在一定范圍內(nèi)的顏色變化往往區(qū)分不出來。并且顏色在按色彩量化時會產(chǎn)生量化誤差,從而使得原本非常相似的顏色被量化到了不同的范圍之內(nèi),導(dǎo)致圖像匹配時漏選。采用正態(tài)分布擬和法來獲取指定顏色的擴(kuò)展值,對主色調(diào)進(jìn)行擴(kuò)展,可彌補(bǔ)由于用戶選擇的隨機(jī)性和量化等引起的誤差。
3.1.2基于紋理的檢索
所謂紋理,是指圖像像素灰度集或顏色的某種規(guī)律性變化。紋理特征主要包括粗糙度、方向性、對比度以及規(guī)則性;诩y理的檢索適用于檢索諸如水波、布匹、建材等類型的圖像,通常采用統(tǒng)計(jì)方法、結(jié)構(gòu)方法以及頻譜分析方法進(jìn)行。統(tǒng)計(jì)方法主要用于分析像木紋、沙地、草坪等細(xì)致而不規(guī)則的物體,根據(jù)圖像像素間灰度的統(tǒng)計(jì)性質(zhì)對紋理規(guī)定出特征以及特征與參數(shù)間的關(guān)系。結(jié)構(gòu)方法適于像布料或磚瓦等一類元素組成的紋理以及排列比較規(guī)則的東西,根據(jù)紋理基元及其排列規(guī)則來描述紋理特征。
統(tǒng)計(jì)方法通常在頻率域和空間域上進(jìn)行。在頻率域上,主要采用傅立葉變換和小波分析。傅立葉變換在能量譜上反映圖像粗糙度和方向性;小波分析中采用Gabor濾波能夠表現(xiàn)出最 好的特征。在空間域主要采用Haraliek和Shanmugam 提出的共生矩陣法,共生矩陣的每個元素表示從灰度i像素點(diǎn)開始離開某固定位置t的像素點(diǎn)灰度為j的概率。該法的缺點(diǎn)在于矩 陣很大且含有大量的冗余信息。Tamura是紋理分析的另一主要方法,它定義了粗糙度、方向、歸整等6種特征,每種特征相互獨(dú)立且可視。其優(yōu)點(diǎn)在于幾乎沒有冗余信息,算法的效率比較商。
在紋理研究的早期,人們普遍認(rèn)為統(tǒng)計(jì)方法優(yōu)于頻譜分析方法。8O年代, 隨機(jī)場模型開始用于紋理的分類和識別。Kashyap采用基于圓對稱自回歸隨機(jī)場模型的特征,用于自然 紋理的分類, 并取得了9l% 的正確率。F.S.Cohen等采用Gaussian Markov隨機(jī)場模型(GMRF),對9種自然紋理的識別達(dá)到了99% 至100% 的正確率。D.K.Panjwani和G.Healy進(jìn)一步采用GMRF模型用于彩色紋理圖象的分割, 也取得了較好的效果。
【論文開題報(bào)告舉例】相關(guān)文章:
國貿(mào)論文開題報(bào)告03-19
oracle論文開題報(bào)告03-19
物流論文開題報(bào)告02-24
稅務(wù)論文開題報(bào)告12-21
口譯論文開題報(bào)告12-21
電大論文開題報(bào)告11-18
論文開題報(bào)告須知03-19
施工論文開題報(bào)告02-07
學(xué)位論文開題報(bào)告02-07